Isolater - Feed

Ax Jiayang Gao, Tianyi Zheng, Jiayang Zou, Fengxiang Yang, Shice Liu, Luyao Fan, Zheyu Zhang, Hao Zhang, Jinwei Chen, Peng-Tao Jiang, Bo Li, Jia Wang 22d ago

C$^2$FG: Control Classifier-Free Guidance via Score Discrepancy Analysis

Theoretical analysis of classifier-free guidance in diffusion models with bounds on score discrepancy for controlled guidance weights.

Ax Yuval Ran-Milo 22d ago

Attention Sinks Are Provably Necessary in Softmax Transformers: Evidence from Trigger-Conditional Tasks

Theoretical analysis proving attention sinks are functionally necessary in softmax Transformers for trigger-conditional tasks.

Ax Martin G. Frasch 22d ago

Minimum-Action Learning: Energy-Constrained Symbolic Model Selection for Physical Law Identification from Noisy Data

Framework for identifying symbolic physical laws from noisy data by minimizing action functional with sparsity and energy conservation.

Ax Huamin Chen, Xunzhuo Liu, Bowei He, Fuyuan Lyu, Yankai Chen, Xue Liu, Yuhan Liu, Junchen Jiang 22d ago

The Workload-Router-Pool Architecture for LLM Inference Optimization: A Vision Paper from the vLLM Semantic Router Project

vLLM Semantic Router architecture for optimizing LLM inference with routing mechanisms, semantic caching, and safety classification.

Ax Shreeram Murali, Cristian R. Rojas, Dominik Baumann 22d ago

Computationally lightweight classifiers with frequentist bounds on predictions

Computationally efficient classification algorithm with frequentist uncertainty bounds for safety-critical applications.

Ax Xiang Li, Yixuan Jia, Xiao Li, Jeffrey A. Fessler, Rongrong Wang, Qing Qu 22d ago

MCLR: Improving Conditional Modeling via Inter-Class Likelihood-Ratio Maximization and Unifying Classifier-Free Guidance with Alignment Objectives

Theoretical framework unifying classifier-free guidance with alignment objectives in diffusion models for generative modeling.

Ax Noah Bergam, Samuel Deng, Daniel Hsu 22d ago

A One-Inclusion Graph Approach to Multi-Group Learning

Theoretical analysis of sample complexity bounds for multi-group learning using one-inclusion graph prediction strategy.

Ax Andi Nika, Debmalya Mandal, Parameswaran Kamalaruban, Adish Singla, Goran Radanovi\'c 22d ago

Corruption-robust Offline Multi-agent Reinforcement Learning From Human Feedback

Multi-agent reinforcement learning framework addressing robustness to data corruption in preference-based learning from human feedback.

Ax Chien-Ping Lu 22d ago

Continued AI Scaling Requires Repeated Efficiency Doublings

Analysis of AI scaling requiring repeated efficiency doublings, distinguishing logical compute from physical resource implementation efficiency.

Ax Anci Lin, Xiaohong Liu, Zhiwen Zhang, Wenju Zhao 22d ago

Biomimetic causal learning for microstructure-forming phase transitions

Biomimetic physics-informed neural networks for modeling microstructure-forming phase transitions in cellular matrices.

Ax Brandon Yee, Pairie Koh 22d ago

PI-JEPA: Label-Free Surrogate Pretraining for Coupled Multiphysics Simulation via Operator-Split Latent Prediction

Physics-informed label-free pretraining method for coupled multiphysics simulation surrogates using operator-split latent prediction.

Ax Dharmesh Tailor, Nicol\`o Felicioni, Kamil Ciosek 22d ago

A Bayesian Information-Theoretic Approach to Data Attribution

Bayesian information-theoretic approach to training data attribution that traces model predictions to influential training examples for interpretability.

Ax Minglu Liu, Cunchen Hu, Liangliang Xu, Fengming Tang, Ruijia Wang, Fu Yu 22d ago

STQuant: Spatio-Temporal Adaptive Framework for Optimizer Quantization in Large Multimodal Model Training

STQuant framework for adaptive spatio-temporal quantization of optimizer states during large multimodal model training to reduce memory costs.

Ax Nozomu Kobayashi, Yoshiyuki Suimon, Koichi Miyamoto 22d ago

Time series generation for option pricing on quantum computers using tensor network

Quantum computing approach for option pricing using tensor networks to prepare quantum states encoding asset price distributions.

Ax Tim Johnsen, Marco Levorato 22d ago

NaviSlim: Adaptive Context-Aware Navigation and Sensing via Dynamic Slimmable Networks

Adaptive neural networks for autonomous micro-drones with computational constraints via dynamic slimmable network architecture.

Ax Takuro Kutsuna 22d ago

A Probabilistic Formulation of Offset Noise in Diffusion Models

Theoretical analysis of offset noise in diffusion models to address brightness value generation challenges in large-scale models.

Ax Huawei Lin, Yingjie Lao, Weijie Zhao 22d ago

DMin: Scalable Training Data Influence Estimation for Diffusion Models

DMin framework for scalable training data influence estimation in diffusion models, enabling identification of influential training samples on generated outputs.

Ax Ximing Xing, Juncheng Hu, Ziteng Xue, Jing Zhang, Buyu Li, Sheng Wang, Dong Xu, Qian Yu 22d ago

SVGFusion: A VAE-Diffusion Transformer for Vector Graphic Generation

VAE-diffusion framework for generating high-quality SVG graphics from text with structural understanding.

Ax Antoni Kowalczuk, Jan Dubi\'nski, Franziska Boenisch, Adam Dziedzic 22d ago

Privacy Attacks on Image AutoRegressive Models

Comprehensive privacy attack analysis on image autoregressive models, identifying membership inference and extraction vulnerabilities.

Ax Mohammad Albinhassan, Pranava Madhyastha, Alessandra Russo 22d ago

$\texttt{SEM-CTRL}$: Semantically Controlled Decoding

Method for enforcing syntactic and semantic constraints in LLM decoding through MCTS-guided token-level control.

Ax Musfiqur Rahman, SayedHassan Khatoonabadi, Emad Shihab 22d ago

OpenClassGen: A Large-Scale Corpus of Real-World Python Classes for LLM Research

Large-scale corpus of 324,843 Python classes from open-source projects for training and evaluating LLMs on code generation.

Ax Dezheng Han, Yibin Jia, Ruxiao Chen, Wenjie Han, Shuaishuai Guo, Jianbo Wang 22d ago

ReCellTy: Domain-Specific Knowledge Graph Retrieval-Augmented LLMs Reasoning Workflow for Single-Cell Annotation

RAG-based LLM workflow using domain-specific knowledge graph for automated single-cell type annotation in biology.

Ax Rui Melo, Claudia Mamede, Andre Catarino, Rui Abreu, Henrique Lopes Cardoso 22d ago

Are Sparse Autoencoders Useful for Java Function Bug Detection?

Study evaluating sparse autoencoders for detecting bugs in Java code, addressing software vulnerability detection.

Ax Ozsel Kilinc, Cem Tarhan 22d ago

RQR3D: Reparametrizing the regression targets for BEV-based 3D object detection

Technique for improving BEV-based 3D object detection in autonomous driving by reparametrizing regression targets.

Ax Charig Yang, Samiul Alam, Shakhrul Iman Siam, Michael J. Proulx, Lambert Mathias, Kiran Somasundaram, Luis Pesqueira, James Fort, Sheroze Sheriffdeen, Omkar Parkhi, Carl Ren, Mi Zhang, Yuning Chai, Richard Newcombe, Hyo Jin Kim 22d ago

Reading Recognition in the Wild

Task and dataset for detecting when users are reading in egocentric smart glasses video using multimodal models.

Ax Thinh Pham, Nguyen Nguyen, Pratibha Zunjare, Weiyuan Chen, Yu-Min Tseng, Tu Vu 22d ago

SealQA: Raising the Bar for Reasoning in Search-Augmented Language Models

Benchmark dataset (SealQA) for evaluating search-augmented LLMs on fact-seeking questions with conflicting or noisy search results.

Ax Adrian-Marius Dumitran, Radu Dita, Angela Liliana Dumitran 22d ago

BacPrep: Lessons from Deploying an LLM-Based Bacalaureat Assessment Platform

Deployment case study of LLM-based platform for automated assessment of Romanian Bacalaureat exam questions using Gemini Flash.

Ax Tianjiao Yu, Vedant Shah, Muntasir Wahed, Ying Shen, Kiet A. Nguyen, Ismini Lourentzou 22d ago

Part$^{2}$GS: Part-aware Modeling of Articulated Objects using 3D Gaussian Splatting

Framework for 3D reconstruction of articulated objects using part-aware Gaussian splatting representation.

Ax Scarlett Raine, Tobias Fischer 22d ago

AI-Driven Marine Robotics: Emerging Trends in Underwater Perception and Ecosystem Monitoring

Survey of AI applications in marine robotics for ecosystem monitoring and conservation using underwater perception.

Ax Alissa A. Valentine, Lauren A. Lepow, Lili Chan, Alexander W. Charney, Isotta Landi 22d ago

Bias Detection in Emergency Psychiatry: Linking Negative Language to Diagnostic Disparities

Analysis of clinician bias in emergency psychiatry using NLP to detect negative language linked to diagnostic disparities.

Ax Himanshu Singh, A. V. Subramanyam, Shivank Rajput, Mohan Kankanhalli 22d ago

Nearest Neighbor Projection Removal Adversarial Training

Adversarial training framework for neural networks that mitigates inter-class feature overlap to improve robustness.

Ax Hyungjin Chung, Hyelin Nam, Jiyeon Kim, Hyojun Go, Byeongjun Park, Junho Kim, Joonseok Lee, Seongsu Ha, Byung-Hoon Kim 22d ago

Video Parallel Scaling: Aggregating Diverse Frame Subsets for VideoLLMs

Inference method for VideoLLMs that processes multiple frame subsets in parallel to improve temporal detail without increasing context window.

Ax Christoph Timmermann, Hyunse Lee, Woojin Lee 22d ago

SeMoBridge: Semantic Modality Bridge for Efficient Few-Shot Adaptation of CLIP

Technique to improve CLIP few-shot classification by addressing modality gap through semantic bridging between image and text embeddings.

Ax Ayan Majumdar, Feihao Chen, Jinghui Li, Xiaozhen Wang 22d ago

Evaluating LLMs for Demographic-Targeted Social Bias Detection: A Comprehensive Benchmark Study

Benchmark for evaluating LLMs on detecting demographic-targeted social biases across diverse content types and demographics.

Ax Hsien-Chin Lin, Benjamin Matthias Ruppik, Carel van Niekerk, Chia-Hao Shen, Michael Heck, Nurul Lubis, Renato Vukovic, Shutong Feng, Milica Ga\v{s}i\'c 22d ago

Prompt reinforcing for long-term planning of large language models

Method to improve LLM performance in multi-turn conversations by reinforcing long-term planning and goal tracking through prompting.

Ax Zhiyu Wang, Bingxin Zhou, Jing Wang, Yang Tan, Weishu Zhao, Pietro Li\`o, Liang Hong 22d ago

Fast and Interpretable Protein Substructure Alignment via Optimal Transport

Protein structure alignment using optimal transport for identifying and comparing local structural motifs.

Ax Gaoxiang Huang, Songning Lai, Yutao Yue 22d ago

Mitigating Spurious Background Bias in Multimedia Recognition with Disentangled Concept Bottlenecks

Lightweight Disentangled Concept Bottleneck Model addressing bias in input-to-concept mapping for interpretable multimedia recognition.

Ax Xi Zhang, Hanwei Zhu, Yan Zhong, Jiamang Wang, Weisi Lin 22d ago

BADiff: Bandwidth Adaptive Diffusion Model

Framework enabling diffusion models to adapt generation quality based on real-time network bandwidth constraints in cloud-to-device scenarios.

Ax Junpei Komiyama, Kyoungseok Jang, Junya Honda 22d ago

Rate-optimal Design for Anytime Best Arm Identification

Minimax optimal algorithm for best arm identification under fixed sampling budget with applications to A/B testing.

Ax Georgios Pantazis, Nicola Mignoni, Raffaele Carli, Mariagrazia Dotoli, Sergio Grammatico 22d ago

Adversarially and Distributionally Robust Virtual Energy Storage Systems via the Scenario Approach

Convex optimization framework for robust scheduling of aggregated EV battery storage under uncertainty.

Ax Bhuvan Sachdeva, Karan Uppal, Abhinav Java, Vineeth N. Balasubramanian 22d ago

Understanding Task Transfer in Vision-Language Models

Study of task transfer in Vision-Language Models examining how finetuning on one perception task affects performance on others.

Ax Austin Spizzirri 22d ago

The Specification Trap: Why Static Value Alignment Alone Cannot Produce Robust Alignment

Philosophical analysis arguing static value alignment approaches cannot ensure robust AI alignment under capability scaling and distribution shift.

Ax Brenda Anague, Bamdad Hosseini, Issa Karambal, Jean Medard Ngnotchouye 22d ago

Physics-Informed Neural Networks for Joint Source and Parameter Estimation in Advection-Diffusion Equations

PINNs applied to source inversion in advection-diffusion equations with sparse measurements for scientific computing.

Ax Jonathan Rystr{\o}m, Zihao Fu, Chris Russell 22d ago

OxEnsemble: Fair Ensembles for Low-Data Classification

OxEnsemble: Fair classification approach for low-data, imbalanced settings with demographic group constraints.

Ax Kohei Nishikawa, Koki Shimizu, Hiroki Hashiguchi 22d ago

Evaluating Singular Value Thresholds for DNN Weight Matrices based on Random Matrix Theory

Method for determining singular value thresholds in DNN weight compression using random matrix theory.

Ax Ayrat Abdullin, Umair Bin Waheed, Leo Eisner, Naveed Iqbal 22d ago

Parameter-Efficient Transfer Learning for Microseismic Phase Picking Using a Neural Operator

Parameter-efficient transfer learning with neural operators for microseismic phase picking across varying signal conditions.

Ax Loris Schoenegger, Benjamin Roth 22d ago

Compact Example-Based Explanations for Language Models

Study on selecting minimal training data subsets for example-based explanations of language model predictions using influence estimation.

Ax Kyriakos Stylianopoulos, Mattia Fabiani, Giulia Torcolacci, Davide Dardari, George C. Alexandropoulos 22d ago

Over-The-Air Extreme Learning Machines with XL Reception via Nonlinear Cascaded Metasurfaces

Wireless ML inference via programmable metasurfaces for over-the-air extreme learning machines in MIMO systems.

Ax Zhicheng Yang, Zhijiang Guo, Yinya Huang, Yongxin Wang, Wenlei Shi, Yiwei Wang, Xiaodan Liang, Jing Tang 22d ago

Accordion-Thinking: Self-Regulated Step Summaries for Efficient and Readable LLM Reasoning

Accordion-Thinking: Framework enabling LLMs to self-regulate reasoning step granularity through dynamic summarization for efficient inference.

Ax Antonin Sulc 22d ago

Differentiable Logical Programming for Quantum Circuit Discovery and Optimization

Neuro-symbolic framework using differentiable logic programming to design and optimize quantum circuits.