Isolater - Feed

Ax Zijie Liu, Jie Peng, Jinhao Duan, Zirui Liu, Kaixiong Zhou, Mingfu Liang, Luke Simon, Xi Liu, Zhaozhuo Xu, Tianlong Chen 2/24/2026

A Replicate-and-Quantize Strategy for Plug-and-Play Load Balancing of Sparse Mixture-of-Experts LLMs

Load balancing strategy for sparse mixture-of-experts LLMs addressing expert underutilization through replicate-and-quantize approach at inference time.

Ax Jin Liu, Yinbin Miao, Ning Xi, Junkang Liu 2/24/2026

DP-FedAdamW: An Efficient Optimizer for Differentially Private Federated Large Models

Efficient optimizer for differentially private federated learning of large models addressing variance amplification and bias from privacy noise.

Ax Caroline Horsch, Laurens Engwegen, Max Weltevrede, Matthijs T. J. Spaan, Wendelin B\"ohmer 2/24/2026

Sparse Masked Attention Policies for Reliable Generalization

Information removal method using sparse masked attention for RL policies that generalize reliably to unseen tasks and observations.

Ax Moritz A. Zanger, Yijun Wu, Pascal R. Van der Vaart, Wendelin B\"ohmer, Matthijs T. J. Spaan 2/24/2026

On the Equivalence of Random Network Distillation, Deep Ensembles, and Bayesian Inference

Theoretical analysis establishing equivalence between random network distillation, deep ensembles, and Bayesian inference for uncertainty quantification.

Ax Yongsheng Chen, Yong Chen, Wei Guo, Xinghui Zhong 2/24/2026

Unlearning Noise in PINNs: A Selective Pruning Framework for PDE Inverse Problems

Selective pruning framework for physics-informed neural networks to improve robustness against noise in PDE inverse problems.

Ax Itamar Trainin, Shauli Ravfogel, Omri Abend, Amir Feder 2/24/2026

Discrete Diffusion Models Exploit Asymmetry to Solve Lookahead Planning Tasks

Analysis of how discrete diffusion models exploit asymmetry mechanisms for multi-step lookahead planning compared to autoregressive transformers.

Ax Alaa El Ichi, Khalide Jbilou 2/24/2026

A Computationally Efficient Multidimensional Vision Transformer

Tensor-based Vision Transformer architecture exploiting multilinear structures for computational efficiency in image processing tasks.

Ax Ha-Anh Hoang Nguyen, Tri-Duc Phan Le, Duc-Hoang Pham, Huy-Son Nguyen, Cam-Van Thi Nguyen, Duc-Trong Le, Hoang-Quynh Le 2/24/2026

Counterfactual Understanding via Retrieval-aware Multimodal Modeling for Time-to-Event Survival Prediction

CURE framework for counterfactual survival prediction integrating multimodal clinical and omics data with latent subgroup retrieval for time-to-event modeling.

Ax Nuocheng Yang, Sihua Wang, Zhaohui Yang, Mingzhe Chen, Changchuan Yin, Kaibin Huang 2/24/2026

A Secure and Private Distributed Bayesian Federated Learning Design

Distributed federated learning framework addressing privacy leakage, slow convergence, and Byzantine robustness using Bayesian methods without central server.

Ax Yuxing Tian, Yiyan Qi, Fengran Mo, Weixu Zhang, Jian Guo, Jian-Yun Nie 2/24/2026

Learning Discriminative and Generalizable Anomaly Detector for Dynamic Graph with Limited Supervision

Semi-supervised approach for dynamic graph anomaly detection addressing label scarcity and poor generalization to unseen anomalies via discriminative learning.

Ax Nicolas Anguita, Francesco Locatello, Andrew M. Saxe, Marco Mondelli, Flavia Mancini, Samuel Lippl, Clementine Domine 2/24/2026

A Theory of How Pretraining Shapes Inductive Bias in Fine-Tuning

Theoretical analysis of how pretraining initializations impact feature learning and refinement during fine-tuning in modern deep learning systems.

Ax Florentin Coeurdoux, Etienne Lempereur, Nathana\"el Cuvelle-Magar, Thomas Eboli, St\'ephane Mallat, Anastasia Borovykh, Eric Vanden-Eijnden 2/24/2026

Training-Free Generative Modeling via Kernelized Stochastic Interpolants

Kernel method for generative modeling within stochastic interpolant framework replacing neural network training with linear systems solved from data.

Ax Thanh Q. Tran, Arun Verma, Kiwan Wong, Bryan Kian Hsiang Low, Daniela Rus, Wei Xiao 2/24/2026

BarrierSteer: LLM Safety via Learning Barrier Steering

BarrierSteer framework for LLM safety using barrier steering to prevent adversarial attacks and unsafe content generation with theoretical guarantees.

Ax Ezra Edelman, Surbhi Goel 2/24/2026

Reliable Abstention under Adversarial Injections: Tight Lower Bounds and New Upper Bounds

Theoretical study of online learning under adversarial injection with tight bounds on learner's ability to abstain from uncertain predictions in clean-label setting.

Ax Yunxiao Zhao, Changxiao Cai 2/24/2026

Adaptation to Intrinsic Dependence in Diffusion Language Models

Theoretical analysis of diffusion language models examining how unmasking schedules affect parallel token generation quality compared to autoregressive approaches.

Ax Wendi Li, Sharon Li 2/24/2026

LAD: Learning Advantage Distribution for Reasoning

New RL objective for LLM reasoning using advantage distribution matching to improve diversity and exploration beyond reward maximization in multi-step reasoning tasks.

Ax Zhenyao Ma, Yue Liang, Dongxu Li 2/24/2026

Behavior Learning (BL): Learning Hierarchical Optimization Structures from Data

Novel ML framework learning interpretable hierarchical optimization structures from data, unifying predictive performance with intrinsic interpretability for scientific applications.

Ax Suraj Prasad, Anubha Pant 2/24/2026

Replication Study: Federated Text-Driven Prompt Generation for Vision-Language Models

Replication study of federated learning approach for vision-language models using text-driven prompt generation to improve zero-shot generalization to unseen classes.

Ax Shiyu Wang, Haolin Chen, Liangwei Yang, Jielin Qiu, Rithesh Murthy, Ming Zhu, Zixiang Chen, Silvio Savarese, Caiming Xiong, Shelby Heinecke, Huan Wang 2/24/2026

Prompt Optimization Via Diffusion Language Models

Diffusion language models optimize system prompts via masked denoising without gradient access to base LLM.

Ax Faruk Alpay, Bugra Kilictas 2/24/2026

Asymptotic Semantic Collapse in Hierarchical Optimization

Studies failure mode in multi-agent language systems where dominant context absorbs individual agent semantics.

Ax Gaia A. Bertolino, Yuwei Zhang, Tong Xia, Domenico Talia, Cecilia Mascolo 2/24/2026

RA-QA: Towards Respiratory Audio-based Health Question Answering

Question-answering system for respiratory health using audio analysis and natural language interaction.

Ax Xiaoyan Bai, Alexander Baumgartner, Haojia Sun, Ari Holtzman, Chenhao Tan 2/24/2026

The Story is Not the Science: Execution-Grounded Evaluation of Mechanistic Interpretability Research

AI agents as evaluators for mechanistic interpretability research, addressing reproducibility via execution-grounded testing.

Ax Zhangfan Yang, Baoyun Chen, Dong Xu, Jia Wang, Ruibin Bai, Junkai Ji, Zexuan Zhu 2/24/2026

BioLM-Score: Language-Prior Conditioned Probabilistic Geometric Potentials for Protein-Ligand Scoring

Language model-based scoring function for protein-ligand binding in drug design.

Ax Christopher Warner, Jonas Mago, JR Huml, Mohamed Osman, Beren Millidge 2/24/2026

ZUNA: Flexible EEG Superresolution with Position-Aware Diffusion Autoencoders

Diffusion autoencoder for EEG signal superresolution with arbitrary electrode positions.

Ax Ihor Stepanov, Mykhailo Shtopko, Dmytro Vodianytskyi, Oleksandr Lukashov 2/24/2026

The Million-Label NER: Breaking Scale Barriers with GLiNER bi-encoder

GLiNER-bi-Encoder: Named entity recognition architecture decoupling label and context encoding for zero-shot flexibility with industrial-scale efficiency.

Ax Nahom Birhan, Daniel Wesego, Dereje Shenkut, Frank Liu, Daniel Takabi 2/24/2026

DCInject: Persistent Backdoor Attacks via Frequency Manipulation in Personal Federated Learning

DCInject: Frequency-domain backdoor attack method for personalized federated learning exploiting DC component manipulation.

Ax Yanlin Zhang, Linjie Xu, Quan Gan, David Wipf, Minjie Wang 2/24/2026

RDBLearn: Simple In-Context Prediction Over Relational Databases

RDBLearn extends tabular in-context learning to relational databases, enabling single models to adapt to prediction tasks across linked tables.

Ax Sarah M\"uller, Philipp Berens 2/24/2026

Mitigating Shortcut Learning via Feature Disentanglement in Medical Imaging: A Benchmark Study

Benchmark study on feature disentanglement methods to mitigate shortcut learning in medical imaging models.

Ax Vasile Marian, Yong-Bin Kang, Alexander Buddery 2/24/2026

Do Generative Metrics Predict YOLO Performance? An Evaluation Across Models, Augmentation Ratios, and Dataset Complexity

Evaluation of whether standard generative metrics (FID) predict object detection performance with synthetic training augmentation.

Ax Suna Bu\u{g}day, Yvan Saeys, Jonathan Peck 2/24/2026

Triggering hallucinations in model-based MRI reconstruction via adversarial perturbations

Study of adversarial attacks causing hallucinations in deep learning-based MRI reconstruction models.

Ax Zhiqin Qian, Ryan Diaz, Sangwon Seo, Vaibhav Unhelkar 2/24/2026

Hierarchical Reward Design from Language: Enhancing Alignment of Agent Behavior with Human Specifications

Framework for translating human language specifications into hierarchical reward functions to align AI agent behavior with human expectations.

Ax Vatsal Goel, Rishon Dsouza, Nikhil Ega, Amey Ramesh Rambatla, Rob Friel, Shuai Shao, Yash Sheth 2/24/2026

Luna-2: Scalable Single-Token Evaluation with Small Language Models

Luna-2: Single-token evaluation architecture using small language models for fast, deterministic LLM-as-judge metrics at scale.

Ax Anjiabei Wang, Shuangge Wang, Tesca Fitzgerald 2/24/2026

Enhancing Goal Inference via Correction Timing

Method for robots to infer task goals from user corrections by analyzing timing and content of behavioral feedback.

Ax Mohammad Heydari, Terence D. Todd, Dongmei Zhao, George Karakostas 2/24/2026

Federated Learning-Assisted Optimization of Mobile Transmission with Digital Twins

Federated learning approach for mobile transmission scheduling using digital twins while preserving privacy.

Ax Tomasz Rybotycki, Sebastian Dziura, Piotr Gawron 2/24/2026

Auto Quantum Machine Learning for Multisource Classification

Automated quantum machine learning pipeline for multisource classification tasks in remote sensing applications.

Ax Harry Robertshaw, Nikola Fischer, Lennart Karstensen, Benjamin Jackson, Xingyu Chen, S. M. Hadi Sadati, Christos Bergeles, Alejandro Granados, Thomas C Booth 2/24/2026

Toward AI Autonomous Navigation for Mechanical Thrombectomy using Hierarchical Modular Multi-agent Reinforcement Learning (HM-MARL)

Hierarchical multi-agent reinforcement learning framework for autonomous navigation in endovascular mechanical thrombectomy procedures.

Ax Ibrahim Kilinc, Robert W. Heath Jr 2/24/2026

Heterogeneity-agnostic AI/ML-assisted beam selection for multi-panel arrays

ML-based beam selection for heterogeneous antenna arrays using location information to reduce training overhead.

Ax Martin Bertran, Riccardo Fogliato, Zhiwei Steven Wu 2/24/2026

Many AI Analysts, One Dataset: Navigating the Agentic Data Science Multiverse

Using AI agents to conduct multiple independent analyses on same dataset, demonstrating variability in research conclusions from analytic choices.

Ax Yifei Sun, James M. Shine, Robert D. Sanders, Robin F. H. Cash, Sharon L. Naismith, Fernando Calamante, Jinglei Lv 2/24/2026

A Data-Driven Method to Map the Functional Organisation of Human Brain White Matter

Data-driven framework integrating diffusion and functional MRI to map brain white matter neural communication pathways.

Ax Kyurae Kim, Qiang Fu, Yi-An Ma, Jacob R. Gardner, Trevor Campbell 2/24/2026

Stochastic Gradient Variational Inference with Price's Gradient Estimator from Bures-Wasserstein to Parameter Space

Theoretical work on stochastic gradient variational inference for approximating distributions using Wasserstein metrics.

Ax Bo Liang, Chen Gong, Haobo Wang, Qirui Liu, Rungui Zhou, Fengzhi Shao, Yubo Wang, Wei Gao, Kaichen Zhou, Guolong Cui, Chenren Xu 2/24/2026

WiCompass: Oracle-driven Data Scaling for mmWave Human Pose Estimation

mmWave pose estimation framework using motion-capture data for improved robustness to distribution shifts.

Ax Naoya Hashimoto, Yuta Kawakami, Jin Tian 2/24/2026

Bounds and Identification of Joint Probabilities of Potential Outcomes and Observed Variables under Monotonicity Assumptions

Causal inference method for bounding and identifying joint probabilities under monotonicity assumptions via linear programming.

Ax Chun Yan Ryan Kan, Tommy Tran, Vedant Yadav, Ava Cai, Kevin Zhu, Ruizhe Li, Maheep Chaudhary 2/24/2026

MANATEE: Inference-Time Lightweight Diffusion Based Safety Defense for LLMs

MANATEE: inference-time defense against adversarial jailbreaks using density estimation on benign representation manifolds.

Ax Mubshra Zulfiqar, Muhammad Ayzed Mirza, Basit Qureshi 2/24/2026

Carbon-aware decentralized dynamic task offloading in MIMO-MEC networks via multi-agent reinforcement learning

Multi-agent reinforcement learning for dynamic task offloading in edge computing with renewable energy constraints.

Ax Debalina Ghosh Paul, Hong Zhu, Ian Bayley 2/24/2026

Operational Robustness of LLMs on Code Generation

Study of LLM robustness to natural language variations in code generation tasks, addressing sensitivity in developer applications.

Ax Tommoro Robotics, :, Jesoon Kang, Taegeon Park, Jisu An, Soo Min Kimm, Jaejoon Kim, Jinu Pahk, Byungju Kim, Junseok Lee, Namheon Baek, Sungwan Ha, Hojun Baek, Eduardo Ayerve Cruz, Wontae Kim, Junghyeon Choi, Yousuk Lee, Joonmo Han, Sunghyun Cho, Sunghyun Kwon, Soyoung Lee, Jun Ki Lee, Seung-Joon Yi, Byoung-Tak Zhang, Theo Taeyeong Kim 2/24/2026