Isolater - Feed

Ax Orin Levy, Aviv Rosenberg, Alon Cohen, Yishay Mansour 2/17/2026

Near-Optimal Regret for Policy Optimization in Contextual MDPs with General Offline Function Approximation

OPO-CMDP presents first policy optimization algorithm for contextual MDPs with general offline function approximation achieving near-optimal regret bounds.

Ax Xin Yan, Zhenglin Wan, Feiyang Ye, Xingrui Yu, Hangyu Du, Yang You, Ivor Tsang 2/17/2026

HBVLA: Pushing 1-Bit Post-Training Quantization for Vision-Language-Action Models

HBVLA applies 1-bit post-training quantization to vision-language-action models for efficient deployment on resource-constrained robots and edge devices.

Ax Talha Ansar, Muhammad Mujtaba Abbas, Ramit Debnath, Vivek Dua, Waqar Muhammad Ashraf 2/17/2026

Data-driven Bi-level Optimization of Thermal Power Systems with embedded Artificial Neural Networks

Bi-level optimization framework using neural networks for operational optimization of thermal power systems with hierarchical variables.

Ax ZhiMing Li, JiaHe Feng 2/17/2026

Discrete Double-Bracket Flows for Isotropic-Noise Invariant Eigendecomposition

Novel matrix-free eigendecomposition method using discrete double-bracket flows that is invariant to isotropic noise shifts.

Ax Youwei Shu, Shaomian Zheng, Dingnan Jin, Wenjie Qu, Ziyao Guo, Qing Cui, Jun Zhou, Jiaheng Zhang 2/17/2026

On Representation Redundancy in Large-Scale Instruction Tuning Data Selection

Study of instruction-tuning data selection for LLMs using semantic representation similarity to identify redundancy in large-scale datasets.

Ax Xiaoyun Yu, Li fan, Xiangfei Qiu, Nanqing Dong, Yonggui Huang, Honggang Qi, Geguang Pu, Wanli Ouyang, Xi Chen, Jilin Hu 2/17/2026

MEMTS: Internalizing Domain Knowledge via Parameterized Memory for Retrieval-Free Domain Adaptation of Time Series Foundation Models

MEMTS introduces parameterized memory for domain adaptation of time series foundation models to handle temporal distribution shifts and domain-specific patterns.

Ax Marc Boubnovski Martell, Josefa Lia Stoisser, Lawrence Phillips, Aditya Misra, Robert Kitchen, Jesper Ferkinghoff-Borg, Jialin Yu, Philip Torr, Kaspar M\"arten 2/17/2026

MechPert: Mechanistic Consensus as an Inductive Bias for Unseen Perturbation Prediction

MechPert predicts transcriptional responses to unseen genetic perturbations using mechanistic consensus as inductive bias, combining knowledge graphs with LLM reasoning.

Ax Xiaoyu Tao, Mingyue Cheng, Chuang Jiang, Tian Gao, Huanjian Zhang, Yaguo Liu 2/17/2026

Cast-R1: Learning Tool-Augmented Sequential Decision Policies for Time Series Forecasting

Cast-R1 applies tool-augmented sequential decision policies and iterative reasoning to time series forecasting, enabling autonomous evidence acquisition and prediction revision.

Ax Yutong Du, Zicheng Liu, Yi Huang, Bazargul Matkerim, Bo Qi, Yali Zong, Peixian Han 2/17/2026

Fast Physics-Driven Untrained Network for Highly Nonlinear Inverse Scattering Problems

Physics-driven Fourier-spectral solver for untrained neural networks applied to electromagnetic inverse scattering via spectral-domain optimization.

Ax Xiaoyu Tao, Yuchong Wu, Mingyue Cheng, Ze Guo, Tian Gao 2/17/2026

AnomaMind: Agentic Time Series Anomaly Detection with Tool-Augmented Reasoning

AnomaMind uses agentic reasoning with tool augmentation for time series anomaly detection, framing it as evidence-driven diagnosis rather than fixed discriminative prediction.

Ax Guojian Zhan, Letian Tao, Pengcheng Wang, Yixiao Wang, Yiheng Li, Yuxin Chen, Masayoshi Tomizuka, Shengbo Eben Li 2/17/2026

Mean Flow Policy with Instantaneous Velocity Constraint for One-step Action Generation

Mean velocity policy for reinforcement learning enabling fast one-step action generation with velocity constraints.

Ax Jorge Carrasco-Pollo, Floor Eijkelboom, Jan-Willem van de Meent 2/17/2026

Pawsterior: Variational Flow Matching for Structured Simulation-Based Inference

Variational flow-matching framework for simulation-based inference respecting structured domains with discrete-continuous variables.

Ax Weixuan Yuan, Zengrui Jin, Yichen Wang, Donglin Xie, Ziyi Ye, Chao Zhang, Xuesong Chen 2/17/2026

sleep2vec: Unified Cross-Modal Alignment for Heterogeneous Nocturnal Biosignals

Foundation model for multimodal sleep biosignals handling heterogeneous devices and sensor dropout for sleep staging.

Ax Ouns El Harzli, Yoonsoo Nam, Ilja Kuzborskij, Bernardo Cuenca Grau, Ard A. Louis 2/17/2026

Sufficient Conditions for Stability of Minimum-Norm Interpolating Deep ReLU Networks

Theoretical analysis of algorithmic stability and generalization error bounds for minimum-norm deep ReLU networks.

Ax Juntong Wang, Libin Chen, Xiyuan Wang, Shijia Kang, Haotong Yang, Da Zheng, Muhan Zhang 2/17/2026

GREPO: A Benchmark for Graph Neural Networks on Repository-Level Bug Localization

Graph neural network benchmark for repository-level bug localization using code graph structure beyond standard LLM context windows.

Ax Zhimin Zhao 2/17/2026

Why Code, Why Now: Learnability, Computability, and the Real Limits of Machine Learning

Analysis comparing code generation learnability to reinforcement learning, proposing hierarchy of feedback quality as ML progress ceiling.

Ax Dat Le, Duc-Cuong Le, Anh-Son Nguyen, Tuan-Dung Bui, Thu-Trang Nguyen, Son Nguyen, Hieu Dinh Vo 2/17/2026

A Multi-Agent Framework for Code-Guided, Modular, and Verifiable Automated Machine Learning

Multi-agent AutoML framework using LLM-based code generation with modular architecture to reduce hallucinations and improve verifiability.

Ax Adolfo Gonz\'alez, V\'ictor Parada 2/17/2026

An Adaptive Model Selection Framework for Demand Forecasting under Horizon-Induced Degradation to Support Business Strategy and Operations

Adaptive model selection framework for demand forecasting across multiple SKUs and planning horizons.

Ax Sam Dauncey, Roger Wattenhofer 2/17/2026

You Can Learn Tokenization End-to-End with Reinforcement Learning

End-to-end learnable tokenization for LLMs using reinforcement learning instead of hardcoded compression steps.

Ax Taiwei Shi, Sihao Chen, Bowen Jiang, Linxin Song, Longqi Yang, Jieyu Zhao 2/17/2026

Experiential Reinforcement Learning

Training paradigm embedding experience replay in reinforcement learning for LMs to learn from sparse, delayed environmental feedback.

Ax Yuhang Li, Reena Elangovan, Xin Dong, Priyadarshini Panda, Brucek Khailany 2/17/2026

QuRL: Efficient Reinforcement Learning with Quantized Rollout

Quantized reinforcement learning for LLM training that accelerates rollout efficiency by 30% using quantized actor networks.

Ax Ho-Hsuan Wang, Afnan Sultan, Andrea Volkamer, Dietrich Klakow 2/17/2026

Chemical Language Models for Natural Products: A State-Space Model Approach

State-space models (Mamba) applied to natural product chemistry for molecular property prediction and generation.

Ax Zedong Wang, Yuyang Wang, Ijay Narang, Felix Wang, Yuzhou Wang, Siva Theja Maguluri 2/17/2026

Steady-State Behavior of Constant-Stepsize Stochastic Approximation: Gaussian Approximation and Tail Bounds

Theoretical analysis of constant-stepsize stochastic approximation with Gaussian approximations and tail bounds for convergence.

Ax Chenyue Li, Wen Deng, Zhuotao Sun, Mengxi Jin, Hanzhe Cui, Han Li, Shentong Li, Man Kit Yu, Ming Long Lai, Yuhao Yang, Mengqian Lu, Binhang Yuan 2/17/2026

S2SServiceBench: A Multimodal Benchmark for Last-Mile S2S Climate Services

Multimodal benchmark for evaluating climate forecasting services using large language models for decision-making under uncertainty.

Ax Xinxing Zhou, Qingren Yao, Yiji Zhao, Chenghao Liu, Flora Salim, Xiaojie Yuan, Yanlong Wen, Ming Jin 2/17/2026

EIDOS: Latent-Space Predictive Learning for Time Series Foundation Models

Foundation model for time series that uses latent-space predictive learning instead of direct future value prediction.

Ax Yue Wang, Areg Karapetyan, Djellel Difallah, Samer Madanat 2/17/2026

UniST-Pred: A Robust Unified Framework for Spatio-Temporal Traffic Forecasting in Transportation Networks Under Disruptions

Spatio-temporal forecasting framework for traffic prediction under structural and observational uncertainties in transportation networks.

Ax Atsushi Shimizu, Shohei Taniguchi, Yutaka Matsuo 2/17/2026

Position Encoding with Random Float Sampling Enhances Length Generalization of Transformers

Position encoding technique using random float sampling to improve transformer length generalization beyond pretraining sequence lengths.

Ax Kai Zhang, Xuanyu Cao, Khaled B. Letaief 2/17/2026

Decentralized Federated Learning With Energy Harvesting Devices

Federated learning system for edge devices using energy harvesting to reduce battery depletion during collaborative model training.

Ax Yaqian Zhang, Bernhard Pfahringer, Eibe Frank, Albert Bifet 2/17/2026

Policy Gradient with Adaptive Entropy Annealing for Continual Fine-Tuning

Parameter-efficient fine-tuning for vision models using policy gradient with adaptive entropy annealing to prevent catastrophic forgetting in class-incremental learning.

Ax Jae-Hwan Choi, Jiwoo Yoon, Dohyun Kwon, Jaewoong Choi 2/17/2026

Neural Optimal Transport in Hilbert Spaces: Characterizing Spurious Solutions and Gaussian Smoothing

Theoretical analysis of Neural Optimal Transport in Hilbert spaces, addressing spurious solutions through regular measures framework and Gaussian smoothing.

Ax Luigi Ciceri, Corrado Mio, Jianyi Lin, Gabriele Gianini 2/17/2026

Geometry-Aware Physics-Informed PointNets for Modeling Flows Across Porous Structures

Physics-informed PointNets and geometry-aware neural operators for modeling flows across porous structures with coupled physics and diverse geometries.

Ax Anton Korznikov, Andrey Galichin, Alexey Dontsov, Oleg Rogov, Ivan Oseledets, Elena Tutubalina 2/17/2026

Sanity Checks for Sparse Autoencoders: Do SAEs Beat Random Baselines?

Sanity checks validating whether sparse autoencoders recover meaningful features beyond random baselines for neural network interpretability.

Ax Xuanbo Su, Hao Luo, Yingfang Zhang, Lijun Zhang 2/17/2026

ROAST: Rollout-based On-distribution Activation Steering Technique

ROAST uses on-distribution rollouts for parameter-efficient LLM activation steering at inference time, replacing off-distribution supervision with continuous soft scaling.

Ax Rizhen Hu, Yuan Cao, Boao Kong, Mou Sun, Kun Yuan 2/17/2026

Synergistic Intra- and Cross-Layer Regularization Losses for MoE Expert Specialization

Plug-and-play regularization losses for Mixture-of-Experts models promoting expert specialization across intra- and cross-layers without structural modifications.

Ax Max Fomin 2/17/2026

When Benchmarks Lie: Evaluating Malicious Prompt Classifiers Under True Distribution Shift

Comprehensive analysis of malicious prompt classifier robustness under distribution shift with 18 datasets spanning jailbreaks and prompt injections for LLM agents.

Ax Yiran Guo, Zhongjian Qiao, Yingqi Xie, Jie Liu, Dan Ye, Ruiqing Zhang, Shuang Qiu, Lijie Xu 2/17/2026

Deep Dense Exploration for LLM Reinforcement Learning via Pivot-Driven Resampling

Pivot-driven resampling technique for deep dense exploration in LLM RL, discovering high-quality trajectories within limited sampling budget from language space.

Ax Nicolas Zumarraga, Thomas Kaar, Ning Wang, Maxwell A. Xu, Max Rosenblattl, Markus Kreft, Kevin O'Sullivan, Paul Schmiedmayer, Patrick Langer, Robert Jakob 2/17/2026

TS-Haystack: A Multi-Scale Retrieval Benchmark for Time Series Language Models

TS-Haystack benchmark evaluates time series language models on long-context retrieval with millions of datapoints, requiring precise temporal localization.

Ax Jinbo Wang, Binghui Li, Zhanpeng Zhou, Mingze Wang, Yuxuan Sun, Jiaqi Zhang, Xunliang Cai, Lei Wu 2/17/2026

Fast Catch-Up, Late Switching: Optimal Batch Size Scheduling via Functional Scaling Laws

Characterizes optimal batch size scheduling for large-scale deep learning under fixed data budget using functional scaling law framework.

Ax Omin Kwon, Yeonjae Kim, Doyeon Kim, Minseo Kim, Yeonhong Park, Jae W. Lee 2/17/2026

MAGE: All-[MASK] Block Already Knows Where to Look in Diffusion LLM

MAGE optimizes KV cache memory access in block diffusion LLMs for long-context settings using dynamic sparse attention adapted to block diffusion uniqueness.

Ax Seyedsaman Emami, Daniel Hern\'andez-Lobato, Gonzalo Mart\'inez-Mu\~noz 2/17/2026

Robust multi-task boosting using clustering and local ensembling

RMB-CLE framework for multi-task learning integrating error-based task clustering with local ensembling to mitigate negative transfer from unrelated tasks.

Ax Yaxuan Kong, Hoyoung Lee, Yoontae Hwang, Alejandro Lopez-Lira, Bradford Levy, Dhagash Mehta, Qingsong Wen, Chanyeol Choi, Yongjae Lee, Stefan Zohren 2/17/2026

Evaluating LLMs in Finance Requires Explicit Bias Consideration

Analysis identifying five recurring biases in financial LLM applications: look-ahead, survivorship, narrative, objective, and cost bias that invalidate deployment claims.

Ax Pinqiao Wang, Sheng Li 2/17/2026

Multi-Agent Debate: A Unified Agentic Framework for Tabular Anomaly Detection

MAD framework treats tabular anomaly detection as multi-agent debate, leveraging disagreement from heterogeneous model families under distribution shift and rare-anomaly regimes.

Ax Manal Rahal, Bestoun S. Ahmed, Roger Renstr\"om, Robert Stener 2/17/2026

Cross-household Transfer Learning Approach with LSTM-based Demand Forecasting

Transfer learning approach using LSTM for cross-household hot water demand forecasting to optimize heat pump operation and reduce energy waste.

Ax Yilun Kuang, Yash Dagade, Deep Chakraborty, Erik Learned-Miller, Randall Balestriero, Tim G. J. Rudner, Yann LeCun 2/17/2026

Radial-VCReg: More Informative Representation Learning Through Radial Gaussianization

Radial-VCReg augments VCReg with radial Gaussianization loss for improved self-supervised representation learning by aligning feature norms with Chi distribution.

Ax Boning Zhou, Ziyu Wang, Han Hong, Haoqi Hu 2/17/2026

Integrating Unstructured Text into Causal Inference: Empirical Evidence from Real Data

Framework leveraging transformer-based language models for causal inference from unstructured text, comparing estimates against structured data baselines.

Ax Lamine Rihani 2/17/2026

Reverse N-Wise Output-Oriented Testing for AI/ML and Quantum Computing Systems

Testing methodology for AI/ML and quantum systems addressing high-dimensional inputs, probabilistic outputs, and evaluation of trustworthiness, fairness, and robustness.

Ax Ruomeng Ding, Tianwei Gao, Thomas P. Zollo, Eitan Bachmat, Richard Zemel, Zhun Deng 2/17/2026

Whom to Query for What: Adaptive Group Elicitation via Multi-Turn LLM Interactions

Framework for adaptive multi-turn LLM interactions to efficiently elicit group-level information from surveys, optimizing respondent selection and questioning strategy.

Ax Kris Shengjun Dong, Sahil Modi, Dima Nikiforov, Sana Damani, Edward Lin, Siva Kumar Sastry Hari, Christos Kozyrakis 2/17/2026

KernelBlaster: Continual Cross-Task CUDA Optimization via Memory-Augmented In-Context Reinforcement Learning

KernelBlaster uses agentic workflows with in-context RL to optimize CUDA code across GPU architectures, aggregating knowledge from prior optimizations without expensive finetuning.

Ax Edwin Chen, Zulekha Bibi 2/17/2026

Machine Learning as a Tool (MLAT): A Framework for Integrating Statistical ML Models as Callable Tools within LLM Agent Workflows

MLAT framework exposes pre-trained ML models as callable tools within LLM agent workflows, enabling agents to invoke quantitative predictions and reason about outputs contextually.

Ax Songyuan Li, Jia Hu, Ahmed M. Abdelmoniem, Geyong Min, Haojun Huang, Jiwei Huang 2/17/2026

DeepFusion: Accelerating MoE Training via Federated Knowledge Distillation from Heterogeneous Edge Devices

Federated learning approach (DeepFusion) for training MoE-based LLMs using knowledge distillation from heterogeneous edge devices, enabling privacy-preserving distributed training.