Isolater - Feed

Ax Anirudh Satheesh, Ziyi Chen, Furong Huang, Heng Huang 2/13/2026

Provably Efficient Algorithms for S- and Non-Rectangular Robust MDPs with General Parameterization

Provably efficient algorithms for robust MDPs with general policy parameterization, reducing to entropy-regularized formulations.

Ax Dibyanayan Bandyopadhyay, Asif Ekbal 2/13/2026

Sparse Semantic Dimension as a Generalization Certificate for LLMs

Mathematical framework explaining LLM generalization through sparse low-dimensional manifold geometry of activation states rather than parameter count.

Ax Qingsong Wang, Mikhail Belkin, Yusu Wang 2/13/2026

General and Efficient Steering of Unconditional Diffusion

Efficient steering method for unconditional diffusion models enabling controllable generation without gradient guidance or retraining.

Ax Chongyi Zheng, Royina Karegoudra Jayanth, Benjamin Eysenbach 2/13/2026

Can We Really Learn One Representation to Optimize All Rewards?

Investigates whether a single learned representation can optimize multiple reward functions in RL, studying representation learning for multi-objective policies.

Ax David Pardoe, Neil Daftary, Miro Furtado, Aditya Aiyer, Yu Wang, Liuqing Li, Tao Song, Lars Hertel, Young Jin Yun, Senthil Radhakrishnan, Zhiwei Wang, Tommy Li, Khai Tran, Ananth Nagarajan, Ali Naqvi, Yue Zhang, Renpeng Fang, Avi Romascanu, Arjun Kulothungun, Deepak Kumar, Praneeth Boda, Fedor Borisyuk, Ruoyan Wang 2/13/2026

CADET: Context-Conditioned Ads CTR Prediction With a Decoder-Only Transformer

CADET applies decoder-only transformer architecture to CTR prediction in ads systems, addressing challenges of contextual post-scoring constraints.

Ax Md Rakibul Haque, Vishwa Goudar, Shireen Elhabian, Warren Woodrich Pettine 2/13/2026

TimeSynth: A Framework for Uncovering Systematic Biases in Time Series Forecasting

TimeSynth framework for evaluating time series forecasting models and uncovering systematic biases in benchmarking nonlinear vs linear approaches.

Ax Nghia Nguyen, Tianjiao Ding, Ren\'e Vidal 2/13/2026

Hierarchical Concept Embedding & Pursuit for Interpretable Image Classification

Interpretable image classification using hierarchical concept embeddings derived from vision-language models for sparse concept recovery.

Ax Jared Levy, Aarti Lalwani, Elijah Wyckoff, Kenneth J. Loh, Sara P. Gombatto, Rose Yu, Emilia Farcas 2/13/2026

Assessing Low Back Movement with Motion Tape Sensor Data Through Deep Learning

Deep learning approach for classifying lower back movements from motion tape sensor data to support remote physical therapy monitoring.

Ax Kazuki Haishima, Kyohei Suzuki, Konstantinos Slavakis 2/13/2026

External Division of Two Bregman Proximity Operators for Poisson Inverse Problems

Novel sparse recovery method for Poisson inverse problems using Bregman proximity operators and NoLips algorithm.

Ax Xuan Yu, Xu Wang, Rui Zhu, Yudong Zhang, Yang Wang 2/13/2026

Exploring Multiple High-Scoring Subspaces in Generative Flow Networks

Research on Generative Flow Networks: methods for biasing GFlowNets toward high-reward solutions in combinatorial optimization.

Ax Xuan Yu, Xu Wang, Rui Zhu, Yudong Zhang, Yang Wang 2/13/2026

Partial GFlowNet: Accelerating Convergence in Large State Spaces via Strategic Partitioning

Partial GFlowNet accelerates convergence in large state spaces via planner-based partitioning, improving generative flow network scalability.

Ax Diptarka Chakraborty, Kushagra Chatterjee, Debarati Das, Tien-Long Nguyen 2/13/2026

A Generic Framework for Fair Consensus Clustering in Streams

Framework for fair consensus clustering in multi-agent streaming environments under proportionate fairness constraints.

Ax Jiangkai Xiong, Kalyan Talluri, Hanzhao Wang 2/13/2026

Calibrating an Imperfect Auxiliary Predictor for Unobserved No-Purchase Choice

Calibrates auxiliary predictors for multinomial logit models with missing consumer choice data in market estimation.

Ax Zhen Bi, Xueshu Chen, Luoyang Sun, Yuhang Yao, Qing Shen, Jungang Lou, Cheng Deng 2/13/2026

RooflineBench: A Benchmarking Framework for On-Device LLMs via Roofline Analysis

RooflineBench framework benchmarks small language models on edge hardware using roofline analysis for performance characterization across architectures.

Ax Li He, Qiang Qu, He Zhao, Stephen Wan, Dadong Wang, Lina Yao, Tongliang Liu 2/13/2026

Unifying Stable Optimization and Reference Regularization in RLHF

Unified framework addressing reward hacking and optimization instability in RLHF by combining KL regularization and policy ratio clipping.

Ax Congmin Zheng, Xiaoyun Mo, Xinbei Ma, Qiqiang Lin, Yin Zhao, Jiachen Zhu, Xingyu Lou, Jun Wang, Zhaoxiang Wang, Weiwen Liu, Zhuosheng Zhang, Yong Yu, Weinan Zhang 2/13/2026

Adaptive Milestone Reward for GUI Agents

Adaptive Milestone Reward addresses temporal credit assignment in RL-trained GUI agents by balancing outcome and process reward with adaptive thresholds.

Ax Eunyeong Cho, Jehyeon Bang, Ranggi Hwang, Minsoo Rhu 2/13/2026

PASCAL: A Phase-Aware Scheduling Algorithm for Serving Reasoning-based Large Language Models

PASCAL phase-aware scheduling algorithm optimizes serving of reasoning-based LLMs by distinguishing reasoning and answering phases for improved latency.

Ax Zhihang Yuan, Zhiyuan Liu, Mahesh K. Marina 2/13/2026

AltTS: A Dual-Path Framework with Alternating Optimization for Multivariate Time Series Forecasting

AltTS dual-path framework with alternating optimization separates autoregressive dynamics from cross-dimension interactions in multivariate time series forecasting.

Ax Jingkun Liu, Yisong Yue, Max Welling, Yue Song 2/13/2026

Krause Synchronization Transformers

Krause Attention mechanism prevents representation collapse in transformers by decoupling softmax normalization inspired by bounded-confidence dynamics.

Ax Luis Olmos, Rashida Hasan 2/13/2026

Real-Time Proactive Anomaly Detection via Forward and Backward Forecast Modeling

Proactive anomaly detection using forward and backward forecast modeling for early warning signals in industrial, financial, cybersecurity applications.

Ax Yuanfu Wang, Zhixuan Liu, Xiangtian Li, Chaochao Lu, Chao Yang 2/13/2026

Native Reasoning Models: Training Language Models to Reason on Unverifiable Data

Native Reasoning Models trains language models to reason without external verifiers or fully-annotated data, extending RLVR paradigm to unverifiable domains.

Ax Sisuo Lyu, Siru Zhong, Tiegang Chen, Weilin Ruan, Qingxiang Liu, Taiqiang Lv, Qingsong Wen, Raymond Chi-Wing Wong, Yuxuan Liang 2/13/2026

TS-Memory: Plug-and-Play Memory for Time Series Foundation Models

TS-Memory adds plug-and-play memory module to time series foundation models for efficient adaptation under distribution shift without catastrophic forgetting.

Ax Jichu Li, Xuan Tang, Difan Zou 2/13/2026

The Implicit Bias of Steepest Descent with Mini-batch Stochastic Gradient

Studies implicit bias of mini-batch stochastic steepest descent in multiclass classification under various norm geometries.

Ax Fanqi Shen, Enhong Yang, Jiahe Li, Junru Hong, Xiaoran Pan, Zhizhang Yuan, Meng Li, Yang Yang 2/13/2026

Brain4FMs: A Benchmark of Foundation Models for Electrical Brain Signal

Benchmark evaluating foundation models pretrained on brain electrical signals for EEG and intracranial recordings in neuroscience.

Ax Yujie Gu, Richeng Jin, Zhaoyang Zhang, Huaiyu Dai 2/13/2026

Gradient Compression May Hurt Generalization: A Remedy by Synthetic Data Guided Sharpness Aware Minimization

Analyzes gradient compression effects on loss landscapes in federated learning, proposing sharpness-aware minimization remedy for generalization.

Ax Yair Schiff, Omer Belhasin, Roy Uziel, Guanghan Wang, Marianne Arriola, Gilad Turok, Michael Elad, Volodymyr Kuleshov 2/13/2026

Learn from Your Mistakes: Self-Correcting Masked Diffusion Models

Framework enabling masked diffusion models to perform token correction after unmasking, reducing error accumulation in parallel generation.

Ax Naveen Sahi, Jeremy Dohmann, Armen Aghajanyan, Akshat Shrivastava 2/13/2026

SkillRater: Untangling Capabilities in Multimodal Data

SkillRater decomposes data quality into multidimensional capabilities rather than single scores, improving data curation for model training.

Ax Tatsuya Sagawa, Ryosuke Kojima 2/13/2026

How Well Do Large-Scale Chemical Language Models Transfer to Downstream Tasks?

Evaluates transfer learning performance of large-scale chemical language models across downstream molecular property prediction tasks.

Ax Weida Li, Yaoliang Yu, Bryan Kian Hsiang Low 2/13/2026

TreeGrad-Ranker: Feature Ranking via $O(L)$-Time Gradients for Decision Trees

TreeGrad-Ranker uses probabilistic values to rank features in decision trees for local prediction explanation via efficient gradient computation.

Ax Wenqian Chen, Yucheng Fu, Michael Penwarden, Pratanu Roy, Panos Stinis 2/13/2026

ArGEnT: Arbitrary Geometry-encoded Transformer for Operator Learning

ArGEnT transformer learns solution operators for physical systems with complex geometries, enabling surrogate modeling across varying parametric settings.

Ax Dongxiao He, Wenxuan Sun, Yongqi Huang, Jitao Zhao, Di Jin 2/13/2026

GP2F: Cross-Domain Graph Prompting with Adaptive Fusion of Pre-trained Graph Neural Networks

Graph prompt learning framework adapting pre-trained GNNs across domains via adaptive fusion and cross-domain knowledge transfer.

Ax Jianhua Wang, Yinlin Su 2/13/2026

TIP: Resisting Gradient Inversion via Targeted Interpretable Perturbation in Federated Learning

Defense against gradient inversion attacks in federated learning using targeted interpretable perturbation preserving model utility.

Ax Yinlin Zhu, Di Wu, Xu Wang, Guocong Quan, Miao Hu 2/13/2026

Both Topology and Text Matter: Revisiting LLM-guided Out-of-Distribution Detection on Text-attributed Graphs

LLM-guided out-of-distribution detection for text-attributed graphs combining topology and text features for unseen patterns.

Ax Tingkai Jia, Cheng Chen 2/13/2026

Fully First-Order Algorithms for Online Bilevel Optimization

First-order algorithms for online bilevel optimization eliminating need for Hessian-vector product computation.

Ax David Fuentes-Jim\'enez, Sara Garc\'ia-de-Villa, David Casillas-P\'erez, Pablo Flor\'ia, Francisco-Manuel Melgarejo-Meseguer 2/13/2026

Explainable Machine-Learning based Detection of Knee Injuries in Runners

ML-based system detecting knee injuries in runners using optical motion capture and explainable machine learning.

Ax Joey Zhong, Hao Zhang, Clare Southern, Jeremy Yang, Thomas Wang, Kate Jung, Shu Zhang, Denis Yarats, Johnny Ho, Jerry Ma 2/13/2026

DRACO: a Cross-Domain Benchmark for Deep Research Accuracy, Completeness, and Objectivity

Benchmark of complex deep research tasks across 10 domains from real-world usage patterns, measuring accuracy, completeness, objectivity.

Ax Oliver Zahn, Matt Beton, Simran Chana 2/13/2026

ANML: Attribution-Native Machine Learning with Guaranteed Robustness

Framework weighting training samples by quality factors including gradient consistency and verification status for specialized expert data.

Ax Chengting Yu, Xiaobo Shu, Yadao Wang, Yizhen Zhang, Haoyi Wu, You Wu, Rujiao Long, Ziheng Chen, Yuchi Xu, Wenbo Su, Bo Zheng 2/13/2026

SpiralFormer: Looped Transformers Can Learn Hierarchical Dependencies via Multi-Resolution Recursion

Recursive Transformer architecture learning hierarchical dependencies through multi-resolution recursion with shared layers.

Ax Yongyao Wang, Ziqi Miao, Lu Yang, Haonan Jia, Wenting Yan, Chen Qian, Lijun Li 2/13/2026

TabSieve: Explicit In-Table Evidence Selection for Tabular Prediction

Framework for tabular prediction using explicit in-table evidence selection, making row context auditable and interpretable.

Ax Luigi Simeone 2/13/2026

Potential-energy gating for robust state estimation in bistable stochastic systems

Physics-based state estimation method using potential-energy gating for robust filtering in bistable stochastic systems.

Ax Haolei Bai, Lingcheng Kong, Xueyi Chen, Jianmian Wang, Zhiqiang Tao, Huan Wang 2/13/2026

DICE: Diffusion Large Language Models Excel at Generating CUDA Kernels

Diffusion LLM approach for CUDA kernel code generation leveraging parallel token generation and non-sequential refinement.

Ax Shervin Ghasemlou 2/13/2026

Dopamine: Brain Modes, Not Brains

Parameter-efficient fine-tuning method viewing adaptation as neuromodulation-inspired mode selection and rescaling of pretrained computations.

Ax Ilya Kuleshov, Alexander Marusov, Alexey Zaytsev 2/13/2026

U-Former ODE: Fast Probabilistic Forecasting of Irregular Time Series

U-Former ODE architecture for fast probabilistic forecasting of irregularly sampled time series using neural differential equations.

Ax Zhihang Yuan, Leyang Xue, Waleed Ahsan, Mahesh K. Marina 2/13/2026

TUBO: A Tailored ML Framework for Reliable Network Traffic Forecasting

ML framework for reliable network traffic forecasting using deep learning adapted for traffic characteristics.

Ax Cl\'audio Correia, Alberto E. A. Ferreira, Lucas Martins, Miguel P. Bento, Sofia Guerreiro, Ricardo Ribeiro Pereira, Ana Sofia Gomes, Jacopo Bono, Hugo Ferreira, Pedro Bizarro 2/13/2026

MUSE: Multi-Tenant Model Serving With Seamless Model Updates

Multi-tenant model serving system handling seamless model updates with dynamic decision threshold management.

Ax Haoran Dang, Cuiling Lan, Hai Wan, Xibin Zhao, Yan Lu 2/13/2026

Temperature as a Meta-Policy: Adaptive Temperature in LLM Reinforcement Learning

Framework treating temperature as adaptive meta-policy in LLM reinforcement learning to improve exploration-exploitation tradeoff.

Ax Ainhize Barrainkua, Santiago Mazuelas, Novi Quadrianto, Jose A. Lozano 2/13/2026

Safe Fairness Guarantees Without Demographics in Classification: Spectral Uncertainty Set Perspective

Method for fair classification without demographic information using spectral uncertainty sets.

Ax Keita Broadwater 2/13/2026

Evaluating LLM Safety Under Repeated Inference via Accelerated Prompt Stress Testing

Benchmark for evaluating LLM safety under repeated inference via prompt stress testing, addressing consistency failures in deployment.

Ax Sebastian Zeng, Andreas Petersson, Wolfgang Bock 2/13/2026

Latent-Variable Learning of SPDEs via Wiener Chaos

Method for learning stochastic partial differential equations from spatiotemporal observations using latent-variable formulation and deep learning.

Ax Jiafei Lyu, Jingwen Yang, Zhongjian Qiao, Runze Liu, Zeyuan Liu, Deheng Ye, Zongqing Lu, Xiu Li 2/13/2026

Temporal Difference Learning with Constrained Initial Representations

Enhances off-policy RL sample efficiency by constraining initial representations to address distribution shift and stabilize training.