Isolater - Feed

Ax Muhammad Khalifa, Zohaib Khan, Omer Tafveez, Hao Peng, Lu Wang 3/10/2026

Countdown-Code: A Testbed for Studying The Emergence and Generalization of Reward Hacking in RLVR

Benchmark environment for studying reward hacking in RL agents through dual-access mathematical reasoning tasks.

Ax Tao Shi, Liangming Chen, Long Jin, Mengchu Zhou 3/10/2026

Combining Adam and its Inverse Counterpart to Enhance Generalization of Deep Learning Optimizers

InvAdam optimizer variant that improves generalization by finding flatter minima than standard Adam.

Ax Subhojyoti Mukherjee, Stefano Petrangeli, Branislav Kveton, Trung Bui, Franck Dernoncourt, Arko Mukherjee 3/10/2026

Agentic Planning with Reasoning for Image Styling via Offline RL

AI agent framework using offline RL for structured planning and reasoning in image editing tasks.

Ax Yuxuan Han, Meng-Hao Guo, Zhengning Liu, Wenguang Chen, Shi-Min Hu 3/10/2026

Making LLMs Optimize Multi-Scenario CUDA Kernels Like Experts

LLM-based system for automated CUDA kernel optimization across ML and scientific computing domains.

Ax Haonan Xu, Yang Yang 3/10/2026

Shaping Parameter Contribution Patterns for Out-of-Distribution Detection

Method to improve OOD detection by diversifying parameter contribution patterns in classifiers.

Ax Zhaoyang Ren, Qilin Li 3/10/2026

A Dual-Graph Spatiotemporal GNN Surrogate for Nonlinear Response Prediction of Reinforced Concrete Beams under Four-Point Bending

GNN surrogate model for simulating reinforced concrete beams under bending using spatiotemporal graphs.

Ax Jilong Liu, Yonghui Yang, Pengyang Shao, Haokai Ma, Wei Qin, Richang Hong 3/10/2026

wDPO: Winsorized Direct Preference Optimization for Robust LLM Alignment

wDPO improves DPO for LLM alignment by using winsorization to handle noisy preference data robustly.

Ax Yair Ashlagi, Roi Livni, Shay Moran, Tom Waknine 3/10/2026

Margin in Abstract Spaces

Theoretical analysis of margin-based learning in metric spaces and generalization guarantees independent of parameter count.

Ax Chuxue Cao, Honglin Lin, Zhanping Zhong, Xin Gao, Mengzhang Cai, Conghui He, Sirui Han, Lijun Wu 3/10/2026

Unlocking Data Value in Finance: A Study on Distillation and Difficulty-Aware Training

Empirical study on knowledge distillation and difficulty-aware training for improving LLM performance in finance domain.

Ax Kavyansh Tyagi, Vishwas Rathi, Puneet Goyal 3/10/2026

LightMedSeg: Lightweight 3D Medical Image Segmentation with Learned Spatial Anchors

Lightweight UNet-style architecture for 3D medical image segmentation with learned spatial anchors and anatomical priors.

Ax Andrea Giuseppe Di Francesco, Andrea Rubbi, Pietro Li\`o 3/10/2026

Retrieval-Augmented Generation for Predicting Cellular Responses to Gene Perturbation

PT-RAG uses retrieval-augmented generation to predict cellular responses to gene perturbations with improved generalization.

Ax Zixuan Yu, Zhenheng Tang, Tongliang Liu, Chengqi Zhang, Xiaowen Chu, Bo Han 3/10/2026

Rethinking Deep Research from the Perspective of Web Content Distribution Matching

WeDas framework improves web search agents by matching queries to web content distribution structures for better evidence retrieval.

Ax Chia-Fu Lin, Yi-Ju Tseng 3/10/2026

LF2L: Loss Fusion Horizontal Federated Learning Across Heterogeneous Feature Spaces Using External Datasets Effectively: A Case Study in Second Primary Cancer Prediction

Federated learning approach for predicting secondary cancer using heterogeneous features across hospitals.

Ax Madhurima Panja, Grace Younes, Tanujit Chakraborty 3/10/2026

Turning Time Series into Algebraic Equations: Symbolic Machine Learning for Interpretable Modeling of Chaotic Time Series

Symbolic machine learning method to convert chaotic time series into interpretable algebraic equations for forecasting.

Ax Ninda Nurseha Amalina, Heungjo An 3/10/2026

Adaptive Double-Booking Strategy for Outpatient Scheduling Using Multi-Objective Reinforcement Learning

Multi-objective reinforcement learning applied to outpatient clinic scheduling with adaptive double-booking policies.

Ax Nilesh Jain, Rohit Yadav, Sagar Kotian, Claude AI 3/10/2026

AutoResearch-RL: Perpetual Self-Evaluating Reinforcement Learning Agents for Autonomous Neural Architecture Discovery

AutoResearch-RL is an RL agent that autonomously conducts perpetual neural architecture and hyperparameter search via code modification without human supervision.

Ax Yiming Sun, Qi Cheng, Licheng Liu, Runlong Yu, Yiqun Xie, Xiaowei Jia 3/10/2026

Retrieval-Augmented Multi-scale Framework for County-Level Crop Yield Prediction Across Large Regions

Retrieval-augmented multi-scale framework for county-level crop yield prediction addressing regional and temporal challenges in agricultural forecasting.

Ax Angad Singh Ahuja 3/10/2026

Adversarial Latent-State Training for Robust Policies in Partially Observable Domains

Adversarial latent-state training framework for robust policies in partially observable MDPs under latent distribution shift with theoretical guarantees.

Ax Lujing Zhang, Daniel Hsu, Sivaraman Balakrishnan 3/10/2026

ShakyPrepend: A Multi-Group Learner with Improved Sample Complexity

ShakyPrepend applies differential privacy-inspired tools to multi-group learning for improved sample complexity and adaptation to group structure.

Ax Truong Xuan Khanh, Truong Quynh Hoa 3/10/2026

Norm-Hierarchy Transitions in Representation Learning: When and Why Neural Networks Abandon Shortcuts

Analyzes norm-hierarchy transitions explaining when neural networks transition from spurious shortcuts to structured representations during training.

Ax Antonio De Santis, Schrasing Tong, Marco Brambilla, Lalana Kagal 3/10/2026

Learning Concept Bottleneck Models from Mechanistic Explanations

Learning concept bottleneck models from mechanistic explanations instead of pre-specified or LLM-prompted concepts for improved interpretability and predictive power.

Ax Yuanyun Zhang, Shi Li 3/10/2026

Learning Clinical Representations Under Systematic Distribution Shift

Addresses representation entanglement between physiologic signal and institutional artifacts in clinical ML under systematic distribution shift from heterogeneous practices.

Ax Sean Gunn, Jorio Cocola, Oliver De Candido, Vaggos Chatziafratis, Paul Hand 3/10/2026

Latent Generative Models with Tunable Complexity for Compressed Sensing and other Inverse Problems

Develops tunable-complexity priors for diffusion models and normalizing flows to balance representation error and overfitting in inverse problem solving.

Ax Yucheng Xing, Xin Wang 3/10/2026

N-Tree Diffusion for Long-Horizon Wildfire Risk Forecasting

N-Tree Diffusion enables efficient long-horizon wildfire risk forecasting by hierarchically extending diffusion models across multiple prediction steps.

Ax Mohammed Alnemari, Rizwan Qureshi, Nader Begrazadah 3/10/2026

Scaling Laws in the Tiny Regime: How Small Models Change Their Mistakes

Examines neural scaling laws in sub-20M parameter regime for TinyML/edge AI, showing both ConvNets and MobileNetV2 follow power law error scaling.

Ax Hieu Le, Oguz Bedir, Mostafa Ibrahim, Jian Tao, Sabit Ekin 3/10/2026

Learning to Reflect: Hierarchical Multi-Agent Reinforcement Learning for CSI-Free mmWave Beam-Focusing

Hierarchical multi-agent RL framework for controlling reconfigurable intelligent surfaces in mmWave systems without channel state information estimation overhead.

Ax Xuxing Chen, Yun He, Jiayi Xu, Minhui Huang, Xiaoyi Liu, Boyang Liu, Fei Tian, Xiaohan Wei, Rong Jin, Sem Park, Bo Long, Xue Feng 3/10/2026

Feed m Birds with One Scone: Accelerating Multi-task Gradient Balancing via Bi-level Optimization

Accelerates multi-task learning gradient balancing through bi-level optimization to improve MGDA-type methods for handling task conflicts.

Ax Rian Atri 3/10/2026

Deterministic Fuzzy Triage for Legal Compliance Classification and Evidence Retrieval

Deterministic fuzzy triage system for legal compliance classification using dual encoders and transparent bands, demonstrated on contractual evidence HIPAA/NERC-CIP alignment.

Ax Ruixin Guo, Xinyu Li, Hao Zhou, Yang Zhou, Ruoming Jin 3/10/2026

Generalizing Linear Autoencoder Recommenders with Decoupled Expected Quadratic Loss

Generalizes linear autoencoder recommender systems by decoupling expected quadratic loss to improve hyperparameter flexibility beyond prior constraints.

Ax Shuzhang Zhong, Baotong Lu, Qi Chen, Chuanjie Liu, Fan Yang, Meng Li 3/10/2026

DualSpec: Accelerating Deep Research Agents via Dual-Process Action Speculation

DualSpec accelerates LLM-based research agents by speculating on actions during reasoning to reduce latency in long-horizon information-seeking tasks with tool use.

Ax Suorong Yang, Fangjian Su, Hai Gan, Ziqi Ye, Jie Li, Baile Xu, Furao Shen, Soujanya Poria 3/10/2026

Data Agent: Learning to Select Data via End-to-End Dynamic Optimization

Data Agent uses end-to-end optimization to dynamically select informative samples during training acceleration.

Ax Yi Tian, Kaiqing Zhang, Russ Tedrake, Suvrit Sra 3/10/2026

Cost-Driven Representation Learning for Linear Quadratic Gaussian Control: Part II

Cost-driven state representation learning for control tasks from high-dimensional partial observations.

Ax Yael S. Elmatad 3/10/2026

Discrete Tokenization Unlocks Transformers for Calibrated Tabular Forecasting

Tokenization approach enables transformers to outperform gradient boosting on tabular forecasting tasks.

Ax Mingxin Zhang, Xiaofeng Dai, Yu Yao, Ziqi Yin 3/10/2026

Contact-Guided 3D Genome Structure Generation of E. coli via Diffusion Transformers

Diffusion transformer framework generates 3D genome structures conditioned on Hi-C contact maps.

Ax Jianlu Shen, Fu Feng, Jiaze Xu, Yucheng Xie, Jiaqi Lv, Xin Geng 3/10/2026

A Unified Framework for Knowledge Transfer in Bidirectional Model Scaling

Unified framework for knowledge transfer between models of different sizes, enabling bidirectional scaling.

Ax Matea Marinova, Shashi Raj Pandey, Junya Shiraishi, Martin Voigt Vejling, Valentin Rakovic, Petar Popovski 3/10/2026

Online Continual Learning for Anomaly Detection in IoT under Data Distribution Shifts

OCLADS framework for continual learning in IoT anomaly detection under non-stationary data distributions.

Ax Chieh-Hsin Lai, Bac Nguyen, Naoki Murata, Yuhta Takida, Toshimitsu Uesaka, Yuki Mitsufuji, Stefano Ermon, Molei Tao 3/10/2026

A Unified View of Drifting and Score-Based Models

Theoretical analysis connecting drifting models and score-based generative models through kernel-weighted discrepancy.

Ax Heungjo An 3/10/2026

Reinforcement learning-based dynamic cleaning scheduling framework for solar energy system

RL framework optimizes cleaning schedules for solar panels using PPO algorithm in arid regions.

Ax Jianlu Shen, Fu Feng, Yucheng Xie, Jiaqi Lv, Xin Geng 3/10/2026

One-for-All Model Initialization with Frequency-Domain Knowledge

Method for transferring knowledge from pre-trained models to different architectural scales using frequency-domain information.

Ax Hongjie Jiang, Yifei Tang, Shuqiang Wang 3/10/2026

Neural Dynamics-Informed Pre-trained Framework for Personalized Brain Functional Network Construction

Neural dynamics-informed pre-training framework for personalized brain functional network construction addressing heterogeneous neural activity patterns.

Ax Tony Zahtila, Ettore Saetta, Murray Cutforth, Davy Brouzet, Diego Rossinelli, Gianluca Iaccarino 3/10/2026

Generative prediction of laser-induced rocket ignition with dynamic latent space representations

Data-driven approach using dynamic latent space representations for generative prediction of laser-induced rocket ignition with uncertainty quantification.

Ax Ramin Akbari, Milad Afshari, Vishnu Naresh Boddeti 3/10/2026

Obliviator Reveals the Cost of Nonlinear Guardedness in Concept Erasure

Obliviator method revealing vulnerability of concept erasure to nonlinear adversaries, analyzing statistical dependencies in representation unlearning.

Ax Naqcho Ali Mehdi, Amir Ali 3/10/2026

ECG Classification on PTB-XL: A Data-Centric Approach with Simplified CNN-VAE

ECG classification on PTB-XL dataset using simplified CNN-VAE with data-centric approach for cardiovascular disease detection.

Ax Zhenwei Wang, Tiehua Zhang, Ning Xue, Ender Ozcan, Ling Wang, Ruibin Bai 3/10/2026

Constraints Matrix Diffusion based Generative Neural Solver for Vehicle Routing Problems

Constraints Matrix Diffusion-based generative neural solver for vehicle routing problems emphasizing local optimization and small-scale generalization.

Ax Haiteng Wang, Yikang Li, Yunfei Zhu, Jingheng Yan, Lei Ren, Laurence T. Yang 3/10/2026

TS-MLLM: A Multi-Modal Large Language Model-based Framework for Industrial Time-Series Big Data Analysis

TS-MLLM: multi-modal LLM framework for industrial time-series analysis combining temporal signals, frequency-domain visuals, and textual knowledge for prognostics.

Ax Hans Farrell Soegeng, Sarthak Ketanbhai Modi, Thomas Peyrin 3/10/2026

TT-Sparse: Learning Sparse Rule Models with Differentiable Truth Tables

TT-Sparse: neural building block for learning interpretable sparse rule models using differentiable truth tables balancing performance and human-understandable complexity.

Ax Jiajun He, Zongyu Guo, Zhaoyang Jia, Xiaoyi Zhang, Jiahao Li, Xiao Li, Bin Li, Jos\'e Miguel Hern\'andez-Lobato, Yan Lu 3/10/2026

Compression as Adaptation: Implicit Visual Representation with Diffusion Foundation Models

Visual representation framework encoding signals as low-rank adaptations to frozen diffusion foundation models for compact storage and reuse.

Ax Chang Su, Zhongkai Hao, Zhizhou Zhang, Zeyu Xia, Youjia Wu, Hang Su, Jun Zhu 3/10/2026

Helix: Evolutionary Reinforcement Learning for Open-Ended Scientific Problem Solving

Helix: evolutionary reinforcement learning system combining LLMs with RL for open-ended scientific problem solving with improved exploration and generalization.

Ax Mohammad Nooraiepour, Jakub Wiktor Both, Teeratorn Kadeethum, Saeid Sadeghnejad 3/10/2026

Partial Differential Equations in the Age of Machine Learning: A Critical Synthesis of Classical, Machine Learning, and Hybrid Methods

Critical review synthesizing classical numerical methods and machine learning approaches for solving PDEs, examining six fundamental computational challenges.

Ax Yuanhao Pu, Defu Lian, Enhong Chen 3/10/2026

Beyond Surrogates: A Quantitative Analysis for Inter-Metric Relationships

Theoretical analysis of relationships between surrogate losses and evaluation metrics, addressing metric mismatch between offline validation and online performance.