Isolater - Feed

Ax Zifei Xu, Sayeh Sharify, Hesham Mostafa 4/2/2026

MF-QAT: Multi-Format Quantization-Aware Training for Elastic Inference

arXiv: Multi-format quantization-aware training enables single model robustness across multiple numeric precisions for elastic inference.

Ax Jiabin Lin, Shana Moothedath 4/2/2026

Learning Shared Representations for Multi-Task Linear Bandits

arXiv: Multi-task representation learning in linear bandits with shared latent representations for knowledge transfer.

Ax Xiao Zhang, Juntao Lyu, Tianyu Hu, Qianchuan Zhao, Huimin Ma 4/2/2026

Learning from Many and Adapting to the Unknown in Open-set Test Streams

arXiv: Test-time adaptation for LLMs under continual distribution shift and open-set tasks, preserving source knowledge.

Ax Hongyang Yang, Yanxin Zhang, Yang She, Yue Xiao, Hao Wu, Yiyang Zhang, Jiapeng Hou, Rongshan Zhang 4/2/2026

HabitatAgent: An End-to-End Multi-Agent System for Housing Consultation

arXiv: HabitatAgent multi-agent LLM system for housing consultation with transparent reasoning and factuality guarantees.

Ax Axel Giottonini, Thomas Lemmin 4/2/2026

Representation choice shapes the interpretation of protein conformational dynamics

arXiv: Study on how representation choice affects interpretation of protein conformational dynamics from molecular dynamics simulations.

Ax Qi Shao, Duxin Chen, Jiawen Chen, Yujie Zeng, Athen Ma, Wenwu Yu, Vito Latora, Wei Lin 4/2/2026

Predicting Dynamics of Ultra-Large Complex Systems by Inferring Governing Equations

arXiv: Sparse Identification Graph Neural Network for discovering interpretable governing equations in ultra-large complex systems.

Ax Mingyang Song, Mao Zheng 4/2/2026

A Survey of On-Policy Distillation for Large Language Models

arXiv survey: On-policy distillation transfers reasoning from frontier LLMs to smaller models, addressing exposure bias in knowledge distillation.

Ax Marwan Hassani, Tamara Verbeek, Sjoerd van Straten 4/2/2026

Chameleons do not Forget: Prompt-Based Online Continual Learning for Next Activity Prediction

arXiv: Prompt-based online continual learning for next activity prediction in dynamic processes using catastrophic forgetting mitigation.

Ax Sandeep Kumar Samota, Reema Gupta, Snehashish Chakraverty 4/2/2026

Embedded Variational Neural Stochastic Differential Equations for Learning Heterogeneous Dynamics

arXiv: Variational Neural Stochastic Differential Equations model complex socioeconomic time-series data with heterogeneous dynamics.

Ax Ritish Shrirao, Aditya Priyadarshi, Raghuram Bharadwaj Diddigi 4/2/2026

Full-Gradient Successor Feature Representations

arXiv: Full-gradient successor feature representations improve convergence guarantees for transfer learning in RL with non-linear function approximation.

Ax Josephine Westermann, Benno Huber, Thomas O'Leary-Roseberry, Jakob Zech 4/2/2026

Performance of Neural and Polynomial Operator Surrogates

arXiv: Empirical comparison of neural operator surrogates including Fourier neural operators vs polynomial methods for parametric PDEs.

Ax Yu Xia, Canwen Xu, Zhewei Yao, Julian McAuley, Yuxiong He 4/2/2026

Learning to Hint for Reinforcement Learning

arXiv: Group Relative Policy Optimization for RL addresses advantage collapse in reinforcement learning with verifiable rewards using hints.

Ax Anton Altenbernd, Philipp Wiesner, Odej Kao 4/2/2026

Exploring Silent Data Corruption as a Reliability Challenge in LLM Training

Analysis of silent data corruption during LLM training on hardware, studying gradient corruption impacts and detection mechanisms.

Ax Bj\"orn Roman Kohlberger (EctoSpace, Dublin, Ireland) 4/2/2026

Spectral Compact Training: Pre-Training Large Language Models via Permanent Truncated SVD and Stiefel QR Retraction

Spectral Compact Training method reduces LLM training memory footprint by replacing dense weight matrices with truncated SVD factors.

Ax Sayed Hashim, Frank Soboczenski, Paul Cairns 4/2/2026

BioCOMPASS: Integrating Biomarkers into Transformer-Based Immunotherapy Response Prediction

Transformer-based model with biomarkers for immunotherapy response prediction, improving generalization across diverse cancer datasets.

Ax Lala Shakti Swarup Ray, Mengxi Liu, Alcina Pinto, Deepika Gurung, Daniel Geissler, Paul Lukowoicz, Bo Zhou 4/2/2026

ActivityNarrated: An Open-Ended Narrative Paradigm for Wearable Human Activity Understanding

Open-ended narrative framework for wearable human activity recognition using compositional, unscripted activities instead of closed-set classification.

Ax Swapnil Parekh 4/2/2026

Thinking Wrong in Silence: Backdoor Attacks on Continuous Latent Reasoning

ThoughtSteer backdoor attack exploiting continuous reasoning in language models that operate silently in hidden states without token output.

Ax Nikita Gabdullin, Ilya Androsov 4/2/2026

Using predefined vector systems to speed up neural network multimillion class classification

Method to reduce neural network multi-class classification complexity from O(n) to O(1) by leveraging known latent space geometry properties.

Ax Dharma Teja Vooturi, Dhiraj Kalamkar, Dipankar Das, Bharat Kaul 4/2/2026

Scalable Pretraining of Large Mixture of Experts Language Models on Aurora Super Computer

Optimus training library for pretraining mixture-of-experts LLMs at exascale on Aurora supercomputer, demonstrating 1000s GPU tile scaling.

Ax Yuchang Jiang, Jan Dirk Wegner, Vivien Sainte Fare Garnot 4/2/2026

MIRANDA: MId-feature RANk-adversarial Domain Adaptation toward climate change-robust ecological forecasting with deep learning

Deep learning method for plant phenology prediction using domain adaptation to improve climate change forecasting in ecological systems.

Ax Martin Jaraiz 4/2/2026

Cost-Penalized Fitness in FMA-Orchestrated Mixture of Experts: Experimental Evidence for Molecular Memory in Domain Adaptation

Experimental evaluation of Free-Market Algorithm orchestrated Mixture-of-Experts with cost-penalized fitness for domain adaptation.

Ax Yuhang Li, Donghyun Lee, Ruokai Yin, Priyadarshini Panda 4/2/2026

Optimal Brain Decomposition for Accurate LLM Low-Rank Approximation

Optimal decomposition technique for low-rank approximation of LLM weights enabling efficient fine-tuning and inference.

Ax Zhanzhi Lou, Hui Chen, Yibo Li, Qian Wang, Bryan Hooi 4/2/2026

Learning to Learn-at-Test-Time: Language Agents with Learnable Adaptation Policies

Method for language agents to optimize test-time adaptation policies through iterative refinement during inference.

Ax Huaiyang Wang, Xiaojie Li, Deqing Wang, Haoyi Zhou, Zixuan Huang, Yaodong Yang, Jianxin Li, Yikun Ban 4/2/2026

Policy Improvement Reinforcement Learning

Reinforcement learning approach with verification for iteratively improving LLM policies based on actual performance gains.

Ax Zheng Zhang, Cuong C. Nguyen, David Rosewarne, Kevin Wells, Gustavo Carneiro 4/2/2026

Fatigue-Aware Learning to Defer via Constrained Optimisation

Framework for human-AI cooperation that models fatigue-induced performance degradation in learning-to-defer systems.

Ax Antonin Sulc 4/2/2026

Event Embedding of Protein Networks : Compositional Learning of Biological Function

Compositional embedding method for protein networks using additive sequence models on biological interaction data.

Ax Haorui Ma, Dennis Frauen, Valentyn Melnychuk, Stefan Feuerriegel 4/2/2026

Orthogonal Learner for Estimating Heterogeneous Long-Term Treatment Effects

Orthogonal learning approach for estimating heterogeneous long-term treatment effects combining experiments and observational data.

Ax Hsin-Ling Hsu, Min-Yu Chen, Nai-Chia Chen, Yan-Ru Chen, Yi-Ling Chang, Fang Yu 4/2/2026

WARP: Guaranteed Inner-Layer Repair of NLP Transformers

Method for verifiable repair of transformer vulnerabilities to adversarial perturbations with inner-layer guarantees.

Ax Ruijie Hao, Longfei Zhang, Yang Dai, Yang Ma, Xingxing Liang, Guangquan Cheng 4/2/2026

Flow-based Policy With Distributional Reinforcement Learning in Trajectory Optimization

Flow-based reinforcement learning policy with distributional approach for capturing multimodal solutions in trajectory optimization.

Ax Nikolai Merkel, Ruben Mayer, Volker Markl, Hans-Arno Jacobsen 4/2/2026

EmbedPart: Embedding-Driven Graph Partitioning for Scalable Graph Neural Network Training

Graph partitioning technique using embeddings to enable scalable distributed training of graph neural networks.

Ax Rafael Sojo, Pedro Larra\~naga, Concha Bielza 4/2/2026

Transfer learning for nonparametric Bayesian networks

Transfer learning methodologies for Bayesian network structure learning with scarce data.

Ax Philip Jordan, Maryam Kamgarpour 4/2/2026

Model-Based Learning of Near-Optimal Finite-Window Policies in POMDPs

Model-based learning approach for finite-window policies in partially observable Markov decision processes.

Ax Zhichen Liu, Tianle Lun, Zhibin Wen, Hao An, Yulin Ou, Jianhui Xu, Hao Zhang, Wenyi Fang, Yang Zheng, Yang Xu 4/2/2026

Fast and Accurate Probing of In-Training LLMs' Downstream Performances

Method for efficiently evaluating LLM downstream performance during training without expensive full inference.

Ax Jinzhao Li, Nan Jiang, Yexiang Xue 4/2/2026

Approximating Pareto Frontiers in Stochastic Multi-Objective Optimization via Hashing and Randomization

Algorithmic approach to multi-objective optimization via hashing and randomization for identifying Pareto frontiers.

Ax Kazuya Takabatake, Shotaro Akaho 4/2/2026

Reconsidering Dependency Networks from an Information Geometry Perspective

Theoretical analysis of dependency networks using information geometry perspective for modeling complex systems.

Ax Zhantao Chen, Dongyi He, Jin Fang, Xi Chen, Yisuo Liu, Xiaozhen Zhong, Xuejun Hu 4/2/2026

Toward Personalized Darts Training: A Data-Driven Framework Based on Skeleton-Based Biomechanical Analysis and Motion Modeling

Data-driven sports training framework using skeleton-based biomechanical analysis and motion modeling for dart throwing.

Ax Xiangpeng Li, Yu-Hsuan Ho, Sam D Brody, Ali Mostafavi 4/2/2026

Property-Level Flood Risk Assessment Using AI-Enabled Street-View Lowest Floor Elevation Extraction and ML Imputation Across Texas

AI pipeline extracting building elevation data from street-view imagery with ML imputation for flood risk assessment.

Ax Gleb Rodionov 4/2/2026

Isomorphic Functionalities between Ant Colony and Ensemble Learning: Part II-On the Strength of Weak Learnability and the Boosting Paradigm

Mathematical analysis establishing isomorphism between ant colony behavior and ensemble learning methods like boosting.