Isolater - Feed

Ax Bo Dai, Na Li, Dale Schuurmans 2/16/2026

Spectral Ghost in Representation Learning: from Component Analysis to Self-Supervised Learning

Study of spectral ghost phenomenon in self-supervised learning. Analyzes representation learning using unlabeled data for downstream task transfer.

Ax Yu Xie, Xing Kai Ren, Ying Qi, Hu Yao 2/16/2026

SAGE: Sequence-level Adaptive Gradient Evolution for Generative Recommendation

RL-based preference optimization for generative recommenders. Proposes SAGE to address symmetric conservatism failure in list-wise ranking with multi-objective feedback.

Ax James King, Arturs Berzins, Siddhartha Mishra, Marius Zeinhofer 2/16/2026

Gauss-Newton Natural Gradient Descent for Shape Learning

Gauss-Newton natural gradient descent method for shape learning addressing ill-conditioning in implicit neural surfaces.

Ax Jatan Shrestha, Santeri Heiskanen, Kari Hepola, Severi Rissanen, Pekka J\"a\"askel\"ainen, Joni Pajarinen 2/16/2026

Pareto-Conditioned Diffusion Models for Offline Multi-Objective Optimization

Pareto-Conditioned Diffusion framework for offline multi-objective optimization using conditional sampling.

Ax Mohammed Osman Gani, Zhipeng He, Chun Ouyang, Sara Khalifa 2/16/2026

Deep Time-Series Models Meet Volatility: Multi-Horizon Electricity Price Forecasting in the Australian National Electricity Market

Deep learning models for electricity price forecasting in volatile markets with extreme price spikes.

Ax Hengjie Cao, Mengyi Chen, Yifeng Yang, Fang Dong, Ruijun Huang, Anrui Chen, Jixian Zhou, Mingzhi Dong, Yujiang Wang, Dongsheng Li, Wenyi Fang, Yuanyi Lin, Fan Wu, Li Shang 2/16/2026

Dispelling the Curse of Singularities in Neural Network Optimizations

Analysis of optimization instability in deep networks caused by singularities in parameter and representation space.

Ax Paribesh Regmi, Rui Li, Kishan KC 2/16/2026

Bayesian Neighborhood Adaptation for Graph Neural Networks

Bayesian approach for adaptively determining neighborhood aggregation scope in graph neural networks.

Ax Fengpeng Li, Kemou Li, Qizhou Wang, Bo Han, Jiantao Zhou 2/16/2026

AEGIS: Adversarial Target-Guided Retention-Data-Free Robust Concept Erasure from Diffusion Models

Method for erasing harmful concepts from diffusion models while maintaining robustness and generation quality.

Ax Kevin Li, Dibyadeep Saha, Avni Kanodia, Fan Lai 2/16/2026

tLoRA: Efficient Multi-LoRA Training with Elastic Shared Super-Models

tLoRA framework for efficient multi-LoRA training on frozen LLM backbones with elastic shared super-models.

Ax Sunil Madhow, Yuchen Liang, Ness Shroff, Yingbin Liang, Yu-Xiang Wang 2/16/2026

Learnable Chernoff Baselines for Inference-Time Alignment

Learnable Chernoff Baselines for efficient inference-time alignment of generative models using reward guidance.

Ax Dongyeop Woo, Marta Skreta, Seonghyun Park, Kirill Neklyudov, Sungsoo Ahn 2/16/2026

Riemannian MeanFlow

Flow models for efficient generative modeling on Riemannian manifolds with reduced inference evaluations.

Ax Gunn Kim 2/16/2026

Thermodynamic Isomorphism of Transformers: A Lagrangian Approach to Attention Dynamics

Thermodynamic framework analyzing transformer attention through Lagrangian mechanics and entropy minimization.

Ax Tiwei Bie, Maosong Cao, Xiang Cao, Bingsen Chen, Fuyuan Chen, Kun Chen, Lun Du, Daozhuo Feng, Haibo Feng, Mingliang Gong, Zhuocheng Gong, Yanmei Gu, Jian Guan, Kaiyuan Guan, Hongliang He, Zenan Huang, Juyong Jiang, Zhonghui Jiang, Zhenzhong Lan, Chengxi Li, Jianguo Li, Zehuan Li, Huabin Liu, Lin Liu, Guoshan Lu, Yuan Lu, Yuxin Ma, Xingyu Mou, Zhenxuan Pan, Kaida Qiu, Yuji Ren, Jianfeng Tan, Yiding Tian, Zian Wang, Lanning Wei, Tao Wu, Yipeng Xing, Wentao Ye, Liangyu Zha, Tianze Zhang, Xiaolu Zhang, Junbo Zhao, Da Zheng, Hao Zhong, Wanli Zhong, Jun Zhou, Junlin Zhou, Liwang Zhu, Muzhi Zhu, Yihong Zhuang 2/16/2026

LLaDA2.1: Speeding Up Text Diffusion via Token Editing

LLaDA2.1 text diffusion improvement combining token-to-token and mask-to-token editing for faster generation.

Ax Lei You 2/16/2026

Epistemic Throughput: Fundamental Limits of Attention-Constrained Inference

Formalization of attention-constrained inference for screening and verifying candidates under limited review capacity.

Ax Yongzhong Xu 2/16/2026

Low-Dimensional Execution Manifolds in Transformer Learning Dynamics: Evidence from Modular Arithmetic Tasks

Analysis showing transformer learning dynamics collapse onto low-dimensional manifolds despite high parameter dimensionality.

Ax Sedigheh Eslami, Maksim Gaiduk, Markus Krimmel, Louis Milliken, Bo Wang, Denis Bykov 2/16/2026

Diffusion-Pretrained Dense and Contextual Embeddings

Multilingual embedding models using contrastive learning on diffusion-pretrained backbone for web-scale retrieval.

Ax Yuanyong Luo, Jing Huang, Yu Cheng, Ziwei Yu, Kaihua Tang, Xinda Ma, Xin Wang, Anping Tong, Guipeng Hu, Yun Xu, Mehran Taghian, Peng Wu, Guanglin Li, Yunke Peng, Tianchi Hu, Minqi Chen, Michael Bi Mi, Hu Liu, Xiping Zhou, Junsong Wang, Qiang Lin, Heng Liao 2/16/2026

HiFloat4 Format for Language Model Inference

HiFloat4 block floating-point format for efficient LLM inference, achieving 4.5 bits per value with three-level scaling.

Ax Jiangkai Xiong, Kalyan Talluri, Hanzhao Wang 2/16/2026

Calibrating an Imperfect Auxiliary Predictor for Unobserved No-Purchase Choice

Statistical method for estimating consumer preferences when purchase observations are incomplete.

Ax Chihiro Watanabe, Taiji Suzuki 2/16/2026

AutoLL: Automatic Linear Layout of Graphs based on Deep Neural Network

Deep neural network approach for automatic linear graph layout optimization and visualization.

Ax Xin Wen, Will Wei Sun, Yichen Zhang 2/16/2026

Online Tensor Inference

Online tensor inference method for real-time processing of sequentially arriving high-dimensional data with statistical capabilities.

Ax Seong Jin Lee, Will Wei Sun, Yufeng Liu 2/16/2026

Low-Rank Online Dynamic Assortment with Dual Contextual Information

ML research on dynamic assortment optimization with dual contextual information for e-commerce recommendation systems.

Ax Lijun Bo, Yijie Huang, Xiang Yu, Tingting Zhang 2/16/2026

Continuous-time q-Learning for Jump-Diffusion Models under Tsallis Entropy

ML research on continuous-time Q-learning for jump-diffusion models using Tsallis entropy regularization instead of Shannon entropy.

Ax Oscar Clivio, Avi Feller, Chris Holmes 2/16/2026

Towards Representation Learning for Weighting Problems in Design-Based Causal Inference

Representation learning approach for design-based weighting in causal inference without outcome information.

Ax Sabyasachi Chatterjee 2/16/2026

Minmax Trend Filtering: Generalizations of Total Variation Denoising via a Local Minmax/Maxmin Formula

Minmax trend filtering generalizes total variation denoising through local minmax/maxmin formulas for improved signal smoothing.

Ax Leyao Wang, Yu Wang, Bo Ni, Yuying Zhao, Hanyu Wang, Yao Ma, Tyler Derr 2/16/2026

SaVe-TAG: LLM-based Interpolation for Long-Tailed Text-Attributed Graphs

SaVe-TAG uses LLM-based interpolation to address long-tailed class imbalance in text-attributed graphs for GNN generalization.

Ax Borjan Geshkovski, Philippe Rigollet, Dom\`enec Ruiz-Balet 2/16/2026

Measure-to-measure interpolation using Transformers

Theoretical analysis of Transformers as measure-to-measure maps implemented as interacting particle systems on the unit sphere.

Ax Anton Baumann, Rui Li, Marcus Klasson, Santeri Mentu, Shyamgopal Karthik, Zeynep Akata, Arno Solin, Martin Trapp 2/16/2026

Post-hoc Probabilistic Vision-Language Models

Post-hoc method adding probabilistic uncertainty to vision-language models like CLIP to better handle domain shifts in downstream tasks.

Ax Shubham Gupta, Zichao Li, Tianyi Chen, Cem Subakan, Siva Reddy, Perouz Taslakian, Valentina Zantedeschi 2/16/2026

Hierarchical Retrieval at Scale: Bridging Transparency and Efficiency

Hierarchical retrieval method offering interpretability and efficiency improvements over embedding-based similarity search for large-scale systems.

Ax Evan Sidrow, Alexandre Bouchard-C\^ot\'e, Lloyd T. Elliott 2/16/2026

Variational phylogenetic inference with products over bipartitions

Variational Bayesian approach for phylogenetic tree inference using coalescent-based variational families.

Ax Yuning Du, Jingshuai Liu, Rohan Dharmakumar, Sotirios A. Tsaftaris 2/16/2026

Active Sampling for MRI-based Sequential Decision Making

Active sampling strategy for MRI point-of-care applications using sequential decision making from k-space with fewer measurements.

Ax Zhaowei Zhang, Xiaobo Wang, Minghua Yi, Mengmeng Wang, Fengshuo Bai, Zilong Zheng, Yipeng Kang, Yaodong Yang 2/16/2026

PoliCon: Evaluating LLMs on Achieving Diverse Political Consensus Objectives

PoliCon benchmark evaluates LLMs on achieving political consensus objectives using deliberation records from European Parliament.

Ax Yuhao Sun, Jiacheng Zhang, Zesheng Ye, Chaowei Xiao, Feng Liu 2/16/2026

Sample-Specific Noise Injection For Diffusion-Based Adversarial Purification

Sample-specific noise injection strategy for diffusion-based adversarial purification to improve robustness against adversarial attacks.

Ax Dheeraj Vattikonda, Santhoshi Ravichandran, Emiliano Penaloza, Hadi Nekoei, Megh Thakkar, Thibault Le Sellier de Chezelles, Nicolas Gontier, Miguel Mu\~noz-M\'armol, Sahar Omidi Shayegan, Stefania Raimondo, Xue Liu, Alexandre Drouin, Laurent Charlin, Alexandre Pich\'e, Alexandre Lacoste, Massimo Caccia 2/16/2026

How to Train Your LLM Web Agent: A Statistical Diagnosis

Statistical diagnosis and training methods for LLM-based web agents addressing multi-step interactions and reducing post-training compute costs.

Ax Lorenzo Mannocci, Stefano Cresci, Matteo Magnani, Anna Monreale, Maurizio Tesconi 2/16/2026

Multimodal Coordinated Online Behavior: Trade-offs and Strategies

Analysis of coordinated online behavior using multimodal approaches to detect disinformation campaigns and collective manipulation.

Ax Sarah McClure, Evyatar Cohen, Alex Shpiner, Mark Silberstein, Sylvia Ratnasamy, Scott Shenker, Isaac Keslassy 2/16/2026

Load Balancing for AI Training Workloads

Technical analysis of load-balancing designs for AI training workloads, comparing approaches and establishing optimality bounds for distributed training.

Ax Giovanni Cherubin, Andrew Paverd 2/16/2026

Highlight & Summarize: RAG without the jailbreaks

Highlight & Summarize method for RAG systems to prevent jailbreaking and model hijacking of LLMs through prompt injection defense.

Ax Xingshan Zeng, Weiwen Liu, Lingzhi Wang, Liangyou Li, Fei Mi, Yasheng Wang, Lifeng Shang, Xin Jiang, Qun Liu 2/16/2026

ToolACE-MT: Non-Autoregressive Generation for Agentic Multi-Turn Interaction

ToolACE-MT enables non-autoregressive generation for multi-turn LLM agent interactions with complex function calls, reducing data generation costs.

Ax Gernot Fiala, Markus Plass, Robert Harb, Peter Regitnig, Kristijan Skok, Wael Al Zoughbi, Carmen Zerner, Paul Torke, Michaela Kargl, Heimo M\"uller, Tomas Brazdil, Matej Gallo, Jaroslav Kub\'in, Roman Stoklasa, Rudolf Nenutil, Norman Zerbe, Andreas Holzinger, Petr Holub 2/16/2026

From slides to AI-ready maps: Standardized multi-layer tissue maps as metadata for artificial intelligence in digital pathology

Standardized multi-layer tissue maps as metadata format for whole slide image AI algorithm development in digital pathology.

Ax Thinh Viet Le, Mark M. Wilde, Vassilis Kekatos 2/16/2026