Isolater - Feed

Ax Amirreza Alasti, Efe Erdal, Y\"ucel Celik, Theresa Eimer 4/2/2026

Learning to Play Blackjack: A Curriculum Learning Perspective

LLM-based curriculum learning framework for reinforcement learning agents applied to Blackjack game strategy.

Ax Selin Bayramo\u{g}lu, George L Nemhauser, Nikolaos V Sahinidis 4/2/2026

Speeding Up Mixed-Integer Programming Solvers with Sparse Learning for Branching

Sparse interpretable machine learning models for improving branching decisions in mixed-integer programming solvers without GPU requirements.

Ax Annette Taberner-Miller 4/2/2026

ParetoBandit: Budget-Paced Adaptive Routing for Non-Stationary LLM Serving

Open-source adaptive router for multi-model LLM serving using cost-aware contextual bandits with non-stationary pricing and quality changes.

Ax Ferdaus Anam Jibon, Fazlul Hasan Siddiqui, F. Deeba, Gahangir Hossain 4/2/2026

Epileptic Seizure Detection in Separate Frequency Bands Using Feature Analysis and Graph Convolutional Neural Network (GCN) from Electroencephalogram (EEG) Signals

Epileptic seizure detection from EEG signals using graph convolutional neural networks on frequency band features.

Ax Md Rafi Islam, Md Rejwanul Haque, Elizabeth Choma, Shannon Hayes, Siobhan McMahon, Xiangrong Shen, Edward Sazonov 4/2/2026

Sit-to-Stand Transitions Detection and Duration Measurement Using Smart Lacelock Sensor

Sit-to-stand transition detection using smart lacelock sensor for fall risk assessment in older adults.

Ax Rachid Drissi 4/2/2026

L\'evy-Flow Models: Heavy-Tail-Aware Normalizing Flows for Financial Risk Management

Normalizing flow models using Lévy process distributions for heavy-tailed financial risk modeling.

Ax Brenden Latham, Mehrdad Moharrami 4/2/2026

Offline Constrained RLHF with Multiple Preference Oracles

Offline reinforcement learning from human feedback with multiple preference oracles for trading off performance with safety and fairness constraints.

Ax Javier Bisbal, Julio Sotelo, Hern\'an Mella, Oliver Welin Odeback, Joaqu\'in Mura, David Marlevi, Junya Matsuda, Kotomi Iwata, Tetsuro Sekine, Cristian Tejos, Sergio Uribe 4/2/2026

Unsupervised 4D Flow MRI Velocity Enhancement and Unwrapping Using Divergence-Free Neural Networks

Unsupervised neural network for 4D Flow MRI velocity field enhancement and phase wrapping correction using divergence-free parameterization.

Ax Thomas Buckley, Leslie Schumm, Manor Askenazi, Edward Rietman 4/2/2026

Lead Zirconate Titanate Reservoir Computing for Classification of Written and Spoken Digits

Physical reservoir computing using Lead Zirconate Titanate for digit classification.

Ax Sunny Liu, Habon Issa, Andr\'e Longon, Liv Gorton, Meenakshi Khosla, David Klindt 4/2/2026

Measuring the Representational Alignment of Neural Systems in Superposition

Alignment metrics for comparing neural network representations operating in superposition.

Ax Hoang-Chau Luong, Dat Ba Tran, Lingwei Chen 4/2/2026

Diversity-Aware Reverse Kullback-Leibler Divergence for Large Language Model Distillation

Diversity-aware reverse KL divergence method improving LLM distillation with large capacity mismatches.

Ax Anamika Paul Rupa 4/2/2026

Neural Collapse Dynamics: Depth, Activation, Regularisation, and Feature Norm Threshold

Analysis of neural collapse dynamics identifying critical feature norm threshold for convergence.

Ax Jinghan Yao, Sam Ad\'e Jacobs, Walid Krichene, Masahiro Tanaka, Dhabaleswar K Panda 4/2/2026

MAC-Attention: a Match-Amend-Complete Scheme for Fast and Accurate Attention Computation

MAC-Attention acceleration technique for LLM long-context decoding that preserves attention computation fidelity without compression.

Ax Yoann Boget, Pablo Strasser, Alexandros Kalousis 4/2/2026

Hierarchical Discrete Flow Matching for Graph Generation

Hierarchical flow matching framework for computationally efficient graph generation with reduced complexity.

Ax Chuyi Dai, Witold Pedrycz, Suping Xu, Ding Liu, Xianmin Wang 4/2/2026

Informed Machine Learning with Knowledge Landmarks

Knowledge-Data ML framework integrating numeric data with knowledge for model construction.

Ax Md Mirajul Islam, Rajesh Debnath, Adittya Soukarjya Saha, Min Chi 4/2/2026

Hierarchical Apprenticeship Learning from Imperfect Demonstrations with Evolving Rewards

Apprenticeship learning from imperfect demonstrations with evolving rewards in e-learning contexts.

Ax Lam M. Nguyen, Dzung T. Phan, Jayant Kalagnanam 4/2/2026

Learning to Shuffle: Block Reshuffling and Reversal Schemes for Stochastic Optimization

Research on shuffling strategies for stochastic gradient descent optimization with convergence analysis.

Ax Eloghosa Ikponmwoba, Opeoluwa Owoyele 4/2/2026

Autonomous Adaptive Solver Selection for Chemistry Integration via Reinforcement Learning

Reinforcement learning framework for autonomous solver selection in chemical kinetics integration.

Ax Hochan Son, Xiaofeng Lin, Jason Ni, Guang Cheng 4/2/2026

SYNTHONY: A Stress-Aware, Intent-Conditioned Agent for Deep Tabular Generative Models Selection

Agent system using RL to select optimal deep generative models for tabular data synthesis.

Ax Huseyin Tuna Erdinc, Ipsita Bhar, Rafael Orozco, Thales Souza, Felix J. Herrmann 4/2/2026

SAGE: Subsurface AI-driven Geostatistical Extraction with proxy posterior

Generative framework for subsurface velocity model synthesis using proxy posterior estimation.

Ax Anurag Kumar, Raghuveer Peri, Jon Burnsky, Alexandru Nelus, Rohit Paturi, Srikanth Vishnubhotla, Yanjun Qi 4/2/2026

Robust Multimodal Safety via Conditional Decoding

Conditional decoding strategy (CASA) for improving safety alignment in multimodal LLMs against cross-modal attacks.

Ax Aengus Lynch 4/2/2026

The Persistent Vulnerability of Aligned AI Systems

AI safety research on vulnerabilities in autonomous agents with filesystem/email access via circuit analysis.

Ax Yagiz Ihlamur 4/2/2026

When Career Data Runs Out: Structured Feature Engineering and Signal Limits for Founder Success Prediction

XGBoost model for startup founder success prediction using engineered features from career data.

Ax Ankit Grover, Lodovico Giaretta, R\'emi Bourgerie, Sarunas Girdzijauskas 4/2/2026

Is One Token All It Takes? Graph Pooling Tokens for LLM-based GraphQA

Method for encoding graph structure into LLMs via graph pooling tokens for Graph Question Answering tasks.

Ax Mahammad Valiyev, Jodel Cornelio, Behnam Jafarpour 4/2/2026

Deep Learning-Accelerated Surrogate Optimization for High-Dimensional Well Control in Stress-Sensitive Reservoirs

Deep learning surrogate optimization for production control in stress-sensitive oil reservoirs.

Ax Saman Khamesian, Sri Harini Balaji, Di Yang Shi, Stephanie M. Carpenter, Daniel E. Rivera, W. Bradley Knox, Peter Stone, Hassan Ghasemzadeh 4/2/2026

GUIDE: Reinforcement Learning for Behavioral Action Support in Type 1 Diabetes

Reinforcement learning approach for behavioral support in Type 1 Diabetes management and insulin dosing.

Ax Shihao Li, Jiachen Li, Dongmei Chen 4/2/2026

Gradient-Based Data Valuation Improves Curriculum Learning for Game-Theoretic Motion Planning

Gradient-based data valuation for curriculum learning in game-theoretic motion planning using TracIn scoring.

Ax Weyl Lu, Chenjie Hao, Yubei Chen 4/2/2026

Deep Networks Favor Simple Data

Study showing deep networks assign higher density to simpler out-of-distribution data than in-distribution test data.

Ax Yaqi Chen, Shixun Huang, Ryan Twemlow, Lei Wang, John Le, Sheng Wang, Willy Susilo, Jun Yan, Jun Shen 4/2/2026

A Cross-graph Tuning-free GNN Prompting Framework

Tuning-free GNN prompting framework for cross-graph adaptation without task-specific parameter updates.

Ax Ravi Ranjan, Utkarsh Grover, Xiaomin Lin, Agoritsa Polyzou 4/2/2026

G-Drift MIA: Membership Inference via Gradient-Induced Feature Drift in LLMs

Membership inference attack on LLMs via gradient-induced feature drift to detect training data exposure.

Ax Amirhossein Dezhboro, Fateme Maleki, Arman Adibi, Erfan Amini, Jose E. Ramirez-Marquez 4/2/2026

Convergence of Byzantine-Resilient Gradient Tracking via Probabilistic Edge Dropout

Distributed optimization algorithm for Byzantine-resilient gradient tracking with probabilistic edge dropout.

Ax Abrari Noor Hasmi, Haralampos Hatzikirou, Hadi Susanto 4/2/2026

Phase space integrity in neural network models of Hamiltonian dynamics: A Lagrangian descriptor approach

Lagrangian Descriptors framework for evaluating neural network models of Hamiltonian dynamics.

Ax Yiyang Sun, Haiyang Huang, Gaurav Rajesh Parikh, Cynthia Rudin 4/2/2026

The Rashomon Effect for Visualizing High-Dimensional Data

Dimension reduction research exploring multiple valid embeddings for high-dimensional data visualization.

Ax Haoyu Zheng, Yongqiang Zhang, Fangcheng Fu, Xiaokai Zhou, Hao Luo, Hongchao Zhu, Yuanyuan Zhu, Hao Wang, Xiao Yan, Jiawei Jiang 4/2/2026

Scheduling LLM Inference with Uncertainty-Aware Output Length Predictions

Research on scheduling LLM inference using uncertainty-aware output length predictions instead of point estimates.

Ax Yunwen Lei, Yufeng Xie 4/2/2026

Towards Initialization-dependent and Non-vacuous Generalization Bounds for Overparameterized Shallow Neural Networks

arXiv: Generalization bounds for overparameterized shallow neural networks using initialization-dependent distance norms.

Ax Yaoming Yang, Shuai Wang, Bingdong Li, Peng Yang, Ke Tang 4/2/2026

A Decoupled Basis-Vector-Driven Generative Framework for Dynamic Multi-Objective Optimization

arXiv: Decoupled basis-vector-driven generative framework for dynamic multi-objective optimization addressing irregular mutations and cold-start.

Ax Junxian Wu, Chenghan Fu, Zhanheng Nie, Daoze Zhang, Bowen Wan, Wanxian Guan, Chuan Yu, Jian Xu, Bo Zheng 4/2/2026

MOON3.0: Reasoning-aware Multimodal Representation Learning for E-commerce Product Understanding

arXiv: MOON3.0 multimodal representation learning framework for fine-grained e-commerce product understanding using reasoning-aware embeddings.

Ax Mudit Sharma, Shweta Jain, Vaneet Aggarwal, Ganesh Ghalme 4/2/2026

Lipschitz Dueling Bandits over Continuous Action Spaces

arXiv: First algorithm for Lipschitz dueling bandits over continuous action spaces using adaptive reference arms.

Ax Zifei Xu, Sayeh Sharify, Hesham Mostafa 4/2/2026

MF-QAT: Multi-Format Quantization-Aware Training for Elastic Inference

arXiv: Multi-format quantization-aware training enables single model robustness across multiple numeric precisions for elastic inference.

Ax Jiabin Lin, Shana Moothedath 4/2/2026

Learning Shared Representations for Multi-Task Linear Bandits

arXiv: Multi-task representation learning in linear bandits with shared latent representations for knowledge transfer.

Ax Xiao Zhang, Juntao Lyu, Tianyu Hu, Qianchuan Zhao, Huimin Ma 4/2/2026

Learning from Many and Adapting to the Unknown in Open-set Test Streams

arXiv: Test-time adaptation for LLMs under continual distribution shift and open-set tasks, preserving source knowledge.

Ax Hongyang Yang, Yanxin Zhang, Yang She, Yue Xiao, Hao Wu, Yiyang Zhang, Jiapeng Hou, Rongshan Zhang 4/2/2026

HabitatAgent: An End-to-End Multi-Agent System for Housing Consultation

arXiv: HabitatAgent multi-agent LLM system for housing consultation with transparent reasoning and factuality guarantees.

Ax Axel Giottonini, Thomas Lemmin 4/2/2026

Representation choice shapes the interpretation of protein conformational dynamics

arXiv: Study on how representation choice affects interpretation of protein conformational dynamics from molecular dynamics simulations.

Ax Qi Shao, Duxin Chen, Jiawen Chen, Yujie Zeng, Athen Ma, Wenwu Yu, Vito Latora, Wei Lin 4/2/2026

Predicting Dynamics of Ultra-Large Complex Systems by Inferring Governing Equations

arXiv: Sparse Identification Graph Neural Network for discovering interpretable governing equations in ultra-large complex systems.

Ax Mingyang Song, Mao Zheng 4/2/2026

A Survey of On-Policy Distillation for Large Language Models

arXiv survey: On-policy distillation transfers reasoning from frontier LLMs to smaller models, addressing exposure bias in knowledge distillation.

Ax Marwan Hassani, Tamara Verbeek, Sjoerd van Straten 4/2/2026

Chameleons do not Forget: Prompt-Based Online Continual Learning for Next Activity Prediction

arXiv: Prompt-based online continual learning for next activity prediction in dynamic processes using catastrophic forgetting mitigation.

Ax Sandeep Kumar Samota, Reema Gupta, Snehashish Chakraverty 4/2/2026

Embedded Variational Neural Stochastic Differential Equations for Learning Heterogeneous Dynamics

arXiv: Variational Neural Stochastic Differential Equations model complex socioeconomic time-series data with heterogeneous dynamics.

Ax Ritish Shrirao, Aditya Priyadarshi, Raghuram Bharadwaj Diddigi 4/2/2026

Full-Gradient Successor Feature Representations

arXiv: Full-gradient successor feature representations improve convergence guarantees for transfer learning in RL with non-linear function approximation.

Ax Josephine Westermann, Benno Huber, Thomas O'Leary-Roseberry, Jakob Zech 4/2/2026

Performance of Neural and Polynomial Operator Surrogates

arXiv: Empirical comparison of neural operator surrogates including Fourier neural operators vs polynomial methods for parametric PDEs.

Ax Yu Xia, Canwen Xu, Zhewei Yao, Julian McAuley, Yuxiong He 4/2/2026

Learning to Hint for Reinforcement Learning

arXiv: Group Relative Policy Optimization for RL addresses advantage collapse in reinforcement learning with verifiable rewards using hints.