Isolater - Feed

Ax Robin Doerfler, Lonce Wyse 3/11/2026

Physics-Informed Neural Engine Sound Modeling with Differentiable Pulse-Train Synthesis

Differentiable neural synthesis architecture for engine sound modeling using physics-informed pulse-train resonators.

Ax Yaping Zhang, Yupu Liang, Zhiyang Zhang, Zhiyuan Chen, Lu Xiang, Yang Zhao, Yu Zhou, Chengqing Zong 3/11/2026

ICDAR 2025 Competition on End-to-End Document Image Machine Translation Towards Complex Layouts

Competition for end-to-end document image translation combining OCR and NLP for complex layout preservation.

Ax Taesung Kwon, Lorenzo Bianchi, Lennart Wittke, Felix Watine, Fabio Carrara, Jong Chul Ye, Romann Weber, Vinicius Azevedo 3/11/2026

Reviving ConvNeXt for Efficient Convolutional Diffusion Models

Fully convolutional diffusion model using ConvNets for efficient generative modeling compared to transformer alternatives.

Ax Zirui Zhang, Yaping Zhang, Lu Xiang, Yang Zhao, Feifei Zhai, Yu Zhou, Chengqing Zong 3/11/2026

PromptDLA: A Domain-aware Prompt Document Layout Analysis Framework with Descriptive Knowledge as a Cue

Prompt-based document layout analysis framework using domain-specific descriptive knowledge for improved multi-domain generalization.

Ax Trung Hieu Ngo, Adrien Bazoge, Solen Quiniou, Pierre-Antoine Gourraud, Emmanuel Morin 3/11/2026

Investigating Gender Stereotypes in Large Language Models via Social Determinants of Health

Benchmark evaluating gender stereotypes in LLMs across healthcare contexts with intersectional social determinants of health factors.

Ax Nicolas Schischka, Nikhil Gosala, B Ravi Kiran, Senthil Yogamani, Abhinav Valada 3/11/2026

Open-World Motion Forecasting

Motion forecasting system for autonomous vehicles handling open-world scenarios with imperfect perception and evolving object taxonomy.

Ax Saugata Purkayastha, Pranav Kushare, Pragya Paramita Pal, Sukannya Purkayastha 3/11/2026

Common Sense vs. Morality: The Curious Case of Narrative Focus Bias in LLMs

Benchmark dataset and analysis of LLM bias showing models prioritize moral reasoning over commonsense knowledge.

Ax Yoon Jo Kim, Wonyoung Cho, Jongmin Lee, Han Joo Chae, Hyunki Park, Sang Hoon Seo, Noh Jae Myung, Kyungmi Yang, Dongryul Oh, Jin Sung Kim 3/11/2026

A Guideline-Aware AI Agent for Zero-Shot Target Volume Auto-Delineation

AI agent framework for automated clinical target volume delineation in radiotherapy that adapts to guideline changes without retraining.

Ax Jiajun Cao, Xiaoan Zhang, Xiaobao Wei, Liyuqiu Huang, Wang Zijian, Hanzhen Zhang, Zhengyu Jia, Wei Mao, Hao Wang, Xianming Liu, Shuchang Zhou Liu, Yang Wang, Shanghang Zhang 3/11/2026

EvoDriveVLA: Evolving Autonomous Driving Vision-Language-Action Model via Collaborative Perception-Planning Distillation

Vision-language-action model for autonomous driving combining perception and planning distillation to improve stability.

Ax David Baumgartner, Helge Langseth, Kenth Eng{\o}-Monsen, Heri Ramampiaro 3/11/2026

Temporal-Conditioned Normalizing Flows for Multivariate Time Series Anomaly Detection

Normalizing flows framework for time series anomaly detection with temporal conditioning and uncertainty quantification.

Ax Enming Zhang, Jiayang Li, Yanru Wu, Zhenyu Liu, Yang Li 3/11/2026

Evolving Prompt Adaptation for Vision-Language Models

Vision-language model adaptation method using evolutionary prompt learning to prevent catastrophic forgetting while maintaining parameter efficiency.

Ax Cosmo Santoni 3/11/2026

Compiler-First State Space Duality and Portable $O(1)$ Autoregressive Caching for Inference

Research on portable O(1) autoregressive caching for state-space models via XLA compilation, removing hardware-specific kernel dependencies.

Ax Alessio Masano, Giovanni Bellitto, Dipam Goswani, Joost Van de Weijer, Concetto Spampinato 3/11/2026

Routing without Forgetting

Research on online continual learning in transformers using routing mechanisms without catastrophic forgetting in non-stationary data streams.

Ax Simon Brandt, Paul Haider, Walter Senn, Federico Benitez, Mihai A. Petrovici 3/11/2026

A Variational Latent Equilibrium for Learning in Cortex

Research on biologically-inspired learning algorithm addressing backpropagation limitations for complex temporal pattern recognition in cortex-like systems.

Ax \"Umit Mert \c{C}a\u{g}lar, Alptekin Temizel 3/11/2026

Grounding Synthetic Data Generation With Vision and Language Models

Framework for interpretable synthetic data generation using vision-language models with grounded evaluation metrics for downstream tasks.

Ax Anupam Purwar, Aditya Choudhary 3/11/2026

MM-tau-p$^2$: Persona-Adaptive Prompting for Robust Multi-Modal Agent Evaluation in Dual-Control Settings

Research on persona-adaptive prompting for evaluating multi-modal LLM agents in customer experience scenarios with dual-control interactions.

Ax Tianyi Zeng, Jincheng Gao, Tianyi Wang, Zijie Meng, Miao Zhang, Jun Yin, Haoyuan Sun, Junfeng Jiao, Christian Claudel, Junbo Tan, Xueqian Wang 3/11/2026

When to Lock Attention: Training-Free KV Control in Video Diffusion

Training-free KV-Lock framework for video diffusion models improving foreground quality while maintaining background consistency.

Ax Federico Bello, Gonzalo Chiarlone, Marcelo Fiori, Gast\'on Garc\'ia Gonz\'alez, Federico Larroca 3/11/2026

GNNs for Time Series Anomaly Detection: An Open-Source Framework and a Critical Evaluation

Open-source framework for time series anomaly detection using graph neural networks with critical evaluation and standardized benchmarks.

Ax Jacopo Vitale, David Della Morte, Luca Bacco, Mario Merone, Mark de Groot, Saskia Haitjema, Leandro Pecchia, Bram van Es 3/11/2026

Automatic Cardiac Risk Management Classification using large-context Electronic Patients Health Records

ML research benchmarking three paradigms for automated cardiac risk classification from unstructured electronic health records using large-context LLMs.

Ax Nguyen Anh Tuong, Phan Ba Duc, Nguyen Trung Quoc, Tran Dac Thinh, Dang Duy Lan, Nguyen Quoc Thinh, Tung Le 3/11/2026

AutoViVQA: A Large-Scale Automatically Constructed Dataset for Vietnamese Visual Question Answering

Large-scale Vietnamese VQA dataset automatically constructed using pre-trained transformers.

Ax Dechuan Teng, Chunlin Lu, Libo Qin, Wanxiang Che 3/11/2026

ESAinsTOD: A Unified End-to-End Schema-Aware Instruction-Tuning Framework for Task-Oriented Dialog Modeling

Unified instruction-tuning framework for task-oriented dialog systems using schema-aware prompting.

Ax Davit Melikidze, Marian Schneider, Jessica Lam, Martin Wertich, Ido Hakimi, Barna P\'asztor, Andreas Krause 3/11/2026

ActiveUltraFeedback: Efficient Preference Data Generation using Active Learning

Active learning pipeline for efficient preference data generation to improve RLHF alignment of LLMs.

Ax Chih-Kai Yang, Yun-Shao Tsai, Yu-Kai Guo, Ping-Le Tsai, Yen-Ting Piao, Hung-Wei Chen, Ting-Lin Hsiao, Yun-Man Hsu, Ke-Han Lu, Hung-yi Lee 3/11/2026

MUGEN: Evaluating and Improving Multi-audio Understanding of Large Audio-Language Models

Benchmark and improvement strategies for multi-audio understanding in large audio-language models.

Ax Sihong Wu, Yiling Ma, Yilun Zhao, Tiansheng Hu, Owen Jiang, Manasi Patwardhan, Arman Cohan 3/11/2026

RbtAct: Rebuttal as Supervision for Actionable Review Feedback Generation

LLM-based method for generating actionable peer review feedback using rebuttal data as supervision.

Ax Chengjun Yu, Xuhan Zhu, Chaoqun Du, Pengfei Yu, Wei Zhai, Yang Cao, Zheng-Jun Zha 3/11/2026

EXPLORE-Bench: Egocentric Scene Prediction with Long-Horizon Reasoning

Benchmark for evaluating multimodal LLMs on egocentric scene prediction with long-horizon action reasoning.

Ax Soroush Seifi, Simon Gardier, Vaggelis Dorovatas, Daniel Olmeda Reino, Rahaf Aljundi 3/11/2026

Ego: Embedding-Guided Personalization of Vision-Language Models

Personalization framework for vision-language models enabling customized AI assistants without additional training.

Ax Karla Tame-Narvaez, Steven Gardiner, Aleksandra \'Ciprijanovi\'c, Giuseppe Cerati 3/11/2026

First Estimation of Model Parameters for Neutrino-Induced Nucleon Knockout Using Simulation-Based Inference

Simulation-based inference approach for estimating neutrino interaction parameters in physics experiments.

Ax Yixiong Chen 3/11/2026

A Hybrid Quantum-Classical Framework for Financial Volatility Forecasting Based on Quantum Circuit Born Machines

Quantum-classical hybrid framework for financial volatility forecasting using quantum circuit models.

Ax Jialei Tan, Zheng Lin, Xiangming Cai, Ruoxi Zhu, Zihan Fang, Pingping Chen, Wei Ni 3/11/2026

Exploiting Label-Aware Channel Scoring for Adaptive Channel Pruning in Split Learning

Adaptive channel pruning for split learning to reduce communication overhead in federated training.

Ax Abhishikth Mallampalli, Sridhara Dasu 3/11/2026

MITRA: An AI Assistant for Knowledge Retrieval in Physics Collaborations

RAG-based AI assistant prototype for knowledge retrieval across large scientific collaboration documentation.

Ax Vitaly Bulgakov 3/11/2026

Correction of Transformer-Based Models with Smoothing Pseudo-Projector

Lightweight pseudo-projector module to improve transformer robustness by correcting hidden representations.

Ax Kangsan Kim, Yanlai Yang, Suji Kim, Woongyeong Yeo, Youngwan Lee, Mengye Ren, Sung Ju Hwang 3/11/2026

MA-EgoQA: Question Answering over Egocentric Videos from Multiple Embodied Agents

QA task over multi-agent egocentric video data for human-AI collaboration scenarios.

Ax Laya Iyer, Angelina Wang, Sanmi Koyejo 3/11/2026

SCENEBench: An Audio Understanding Benchmark Grounded in Assistive and Industrial Use Cases

Benchmark suite for evaluating large audio language models on audio understanding tasks beyond speech recognition.

Ax Mohamad Alkadamani, Halim Yanikomeroglu, Amir Ghasemi 3/11/2026

A Graph-Based Approach to Spectrum Demand Prediction Using Hierarchical Attention Networks

Hierarchical graph attention network for spectrum demand prediction using geospatial data.

Ax Yixin Zheng, Jiangran Lyu, Yifan Zhang, Jiayi Chen, Mi Yan, Yuntian Deng, Xuesong Shi, Xiaoguang Zhao, Yizhou Wang, Zhizheng Zhang, He Wang 3/11/2026

Emerging Extrinsic Dexterity in Cluttered Scenes via Dynamics-aware Policy Learning

Dynamics-aware policy learning for robotic manipulation in cluttered scenes using non-prehensile contact.

Ax Yiyang Lu, Yu He, Jianlong Chen, Hongyuan Zha 3/11/2026

MSSR: Memory-Aware Adaptive Replay for Continual LLM Fine-Tuning

Memory-aware replay strategy for continual LLM fine-tuning to prevent catastrophic forgetting during sequential training.

Ax Colin Brown, Mohamad Alkadamani, Halim Yanikomeroglu 3/11/2026

AI-Enabled Data-driven Intelligence for Spectrum Demand Estimation

Data-driven ML approach for forecasting spectrum demand in wireless networks.

Ax Rong Zhou, Houliang Zhou, Yao Su, Brian Y. Chen, Yu Zhang, Lifang He, Alzheimer's Disease Neuroimaging Initiative 3/11/2026

Adaptive Clinical-Aware Latent Diffusion for Multimodal Brain Image Generation and Missing Modality Imputation

Framework for synthesizing missing brain imaging modalities using diffusion models for Alzheimer's diagnosis.

Ax Mohamad Alkadamani, Amir Ghasemi, Halim Yanikomeroglu 3/11/2026

Towards Flexible Spectrum Access: Data-Driven Insights into Spectrum Demand

Data-driven methodology for characterizing spectrum demand patterns across space and time in 6G networks.

Ax Yundi Zhang, Sevgi Gokce Kafali, Niklas Bubeck, Daniel Rueckert, Jiazhen Pan 3/11/2026

No Image, No Problem: End-to-End Multi-Task Cardiac Analysis from Undersampled k-Space

Direct cardiac analysis from undersampled k-space MRI data avoiding intermediate image reconstruction step.

Ax Alberto Fern\'andez-Hern\'andez, Cristian P\'erez-Corral, Jose I. Mestre, Manuel F. Dolz, Jose Duato, Enrique S. Quintana-Ort\'i 3/11/2026

When Learning Rates Go Wrong: Early Structural Signals in PPO Actor-Critic

Analysis of learning rate sensitivity in PPO actor-critic RL using hidden neuron behavior and overfitting metrics.

Ax Maximilian Beck, Jonas Gehring, Jannik Kossen, Gabriel Synnaeve 3/11/2026

Towards a Neural Debugger for Python

Neural debugger training LLMs on Python execution traces to enable line-by-line execution prediction for developer assistance.

Ax Xinyu Gao, Gang Chen, Javier Alonso-Mora 3/11/2026

BEACON: Language-Conditioned Navigation Affordance Prediction under Occlusion

BEACON predicts navigation affordances from language instructions and visual observations, handling occluded regions via vision-language models.

Ax David Freire-Obreg\'on 3/11/2026

Emotional Modulation in Swarm Decision Dynamics

Agent-based model extending bee equation with emotional valence and arousal for swarm collective decision-making.

Ax Jazmin Collins, Sharon Y Lin, Tianqi Liu, Andrea Stevenson Won, Shiri Azenkot 3/11/2026

Understanding the Use of a Large Language Model-Powered Guide to Make Virtual Reality Accessible for Blind and Low Vision People

User study evaluating LLM-powered sighted guide for making social VR accessible to blind and low vision people.

Ax Lucas Prieto, Edward Stevinson, Melih Barsbey, Tolga Birdal, Pedro A. M. Mediano 3/11/2026