Isolater - Feed

Ax Sirui Li, Shuhan Xiao, Mihir Joshi, Ahmed Metwally, Daniel McDuff, Wei Wang, Yuzhe Yang 3/17/2026

HEARTS: Benchmarking LLM Reasoning on Health Time Series

HEARTS benchmark for evaluating LLM reasoning on health time series across multiple physiological modalities and temporal dependencies.

Ax Julien Amblard, Niklas Groll, Matthew Tait, Mark Law, G\"urkan Sin, Alessandra Russo 3/17/2026

Failure Detection in Chemical Processes Using Symbolic Machine Learning: A Case Study on Ethylene Oxidation

Symbolic ML approach for failure detection in chemical processes, emphasizing interpretability and safety over neural methods; includes ethylene oxidation case study.

Ax Suyash Fulay, Prerna Ravi, Om Gokhale, Eugene Yi, Michiel Bakker, Deb Roy 3/17/2026

Agora: Teaching the Skill of Consensus-Finding with AI Personas Grounded in Human Voice

AI-powered platform using LLM personas to teach deliberative democratic skills and consensus-finding through simulated discussion scenarios.

Ax Mohammed Brahimi, Karim Laabassi, Mohamed Seghir Hadj Ameur, Aicha Boutorh, Badia Siab-Farsi, Amin Khouani, Omar Farouk Zouak, Seif Eddine Bouziane, Kheira Lakhdari, Abdelkader Nabil Benghanem 3/17/2026

AgrI Challenge: A Data-Centric AI Competition for Cross-Team Validation in Agricultural Vision

ML competition for agricultural vision focusing on data-centric approaches and model generalization under distribution shifts in real field conditions.

Ax Jonas Landsgesell, Pascal Knoll 3/17/2026

Distributional Regression with Tabular Foundation Models: Evaluating Probabilistic Predictions via Proper Scoring Rules

Evaluation framework for tabular foundation models using proper scoring rules to assess full predictive distributions, not just point estimates.

Ax Yehonatan Elisha, Oren Barkan, Noam Koenigstein 3/17/2026

Concept-Guided Fine-Tuning: Steering ViTs away from Spurious Correlations to Improve Robustness

Fine-tuning method for Vision Transformers using concept guidance to reduce spurious correlations and improve robustness to distribution shifts.

Ax Peter Brodeur, Jacob M. Koshy, Anil Palepu, Khaled Saab, Ava Homiar, Roma Ruparel, Charles Wu, Ryutaro Tanno, Joseph Xu, Amy Wang, David Stutz, Wei-Hung Weng, Hannah M. Ferrera, David Barrett, Lindsey Crowley, Jihyeon Lee, Spencer E. Rittner, Ellery Wulczyn, Selena K. Zhang, Elahe Vedadi, Christine G. Kohn, Kavita Kulkarni, Vinay Kadiyala, Sara Mahdavi, Wendy Du, Jessica M. Williams, David Feinbloom, Renee Wong, Tao Tu, Petar Sirkovic, Alessio Orlandi, Christopher Semturs, Yun Liu, Juraj Gottweis, Dale R. Webster, Jo\"elle Barral, Katherine Chou, Pushmeet Kohli, Avinatan Hassidim, Yossi Matias, James Manyika, Rob Fields, Jonathan X. Li, Marc L. Cohen, Vivek Natarajan, Mike Schaekermann, Alan Karthikesalingam, Adam Rodman 3/17/2026

A prospective clinical feasibility study of a conversational diagnostic AI in an ambulatory primary care clinic

Clinical feasibility study of LLM-based conversational diagnostic AI (AMIE) in real primary care workflows with safety evaluation.

Ax Benjamin Reichman, Adar Avsian, Samuel Webster, Larry Heck 3/17/2026

Emotion is Not Just a Label: Latent Emotional Factors in LLM Processing

Study of emotion as latent factor affecting LLM reasoning and attention mechanisms, rather than just a prediction target.

Ax Nicolas Schischka, Nikhil Gosala, B Ravi Kiran, Senthil Yogamani, Abhinav Valada 3/17/2026

Open-World Motion Forecasting

Motion forecasting for autonomous vehicles handling open-world scenarios with imperfect perception and evolving object taxonomies.

Ax Jiajun Cao, Xiaoan Zhang, Xiaobao Wei, Liyuqiu Huang, Wang Zijian, Hanzhen Zhang, Zhengyu Jia, Wei Mao, Hao Wang, Xianming Liu, Shuchang Zhou, Yang Wang, Shanghang Zhang 3/17/2026

EvoDriveVLA: Evolving Autonomous Driving Vision-Language-Action Model via Collaborative Perception-Planning Distillation

Vision-language-action model for autonomous driving using perception-planning distillation to improve visual encoding and trajectory planning stability.

Ax Ruchira Dhar, Qiwei Peng, Anders S{\o}gaard 3/17/2026

Evaluating Adjective-Noun Compositionality in LLMs: Functional vs Representational Perspectives

Research on how LLMs handle compositional language tasks (adjective-noun relationships), comparing external performance with internal model representations.

Ax Yu Zhang, Zhicheng Zhao, Ze Luo, Chenglong Li, Jin Tang 3/17/2026

UAV traffic scene understanding: A regulation embedded multi-modal network and a unified benchmark

Multi-modal network for UAV traffic scene understanding with benchmark. Computer vision for autonomous systems, not core AI/ML research.

Ax David Fraile Navarro, Farah Magrabi, Enrico Coiera 3/17/2026

Evaluation format, not model capability, drives triage failure in the assessment of consumer health AI

Research comparing LLM performance in healthcare triage across evaluation formats. Shows evaluation methodology significantly affects model assessment outcomes.

Ax Qizhi Chen, Chao Qi, Yihong Huang, Muquan Li, Rongzheng Wang, Dongyang Zhang, Ke Qin, Shuang Liang 3/17/2026

KEPo: Knowledge Evolution Poison on Graph-based Retrieval-Augmented Generation

KEPo: research on knowledge graph poisoning attacks against GraphRAG systems. Analyzes vulnerabilities when LLMs rely on external databases.

Ax Ruiying Li, Yunlang Zhou, YuYao Zhu, Kylin Chen, Jingyuan Wang, Sukai Wang, Kongtao Hu, Minhui Yu, Bowen Jiang, Zhan Su, Jiayao Ma, Xin He, Yongjian Shen, Yang Yang, Guanghui Ren, Maoqing Yao, Wenhao Wang, Yao Mu 3/17/2026

RoboClaw: An Agentic Framework for Scalable Long-Horizon Robotic Tasks

RoboClaw: Agentic framework unifying data collection, policy learning, and deployment for long-horizon robotic manipulation using Vision-Language-Action systems.

Ax Konstantin Krestnikov 3/17/2026

Truth as a Compression Artifact in Language Model Training

Controlled experiments showing language models prefer correct answers due to data compressibility structure rather than truth, using small transformers on contradictory corpora.

Ax Xingze Zou, Jing Wang, Yuhua Zheng, Xueyi Chen, Haolei Bai, Lingcheng Kong, Syed A. R. Abu-Bakar, Zhaode Wang, Chengfei Lv, Haoji Hu, Huan Wang 3/17/2026

MobileKernelBench: Can LLMs Write Efficient Kernels for Mobile Devices?

MobileKernelBench benchmark evaluating LLM capability to generate efficient computational kernels for mobile devices, with systematic investigation of code generation limits.

Ax Zhaoyang Jiang, Zhizhong Fu, David McAllister, Yunsoo Kim, Honghan Wu 3/17/2026

LoV3D: Grounding Cognitive Prognosis Reasoning in Longitudinal 3D Brain MRI via Regional Volume Assessments

LoV3D: Vision-language model pipeline for longitudinal brain MRI analysis that grounds neurological disease progression reasoning in regional volume measurements.

Ax Ionel Cristian Vladu, Nicu Bizdoaca, Ionica Pirici, Tudor-Adrian Balseanu, Eduard Nicusor Bondoc 3/17/2026

The DIME Architecture: A Unified Operational Algorithm for Neural Representation, Dynamics, Control and Integration

Theoretical neural architecture integrating perception, memory, prediction, and control as unified computational framework inspired by neuroscience evidence.

Ax Duncan Eddy, Esen Yel, Emma Passmore, Niles Egan, Grayson Armour, Dylan M. Asmar, Mykel J. Kochenderfer 3/17/2026

Optimizing Task Completion Time Updates Using POMDPs

POMDP-based approach for optimizing when to update task completion time announcements in project management, balancing accuracy and stakeholder trust.

Ax Zheda Mai, Ke Zhang, Fu-En Wang, Zixiao Ken Wang, Albert Y. C. Chen, Lu Xia, Min Sun, Wei-Lun Chao, Cheng-Hao Kuo 3/17/2026

Revisiting Model Stitching In the Foundation Model Era

Research on model stitching technique for Vision Foundation Models, testing representational compatibility across models with different training objectives and data sources.

Ax Lehui Li, Yuyao Wang, Jisheng Yan, Wei Zhang, Jinliang Deng, Haoliang Sun, Zhongyi Han, Yongshun Gong 3/17/2026

From Text to Forecasts: Bridging Modality Gap with Temporal Evolution Semantic Space

Method for incorporating text into time-series forecasting by bridging the modality gap between qualitative text and quantitative forecasting signals through semantic space alignment.

Ax Shuxin Liu, Ou Wu 3/17/2026

MetaKE: Meta-learning Aligned Knowledge Editing via Bi-level Optimization

MetaKE addresses knowledge editing in LLMs using bi-level optimization to fix specific facts without degrading general capabilities, identifying semantic-execution misalignment issues.

Ax Konstantinos F. Xylogiannopoulos, Petros Xanthopoulos, Panagiotis Karampelas, Georgios A. Bakamitsos 3/17/2026

Experimental evidence of progressive ChatGPT models self-convergence

Empirical study of model collapse in large language models trained recursively on synthetic data.

Ax Ridwan Arefeen, Xiaoxiao Miao, Rong Tong, Aik Beng Ng, Simon See, Timothy Liu 3/17/2026

DAST: A Dual-Stream Voice Anonymization Attacker with Staged Training

Dual-stream voice anonymization attacker using spectral and self-supervised learning features for privacy evaluation.

Ax Kadir-Kaan \"Ozer, Ren\'e Ebeling, Markus Enzweiler 3/17/2026

Surprised by Attention: Predictable Query Dynamics for Time Series Anomaly Detection

Attention-based anomaly detector for multivariate time series using predictable query dynamics.

Ax Boxuan Lyu, Haiyue Song, Zhi Qu 3/17/2026

Is Human Annotation Necessary? Iterative MBR Distillation for Error Span Detection in Machine Translation

Self-evolution framework using Minimum Bayes Risk decoding for error span detection in machine translation without human annotations.

Ax Dayuan Fu, Shenyu Wu, Yunze Wu, Zerui Peng, Yaxing Huang, Jie Sun, Ji Zeng, Mohan Jiang, Lin Zhang, Yukun Li, Jiarui Hu, Liming Liu, Jinlong Hou, Pengfei Liu 3/17/2026

daVinci-Env: Open SWE Environment Synthesis at Scale

Large-scale open-source software engineering environment for training AI agents with executable, verifiable tasks and dynamic feedback.

Ax Yangsong Zhang, Anujith Muraleedharan, Rikhat Akizhanov, Abdul Ahad Butt, G\"ul Varol, Pascal Fua, Fabio Pizzati, Ivan Laptev 3/17/2026

PhysMoDPO: Physically-Plausible Humanoid Motion with Preference Optimization

Method using preference optimization to generate physically-plausible humanoid motion from text descriptions.

Ax Krish Tadigotla 3/17/2026

Translational Gaps in Graph Transformers for Longitudinal EHR Prediction: A Critical Appraisal of GT-BEHRT

Critical analysis of graph transformer architectures for predicting outcomes from longitudinal electronic health records.

Ax Hang Thi-Thuy Le, Long Minh Bui, Minh Hoang, Trong Nghia Hoang 3/17/2026

Continual Fine-Tuning with Provably Accurate and Parameter-Free Task Retrieval

Method for continual fine-tuning of pre-trained models on sequential tasks with parameter-free task retrieval and no forgetting.

Ax Marie-Pierre Sylvestre, Laurence Boulanger 3/17/2026

Introducing Feature-Based Trajectory Clustering, a clustering algorithm for longitudinal data

Clustering algorithm for longitudinal data analyzing time-dependent variables across individuals with shared temporal characteristics.

Ax Yi-Xuan Deng, Xiaoqin Liu, Yi Zhang, Guo-Wei Yang, Shuojin Yang 3/17/2026

Your Code Agent Can Grow Alongside You with Structured Memory

Code agent framework with structured memory enabling adaptive learning from project evolution and past successful reasoning trajectories.

Ax Vladimer Khasia 3/17/2026

Beyond Attention: True Adaptive World Models via Spherical Kernel Operator

World model architecture using spherical kernel operators to handle shifting data distributions in latent space transitions.

Ax Fernando Spadea, Oshani Seneviratne 3/17/2026

Federated Personal Knowledge Graph Completion with Lightweight Large Language Models for Personalized Recommendations

Federated framework combining lightweight LLMs with personal knowledge graphs for privacy-preserving personalized recommendations.

Ax Yongchao Huang, Hassan Raza 3/17/2026

Knowledge, Rules and Their Embeddings: Two Paths towards Neuro-Symbolic JEPA

Neuro-symbolic architecture combining self-supervised learning with verifiable logic rules to mitigate spurious correlations and shortcut learning.

Ax Hanseul Choi, Jinyeong Park, Seongwon Jin, Sungho Park, Jibum Kim 3/17/2026

CAMEL-CLIP: Channel-aware Multimodal Electroencephalography-text Alignment for Generalizable Brain Foundation Models

Multimodal foundation model for EEG-text alignment robust to channel heterogeneity for brain signal analysis applications.

Ax Idan Sulami, Alon Itzkovitch, Michael R. Kearney, Moni Shahar, Ofir Levy 3/17/2026

Spatially Aware Deep Learning for Microclimate Prediction from High-Resolution Geospatial Imagery

Deep learning approach for microclimate prediction from geospatial imagery incorporating spatial relationships in temperature modeling.

Ax Gianluigi Silvestri, Edoardo Cetin 3/17/2026

Learning from Partial Chain-of-Thought via Truncated-Reasoning Self-Distillation

Self-distillation method reducing computational cost of chain-of-thought reasoning by training models to generate correct predictions from truncated reasoning.

Ax Wanyin Wu, Kanxue Li, Baosheng Yu, Haoyun Zhao, Yibing Zhan, Dapeng Tao, Hua Jin 3/17/2026

PREBA: Surgical Duration Prediction via PCA-Weighted Retrieval-Augmented LLMs and Bayesian Averaging Aggregation

Zero-shot LLM approach for surgical duration prediction combining retrieval-augmentation with Bayesian averaging, avoiding need for fine-tuning.

Ax Daniel Bretsko, Piotr Walas, Devashish Khulbe, Sebastian Stros, Stanislav Sobolevsky, Tomas Satura 3/17/2026

FastODT: A tree-based framework for efficient continual learning

Tree-based continual learning framework for non-stationary data distributions with constrained computational resources in time series applications.

Ax Thibault Formal, Maxime Louis, Herv\'e Dejean, St\'ephane Clinchant 3/17/2026

Learning Retrieval Models with Sparse Autoencoders

Sparse autoencoders foundation for learned sparse retrieval, decomposing LLM representations into interpretable latent features for efficient document retrieval.

Ax Farid Najar, Dominique Barth, Yann Strozecki 3/17/2026

Demand Acceptance using Reinforcement Learning for Dynamic Vehicle Routing Problem with Emission Quota

Hybrid reinforcement learning framework for dynamic vehicle routing with emission constraints and demand acceptance optimization.

Ax Emil Hovad 3/17/2026

A Stability-Aware Frozen Euler Autoencoder for Physics-Informed Tracking in Continuum Mechanics (SAFE-PIT-CM)

Physics-informed autoencoder architecture for recovering material parameters and temporal evolution from video in continuum mechanics.

Ax Sunghyeon Woo, Jaeeun Kil, Hoseung Kim, Minsub Kim, Joonghoon Kim, Ahreum Seo, Sungjae Lee, Minjung Jo, Jiwon Ryu, Baeseong Park, Se Jung Kwon, Dongsoo Lee 3/17/2026

ICaRus: Identical Cache Reuse for Efficient Multi Model Inference

Multi-model inference optimization reusing identical KV caches across models to reduce memory consumption in agentic AI systems.

Ax Jieming Bian, Lei Wang, Letian Zhang, Jie Xu 3/17/2026

FedTreeLoRA: Reconciling Statistical and Functional Heterogeneity in Federated LoRA Fine-Tuning

Federated learning method for LoRA fine-tuning of LLMs addressing statistical and functional heterogeneity across model layers.

Ax Aurelien Ghiglino, Daniel Elenius, Anirban Roy, Ramneet Kaur, Manoj Acharya, Colin Samplawski, Brian Matejek, Susmit Jha, Juan Alonso, Adam Cobb 3/17/2026

Do Diffusion Models Dream of Electric Planes? Discrete and Continuous Simulation-Based Inference for Aircraft Design

Generative model approach for aircraft design using simulation-based inference with diffusion models and hierarchical probabilistic methods.

Ax Angelika Romanou, Mark Ibrahim, Candace Ross, Chantal Shaib, Kerem Okta, Sam Bell, Elia Ovalle, Jesse Dodge, Antoine Bosselut, Koustuv Sinha, Adina Williams 3/17/2026

Brittlebench: Quantifying LLM robustness via prompt sensitivity

Benchmark quantifying LLM robustness by measuring model sensitivity to prompt variations, typos, and paraphrases in real-world conditions.

Ax Anirudh Jaidev Mahesh, Ben Griffin, Fuat Alican, Joseph Ternasky, Zakari Salifu, Kelvin Amoaba, Yagiz Ihlamur, Aaron Ontoyin Yin, Aikins Laryea, Afriyie Samuel, Yigit Ihlamur 3/17/2026

From Stochastic Answers to Verifiable Reasoning: Interpretable Decision-Making with LLM-Generated Code

Framework reframing LLMs as code generators for interpretable decision-making in high-stakes scenarios, improving reproducibility over black-box approaches.

Ax Yingsheng Geng, Yuchong Gao, Weihong Wu, Guyue Liu, Jiang Liu 3/17/2026

RelayCaching: Accelerating LLM Collaboration via Decoding KV Cache Reuse

KV cache optimization technique for multi-agent LLM systems that reuses decoding caches to reduce memory usage and latency in collaborative AI tasks.