Isolater - Feed

Ax Zilin Huang, Zihao Sheng, Zhengyang Wan, Yansong Qu, Junwei You, Sicong Jiang, Sikai Chen 3/20/2026

DriveVLM-RL: Neuroscience-Inspired Reinforcement Learning with Vision-Language Models for Safe and Deployable Autonomous Driving

Reinforcement learning approach combining vision-language models with neuroscience-inspired reward signals for safe autonomous driving without manual reward engineering.

Ax Zichen Xie, Wenxi Wang 3/20/2026

Can LLMs Reason Like Automated Theorem Provers for Rust Verification? VCoT-Bench: Evaluating via Verification Chain of Thought

Evaluation framework (VCoT-Bench) measuring LLM reasoning ability for Rust program verification through intermediate verification steps, not just pass/fail outcomes.

Ax Yanchuan Tang, Taowen Wang, Yuefei Chen, Boxuan Zhang, Qiang Guan, Ruixiang Tang 3/20/2026

Shifting Uncertainty to Critical Moments: Towards Reliable Uncertainty Quantification for VLA Model

Uncertainty quantification method for Vision-Language-Action robotic models that detects safety-critical moments during continuous control rather than averaging uncertainty signals.

Ax Ruishuo Chen, Yu Chen, Zhuoran Li, Longbo Huang 3/20/2026

PowerFlow: Unlocking the Dual Nature of LLMs via Principled Distribution Matching

PowerFlow: principled RLIF framework for unsupervised LLM capability elicitation via distribution matching instead of heuristic rewards.

Ax Guangsheng Yu, Qin Wang, Rui Lang, Shuai Su, Xu Wang 3/20/2026

PlanTwin: Privacy-Preserving Planning Abstractions for Cloud-Assisted LLM Agents

Privacy-preserving LLM agent planning via abstractions preventing exposure of local environment data to cloud services.

Ax Sam Ganzfried 3/20/2026

Evolutionarily Stable Stackelberg Equilibrium

Game theory: evolutionarily stable Stackelberg equilibrium solution concept with leader-follower dynamics.

Ax Linfeng Zhang, Taoyong Cui, Dongzhan Zhou, Lei Bai, Sufei Zhang, Luca Rossi, Mao Su, Wanli Ouyang, Pheng-Ann Heng 3/20/2026

An SO(3)-equivariant reciprocal-space neural potential for long-range interactions

Neural potential with SO(3) equivariance for molecular systems with long-range electrostatic interactions.

Ax Arushi Rai, Qiang Zhang, Hanqing Zeng, Yunkai Zhang, Dipesh Tamboli, Xiangjun Fan, Zhuokai Zhao 3/20/2026

TARo: Token-level Adaptive Routing for LLM Test-time Alignment

Token-level Adaptive Routing: inference-time alignment method for freezing LLMs toward structured reasoning without post-training.

Ax Li Wenxiu, Wen Zhanjie, Xia Jiechang, Guo Jingqiao 3/20/2026

The Spillover Effects of Peer AI Rinsing on Corporate Green Innovation

Economics study analyzing spillover effects of AI washing in corporate sustainability claims via semantic analysis.

Ax Arundhathi Dev, Justin Zhan 3/20/2026

Self-Tuning Sparse Attention: Multi-Fidelity Hyperparameter Optimization for Transformer Acceleration

Automated hyperparameter optimization framework for sparse attention mechanisms using Bayesian optimization and multi-fidelity search.

Ax Yang Liu, Jiyao Yang, Hongjin Zhao, Xiaoyong Li, Yanzhe Ji, Xingjian Li, Runmin Jiang, Tianyang Wang, Saeed Anwar, Dongwoo Kim, Yue Yao, Zhenyue Qin, Min Xu 3/20/2026

Mind the Rarities: Can Rare Skin Diseases Be Reliably Diagnosed via Diagnostic Reasoning?

Benchmark evaluating large vision-language models on rare skin disease diagnosis with long-context reasoning.

Ax Li Wenxiu, Wen Zhanjie, Xia Jiechang, Guo Jingqiao 3/20/2026

The Impact of Corporate AI Washing on Farmers' Digital Financial Behavior Response -- An Analysis from the Perspective of Digital Financial Exclusion

Economics paper analyzing corporate AI washing claims and impact on farmers' fintech adoption using CHFS data.

Ax Huy Che, Dinh-Duy Phan, Duc-Khai Lam 3/20/2026

R&D: Balancing Reliability and Diversity in Synthetic Data Augmentation for Semantic Segmentation

Synthetic data augmentation using generative models for semantic segmentation balancing reliability and diversity.

Ax Asmita Bhardwaj, Yuya Jeremy Ong, Eelaaf Zahid, Basel Shbita 3/20/2026

Adaptive Decoding via Test-Time Policy Learning for Self-Improving Generation

RL-based adaptive decoder for LLMs that learns task-specific generation policies at test-time for improved output quality.

Ax Haechan Kim, Soohyun Ryu, Gyouk Chu, Doohyuk Jang, Eunho Yang 3/20/2026

Discounted Beta--Bernoulli Reward Estimation for Sample-Efficient Reinforcement Learning with Verifiable Rewards

Sample-efficient reinforcement learning with verifiable rewards for improving LLM reasoning with Bayesian reward estimation.

Ax Chuxuan Hu, Philip Li, Maxwell Yang, Daniel Kang 3/20/2026

SODIUM: From Open Web Data to Queryable Databases

Research task: automatically extracting and querying structured databases from open web sources for analytical questions.

Ax Xiangxu Zhang, Xiao Zhou, Hongteng Xu, Jianxun Lian 3/20/2026

HypeMed: Enhancing Medication Recommendations with Hypergraph-Based Patient Relationships

Hypergraph neural network for medication recommendations leveraging patient relationships and clinical history.

Ax Vahid Monfared, Mohammad Hadi Gharib, Ali Sabri, Maryam Shahali, Farid Rashidi, Amit Mehta, Reza Rawassizadeh 3/20/2026

Interpretable Prostate Cancer Detection using a Small Cohort of MRI Images

ML research on prostate cancer detection using Vision Transformers on small 162-image dataset with transfer learning.

Ax Haonan Yu, Junhao Liu, Zhenyu Yan, Haoran Lin, Xin Zhang 3/20/2026

WASD: Locating Critical Neurons as Sufficient Conditions for Explaining and Controlling LLM Behavior

WASD framework identifies critical neurons as sufficient conditions for explaining and controlling LLM behavior with natural language directives.

Ax Ziyi Wang, Qizan Guo, Rishitosh Singh, Xiyang Hu 3/20/2026

Do Vision Language Models Understand Human Engagement in Games?

Evaluation of vision-language models on inferring human engagement from gameplay video across multiple prompting strategies and games.

Ax Mingde Zhou, Zheng Chen, Yulun Zhang 3/20/2026

Efficient Video Diffusion with Sparse Information Transmission for Video Compression

Video compression method using diffusion models with sparse information transmission to improve perceptual quality at ultra-low bitrates.

Ax Teerapong Panboonyuen 3/20/2026

Foundations and Architectures of Artificial Intelligence for Motor Insurance

Handbook formalizing AI architectures for motor insurance, covering perception, multimodal reasoning, and production infrastructure for risk assessment.

Ax Elad Yoshai, Ariel D. Yoshai, Natan T. Shaked 3/20/2026

CAFlow: Adaptive-Depth Single-Step Flow Matching for Efficient Histopathology Super-Resolution

CAFlow framework applies adaptive-depth flow matching for efficient histopathology image super-resolution with reduced computational costs.

Ax Liwei Che, Zhiyu Xue, Yihao Quan, Benlin Liu, Zeru Shi, Michelle Hurst, Jacob Feldman, Ruixiang Tang, Ranjay Krishna, Vladimir Pavlovic 3/20/2026

Counting Circuits: Mechanistic Interpretability of Visual Reasoning in Large Vision-Language Models

Mechanistic study of how large vision-language models implement counting behavior, combining synthetic benchmarks with interpretability analysis.

Ax Abhinaba Basu, Pavan Chakraborty 3/20/2026

When Names Change Verdicts: Intervention Consistency Reveals Systematic Bias in LLM Decision-Making

ICE-Guard framework detects spurious feature reliance in LLMs for high-stakes decisions through intervention consistency testing on demographic, authority, and framing biases.

Ax Andrew Choi, Xinjie Wang, Zhizhong Su, Wei Xu 3/20/2026

Scaling Sim-to-Real Reinforcement Learning for Robot VLAs with Generative 3D Worlds

Method for scaling vision-language-action robot learning using generative 3D worlds to address sim-to-real gap.

Ax Haonan Ping, Jian Jiang, Cheng Yuan, Qizhen Sun, Lv Wu, Yutong Ban 3/20/2026

SCISSR: Scribble-Conditioned Interactive Surgical Segmentation and Refinement

SCISSR: Scribble-based interactive framework for surgical scene segmentation using SAM-style prompting.

Ax Xiang Chen, Fangfang Yang, Chunlei Meng, Chengyin Hu, Ang Li, Yiwei Wei, Jiahuan Long, Jiujiang Guo 3/20/2026

CoDA: Exploring Chain-of-Distribution Attacks and Post-Hoc Token-Space Repair for Medical Vision-Language Models

CoDA explores adversarial attacks on medical vision-language models and proposes token-space repair methods.

Ax Dan Ben-Ami, Gabriele Serussi, Kobi Cohen, Chaim Baskin 3/20/2026

HiMu: Hierarchical Multimodal Frame Selection for Long Video Question Answering

HiMu hierarchical frame selection method for long video question answering with vision-language models.

Ax Hoang T. H. Cao, Hai D. V. Trinh, Tho Quan, Lan V. Truong 3/20/2026

Transformers Learn Robust In-Context Regression under Distributional Uncertainty

Study showing Transformers learn robust in-context regression under distributional uncertainty without restrictive assumptions.

Ax Shenggui Li, Chao Wang, Yikai Zhu, Yubo Wang, Fan Yin, Shuai Shi, Yefei Chen, Xiaomin Dong, Qiaoling Chen, Jin Pan, Ji Li, Laixin Xie, Yineng Zhang, Lei Yu, Yonggang Wen, Ivor Tsang, Tianwei Zhang 3/20/2026

SpecForge: A Flexible and Efficient Open-Source Training Framework for Speculative Decoding

SpecForge: Open-source production framework for training draft models used in speculative decoding to reduce LLM inference latency.

Ax Abhinaba Basu, Pavan Chakraborty 3/20/2026

ICE: Intervention-Consistent Explanation Evaluation with Statistical Grounding for LLMs

ICE framework evaluates LLM explanation faithfulness using statistical intervention testing with randomization baselines.

Ax Xuan Liu, Xiaobin Chang 3/20/2026

Elastic Weight Consolidation Done Right for Continual Learning

Systematic analysis and improvements to Elastic Weight Consolidation for continual learning to better estimate weight importance.

Ax Ye Kyaw Thu, Thazin Myint Oo, Thepchai Supnithi 3/20/2026

myMNIST: Benchmark of PETNN, KAN, and Classical Deep Learning Models for Burmese Handwritten Digit Recognition

Benchmark comparing PETNN, KAN, and classical deep learning models on myMNIST Burmese handwritten digit recognition dataset.

Ax Xin Li, Shiming Yu, Leming Shen, Jianing Zhang, Yuanqing Zheng, Yaxiong Xie 3/20/2026

AutORAN: LLM-driven Natural Language Programming for Agile xApp Development

AutORAN uses LLMs for natural language programming to simplify xApp development in Open Radio Access Networks.

Ax Xiaoyin Chen, Canwen Xu, Yite Wang, Boyi Liu, Zhewei Yao, Yuxiong He 3/20/2026

Learning to Self-Evolve

LSE framework trains LLMs to self-improve during inference by iteratively refining context based on problem feedback.

Ax Bin Cao, Sipeng Zheng, Hao Luo, Boyuan Li, Jing Liu, Zongqing Lu 3/20/2026

OpenT2M: No-frill Motion Generation with Open-source,Large-scale, High-quality Data

OpenT2M: Million-scale open-source dataset with 2800+ hours of motion data for text-to-motion generation in animation and robotics.

Ax Shuqi Xiao, Maani Ghaffari, Chengzhong Xu, Hui Kong 3/20/2026

REST: Receding Horizon Explorative Steiner Tree for Zero-Shot Object-Goal Navigation

REST algorithm for zero-shot object-goal navigation using receding horizon planning and Steiner trees for generating subgoal candidates in unknown environments.

Ax J\'an Mikulec, Jakub Breier, Xiaolu Hou 3/20/2026

Beyond TVLA: Anderson-Darling Leakage Assessment for Neural Network Side-Channel Leakage Detection

Anderson-Darling leakage assessment method for detecting side-channel leakage in neural networks, improving on TVLA's mean-based approach.

Ax Pius Horn, Janis Keuper 3/20/2026

Benchmarking PDF Parsers on Table Extraction with LLM-based Semantic Evaluation

Benchmarking framework for PDF table extraction using LLM-based semantic evaluation on synthetically generated PDFs with LaTeX ground truth.

Ax Jingguo Qu, Xinyang Han, Yao Pu, Man-Lik Chui, Simon Takadiyi Gunda, Ziman Chen, Jing Qin, Ann Dorothy King, Winnie Chiu-Wing Chu, Jing Cai, Michael Tin-Cheung Ying 3/20/2026

Multiscale Switch for Semi-Supervised and Contrastive Learning in Medical Ultrasound Image Segmentation

SSL framework for medical ultrasound image segmentation using contrastive learning with multiscale switching to handle limited labeled data and imaging artifacts.

Ax Eduardo Di Santi 3/20/2026

Cognitive Amplification vs Cognitive Delegation in Human-AI Systems: A Metric Framework

Mathematical framework distinguishing cognitive amplification from cognitive delegation in human-AI systems for measuring AI impact on human reasoning.

Ax Zhicong Lu, Zichuan Lin, Wei Jia, Changyuan Tian, Deheng Ye, Peiguang Li, Li Jin, Nayu Liu, Guangluan Xu, Wei Feng 3/20/2026

HISR: Hindsight Information Modulated Segmental Process Rewards For Multi-turn Agentic Reinforcement Learning

HISR framework improving multi-turn agentic reinforcement learning through hindsight information modulation and segmental process rewards for complex long-horizon tasks.

Ax Mohamed Youssef, Mayar Elfares, Anna-Maria Meer, Matteo Bortoletto, Andreas Bulling 3/20/2026

Ontology-Guided Diffusion for Zero-Shot Visual Sim2Real Transfer

Neuro-symbolic sim2real image translation framework using structured ontology-guided diffusion for zero-shot domain transfer without labeled real data.

Ax Hao Wang, Licheng Pan, Zhichao Chen, Chunyuan Zheng, Zhixuan Chu, Xiaoxi Li, Yuan Lu, Xinggao Liu, Haoxuan Li, Zhouchen Lin 3/20/2026

CausalRM: Causal-Theoretic Reward Modeling for RLHF from Observational User Feedbacks

CausalRM method for learning reward models from observational user feedback (clicks, upvotes) as scalable alternative to controlled RLHF annotation.

Ax Dimitris Mitropoulos, Nikolaos Alexopoulos, Georgios Alexopoulos, Diomidis Spinellis 3/20/2026

Measuring and Exploiting Confirmation Bias in LLM-Assisted Security Code Review

Study measuring confirmation bias in LLM-based security code review systems and its exploitability in software supply-chain attacks.

Ax Isabel Rio-Torto, Jaime S. Cardoso, Lu\'is F. Teixeira 3/20/2026

WeNLEX: Weakly Supervised Natural Language Explanations for Multilabel Chest X-ray Classification

Weakly supervised method for generating natural language explanations in chest X-ray classification without explicit explanation annotations.

Ax Gabriele Carrino, Andrea Sassella, Nicolo Brunello, Federico Toschi, Mark James Carman 3/20/2026

Are complicated loss functions necessary for teaching LLMs to reason?

Ablation study of Group Relative Policy Optimization components for LLM reasoning training, questioning necessity of complex loss functions.

Ax Haochen Zhao, Shaoyang Cui 3/20/2026

ClawTrap: A MITM-Based Red-Teaming Framework for Real-World OpenClaw Security Evaluation

ClawTrap MITM-based red-teaming framework for evaluating security robustness of autonomous web agents like OpenClaw against network-layer threats.

Ax Channe Chwa, Xinle Wu, Yao Lu 3/20/2026

Automatic Configuration of LLM Post-Training Pipelines

AutoPipe framework for automated configuration of LLM post-training pipelines combining supervised fine-tuning and reinforcement learning under budget constraints.