Isolater - Feed

Ax Haokun Lin, Haobo Xu, Yichen Wu, Ziyu Guo, Renrui Zhang, Zhichao Lu, Ying Wei, Qingfu Zhang, Zhenan Sun 3/17/2026

Quantization Meets dLLMs: A Systematic Study of Post-training Quantization for Diffusion LLMs

Systematic study of post-training quantization methods for diffusion LLMs to enable edge device deployment, comparing compression techniques.

Ax Dongjun Lee, Changho Hwang, Kimin Lee 3/17/2026

Learning to Generate Unit Test via Adversarial Reinforcement Learning

UTRL: reinforcement learning framework training LLMs to generate high-quality unit tests automatically, addressing test generation challenges.

Ax Katalina Hernandez Delgado 3/17/2026

The Law-Following AI Framework: Legal Foundations and Technical Constraints. Legal Analogues for AI Actorship and technical feasibility of Law Alignment

Research evaluating Law-Following AI framework for embedding legal compliance in advanced AI agents, analyzing legal personhood constructs and technical feasibility.

Ax BaiChen Fan, Yuanxi Cui, Jian Li, Qin Wang, Shibo Zhao, Muqing Cao, Sifan Zhou 3/17/2026

Beyond Frame-wise Tracking: A Trajectory-based Paradigm for Efficient Point Cloud Tracking

Trajectory-based paradigm for efficient 3D point cloud tracking in robotics and autonomous systems.

Ax Zhuoxiao Chen, Hongyang Yu, Ying Xu, Yadan Luo, Long Duong, Yuan-Fang Li 3/17/2026

OraPO: Oracle-educated Reinforcement Learning for Data-efficient and Factual Radiology Report Generation

Reinforcement learning approach for radiology report generation using FactScore-based rewards with reduced data requirements.

Ax Hanqing Liu, Shouwei Ruan, Jiahuan Long, Junqi Wu, Jiacheng Hou, Huili Tang, Tingsong Jiang, Weien Zhou, Wen Yao 3/17/2026

Eva-VLA: Evaluating Vision-Language-Action Models' Robustness Under Real-World Physical Variations

Framework evaluating robustness of Vision-Language-Action models under real-world physical variations for robotic tasks.

Ax Erik Bo\v{z}\'ik, Marek \v{S}uppa 3/17/2026

SloPal: A 60-Million-Word Slovak Parliamentary Corpus with Aligned Speech and Fine-Tuned ASR Models

Slovak parliamentary speech corpus with 66M words and fine-tuned ASR models for low-resource language recognition.

Ax Niclas Pokel, Pehu\'en Moure, Roman B\"ohringer, Yingqiang Gao 3/17/2026

Data-Efficient ASR Personalization for Non-Normative Speech Using an Uncertainty-Based Phoneme Difficulty Score for Guided Sampling

Data-efficient ASR personalization using phoneme-level uncertainty scoring and variational inference. Guides fine-tuning for non-normative speech recognition.

Ax Niclas Pokel, Pehu\'en Moure, Roman Boehringer, Shih-Chii Liu, Yingqiang Gao 3/17/2026

Variational Low-Rank Adaptation for Personalized Impaired Speech Recognition

Variational low-rank adaptation method for personalizing speech recognition on impaired speech using foundation models. Addresses acoustic variability and data scarcity.

Ax Shiyi Liang, Xinyuan Chang, Changjie Wu, Huiyuan Yan, Yifan Bai, Xinran Liu, Hang Zhang, Yujian Yuan, Shuang Zeng, Mu Xu, Xing Wei 3/17/2026

Persistent Autoregressive Mapping with Traffic Rules for Autonomous Driving

Autoregressive method for autonomous driving combining HD map construction with persistent traffic rule awareness across extended driving sequences.

Ax Mohammed Sabry, Anya Belz 3/17/2026

Induction Signatures Are Not Enough: A Matched-Compute Study of Load-Bearing Structure in In-Context Learning

Matched-compute study evaluating synthetic data interventions for in-context learning in language models. Tests mechanism-targeted pretraining effects.

Ax Yuan-An Xiao, Pengfei Gao, Chao Peng, Yingfei Xiong 3/17/2026

Reducing Cost of LLM Agents with Trajectory Reduction

Method for reducing LLM agent inference costs through trajectory reduction. Addresses token cost efficiency in multi-turn agent systems for software engineering.

Ax Ziheng Cheng, Xin Guo, Yufei Zhang 3/17/2026

Deterministic Policy Gradient for Reinforcement Learning with Continuous Time and State

Continuous-time reinforcement learning theory with deterministic policy gradients for continuous state and action spaces.

Ax Daniel Palenicek, Florian Vogt, Joe Watson, Ingmar Posner, Jan Peters 3/17/2026

XQC: Well-conditioned Optimization Accelerates Deep Reinforcement Learning

Deep reinforcement learning optimization method using eigenspectrum analysis and condition numbers to improve sample efficiency and critic network performance.

Ax Shuyang Jiang, Yusheng Liao, Ya Zhang, Yanfeng Wang, Yu Wang 3/17/2026

Overthinking Reduction with Decoupled Rewards and Curriculum Data Scheduling

Technique reducing LLM reasoning model overthinking through decoupled rewards and curriculum scheduling. Addresses excessive token generation without performance gain.

Ax R\u{a}zvan-Andrei Mati\c{s}an, Vincent Tao Hu, Grigory Bartosh, Bj\"orn Ommer, Cees G. M. Snoek, Max Welling, Jan-Willem van de Meent, Mohammad Mahdi Derakhshani, Floor Eijkelboom 3/17/2026

Purrception: Variational Flow Matching for Vector-Quantized Image Generation

Variational flow matching approach for vector-quantized image generation combining categorical supervision with continuous transport dynamics.

Ax Byungjun Kim, Soobin Um, Jong Chul Ye 3/17/2026

Diverse Text-to-Image Generation via Contrastive Noise Optimization

Diffusion model method for diverse text-to-image generation via contrastive noise optimization. Addresses mode collapse in text-guided image synthesis.

Ax Ziyan Wang, Zheng Wang, Jie Fu, Xingwei Qu, Qi Cheng, Shengpu Tang, Minjia Zhang, Xiaoming Huo 3/17/2026

Slow-Fast Policy Optimization: Reposition-Before-Update for LLM Reasoning

Reinforcement learning framework (SFPO) for improving LLM reasoning by decomposing policy optimization into slow and fast components to reduce training instability.

Ax Christoph Riedl 3/17/2026

Emergent Coordination in Multi-Agent Language Models

Information-theoretic framework measuring higher-order structure and emergence in multi-agent LLM systems. Tests for dynamical emergence in agent coordination.

Ax Gagan Bhatia, Somayajulu G Sripada, Kevin Allan, Jacobo Azcona 3/17/2026

Distributional Semantics Tracing: A Framework for Explaining Hallucinations in Large Language Models

Model-native technique to explain LLM hallucinations using layer-wise semantic maps. Traces concept flow through residual streams via unembedding.

Ax Vishakha Lall, Yisi Liu 3/17/2026

Dynamic Stress Detection: A Study of Temporal Progression Modelling of Stress in Speech

Method for detecting psychological stress from speech using temporal modeling with cross-attention. Treats stress as dynamically evolving phenomenon.

Ax Ranjan Sapkota, Manoj Karkee 3/17/2026

Ultralytics YOLO Evolution: An Overview of YOLO26, YOLO11, YOLOv8 and YOLOv5 Object Detectors for Computer Vision and Pattern Recognition

Comprehensive overview of Ultralytics YOLO object detection model evolution from YOLOv5 to YOLO26. Details architectural improvements and benchmarking.

Ax Seong-Joon Park, Hee-Youl Kwak, Yongjune Kim 3/17/2026

Qubit-centric Transformer for Surface Code Decoding

Transformer-based neural network decoder for quantum error correction. Applies deep learning to quantum computing reliability.

Ax Israel Mason-Williams, Gabryel Mason-Williams, Helen Yannakoudakis 3/17/2026

A Functional Perspective on Knowledge Distillation in Neural Networks

Theoretical analysis of knowledge distillation in neural networks from a functional perspective. Decouples compression from architecture reduction.

Ax Milad Hoseinpour, Vladimir Dvorkin 3/17/2026

DiffOPF: Diffusion Solver for Optimal Power Flow

Deep learning approach using diffusion models to solve optimal power flow problems in electrical grids. Captures multi-valued solution mappings.

Ax Chih-Kai Yang, Yen-Ting Piao, Tzu-Wen Hsu, Szu-Wei Fu, Zhehuai Chen, Ke-Han Lu, Sung-Feng Huang, Chao-Han Huck Yang, Yu-Chiang Frank Wang, Yun-Nung Chen, Hung-yi Lee 3/17/2026

SAKE: Towards Editing Auditory Attribute Knowledge of Large Audio-Language Models

Benchmark and methods for editing knowledge in audio-language models without retraining. First work on auditory attribute knowledge editing.

Ax Junhao Zhao, Zishuai Liu, Ruili Fang, Jin Lu, Linghan Zhang, Fei Dou 3/17/2026

CARE: Contrastive Alignment for ADL Recognition from Event-Triggered Sensor Streams

Machine learning method for recognizing daily activities from sensor data using contrastive learning. Addresses ambient assisted living applications.

Ax Mingyan Yang, Guanjie Wang, Manqi Luo, Yifei Liu, Chen Chen, Han Zhao, Yu Feng, Quan Chen, Minyi Guo 3/17/2026

Justitia: Fair and Efficient Scheduling of Task-parallel LLM Agents with Selective Pampering

Justitia scheduling algorithm for fair and efficient execution of task-parallel LLM agents on shared GPUs. Resource scheduling optimization for agent systems.

Ax Xueyi Chen, Keda Tao, Kele Shao, Huan Wang 3/17/2026

StreamingTOM: Streaming Token Compression for Efficient Video Understanding

StreamingTOM training-free token compression for streaming video understanding. Efficiency optimization for video vision-language models.

Ax Jinchang Luo, Mingquan Cheng, Fan Wan, Ni Li, Xiaoling Xia, Shuangshuang Tian, Tingcheng Bian, Haiwei Wang, Haohuan Fu, Yan Tao 3/17/2026

GlobalRAG: Enhancing Global Reasoning in Multi-hop Question Answering via Reinforcement Learning

GlobalRAG reinforcement learning approach for multi-hop question answering with improved global reasoning. RAG system enhancement via RL for better query planning.

Ax Vishakha Lall, Yisi Liu 3/17/2026

Eyes on Target: Gaze-Aware Object Detection in Egocentric Video

Gaze-guided object detection framework for egocentric videos using vision transformers. Computer vision with attention mechanisms.

Ax Nan Li, Albert Gatt, Massimo Poesio 3/17/2026

Grounded Misunderstandings in Asymmetric Dialogue: A Perspectivist Annotation Scheme for MapTask

Annotation scheme for collaborative dialogue corpus capturing speaker perspectives in misunderstandings. Linguistics and NLP dataset annotation work.

Ax Manav Kulshrestha, S. Talha Bukhari, Damon Conover, Aniket Bera 3/17/2026

VLAD-Grasp: Zero-shot Grasp Detection via Vision-Language Models

Zero-shot robotic grasp detection using vision-language models without training data or retraining. Robotics application leveraging VLMs.

Ax Ankan Mullick, Sukannya Purkayastha, Saransh Sharma, Pawan Goyal, Niloy Ganguly 3/17/2026

IDALC: A Semi-Supervised Framework for Intent Detection and Active Learning based Correction

Semi-supervised intent detection framework with active learning correction for voice dialog agents. LLM application for dialog system improvement.

Ax Athul M. Mathew, Haithem Hermassi, Thariq Khalid, Arshad Ali Khan 3/17/2026

GazeVLM: A Vision-Language Model for Multi-Task Gaze Understanding

Vision-language model for unified gaze understanding combining detection, target, and object recognition. Multimodal model for attention estimation.

Ax Khashayar Alavi, Zhastay Yeltay, Lucie Flek, Akbar Karimi 3/17/2026

Privacy-Preserving Explainable AIoT Application via SHAP Entropy Regularization

Privacy-preserving explainable AI for IoT applications using SHAP entropy regularization. Focuses on interpretability and privacy in edge devices.

Ax Bowen Sun, Yujun Cai, Ming-Hsuan Yang, Hang Wu, Yiwei Wang 3/17/2026

PAS: A Training-Free Stabilizer for Temporal Encoding in Video LLMs

Training-free stabilizer (PAS) fixing temporal inconsistency in video LLMs caused by rotary position embedding ripples. Technical improvement for video understanding.

Ax Jian Zhou, Sihao Lin, Shuai Fu, Zerui Li, Gengze Zhou, Qi WU 3/17/2026

Decoupled Action Expert: Confining Task Knowledge to the Conditioning Pathway

Decoupled action expert for vision-language-action models using diffusion/flow-matching for manipulation policies. Computer vision and robotics research.

Ax Kangqiao Zhao, Shuo Huai, Xurui Song, Jun Luo 3/17/2026

Cheating Stereo Matching in Full-scale: Physical Adversarial Attack against Binocular Depth Estimation in Autonomous Driving

Physical adversarial attack against stereo depth estimation in autonomous driving perception. Security research without direct relevance to stated interests.

Ax Yuxuan Gu, Weimin Bai, Yifei Wang, Weijian Luo, He Sun 3/17/2026

Dynamical Mechanisms for Coordinating Long-term Working Memory Based on the Precision of Spike-timing in Cortical Neurons

Neuroscience study of cortical neuron mechanisms underlying long-term working memory through spike-timing precision analysis.