Isolater - Feed

Ax Weixun Wang, XiaoXiao Xu, Wanhe An, Fangwen Dai, Wei Gao, Yancheng He, Ju Huang, Qiang Ji, Hanqi Jin, Xiaoyang Li, Yang Li, Zhongwen Li, Shirong Lin, Jiashun Liu, Zenan Liu, Tao Luo, Dilxat Muhtar, Yuanbin Qu, Jiaqiang Shi, Qinghui Sun, Yingshui Tan, Hao Tang, Runze Wang, Yi Wang, Zhaoguo Wang, Yanan Wu, Shaopan Xiong, Binchen Xu, Xander Xu, Yuchi Xu, Qipeng Zhang, Xixia Zhang, Haizhou Zhao, Jie Zhao, Shuaibing Zhao, Baihui Zheng, Jianhui Zheng, Suhang Zheng, Yanni Zhu, Mengze Cai, Kerui Cao, Xitong Chen, Yue Dai, Lifan Du, Tao Feng, Tao He, Jin Hu, Yijie Hu, Ziyu Jiang, Cheng Li, Xiang Li, Jing Liang, Xin Lin, Chonghuan Liu, ZhenDong Liu, Zhiqiang Lv, Haodong Mi, Yanhu Mo, Junjia Ni, Shixin Pei, Jingyu Shen, XiaoShuai Song, Cecilia Wang, Chaofan Wang, Kangyu Wang, Pei Wang, Tao Wang, Wei Wang, Ke Xiao, Mingyu Xu, Tiange Xu, Nan Ya, Siran Yang, Jianan Ye, Yaxing Zang, Duo Zhang, Junbo Zhang, Boren Zheng, Wanxi Deng, Ling Pan, Lin Qu, Wenbo Su, Jiamang Wang, Wei Wang, Hu Wei, Minggang Wu, Cheng Yu, Bing Zhao, Zhicheng Zheng, Bo Zheng 3/13/2026

Let It Flow: Agentic Crafting on Rock and Roll, Building the ROME Model within an Open Agentic Learning Ecosystem

Agentic Learning Ecosystem (ALE) infrastructure for end-to-end agent development, enabling LLMs to operate in real-world environments with iterative refinement.

Ax Zelai Xu, Zhexuan Xu, Ruize Zhang, Chunyang Zhu, Shi Yu, Weilin Liu, Quanlu Zhang, Wenbo Ding, Chao Yu, Yu Wang 3/13/2026

WideSeek-R1: Exploring Width Scaling for Broad Information Seeking via Multi-Agent Reinforcement Learning

Multi-agent reinforcement learning system exploring width scaling for broad information seeking tasks, addressing organizational capability bottlenecks.

Ax Siyuan Li, Yunjia Wu, Yiyong Xiao, Pingyang Huang, Peize Li, Ruitong Liu, Yan Wen, Te Sun, Fangyi Pei 3/13/2026

Evolving Beyond Snapshots: Harmonizing Structure and Sequence via Entity State Tuning for Temporal Knowledge Graph Forecasting

Temporal knowledge graph forecasting method using entity state tuning to model structural and temporal dependencies without episodic amnesia.

Ax Aniketh Garikaparthi, Manasi Patwardhan, Arman Cohan 3/13/2026

ResearchGym: Evaluating Language Model Agents on Real-World AI Research

Benchmark and execution environment evaluating AI agents on end-to-end research tasks using containerized ICML/ICLR/ACL paper repositories with 39 sub-tasks.

Ax Zhenyu Li, Guanlin Wu, Cheems Wang, Yongqiang Zhao 3/13/2026

Limited Reasoning Space: The cage of long-horizon reasoning in LLMs

Research on chain-of-thought reasoning failures in LLMs when scaling compute budgets, proposing limited reasoning space as explanation for performance collapse.

Ax Shogo Noguchi, Taketo Akama, Tai Nakamura, Shun Minamikawa, Natalia Polouliakh 3/13/2026

Expectation and Acoustic Neural Network Representations Enhance Music Identification from Brain Activity

Neural network representations of music and brain activity for EEG-based music identification using acoustic and expectation signals.

Ax Xiaoying Zhang, Zichen Liu, Yipeng Zhang, Xia Hu, Wenqi Shao 3/13/2026

RetroAgent: From Solving to Evolving via Retrospective Dual Intrinsic Feedback

Reinforcement learning method for LLM-based agents using retrospective feedback to enable continual adaptation and experiential learning.

Ax Rui Liu, Tao Zhe, Dongjie Wang, Zijun Yao, Kunpeng Liu, Yanjie Fu, Huan Liu, Jian Pei 3/13/2026

AgentOS: From Application Silos to a Natural Language-Driven Data Ecosystem

Open-source framework for locally-hosted LLM-based agents that autonomously operate computing environments and orchestrate workflows.

Ax Junnan Dong, Chuang Zhou, Zheng Yuan, Yifei Yu, Qiufeng Wang, Yinghui Li, Siyu An, Di Yin, Xing Sun, Feiyue Huang 3/13/2026

Deep Tabular Research via Continual Experience-Driven Execution

Agentic framework for multi-step reasoning over complex tabular data with hierarchical headers using closed-loop decision-making.

Ax Jiangming Shu, Yuxiang Zhang, Ye Ma, Xueyuan Lin, Jitao Sang 3/13/2026

Evaluate-as-Action: Self-Evaluated Process Rewards for Retrieval-Augmented Agents

EvalAct: Method for retrieval-augmented agents using self-evaluated process rewards to optimize multi-step reasoning via explicit quality assessment actions.

Ax Xin An, Jingyi Cai, Xiangyang Chen, Huayao Liu, Peiting Liu, Peng Wang, Bei Yang, Xiuwen Zhu, Yongfan Chen, Yan Gao, Yuan Gao, Baoyu Hou, Guangzheng Hu, Shuzhao Li, Weixu Qiao, Weidong Ren, Yanan Wang, Boyu Yang, Fan Yang, Jiangtao Zhang, Lixin Zhang, Lin Qu, Hu Wei, Xiaoxiao Xu, Bing Zhao 3/13/2026

Logics-Parsing-Omni Technical Report

Omni Parsing: Framework for multimodal parsing across documents, images, audio-visual with unified taxonomy and hierarchical levels.

Ax Marta Sumyk, Oleksandr Kosovan 3/13/2026

CUAAudit: Meta-Evaluation of Vision-Language Models as Auditors of Autonomous Computer-Use Agents

CUAAudit: Meta-evaluation framework for vision-language models as auditors of autonomous desktop computer-use agents.

Ax Valentyn Melnychuk, Dennis Frauen, Stefan Feuerriegel 3/13/2026

Bounds on Representation-Induced Confounding Bias for Treatment Effect Estimation

Theoretical bounds on bias from representation learning in conditional average treatment effect estimation.

Ax Benjamin A. T. Grahama, Lauren Brown, Georgios Chochlakis, Morteza Dehghani, Raquel Delerme, Brittany Friedman, Ellie Graeden, Preni Golazizian, Rajat Hebbar, Parsa Hejabi, Aditya Kommineni, Mayag\"uez Salinas, Michael Sierra-Ar\'evalo, Jackson Trager, Nicholas Weller, Shrikanth Narayanan 3/13/2026

Community-Informed AI Models for Police Accountability

AI models for analyzing police bodycam footage to improve accountability and government transparency.

Ax Hao Wang, Jinzhe Jiang, Xin Zhang, Chen Li 3/13/2026

Partially Recentralization Softmax Loss for Vision-Language Models Robustness

Defense technique for vision-language model robustness against adversarial attacks via softmax loss modification.

Ax Jahir Sadik Monon, Deeparghya Dutta Barua, Md. Mosaddek Khan 3/13/2026

Enhancing Heterogeneous Multi-Agent Cooperation in Decentralized MARL via GNN-driven Intrinsic Rewards

GNN-driven intrinsic reward method for heterogeneous multi-agent cooperation in decentralized reinforcement learning.

Ax Cornelius V. Braun, Robert T. Lange, Marc Toussaint 3/13/2026

Stein Variational Evolution Strategies

Stein Variational Evolution Strategies: Gradient-free variant of SVGD for sampling from unnormalized distributions.

Ax Xichen Guo, Zheng Li, Biwei Huang, Yan Zeng, Zhi Geng, Feng Xie 3/13/2026

Testability of Instrumental Variables in Additive Nonlinear, Non-Constant Effects Models

Theoretical analysis of instrumental variable testability in nonlinear models with non-constant treatment effects.

Ax Carlos G\"uemes-Palau, Miquel Ferriol-Galm\'es, Jordi Paillisse-Vilanova, Albert L\'opez-Bresc\'o, Pere Barlet-Ros, Albert Cabellos-Aparicio 3/13/2026

RouteNet-Gauss: Hardware-Enhanced Network Modeling with Machine Learning

RouteNet-Gauss: ML model integrated with hardware testbed for network simulation and performance prediction.

Ax Yiming Huang, Tolga Birdal 3/13/2026

HOG-Diff: Higher-Order Guided Diffusion for Graph Generation

HOG-Diff: Diffusion model for graph generation incorporating higher-order topology guidance. Improves on image-based approaches.

Ax Ziqiao Weng, Weidong Cai, Bo Zhou 3/13/2026

FedSKD: Aggregation-free Model-heterogeneous Federated Learning via Multi-dimensional Similarity Knowledge Distillation for Medical Image Classification

FedSKD: Federated learning method for model-heterogeneous training via knowledge distillation without centralized aggregation. Medical imaging focus.

Ax Yijie Zheng, Bangjun Xiao, Lei Shi, Xiaoyang Li, Faming Wu, Tianyu Li, Xuefeng Xiao, Yang Zhang, Yuxuan Wang, Shouda Liu 3/13/2026

OrchMLLM: Orchestrate Multimodal Data with Batch Post-Balancing to Accelerate Multimodal Large Language Model Training

OrchMLLM optimizes multimodal LLM training via batch post-balancing. Addresses modality composition incoherence and GPU utilization issues.

Ax Wenqing Zheng, Noah Fatsi, Daniel Barcklow, Dmitri Kalaev, Steven Yao, Owen Reinert, C. Bayan Bruss, Daniele Rosa 3/13/2026

Tuning-Free LLM Can Build A Strong Recommender Under Sparse Connectivity And Knowledge Gap Via Extracting Intent

IKGR framework uses intent-centric knowledge graphs for LLM-based recommendations without fine-tuning. Handles sparsity and cold-start scenarios.

Ax Jun Liu, Zhenglun Kong, Peiyan Dong, Changdi Yang, Tianqi Li, Hao Tang, Geng Yuan, Wei Niu, Wenbin Zhang, Pu Zhao, Xue Lin, Dong Huang, Yanzhi Wang 3/13/2026

Structured Agent Distillation for Large Language Model

Structured Agent Distillation compresses LLM-based agents into smaller student models while preserving reasoning and action consistency.

Ax Chengyu Shen, Zhen Hao Wong, Runming He, Hao Liang, Meiyi Qiang, Zimo Meng, Zhengyang Zhao, Bohan Zeng, Zhengzhou Zhu, Bin Cui, Wentao Zhang 3/13/2026

Let's Verify Math Questions Step by Step

Framework for verifying correctness of math questions used in LLM training. Focuses on QA data quality beyond answer correctness.

Ax Kai Li, Can Shen, Yile Liu, Jirui Han, Kelong Zheng, Xuechao Zou, Lionel Z. Wang, Shun Zhang, Xingjian Du, Hanjun Luo, Yingbin Jin, Xinxin Xing, Ziyang Ma, Yue Liu, Yifan Zhang, Junfeng Fang, Kun Wang, Yibo Yan, Gelei Deng, Haoyang Li, Yiming Li, Xiaobin Zhuang, Tianlong Chen, Qingsong Wen, Tianwei Zhang, Yang Liu, Haibo Hu, Zhizheng Wu, Xiaolin Hu, Eng-Siong Chng, Wenyuan Xu, XiaoFeng Wang, Wei Dong, Xinfeng Li 3/13/2026

AudioTrust: Benchmarking the Multifaceted Trustworthiness of Audio Large Language Models

AudioTrust benchmark evaluating trustworthiness of audio LLMs. Reveals vulnerabilities from non-semantic acoustic cues like timbre and accent.

Ax Jianing Geng, Biao Yi, Zekun Fei, Ruiqi He, Lihai Nie, Tong Li, Zheli Liu 3/13/2026

Hiding in Plain Sight: A Steganographic Approach to Stealthy LLM Jailbreaks

Steganographic jailbreak attacks on LLMs balancing semantic and linguistic stealth. Bypasses safety mechanisms through hidden malicious intent.

Ax Sicheng Feng, Song Wang, Shuyi Ouyang, Lingdong Kong, Zikai Song, Jianke Zhu, Huan Wang, Xinchao Wang 3/13/2026

ReasonMap: Towards Fine-Grained Visual Reasoning from Transit Maps

ReasonMap benchmark for evaluating multimodal LLM visual reasoning on transit maps. Tests math and logic capabilities on 1,008 questions.

Ax Aida Kostikova, Zhipin Wang, Deidamea Bajri, Ole P\"utz, Benjamin Paa{\ss}en, Steffen Eger 3/13/2026

LLLMs: A Data-Driven Survey of Evolving Research on Limitations of Large Language Models

Data-driven survey of 14,648 papers on LLM limitations from 2022-2025. Systematically categorizes known weaknesses and failure modes.

Ax Sirui Lu, Zhijing Jin, Terry Jingchen Zhang, Pavel Kos, J. Ignacio Cirac, Bernhard Sch\"olkopf 3/13/2026

Can Theoretical Physics Research Benefit from Language Agents?

Investigates LLM limitations in theoretical physics. Identifies gaps in physical intuition and constraint satisfaction beyond prompting improvements.

Ax Nadav Kunievsky, James A. Evans 3/13/2026

Measuring Intent Comprehension in LLMs

Study measuring how well LLMs comprehend user intent beyond surface-level text matching. Analyzes gap between token prediction and actual user goals.

Ax Muhammad Ahmad, Muhammad Waqas, Ameer Hamza, Ildar Batyrshin, Grigori Sidorov 3/13/2026

Hope Speech Detection in code-mixed Roman Urdu tweets: A Positive Turn in Natural Language Processing

NLP model for detecting hope speech in code-mixed Roman Urdu tweets. Addresses underrepresented languages and informal text.

Ax Peibo Li, Shuang Ao, Hao Xue, Yang Song, Maarten de Rijke, Johan Barth\'elemy, Tomasz Bednarz, Flora D. Salim 3/13/2026

Refine-POI: Reinforcement Fine-Tuned Large Language Models for Next Point-of-Interest Recommendation

Refine-POI applies reinforcement fine-tuning to LLMs for point-of-interest recommendation with improved semantic ID indexing and topology awareness.

Ax Luke Rivard, Sun Sun, Hongyu Guo, Wenhu Chen, Yuntian Deng 3/13/2026

NeuralOS: Towards Simulating Operating Systems via Neural Generative Models

NeuralOS simulates OS GUIs using RNNs and diffusion models to predict screen frames from user inputs, trained on Ubuntu recordings.

Ax Ondrej Bohdal, Mete Ozay, Jijoong Moon, Kyeng-Hun Lee, Hyeonmok Ko, Umberto Michieli 3/13/2026

Efficient Compositional Multi-tasking for On-device Large Language Models

Research on adapter parameters and task merging for efficient multi-task learning in on-device LLMs, enabling multiple tasks via parameter merging.

Ax Zhejun Zhao, Yuchen Li, Alley Liu, Yuehu Dong, Xiaolong Wei, Lixue Zheng, Pingsheng Liu, Dongdong Shen, Long Xia, Jiashu Zhao, Dawei Yin 3/13/2026

TURA: Tool-Augmented Unified Retrieval Agent for AI Search

TURA proposes a tool-augmented retrieval agent for conversational AI search that handles real-time data and structured queries beyond traditional RAG limitations.

Ax Masoumeh Sharafi, Soufiane Belharbi, Muhammad Osama Zeeshan, Houssem Ben Salem, Ali Etemad, Alessandro Lameiras Koerich, Marco Pedersoli, Simon Bacon, Eric Granger 3/13/2026

Personalized Feature Translation for Expression Recognition: An Efficient Source-Free Domain Adaptation Method

Source-free domain adaptation method for facial expression recognition using personalized feature translation without source data access.

Ax Maolin Sun, Yibiao Yang, Yuming Zhou 3/13/2026

Once4All: Skeleton-Guided SMT Solver Fuzzing with LLM-Synthesized Generators

Once4All uses LLM-synthesized test generators guided by skeleton templates to fuzz SMT solvers and uncover correctness bugs.

Ax Wei-Teng Chu, Tianyi Zhang, Matthew Johnson-Roberson, Weiming Zhi 3/13/2026

Efficient Construction of Implicit Surface Models From a Single Image for Motion Generation

Fast Image-to-Neural Surface constructs implicit distance representations from single images for robotics obstacle avoidance and path planning.

Ax Haoyang Zheng, Xinyang Liu, Cindy Xiangrui Kong, Nan Jiang, Zheyuan Hu, Weijian Luo, Wei Deng, Guang Lin 3/13/2026

Ultra-Fast Language Generation via Discrete Diffusion Divergence Instruct

DiDi-Instruct distills fast student models from diffusion LLMs for ultra-fast language generation matching teacher performance.

Ax Songmei Yu, Andrew Zagula 3/13/2026

TRACE: AI-Assisted Assessment of Collaborative Projects in Computer Science Education

TRACE uses AI for semi-automated assessment of individual contributions in collaborative computer science group projects.

Ax Yeonseo Lee, Jungwook Mun, Hyosup Shin, Guebin Hwang, Junhee Nam, Taeyeop Lee, Sungho Jo 3/13/2026

XGrasp: Gripper-Aware Grasp Detection with Multi-Gripper Data Generation

XGrasp detects robotic grasps that generalize across multiple gripper types without retraining using gripper-aware architecture.

Ax Jingyu Song, Zhenxin Li, Shiyi Lan, Xinglong Sun, Nadine Chang, Maying Shen, Joshua Chen, Katherine A. Skinner, Jose M. Alvarez 3/13/2026

DriveCritic: Towards Context-Aware, Human-Aligned Evaluation for Autonomous Driving with Vision-Language Models

DriveCritic framework uses vision-language models to provide context-aware evaluation of autonomous driving planners aligned with human judgment.

Ax Zhangquan Chen, Manyuan Zhang, Xinlei Yu, Xufang Luo, Mingze Sun, Zihao Pan, Xiang An, Yan Feng, Peng Pei, Xunliang Cai, Ruqi Huang 3/13/2026

Think with 3D: Geometric Imagination Grounded Spatial Reasoning from Limited Views

Vision-language model approach for 3D spatial reasoning from limited views using geometric imagination grounding.

Ax Eric Bigelow, Daniel Wurgaft, YingQiao Wang, Noah Goodman, Tomer Ullman, Hidenori Tanaka, Ekdeep Singh Lubana 3/13/2026

Belief Dynamics Reveal the Dual Nature of In-Context Learning and Activation Steering

Unifying framework explaining in-context learning and activation steering through belief dynamics, treating both as instances of broader control mechanism.

Ax Xin Sun, Daniel St{\aa}hl, Kristian Sandahl, Christoph Kessler 3/13/2026

Quality Assurance of LLM-generated Code: Addressing Non-Functional Quality Characteristics

Study evaluates non-functional quality characteristics of LLM-generated code using ISO/IEC 25010 model across functional correctness, maintainability, and security.

Ax Junbo Zou, Haotian Xia, Zhen Ye, Shengjie Zhang, Christopher Lai, Vicente Ordonez, Weining Shen, Hanjie Chen 3/13/2026

DeepSport: A Multimodal Large Language Model for Comprehensive Sports Video Reasoning via Agentic Reinforcement Learning

DeepSport is an end-to-end trained multimodal LLM for multi-sport video understanding using agentic reinforcement learning for iterative reasoning.

Ax Seyed Mohssen Ghafari, Ronny Kol, Juan C. Quiroz, Nella Luan, Monika Patial, Chanaka Rupasinghe, Herman Wandabwa, Luiz Pizzato 3/13/2026

ConCISE: A Reference-Free Conciseness Evaluation Metric for LLM-Generated Answers

ConCISE is a reference-free evaluation metric for measuring conciseness of LLM-generated responses to reduce verbosity and token costs.

Ax Roman Naeem, David Hagerman, Jennifer Alv\'en, Fredrik Kahl 3/13/2026

RefTr: Recurrent Refinement of Confluent Trajectories for 3D Vascular Tree Centerlines

RefTr extracts 3D vascular tree centerlines from medical images using recurrent refinement to preserve topology for clinical tasks.

Ax Chunzheng Zhu, Yangfang Lin, Shen Chen, Yijun Wang, Jianxin Lin 3/13/2026

MedEyes: Learning Dynamic Visual Focus for Medical Progressive Diagnosis

MedEyes applies vision-language models with reinforcement learning for medical diagnosis via dynamic visual focusing and iterative clinical reasoning.