Isolater - Feed

Ax Mingyuan Zhang, Yue Bai, Huan Wang, Yizhou Wang, Qihua Dong, Yitian Zhang, Yun Fu 3/17/2026

Boosting Large Language Models with Mask Fine-Tuning

Mask Fine-Tuning (MFT) introduces a novel LLM fine-tuning method that improves performance by selectively masking model components without updating weights.

Ax Juntao Zhao, Qi Lu, Wei Jia, Borui Wan, Lei Zuo, Junda Feng, Jianyu Jiang, Yangrui Chen, Shuaishuai Cao, Jialing He, Kaihua Jiang, Yuanzhe Hu, Shibiao Nong, Yanghua Peng, Haibin Lin, Chuan Wu 3/17/2026

MegaScale-Data: Scaling Dataloader for Multisource Large Foundation Model Training

MegaScale-Data addresses computational challenges in training large foundation models from multiple data sources by optimizing dataloader distribution across parallel ranks.

Ax Yuanjun Li, Zhouyang Jiang, Bin Zhang, Mingchao Zhang, Junhao Zhao, Zhiwei Xu 3/17/2026

QLLM: Do We Really Need a Mixing Network for Credit Assignment in Multi-Agent Reinforcement Learning?

Credit assignment method (QLLM) for multi-agent RL eliminating predefined mixing networks through improved value decomposition and interpretability.

Ax Syeda Nahida Akter, Shrimai Prabhumoye, Matvei Novikov, Seungju Han, Ying Lin, Evelina Bakhturina, Eric Nyberg, Yejin Choi, Mostofa Patwary, Mohammad Shoeybi, Bryan Catanzaro 3/17/2026

Nemotron-CrossThink: Scaling Self-Learning beyond Math Reasoning

Nemotron-CrossThink extends RL-based self-learning from math reasoning to broader domains using verifiable reward structures and diverse tasks.

Ax Siddharth Singh, Keshav Pradeep, Mahua Singh, Cunyang Wei, Abhinav Bhatele 3/17/2026

The Big Send-off: Scalable and Performant Collectives for Deep Learning

PCCL library for performant collective communication in distributed AI training on GPU supercomputers, addressing NCCL limitations.

Ax Steven Bedrick, A. Seza Do\u{g}ru\"oz, Sergiu Nisioi 3/17/2026

A Typology of Synthetic Datasets for Dialogue Processing in Clinical Contexts

Typology and analysis of synthetic datasets for clinical dialogue processing, addressing privacy and data governance challenges in healthcare NLP.

Ax Jinming Hu, Hassan Nawaz, Yi-Fan Hou, Yuting Rui, Lijie Chi, Yuxinxin Chen, Arif Ullah, Pavlo O. Dral 3/17/2026

Aitomia: Your Intelligent Assistant for AI-Driven Atomistic and Quantum Chemical Simulations

Aitomia platform combining LLM-based agents and chatbots to assist with atomistic and quantum chemical simulations setup and analysis.

Ax Janis Zenkner, Tobias Sesterhenn, Christian Bartelt 3/17/2026

Beyond Either-Or Reasoning: Transduction and Induction as Cooperative Problem-Solving Paradigms

Analysis of transduction and induction as complementary reasoning paradigms in programming-by-example and few-shot learning contexts.

Ax Yiwei Sun, Peiqi Jiang, Chuanbin Liu, Luohao Lin, Zhiying Lu, Hongtao Xie 3/17/2026

From Evaluation to Defense: Advancing Safety in Video Large Language Models

VideoSafetyEval benchmark with 11.4k video-query pairs across 19 risk categories for evaluating and defending Video LLM safety.

Ax Yige Yuan, Teng Xiao, Shuchang Tao, Xue Wang, Jinyang Gao, Bolin Ding, Bingbing Xu 3/17/2026

Incentivizing Strong Reasoning from Weak Supervision

Method for improving LLM reasoning without expensive RL or high-quality demonstrations using weak supervision and incentive signals.

Ax Yige Yuan, Teng Xiao, Li Yunfan, Bingbing Xu, Shuchang Tao, Yunqi Qiu, Huawei Shen, Xueqi Cheng 3/17/2026

Inference-time Alignment in Continuous Space

Inference-time alignment method for LLMs that searches in continuous response space using reward models for improved exploration.

Ax Haolei Bai, Siyong Jian, Tuo Liang, Yu Yin, Huan Wang 3/17/2026

ERC-SVD: Error-Controlled SVD for Large Language Model Compression

SVD-based compression method (ERC-SVD) for efficient LLM deployment with error control and low-rank approximation techniques.

Ax Jonathan Wenger, Beau Coker, Juraj Marusic, John P. Cunningham 3/17/2026

Variational Deep Learning via Implicit Regularization

Analysis of implicit regularization in overparametrized deep neural networks and improved out-of-distribution generalization via variational methods.

Ax Jatin Kumar Arora, Soutrik Bandyopadhyay, Sunil Sulania, Shubhendu Bhasin 3/17/2026

Balancing Safety and Optimality in Robot Path Planning: Algorithm and Metric

Graph-search path planning algorithm (UPP) that dynamically balances safety and optimality for autonomous robot navigation.

Ax Eran Bamani Beeri, Eden Nissinman, Avishai Sintov 3/17/2026

DiG-Net: Enhancing Human-Robot Interaction through Hyper-Range Dynamic Gesture Recognition in Assistive Robotics

Gesture recognition system (DiG-Net) for human-robot interaction enabling long-range dynamic hand gesture recognition for assistive robotics.

Ax Yajie Zhou, Jiajun Ruan, Eric S. Wang, Sadjad Fouladi, Francis Y. Yan, Kevin Hsieh, Zaoxing Liu 3/17/2026

NetArena: Dynamic Benchmarks for AI Agents in Network Automation

Dynamic benchmark framework (NetArena) for evaluating AI agents in network automation with production-level complexity and reduced contamination risk.

Ax Geonwoo Cho, Jaemoon Lee, Jaegyun Im, Subi Lee, Jihwan Lee, Sundong Kim 3/17/2026

AMPED: Adaptive Multi-objective Projection for balancing Exploration and skill Diversification

Adaptive multi-objective reinforcement learning method for balancing exploration and skill diversity in skill-based RL pretraining.

Ax Jingyu Xiao, Ming Wang, Man Ho Lam, Yuxuan Wan, Junliang Liu, Yintong Huo, Michael R. Lyu 3/17/2026

DesignBench: A Comprehensive Benchmark for MLLM-based Front-end Code Generation

Benchmark for evaluating multimodal LLM-based front-end code generation with modern development frameworks and evaluation metrics.

Ax Shubham Parashar, Shurui Gui, Xiner Li, Hongyi Ling, Sushil Vemuri, Blake Olson, Eric Li, Yu Zhang, James Caverlee, Dileep Kalathil, Shuiwang Ji 3/17/2026

Curriculum Reinforcement Learning from Easy to Hard Tasks Improves LLM Reasoning

Curriculum learning approach scheduling tasks from easy to hard to improve LLM reasoning via reinforcement learning, inspired by DeepSeek-R1.

Ax Ha-Thanh Nguyen, Hideyuki Tachibana, Chaoran Liu, Qianying Liu, Su Myat Noe, Koichi Takeda, Sadao Kurohashi 3/17/2026

BIS Reasoning 1.0: The First Large-Scale Japanese Benchmark for Belief-Inconsistent Syllogistic Reasoning

BIS Reasoning 1.0: Japanese benchmark with 1K+ syllogistic problems evaluating belief bias and inconsistent reasoning in LLMs.

Ax Haoyuan Yang, Yue Zhang, Liqiang Jing, John H. L. Hansen 3/17/2026

Speech Recognition on TV Series with Video-guided Post-ASR Correction

Video-guided post-ASR correction for TV series speech recognition handling multiple speakers and domain-specific terminology.

Ax Arpita Chowdhury, Zheda Mai, Zihe Wang, Sooyoung Jeon, Lemeng Wang, Jiacheng Hou, Wei-Lun Chao 3/17/2026

AVA-Bench: Atomic Visual Ability Benchmark for Vision Foundation Models

AVA-Bench: systematic evaluation benchmark for vision foundation models addressing blind spots in VQA evaluation protocols.

Ax Bassam Noori Shaker, Bahaa Al-Musawi, Mohammed Falih Hassan 3/17/2026

A Lightweight IDS for Early APT Detection Using a Novel Feature Selection Method

Lightweight intrusion detection system for early APT detection using novel feature selection method, not AI/ML focused.

Ax Geonwoo Cho, Jaegyun Im, Jihwan Lee, Hojun Yi, Sejin Kim, Sundong Kim 3/17/2026

TRACED: Transition-aware Regret Approximation with Co-learnability for Environment Design

TRACED: unsupervised environment design using regret approximation for co-learning to improve deep RL agent generalization.

Ax Shin'ya Yamaguchi, Kosuke Nishida, Daiki Chijiwa 3/17/2026

Rationale-Enhanced Decoding for Multi-modal Chain-of-Thought

Rationale-Enhanced Decoding improves chain-of-thought prompting in vision-language models by optimizing intermediate reasoning generation.

Ax Hangjie Yuan, Weihua Chen, Jun Cen, Hu Yu, Jingyun Liang, Shuning Chang, Zhihui Lin, Tao Feng, Pengwei Liu, Jiazheng Xing, Hao Luo, Jiasheng Tang, Fan Wang, Yi Yang 3/17/2026

Lumos-1: On Autoregressive Video Generation with Discrete Diffusion from a Unified Model Perspective

Lumos-1: LLM-based autoregressive video generation using discrete diffusion with efficient architecture avoiding external encoders.

Ax Quang-Binh Nguyen, Minh Luu, Quang Nguyen, Anh Tran, Khoi Nguyen 3/17/2026

CSD-VAR: Content-Style Decomposition in Visual Autoregressive Models

Content-style decomposition in visual autoregressive models enabling recontextualization and stylization for creative image synthesis.

Ax Julien Pourcel, C\'edric Colas, Pierre-Yves Oudeyer 3/17/2026

Self-Improving Language Models for Evolutionary Program Synthesis: A Case Study on ARC-AGI

SOAR: self-improving method integrating language models into evolutionary program synthesis for challenging tasks like ARC-AGI.

Ax Qinglong Yang, Haoming Li, Haotian Zhao, Xiaokai Yan, Jingtao Ding, Fengli Xu, Yong Li 3/17/2026

FingerTip 20K: A Benchmark for Proactive and Personalized Mobile LLM Agents

FingerTip 20K: benchmark for proactive mobile LLM agents with 20K tasks, evaluating multimodal agents using contextual data without explicit instructions.

Ax Xuan Wu, Di Wang, Chunguo Wu, Kaifang Qi, Chunyan Miao, Yubin Xiao, Jian Zhang, You Zhou 3/17/2026

Efficient Neural Combinatorial Optimization Solver for the Min-max Heterogeneous Capacitated Vehicle Routing Problem

Neural Combinatorial Optimization solver for min-max heterogeneous vehicle routing with multiple vehicles using novel decoding approach.

Ax Suchisrit Gangopadhyay, Jung-Hee Kim, Xien Chen, Patrick Rim, Hyoungseob Park, Alex Wong 3/17/2026

Extending Foundational Monocular Depth Estimators to Fisheye Cameras with Calibration Tokens

Method extending monocular depth estimators from perspective to fisheye cameras using calibration tokens for covariate shift alignment.

Ax Xinda Wang, Zhengxu Hou, Yangshijie Zhang, Bingren Yan, Jialin Liu, Chenzhuo Zhao, Zhibo Yang, Bin-Bin Yang, Feng Xiao 3/17/2026

EvolvR: Self-Evolving Pairwise Reasoning for Story Evaluation to Enhance Generation

EvolvR: self-evolving method for story evaluation using LLM-as-judge with pairwise reasoning to improve generation guidance.

Ax Yang Liu, Lu Zhou, Xiawei Du, Ruikun He, Xuguang Zhang, Rongbo Shen, Yixue Li 3/17/2026

Benchmarking LLM-based agents for single-cell omics analysis

Novel benchmarking system evaluating LLM-based agent capabilities for single-cell omics data analysis, assessing planning and code generation.

Ax Haokun Lin, Haobo Xu, Yichen Wu, Ziyu Guo, Renrui Zhang, Zhichao Lu, Ying Wei, Qingfu Zhang, Zhenan Sun 3/17/2026

Quantization Meets dLLMs: A Systematic Study of Post-training Quantization for Diffusion LLMs

Systematic study of post-training quantization methods for diffusion LLMs to enable edge device deployment, comparing compression techniques.

Ax Dongjun Lee, Changho Hwang, Kimin Lee 3/17/2026

Learning to Generate Unit Test via Adversarial Reinforcement Learning

UTRL: reinforcement learning framework training LLMs to generate high-quality unit tests automatically, addressing test generation challenges.

Ax Katalina Hernandez Delgado 3/17/2026

The Law-Following AI Framework: Legal Foundations and Technical Constraints. Legal Analogues for AI Actorship and technical feasibility of Law Alignment

Research evaluating Law-Following AI framework for embedding legal compliance in advanced AI agents, analyzing legal personhood constructs and technical feasibility.

Ax BaiChen Fan, Yuanxi Cui, Jian Li, Qin Wang, Shibo Zhao, Muqing Cao, Sifan Zhou 3/17/2026

Beyond Frame-wise Tracking: A Trajectory-based Paradigm for Efficient Point Cloud Tracking

Trajectory-based paradigm for efficient 3D point cloud tracking in robotics and autonomous systems.

Ax Zhuoxiao Chen, Hongyang Yu, Ying Xu, Yadan Luo, Long Duong, Yuan-Fang Li 3/17/2026

OraPO: Oracle-educated Reinforcement Learning for Data-efficient and Factual Radiology Report Generation

Reinforcement learning approach for radiology report generation using FactScore-based rewards with reduced data requirements.

Ax Hanqing Liu, Shouwei Ruan, Jiahuan Long, Junqi Wu, Jiacheng Hou, Huili Tang, Tingsong Jiang, Weien Zhou, Wen Yao 3/17/2026

Eva-VLA: Evaluating Vision-Language-Action Models' Robustness Under Real-World Physical Variations

Framework evaluating robustness of Vision-Language-Action models under real-world physical variations for robotic tasks.

Ax Erik Bo\v{z}\'ik, Marek \v{S}uppa 3/17/2026

SloPal: A 60-Million-Word Slovak Parliamentary Corpus with Aligned Speech and Fine-Tuned ASR Models

Slovak parliamentary speech corpus with 66M words and fine-tuned ASR models for low-resource language recognition.

Ax Niclas Pokel, Pehu\'en Moure, Roman B\"ohringer, Yingqiang Gao 3/17/2026

Data-Efficient ASR Personalization for Non-Normative Speech Using an Uncertainty-Based Phoneme Difficulty Score for Guided Sampling

Data-efficient ASR personalization using phoneme-level uncertainty scoring and variational inference. Guides fine-tuning for non-normative speech recognition.

Ax Niclas Pokel, Pehu\'en Moure, Roman Boehringer, Shih-Chii Liu, Yingqiang Gao 3/17/2026