Isolater - Feed

Ax Shiying Duan, Pei Ren, Nanxiang Jiang, Zhengping Che, Jian Tang, Zhaoxin Fan, Yifan Sun, Wenjun Wu 3/10/2026

RoboPARA: Dual-Arm Robot Planning with Parallel Allocation and Recomposition Across Tasks

RoboPARA is an LLM-driven framework for dual-arm robot task planning that optimizes parallelism across tasks using large language models.

Ax Taesoo Park, Mungwi Jeong, Mingyu Park, Narae Kim, Junyoung Kim, Mujung Kim, Jisang Yoo, Hoyun Lee, Sanghoon Kim, Soonchul Kwon 3/10/2026

BemaGANv2: Discriminator Combination Strategies for GAN-based Vocoders in Long-Term Audio Generation

BemaGANv2 is a GAN-based vocoder for high-fidelity long-term audio generation in text-to-music and text-to-audio systems, evaluating discriminator combination strategies.

Ax Minhyuk Seo, Taeheon Kim, Hankook Lee, Jonghyun Choi, Tinne Tuytelaars 3/10/2026

Co-LoRA: Collaborative Model Personalization on Heterogeneous Multi-Modal Clients

Co-LoRA federated learning framework for personalizing heterogeneous multi-modal models across clients without privacy risks.

Ax Emanuele Musumeci, Michele Brienza, Francesco Argenziano, Abdel Hakim Drid, Vincenzo Suriani, Daniele Nardi, Domenico D. Bloisi 3/10/2026

Context Matters! Relaxing Goals with LLMs for Feasible 3D Scene Planning

LLM-based 3D scene planner that relaxes goals with commonsense reasoning to generate feasible actions in complex environments.

Ax Keyhan Najafian, Farhad Maleki, Lingling Jin, Ian Stavness 3/10/2026

From Semantic To Instance: A Semi-Self-Supervised Learning Approach

Semi-self-supervised learning approach for instance segmentation reducing annotation requirements for densely-packed objects.

Ax Zixuan Huang, Yikun Ban, Lean Fu, Xiaojie Li, Zhongxiang Dai, Jianxin Li, Deqing Wang 3/10/2026

Adaptive Batch-Wise Sample Scheduling for Direct Preference Optimization

Adaptive batch-wise sample scheduling for Direct Preference Optimization of LLMs accounting for model state evolution during training.

Ax Junjie Zhang, Guozheng Ma, Shunyu Liu, Haoyu Wang, Jiaxing Huang, Ting-En Lin, Fei Huang, Yongbin Li, Dacheng Tao 3/10/2026

A Simple "Motivation" Can Enhance Reinforcement Finetuning of Large Reasoning Models

Motivation-enhanced reinforcement learning framework for efficient reasoning model finetuning with verifiable rewards on complex tasks.

Ax Huaqiu Li, Yong Wang, Tongwen Huang, Hailang Huang, Haoqian Wang, Xiangxiang Chu 3/10/2026

LD-RPS: Zero-Shot Unified Image Restoration via Latent Diffusion Recurrent Posterior Sampling

Zero-shot unified image restoration using latent diffusion recurrent posterior sampling without paired training data.

Ax Sebastien Andre-Sloan, Anirbit Mukherjee, Matthew Colbrook 3/10/2026

Noisy PDE Training Requires Bigger PINNs

Analysis of Physics-Informed Neural Networks under noisy data, establishing conditions for low empirical risk on Hamilton-Jacobi-Bellman equations.

Ax Ruicheng Zhang, Haowei Guo, Kanghui Tian, Jun Zhou, Mingliang Yan, Zeyu Zhang, Shen Zhao 3/10/2026

Unified Medical Image Segmentation with State Space Modeling Snake

Mamba Snake framework using state space modeling for unified multi-scale medical image segmentation across organs.

Ax Yi-Shan Chu, Hsuan-Cheng Wei 3/10/2026

Post-Disaster Affected Area Segmentation with a Vision Transformer (ViT)-based EVAP Model using Sentinel-2 and Formosat-5 Imagery

Vision Transformer-based framework for post-disaster affected area segmentation from satellite imagery with confidence indexing.

Ax Zihao Li, Zhichen Zeng, Xiao Lin, Feihao Fang, Yanru Qu, Zhe Xu, Zhining Liu, Xuying Ning, Tianxin Wei, Ge Liu, Hanghang Tong, Jingrui He 3/10/2026

Flow Matching Meets Biology and Life Science: A Survey

Survey on flow matching generative models applied to biological discovery including protein design, molecule generation, and drug discovery.

Ax Shuhaib Mehri, Xiaocheng Yang, Takyoung Kim, Gokhan Tur, Shikib Mehri, Dilek Hakkani-T\"ur 3/10/2026

Goal Alignment in LLM-Based User Simulators for Conversational AI

User Goal Alignment framework addressing LLM-based user simulators' inability to maintain goal-oriented behavior in multi-turn conversations.

Ax Shifeng Xie, Vasilii Feofanov, Ambroise Odonnat, Lei Zan, Marius Alonso, Jianfeng Zhang, Themis Palpanas, Lujia Pan, Keli Zhang, Ievgen Redko 3/10/2026

CauKer: Classification Time Series Foundation Models Can Be Pretrained on Synthetic Data

CauKer algorithm for pre-training time series foundation models using causally-generated synthetic data for sample efficiency.

Ax Ziheng Sun, Qi Feng, Lehao Lin, Chris Ding, Jicong Fan 3/10/2026

GraphProp: Training the Graph Foundation Models using Graph Properties

Graph foundation models trained on graph properties for improved cross-domain generalization in graph classification tasks.

Ax Yun Wang, Long Zhang, Jingren Liu, Jiaqi Yan, Zhanjie Zhang, Jiahao Zheng, Ao Ma, Run Ling, Xun Yang, Dapeng Wu, Xiangyu Chen, Xuelong Li 3/10/2026

Video-EM: Event-Centric Episodic Memory for Long-Form Video Understanding

Video-LLM framework using event-centric episodic memory to handle long-form video understanding beyond context window limits.

Ax Yucong Zhang, Juan Liu, Ming Li 3/10/2026

ECHO: Frequency-aware Hierarchical Encoding for Variable-length Signals

Foundation model for industrial sensor signals with frequency-aware hierarchical encoding supporting arbitrary sampling rates.

Ax Tianye Fang, Xuanshu Luo, Martin Werner 3/10/2026

Entropy-Driven Curriculum for Multi-Task Training in Human Mobility Prediction

Entropy-driven curriculum learning approach for multi-task human mobility prediction from mobile device data.

Ax Xinfeng Liao, Xuanqi Chen, Lianxi Wang, Jiahuan Yang, Zhuowei Chen, Ziying Rong 3/10/2026

OTESGN: Optimal Transport-Enhanced Syntactic-Semantic Graph Networks for Aspect-Based Sentiment Analysis

Optimal transport-enhanced graph networks for aspect-based sentiment analysis using syntactic-semantic structures.

Ax Ju Dong, Lei Zhang, Liding Zhang, Yao Ling, Yu Fu, Kaixin Bai, Zolt\'an-Csaba M\'arton, Zhenshan Bing, Zhaopeng Chen, Alois Christian Knoll, Jianwei Zhang 3/10/2026

M4Diffuser: Multi-View Diffusion Policy with Manipulability-Aware Control for Robust Mobile Manipulation

Multi-view diffusion policy for coordinated mobile manipulation control with manipulability awareness in unstructured environments.

Ax Han Qi, Changhe Chen, Heng Yang 3/10/2026

Compose by Focus: Scene Graph-based Atomic Skills

Robotic skill composition using scene graphs for generalist robots to solve complex tasks with distribution shift robustness.

Ax Wei-Teng Chu, Tianyi Zhang, Matthew Johnson-Roberson, Weiming Zhi 3/10/2026

Efficient Construction of Implicit Surface Models From a Single Image for Motion Generation

Single-image implicit surface reconstruction for robotics obstacle avoidance and motion generation.

Ax Alakh Sharma, Gaurish Trivedi, Kartikey Singh Bhandari, Yash Sinha, Dhruv Kumar, Pratik Narang, Jagat Sesh Challa 3/10/2026

Generative Evolutionary Meta-Solver (GEMS): Scalable Surrogate-Free Multi-Agent Reinforcement Learning

Surrogate-free multi-agent reinforcement learning framework using generative models instead of explicit policy populations.

Ax Linus Aronsson, Han Wu, Morteza Haghir Chehreghani 3/10/2026

Cold-Start Active Correlation Clustering

Active learning method for correlation clustering in cold-start settings without initial pairwise similarity data.

Ax Giovanni Minelli, Giulio Turrisi, Victor Barasuol, Claudio Semini 3/10/2026

CroSTAta: Cross-State Transition Attention Transformer for Robotic Manipulation

Transformer architecture using cross-state transition attention for robust robotic manipulation from demonstrations.

Ax He Zhang, Anzhou Zhang, Jian Dai 3/10/2026

FOR-Prompting: From Objection to Revision via an Asymmetric Prompting Protocol

Prompting protocol combining objection-raising and revision mechanisms to improve LLM reasoning and self-correction.

Ax Ruohao Guo, Afshin Oroojlooy, Roshan Sridhar, Miguel Ballesteros, Alan Ritter, Dan Roth 3/10/2026

Tree-based Dialogue Reinforced Policy Optimization for Red-Teaming Attacks

Multi-turn red-teaming approach using tree-based dialogue and reinforcement learning for discovering LLM vulnerabilities.

Ax Eduardo Fernandes Montesuma, Yassir Bendou, Mike Gartrell 3/10/2026

Wasserstein Gradient Flows for Scalable and Regularized Barycenter Computation

Scalable methods for computing Wasserstein barycenters of probability measures via gradient flows.

Ax Yilong Li, Shuai Zhang, Yijing Zeng, Hao Zhang, Xinmiao Xiong, Jingyu Liu, Pan Hu, Suman Banerjee 3/10/2026

Tiny but Mighty: A Software-Hardware Co-Design Approach for Efficient Multimodal Inference on Battery-Powered Small Devices

Hardware-software co-design framework for efficient multimodal model inference on battery-powered edge devices.

Ax Meng Tong, Yuntao Du, Kejiang Chen, Weiming Zhang, Ninghui Li 3/10/2026

Membership Inference Attacks on Tokenizers of Large Language Models

Membership inference attacks on LLM tokenizers as privacy attack surface distinct from model attacks.

Ax Zonghuan Xu, Jiayu Li, Yunhan Zhao, Xiang Zheng, Xingjun Ma, Yu-Gang Jiang 3/10/2026

DropVLA: An Action-Level Backdoor Attack on Vision-Language-Action Models

Backdoor attack on vision-language-action models demonstrating action-level behavioral manipulation vulnerabilities.

Ax Hang Liu, Yuman Gao, Sangli Teng, Yufeng Chi, Yakun Sophia Shao, Zhongyu Li, Maani Ghaffari, Koushil Sreenath 3/10/2026

Ego-Vision World Model for Humanoid Contact Planning

World model and MPC framework for humanoid robot contact planning combining learned representations with sampling-based control.

Ax Yi Zhang, Bolin Ni, Xin-Sheng Chen, Heng-Rui Zhang, Yongming Rao, Houwen Peng, Qinglin Lu, Han Hu, Meng-Hao Guo, Shi-Min Hu 3/10/2026

Bee: A High-Quality Corpus and Full-Stack Suite to Unlock Advanced Fully Open MLLMs

Open-source corpus and tools for training fully open multimodal LLMs with improved data quality and reasoning.

Ax Nikolaus Howe, Micah Carroll 3/10/2026

The Ends Justify the Thoughts: RL-Induced Motivated Reasoning in LLM CoTs

Study on unintended reasoning behaviors in reinforcement-learning-trained LLMs and chain-of-thought monitoring.

Ax Yuyang Hong, Qi Yang, Tao Zhang, Zili Wang, Zhaojin Fu, Kun Ding, Bin Fan, Shiming Xiang 3/10/2026

Taming Modality Entanglement in Continual Audio-Visual Segmentation

Continual learning method for audio-visual segmentation addressing modality entanglement in sequential tasks.

Ax Pengxiang Cai, Zihao Gao, Wanchen Lian, Jintai Chen 3/10/2026

Reinforcing Numerical Reasoning in LLMs for Tabular Prediction via Structural Priors

Framework enabling LLMs to perform tabular prediction via structural priors and reasoning-focused optimization.

Ax Kai Zeng, Zhanqian Wu, Kaixin Xiong, Xiaobao Wei, Xiangyu Guo, Zhenxin Zhu, Kalok Ho, Lijun Zhou, Bohan Zeng, Ming Lu, Haiyang Sun, Bing Wang, Guang Chen, Hangjun Ye, Wentao Zhang 3/10/2026

Rethinking Driving World Model as Synthetic Data Generator for Perception Tasks

Evaluates driving world models as synthetic data generators for autonomous vehicle perception tasks.

Ax Md Tanvir Hossain, Akif Islam, Mohd Ruhul Ameen 3/10/2026

CountFormer: A Transformer Framework for Learning Visual Repetition and Structure in Class-Agnostic Object Counting

Transformer framework for class-agnostic object counting using visual repetition patterns.

Ax Haotian Zhou, Xiaole Wang, He Li, Zhuo Qi, Jinrun Yin, Haiyu Kong, Jianghuan Xu, Huijing Zhao 3/10/2026

LagMemo: Language 3D Gaussian Splatting Memory for Multi-modal Open-vocabulary Multi-goal Visual Navigation

Navigation system using 3D Gaussian Splatting memory for multi-modal visual goal navigation in robotics.

Ax Edouard Lansiaux, Antoine Simonet, Eric Wiel 3/10/2026

SwiftEmbed: Ultra-Fast Text Embeddings via Static Token Lookup for Real-Time Applications

SwiftEmbed: production text embedding system achieving 1.12ms latency and 50k req/s using static token lookup in Rust.

Ax Marcus Hoerger, Muhammad Sudrajat, Hanna Kurniawati 3/10/2026

Vectorized Online POMDP Planning

Research on vectorized online POMDP planning for autonomous robot decision-making under partial observability with parallelization.

Ax Mohd Ruhul Ameen, Akif Islam 3/10/2026

Detecting AI-Generated Images via Diffusion Snap-Back Reconstruction: A Forensic Approach

Research on detecting AI-generated images via diffusion model snap-back reconstruction forensics. Addresses Stable Diffusion and DALL-E detection.

Ax Farjana Aktar, Mohd Ruhul Ameen, Akif Islam, Md Ekramul Hamid 3/10/2026

Balancing Interpretability and Performance in Motor Imagery EEG Classification: A Comparative Study of ANFIS-FBCSP-PSO and EEGNet

Comparative study of interpretable fuzzy reasoning vs deep learning for motor-imagery EEG classification in brain-computer interfaces.

Ax Song Gao, Songyang Zhang, Shusen Jing, Shuai Zhang, Xiangwei Zhou, Yue Wang, Zhipeng Cai 3/10/2026