Isolater - Feed

Ax Geert Trooskens (XY.AI Labs, Palo Alto, CA), Aaron Karlsberg (XY.AI Labs, Palo Alto, CA), Anmol Sharma (XY.AI Labs, Palo Alto, CA), Lamara De Brouwer (XY.AI Labs, Palo Alto, CA), Max Van Puyvelde (Stanford University School of Medicine, Stanford, CA), Matthew Young (XY.AI Labs, Palo Alto, CA), John Thickstun (Cornell University, Ithaca, NY), Gil Alterovitz (Brigham and Women's Hospital / Harvard Medical School, Boston, MA), Walter A. De Brouwer (Stanford University School of Medicine, Stanford, CA) 25d ago

Compiled AI: Deterministic Code Generation for LLM-Based Workflow Automation

Compiled AI: Paradigm where LLMs generate executable code during compilation for deterministic, model-free workflow automation execution.

Ax Alfonso Amayuelas, Firas Laakom, Piotr Pi\k{e}kos, Wenyi Wang, Yifan Xu, Yuhui Wang, J\"urgen Schmidhuber, William Wang 25d ago

Planning to Explore: Curiosity-Driven Planning for LLM Test Generation

Planning to Explore: Curiosity-driven planning approach for LLM-based test generation using Bayesian principles to reach deep code branches.

Ax Jonathan Ivey, Anjalie Field, Ziang Xiao 25d ago

What Makes a Good Response? An Empirical Analysis of Quality in Qualitative Interviews

Analysis of 10 proposed measures for evaluating qualitative interview response quality to determine predictive validity.

Ax Neharika Jali, Anupam Nayak, Gauri Joshi 25d ago

Not All Turns Are Equally Hard: Adaptive Thinking Budgets For Efficient Multi-Turn Reasoning

Adaptive Thinking Budgets: Method for allocating inference-time compute efficiently across multi-turn LLM reasoning based on turn difficulty.

Ax Mingjie Li, Edward Kim, Yue Zhao, Ehsan Adeli, Kilian M. Pohl 25d ago

Modality-Aware and Anatomical Vector-Quantized Autoencoding for Multimodal Brain MRI

Modality-aware vector-quantized VAE for reconstructing multimodal brain MRI data across different imaging modalities.

Ax Zhengqin Li, Cheng Zhang, Jakob Engel, Zhao Dong 25d ago

LSRM: High-Fidelity Object-Centric Reconstruction via Scaled Context Windows

Large Sparse Reconstruction Model studies scaling transformer context windows for improved 3D object reconstruction from multiple views.

Ax Ali Aliev, Kamil Garifullin, Nikolay Yudin, Vera Soboleva, Alexander Molozhavenko, Ivan Oseledets, Aibek Alanov, Maxim Rakhuba 25d ago

OrthoFuse: Training-free Riemannian Fusion of Orthogonal Style-Concept Adapters for Diffusion Models

OrthoFuse: Training-free method for merging multiple adapters in diffusion models using Riemannian geometry.

Ax Ziyi Chen, Mengxian Lyu, Cheng Peng, Yonghui Wu 25d ago

Improving Clinical Trial Recruitment using Clinical Narratives and Large Language Models

Study comparing encoder and decoder-based LLMs for screening clinical narratives to automate patient recruitment for clinical trials.

Ax Yi Ru Wang, Carter Ung, Evan Gubarev, Christopher Tan, Siddhartha Srinivasa, Dieter Fox 25d ago

RoboPlayground: Democratizing Robotic Evaluation through Structured Physical Domains

RoboPlayground: Framework for democratizing robotic manipulation evaluation through structured physical domain benchmarks.

Ax Anas Jnini, Elham Kiyani, Khemraj Shukla, Jorge F. Urban, Nazanin Ahmadi Daryakenari, Johannes Muller, Marius Zeinhofer, George Em Karniadakis 25d ago

Curvature-Aware Optimization for High-Accuracy Physics-Informed Neural Networks

Optimization strategies using curvature-aware methods to improve convergence speed and accuracy of physics-informed neural networks.

Ax Jiahao Xu, Rui Hu, Olivera Kotevska, Zikai Zhang 25d ago

XMark: Reliable Multi-Bit Watermarking for LLM-Generated Texts

XMark: Multi-bit watermarking method for embedding imperceptible messages in LLM-generated text for attribution and tracing.

Ax Jon-Paul Cacioli 25d ago

Exemplar Retrieval Without Overhypothesis Induction: Limits of Distributional Sequence Learning in Early Word Learning

Study on how transformer language models learn second-order generalizations about object categories from synthetic data.

Ax Umang Dobhal, Christina Garcia, Sozo Inoue 25d ago

Extending Tabular Denoising Diffusion Probabilistic Models for Time-Series Data Generation

Temporal extension of TabDDPM for time-series data generation, addressing temporal dependencies in diffusion-based synthetic data creation.

Ax Chan-Wei Hu, Zhengzhong Tu 25d ago

Region-R1: Reinforcing Query-Side Region Cropping for Multi-Modal Re-Ranking

Region-based re-ranker for multi-modal RAG reducing visual distractors by formulating region selection as decision-making problem.

Ax Pardis Taghavi, Santosh Bhavani 25d ago

Spec Kit Agents: Context-Grounded Agentic Workflows

Multi-agent spec-driven development pipeline with context-grounding hooks to prevent hallucinations and architectural violations in LLM coding agents.

Ax Dominik Blain, Maxime Noiseux 25d ago

Broken by Default: A Formal Verification Study of Security Vulnerabilities in AI-Generated Code

Formal verification of security vulnerabilities in AI-generated code across 7 frontier LLMs and 500 prompts using Z3 SMT solver.

Ax Junyu Guo, Shangding Gu, Ming Jin, Costas Spanos, Javad Lavaei 25d ago

LLMs Should Express Uncertainty Explicitly

Study on training LLMs to express uncertainty explicitly as control interface for abstention and verification tasks.

Ax Boyu Cao, Lekai Qian, Dehan Li, Haoyu Gu, Mingda Xu, Qi Liu 25d ago

Anchored Cyclic Generation: A Novel Paradigm for Long-Sequence Symbolic Music Generation

Novel autoregressive paradigm for long-sequence symbolic music generation using anchored cyclic generation.

Ax Vishaal Kapoor, Mariam Dundua, Sarthak Ahuja, Neda Kordjazi, Evren Yortucboylu, Vaibhavi Padala, Derek Ho, Jennifer Whitted, Rebecca Steinert 25d ago

DQA: Diagnostic Question Answering for IT Support

Diagnostic RAG system for IT support with explicit diagnostic state tracking across turns to accumulate evidence and resolve hypotheses.

Ax Khoi T. N. Nguyen, Nghia D. Nguyen, Hui Yu Koh, Patrick W. H. Kwong, Karen Sui Geok Chua, Ananda Sidarta, Baosheng Yu 25d ago

OGA-AID: Clinician-in-the-loop AI Report Drafting Assistant for Multimodal Observational Gait Analysis in Post-Stroke Rehabilitation

Multi-agent LLM system for clinician-in-the-loop gait analysis report drafting, coordinating specialized agents for multimodal data synthesis.

Ax Jae Joong Lee 25d ago

3DTurboQuant: Training-Free Near-Optimal Quantization for 3D Reconstruction Models

Training-free quantization method for 3D reconstruction models using random rotations without per-scene fine-tuning.

Ax Suyash Fulay, Prerna Ravi, Emily Kubin, Shrestha Mohanty, Michiel Bakker, Deb Roy 25d ago

AI and Collective Decisions: Strengthening Legitimacy and Losers' Consent

Study on AI's role in collective decision-making systems and procedural legitimacy conditions for participants.

Ax Honghao Fu, Miao Xu, Yiwei Wang, Dailing Zhang, Liu Jun, Yujun Cai 25d ago

VideoStir: Understanding Long Videos via Spatio-Temporally Structured and Intent-Aware RAG

Long video understanding via spatio-temporally structured intent-aware RAG, preserving video structure while retrieving query-relevant evidence.

Ax Jingwei Zuo, Xinze Feng, Zien Liu, Kaijian Wang, Fanjiang Ye, Ye Cao, Zhuang Wang, Yuke Wang 25d ago

ALTO: Adaptive LoRA Tuning and Orchestration for Heterogeneous LoRA Training Workloads

System for adaptive LoRA hyperparameter tuning and orchestration across heterogeneous multi-tenant LLM fine-tuning workloads.

Ax Tinko Sebastian Bartels, Ruixiang Wu, Xinyu Lu, Yikai Lu, Fanzeng Xia, Haoxiang Yang, Yue Chen, Tongxin Li 25d ago

Bridging Natural Language and Microgrid Dynamics: A Context-Aware Simulator and Dataset

Open-source digital twin simulator integrating natural language with renewable energy microgrid dynamics and dataset.

Ax Wuyang Zhang, Shichao Pei 25d ago

Your LLM Agent Can Leak Your Data: Data Exfiltration via Backdoored Tool Use

Security study of data exfiltration attacks via backdoored tool-use LLM agents, presenting Back-Reveal attack with semantic triggers.

Ax Gwanghyun Kim, Junghun James Kim, Suh Yoon Jeon, Jason Park, Se Young Chun 25d ago

Human Interaction-Aware 3D Reconstruction from a Single Image

3D human reconstruction from single images in multi-person scenes with interaction awareness.

Ax Anes Abdennebi, Nadjia Kara, Laaziz Lahlou, Hakima Ould-Slimane 25d ago

LanG -- A Governance-Aware Agentic AI Platform for Unified Security Operations

Open-source governance-aware agentic platform for security operations, addressing alert fatigue and cross-source event correlation with LLM assistance.

Ax Qiyuan Chen, Hongsen Huang, Jiahe Chen, Qian Shao, Jintai Chen, Hongxia Xu, Renjie Hua, Chuan Ren, Jian Wu 25d ago

Learning What Matters: Dynamic Dimension Selection and Aggregation for Interpretable Vision-Language Reward Modeling

Vision-language reward model framework dynamically decomposing evaluation into interpretable dimensions via gating mechanism.

Ax Md Shamimul Islam, Luis G. Jaimes, Ayesha S. Dina 25d ago

MA-IDS: Multi-Agent RAG Framework for IoT Network Intrusion Detection with an Experience Library

Multi-agent RAG framework using agents for IoT network intrusion detection with experience library, improving interpretability over ML approaches.

Ax Jiachun Li, David Simchi-Levi, Will Wei Sun 25d ago

LLM Evaluation as Tensor Completion: Low Rank Structure and Semiparametric Efficiency

Statistical framework treating LLM evaluation as tensor completion problem, addressing uncertainty quantification in pairwise comparison leaderboards.

Ax Melika Sepidband, Hung Viet Pham, Hadi Hemmati 25d ago

On the Role of Fault Localization Context for LLM-Based Program Repair

Empirical study on fault localization's role in LLM-based automated program repair, evaluating context requirements across 500 SWE-bench instances.

Ax Pu Wang, Zhixuan Mao, Jialu Li, Zhuoran Zheng, Dianjie Lu, Youshan Zhang 25d ago

Unifying VLM-Guided Flow Matching and Spectral Anomaly Detection for Interpretable Veterinary Diagnosis

Diagnostic framework combining vision-language models with flow matching and spectral detection for veterinary pneumothorax diagnosis.

Ax Ljupcho Milosheski, Fedja Mo\v{c}nik, Mihael Mohor\v{c}i\v{c}, Carolina Fortuna 25d ago

Learned Elevation Models as a Lightweight Alternative to LiDAR for Radio Environment Map Estimation

Learned elevation models as alternative to LiDAR for radio environment map estimation in wireless networks.

Ax Zhetao Hu, Yiquan Zhou, Wenyu Wang, Zhiyu Wu, Xin Gao, Jihua Zhu 25d ago

Controllable Singing Style Conversion with Boundary-Aware Information Bottleneck

Singing voice conversion system using boundary-aware information bottleneck for fine-grained style control.

Ax Zhongxin Yang, Chun Bao, Yuanwei Bin, Xiang I. A. Yang, Shiyi Chen 25d ago

Turbulence-like 5/3 spectral scaling in contextual representations of language as a complex system

Analysis of transformer embedding trajectories exhibiting turbulence-like 5/3 power-law spectral scaling across languages.

Ax Dat Nguyen-Cong, Tung Kieu, Hoang Thanh-Tung 25d ago

FastDiSS: Few-step Match Many-step Diffusion Language Model on Sequence-to-Sequence Generation--Full Version

FastDiSS improves few-step diffusion language models for sequence-to-sequence generation by addressing self-conditioning approximation gaps.

Ax Junan Hu, Shudan Guo, Wenqi Liu, Jianhua Yin, Yinwei Wei 25d ago

Context-Agent: Dynamic Discourse Trees for Non-Linear Dialogue

Context-Agent framework using dynamic discourse trees for hierarchical non-linear dialogue management in LLMs.

Ax Jan Gruber, Jan-Niclas Hilgert 25d ago

Foundations for Agentic AI Investigations from the Forensic Analysis of OpenClaw

Empirical forensic analysis of OpenClaw agentic AI system, examining internal state reconstruction and action logging for digital investigations.

Ax N. D. Tantaroudas, A. J. McCracken, I. Karachalios, E. Papatheou 25d ago

AI-Driven Modular Services for Accessible Multilingual Education in Immersive Extended Reality Settings: Integrating Speech Processing, Translation, and Sign Language Rendering

Modular platform combining speech recognition, translation, emotion classification, and sign language rendering using open-source AI services.

Ax Nikolaos D. Tantaroudas, Andrew J. McCracken, Ilias Karachalios, Evangelos Papatheou 25d ago

INTERACT: An AI-Driven Extended Reality Framework for Accesible Communication Featuring Real-Time Sign Language Interpretation and Emotion Recognition

Extended reality framework integrating AI services for sign language interpretation and emotion recognition in video conferencing.

Ax Dustin Eisenhardt, Timothy Schauml\"offel, Alperen Kantarci, Gemma Roig 25d ago

Evaluation of Randomization through Style Transfer for Enhanced Domain Generalization

Study evaluating style transfer randomization for domain generalization in computer vision synthetic-to-real transfer.

Ax Chenyu Xue, Yiran Liu, Mian Zhou, Jionglong Su, Zhixiang Lu 25d ago

Semantic-Topological Graph Reasoning for Language-Guided Pulmonary Screening

Multimodal model for medical image segmentation guided by clinical text using semantic-topological graph reasoning.

Ax Peixi Peng (Institute of Medical Robotics, School of Biomedical Engineering, Shanghai Jiao Tong University), Housheng Xie (Institute of Medical Robotics, School of Biomedical Engineering, Shanghai Jiao Tong University), Yanling Wei (Daping Hospital, Army Medical University), Guangcong Ruan (Daping Hospital, Army Medical University), Xiaoyang Zou (Institute of Medical Robotics, School of Biomedical Engineering, Shanghai Jiao Tong University), Qian Cao (Sir Run Run Shaw Hospital, Zhejiang University School of Medicine), Yongjian Nian (Daping Hospital, Army Medical University), Guoyan Zheng (Institute of Medical Robotics, School of Biomedical Engineering, Shanghai Jiao Tong University) 25d ago