Isolater - Feed

Ax Michael S. Zhang, Rishi A. Ruia, Arnav Kewalram, Saathvik Dharmapuram, Utkarsh Sharma, Kevin Zhu 7/2/2026

When Less is More: 8-bit Quantization Improves Continual Learning in Large Language Models

Investigation showing 8-bit quantization paradoxically improves continual learning in LLMs by mitigating catastrophic forgetting compared to FP16.

Ax Saswat Das, Ferdinando Fioretto 7/2/2026

NeuroFilter: Activation-Based Guardrails for Privacy-Conscious LLM Agents

NeuroFilter activation-based privacy guardrails for LLM agents controlling sensitive data access while maintaining agentic capabilities.

Ax Jinju Park, Seokho Kang 7/2/2026

PaAno: Patch-Based Representation Learning for Time-Series Anomaly Detection

PaAno patch-based representation learning for time-series anomaly detection with lower computational cost than transformer baselines.

Ax Jingze Shi, Zhangyang Peng, Yizhang Zhu, Yifan Wu, Guang Liu, Yuyu Luo 7/2/2026

OmniMoE: An Efficient MoE by Orchestrating Atomic Experts at Scale

OmniMoE system-algorithm co-design for scaling Mixture-of-Experts with vector-level atomic experts improving parameter efficiency at scale.

Ax Daniel Geyfman, Felix Draxler, Jan Groeneveld, Hyunsoo Lee, Theofanis Karaletsos, Stephan Mandt 7/2/2026

Calibrated Test-Time Guidance for Bayesian Inference

Calibrated guidance mechanism for diffusion models addressing miscalibration in Bayesian posterior sampling using test-time guidance.

Ax Jindong Jiang, Amala Sanjay Deshmukh, Kateryna Chumachenko, Karan Sapra, Zhiding Yu, Guilin Liu, Andrew Tao, Pavlo Molchanov, Jan Kautz, Wonmin Byeon 7/2/2026

Stateful Token Reduction for Long-Video Hybrid VLMs

Token reduction technique for long-video vision-language models using Mamba-Transformer hybrid architectures with stateful compression.

Ax Pum Jun Kim, Seung-Ah Lee, Seongho Park, Dongyoon Han, Jaejun Yoo 7/2/2026

On the Reliability of Cue Conflict and Beyond

Analysis of neural network visual cue preferences showing instability in stylization-based cue-conflict benchmarks for measuring shape bias.

Ax Yuhan Chen, Yicui Shi, Guofa Li, Liping Zhang, Jie Li, Jiaxin Gao, Wenbo Chu 7/2/2026

KGS-GCN: Kinematics-Driven Gaussian Splatting and Probabilistic Topology for Skeleton-Based Action Recognition

Skeleton-based action recognition using Gaussian splatting and probabilistic topology for sensor-based human-computer interaction.

Ax Hyunji Nam, Haoran Li, Natasha Jaques 7/2/2026

Maximizing Mutual Information Between Prompt and Response Improves LLM Performance With No Additional Data

Method to improve LLM performance by maximizing mutual information between prompts and responses without additional training data.

Ax Zixiang Jiang, Yulun Zhang, Rishi Veerapaneni, Jiaoyang Li 7/2/2026

Planning over MAPF Agent Dependencies via Multi-Dependency PIBT

Multi-Dependency PIBT: Enhanced multi-agent path finding algorithm for planning hundreds of agents in congested environments.

Ax Ziqiao Kong, Wanxu Xia, Chong Wang, Yue Xue, Yi Lu, Pan Li, Shaohua Li, Zong Cao, Yang Liu 7/2/2026

Knowdit: Agentic Smart Contract Vulnerability Detection with Auditing Knowledge Summarization

Knowdit: AI agent system for smart contract vulnerability detection using DeFi-specific semantic knowledge summarization.

Ax Jinkun Hao, Mingda Jia, Ruiyan Wang, Hongrui Zhu, Jiafei Cao, Xihui Liu, Ran Yi, Lizhuang Ma, Jiangmiao Pang, Xudong Xu 7/2/2026

EgoSim: Egocentric World Simulator for Embodied Interaction Generation

EgoSim: Closed-loop egocentric world simulator generating interaction videos with persistent 3D scene state updates.

Ax Vladimir Stantchev 7/2/2026

Hardening x402: PII-Safe Agentic Payments via Pre-Execution Metadata Filtering

Presidio-hardened-x402: Middleware filtering PII from agentic payment metadata before transmission in x402 protocol.

Ax Jinkai Tao, Yubo Wang, Xiaoyu Liu, Menglin Yang 7/2/2026

Continuous Knowledge Metabolism: Generating Scientific Hypotheses from Evolving Literature

System for generating scientific hypotheses from evolving literature using LLMs to identify promising research directions.

Ax Yangyue Wang, Harshvardhan Sikka, Yash Mathur, Tony Zhou, Jinu Nyachhyon, Pranav Guruprasad 7/2/2026

GUI-Perturbed: Domain Randomization Reveals Systematic Brittleness in GUI Grounding Models

GUI-Perturbed: Framework revealing brittleness in GUI grounding models through domain randomization and controlled perturbations.

Ax Changyu Li, Shuanghong Huang, Jiashen Liu, Ming Lei, Jidu Xing, Kaishun Wu, Lu Wang, Fei Luo 7/2/2026

FED-FSTQ: Fisher-Guided Token Quantization for Communication-Efficient Federated Fine-Tuning of LLMs on Edge Devices

FED-FSTQ: Federated fine-tuning of LLMs on edge devices using Fisher-guided token quantization for communication efficiency.

Ax Jose D. Posada, David Love, Somalee Datta, Priya Desai 7/2/2026

SHIELD: A Diverse Clinical Note Dataset and Distilled Small Language Models for Enterprise-Scale De-identification

SHIELD: Clinical NLP dataset and distilled small LMs for de-identification of health records at enterprise scale.

Ax Hengwei Ye, Jiasheng Mao, Zhenhan Guan, Zheng Tian 7/2/2026

EcoGEO: Trajectory-Aware Evidence Ecosystems for Web-Enabled LLM Search Agents

EcoGEO: Framework for understanding how LLM web-search agents are influenced by evidence across multi-step browsing and query trajectories.

Ax Xiaochong Jiang, Shiqi Yang, Ziwei Li, Lifei Liu, Haoran Yu, Yichen Liu 7/2/2026

ChainCaps: Composition-Safe Tool-Using Agents via Monotonic Capability Attenuation

ChainCaps: Framework for safe tool-using AI agents via monotonic capability attenuation to prevent unsafe multi-step tool compositions.

Ax Duoduo Xue, Zhiyu Zhu, Junhui Hou 7/2/2026

Diffusion Image Generation with Explicit Modeling of Data Manifold Geometry

MIND: Diffusion model framework for image generation that explicitly models data manifold geometry with patch tokenization.

Ax Xuanyi Liu, Deyi Ji, Junyu Lu, Jing Wang, Lanyun Zhu, Qianxiong Xu, Xuhang Chen, Tianrun Chen, Siwei Ma 7/2/2026

Seeing is Believing: Aligning Prompt Rewriting with Visual Anchors for Text-to-Image Generation

FaithRewriter: Prompt rewriting system for text-to-image generation that uses visual grounding to reduce intent-generation gap.

Ax Haoyu Wang, Xingyu Yu, Haiyan Zhao, Fengxiang Wang, Xu Han 7/2/2026

LC-QAT: Data-Efficient 2-Bit QAT for LLMs via Linear-Constrained Vector Quantization

LC-QAT: Quantization-aware training method for 2-bit LLM compression using linear-constrained vector quantization to reduce model size.

Ax Callum Barbour 7/2/2026

Vibe Coding Ate My Homework: An evaluation of AI approaches to greenfield software engineering and programming

Evaluation of generative AI for greenfield software engineering and 'vibe coding' practices without underlying domain knowledge.

Ax Borui Cai, Yao Zhao 7/2/2026

Topological Neural Dynamics: A Neuron-wise Framework for Sequence Modeling

Neuron-wise sequence modeling framework enabling independent neural evolution through topological dynamics instead of layer-wise constraints.

Ax Annika Marie Schoene, Cansu Canca, Gautham Vijay Kumar, Anson Antony 7/2/2026

One Year Later...The Harms Persist, But So Do We!

Evaluation of eight LLMs on mental health safety across DSM-5 conditions with adversarial attacks and harm taxonomy framework.

Ax Shuo Guan 7/2/2026

Faithful by Construction: Claim-Anchored Attribution for Multi-Document Summarization

CAMS system for multi-document summarization with fine-grained claim-anchored attribution reducing hallucination in LLM outputs.

Ax Ching-Hao Chiu, Hao-Wei Chung, Gelei Xu, Xueyang Li, Pin-Yu Chen, John Kheir, Meysam Ghaffari, Carlos Morato, Ahmed Abbasi, Yiyu Shi 7/2/2026

Text Over Image: Auditing Multimodal Robustness in Synthetic Medical Image Detection

Evaluation of vision-language models for detecting synthetic medical images with text overlays and metadata in clinical contexts.

Ax Andrew C. Cullen, Neil G. Marchant, Jiani Xie, Paul Montague, Benjamin I. P. Rubinstein 7/2/2026

What Was That Again? Certified Robustness for Automatic Speech Recognition

Certification mechanism for automatic speech recognition improving robustness to adversarial and benign perturbations without oracle knowledge.

Ax Andrew C. Cullen, Neil G. Marchant, Jiani Xie, Paul Montague, Sean Lamont, Maxwell Standen, Benjamin I. P. Rubinstein 7/2/2026

Room for Error: Large-Scale Simulation of Over-the-Air Acoustic Attacks

Large-scale simulation of acoustic adversarial attacks against voice control systems scaling from digital to physical domain.

Ax Yuanyuan Tian, Wenwen Li, Xiao Chen, Michael Brook, Michael Brubaker, Anna Liljedahl, Chitta Baral 7/2/2026

Multimodal and Multiscale Spatial-Temporal Semantic Search and Recommendation with AI Foundation Models

Framework using LLMs and vision-language models for spatial-temporal semantic search and recommendation of geographic information.

Ax Bal\'azs Szalontai, \'Abel Szauter, Bal\'azs M\'arton, P\'eter Verebics, Bal\'azs Pint\'er, Tibor Gregorics 7/2/2026

Diff-Based Code Corruption using LLMs for Large-Scale Bugfix Benchmarking

Large-scale bugfix benchmark using LLMs to generate diverse code corruptions reflecting real-world bug distributions.

Ax Orian Dabod, Amir DN Cohen, Gabriel Stanovsky 7/2/2026

When Reranking Hurts: Uncertainty-Based Gating for Few-Shot Reranking

Training-free gating method for few-shot reranking that uses model uncertainty to determine when reranking degrades LLM performance.

Ax Abhishek Dey 7/2/2026

ComplianceGate: Classifier-Gated Multi-Tier LLM Routing for Inference in Regulated Industries

LLM routing system for regulated industries using classifier gates to enforce compliance and optimize inference cost on sensitive queries.

Ax Dongyoon Hwang, Byungkun Lee, Dongjin Kim, Hyojin Jang, Hoiyeong Jin, Jueun Mun, Minho Park, Hojoon Lee, Hyunseung Kim, Jaegul Choo 7/2/2026

3D HAMSTER: Bridging Planning and Control in Hierarchical Vision Language Action Models through 3D Trajectory Guidance

3D trajectory guidance for hierarchical vision-language action models in robot manipulation using depth-aware planning and control.

Ax Muhammad Usman Safder (Steve), Ayesha Gull (Steve), Rania Elbadry (Steve), Fan Zhang (Steve), Yankai Chen (Steve), Xueqing Peng (Steve), Xue (Steve), Liu, Preslav Nakov, Zhuohan Xie 7/2/2026

FinPersona-Bench: A Benchmark for Longitudinal Psychometric Stability of Autonomous Financial Agents

Benchmark for autonomous LLM-based financial agents measuring behavioral mandate decay over time under market context accumulation.

Ax Hussein Chouman, Wataru Sasaki, Tomokazu Matsui, Hirohiko Suwa, Keiichi Yasumoto 7/2/2026

Representation as a Bottleneck for Mechanistic Interpretability: The Manifestation Unit Protocol

Representation framework for mechanistic interpretability enabling reusable, composable neural network component analysis and natural language querying.

Ax Alaina Kolli, Theodoros Xenakis, Utkarsh Utkarsh, Pengfei Cai, Rafael Gomez-Bombarelli, Alan Edelman, Christopher Vincent Rackauckas 7/2/2026

SNAP-FM: Sparse Nonlinear Accelerated Projection for Physics-Constrained Generative Modeling

Physics-constrained generative modeling using sparse nonlinear projection for inference-time constraint enforcement without retraining.

Ax Rui Shu, Tianpei Xia, Jingzhu He 7/2/2026

SemiScope: Disentangling Classifier Tuning and Joint Optimization in Semi-Supervised Security Classification

Framework disentangling classifier tuning and joint optimization for semi-supervised security classification pipelines.

Ax Niccol\`o Maria Rizzi, Eugenio Lomurno, Alberto Archetti, Matteo Matteucci 7/2/2026

A Filtered Mixture-of-Generators for Fully Synthetic Survival Training

Mixture-of-generators approach for synthesizing survival analysis training data in privacy-constrained clinical settings.

Ax Yong Yi Bay, Kathleen A. Yearick 7/2/2026

GRPO, Dr. GRPO, and DAPO Are Three Operations on One Number: The Group-Standard-Deviation Identity

Analysis showing GRPO, Dr. GRPO, and DAPO LLM training methods adjust a single metric: standard deviation of model disagreement.

Ax AbdElRahman ElSaid, Damir Pulatov 7/2/2026

EVOTS: Evolutionary Transformer Search for Time Series Forecasting

Neural architecture search framework using evolutionary algorithms to design task-adaptive Transformer models for time-series forecasting.

Ax Tom Saliencro, Maya Lindqvist, Rohan Desai, Priya Nair, Daniel Whitmore 7/2/2026

FRAME: Learning the Adaptation Domain with a Mixture of Fractional-Fourier Experts

Parameter-efficient fine-tuning method using mixture-of-experts with learned transformation domains for model adaptation.

Ax Sadanand Singh, Allam Reddy, Manan Chopra 7/2/2026

Verifiable Rewards for Calibrated Probabilistic Forecasting

Reinforcement learning approach using verifiable scoring rules to train calibrated probabilistic forecasting models.

Ax Andrew G. Moore 7/2/2026

Scaling Up Thermodynamic AI Models

Scalable training algorithm for Ising-model-based thermodynamic computing devices for low-power AI inference.

Ax Radhakrishna Achanta, Will Reed 7/2/2026

TallyTrain: Communication-Efficient Federated Distillation

Federated learning optimization reducing communication bandwidth for model parameter averaging and knowledge distillation across distributed peers.

Ax Andrzej Bia{\l}ecki, Adam Mastalerz, Han Zhou 7/2/2026

Play Like Champions: Counterfactual Feedback Generation in Latent Space

Generates counterfactual feedback from superhuman game agents by analyzing latent geometry of expert performance.

Ax Max Kreider, John Harlim, Daning Huang 7/2/2026

Learning dynamical systems from noisy data with Weak-form Kernel Ridge Regression

Weak-form kernel ridge regression approach improves noise robustness for learning complex dynamical systems.

Ax Maxime M\'eloux, Tiago Pimentel, Fran\c{c}ois Portet, Maxime Peyrard 7/2/2026

Validating Causal Abstraction Metrics on Simulated Complex Systems

Benchmark for validating causal abstraction metrics across ten complex systems with ground-truth explanations.

Ax Krishna Harsha Kovelakuntla Huthasana, Alireza Olama, Andreas Lundell 7/2/2026

Entropy-Regularized Probabilistic Gates for Sparse Model Discovery in Scarce-Data Federated Learning

Entropy-regularized probabilistic gates learn sparse models in federated learning under data heterogeneity.

Ax Dong Zhang 7/2/2026

Testing Frontier Large Language Models' Physics Literacy in Parallel Physical Worlds

Four-stage diagnostic evaluates LLM physics reasoning through induction, formulation, prediction, and review in unfamiliar frameworks.