Isolater - Feed

Ax Taha Yasseri, Saeedeh Mohammadi 2d ago

How Similar Are Grokipedia and Wikipedia? A Multi-Dimensional Textual and Structural Comparison

Computational analysis comparing 17,790 articles between Grokipedia (AI-generated) and Wikipedia examining textual and structural biases.

Ax Seunghee Han, Yeonghun Kang, Taeun Bae, Junho Kim, Younghun Kim, Varinia Bernales, Alan Aspuru-Guzik, Jihan Kim 2d ago

EGMOF: Efficient Generation of Metal-Organic Frameworks Using a Hybrid Diffusion-Transformer Architecture

EGMOF: hybrid diffusion-transformer for metal-organic framework generation with inverse design capabilities for materials discovery.

Ax Dom\'icio Pereira Neto, Jo\~ao Correia, Penousal Machado 2d ago

Evolutionary Optimization Trumps Adam Optimization on Embedding Space Exploration

Inference-time optimization using evolutionary algorithms on prompt embeddings for diffusion model control without fine-tuning.

Ax Manan Suri, Puneet Mathur, Nedim Lipka, Franck Dernoncourt, Ryan A. Rossi, Dinesh Manocha 2d ago

Structured Uncertainty guided Clarification for LLM Agents

Structured uncertainty framework for LLM agents with tool-calling to generate principled clarifying questions for ambiguous user instructions.

Ax Zhirui Liu, Kaiyang Ji, Ke Yang, Jingyi Yu, Ye Shi, Jingya Wang 2d ago

Commanding Humanoid by Free-form Language: A Large Language Action Model with Unified Motion Vocabulary

Language-conditioned humanoid robot control using LLM with unified motion vocabulary for free-form command execution and embodied AI.

Ax Anik De, Abhirama Subramanyam Penamakuri, Rajeev Yadav, Aditya Rathore, Harshiv Shah, Devesh Sharma, Sagar Agarwal, Pravin Kumar, Anand Mishra 2d ago

Bharat Scene Text: A Novel Comprehensive Dataset and Benchmark for Indian Language Scene Text Understanding

Bharat Scene Text dataset and benchmark for Indian language scene text recognition addressing script diversity and font variations.

Ax Le Thien Phuc Nguyen, Zhuoran Yu, Samuel Low Yu Hang, Subin An, Jeongik Lee, Yohan Ban, SeungEun Chung, Thanh-Huy Nguyen, JuWan Maeng, Soochahn Lee, Yong Jae Lee 2d ago

See, Hear, and Understand: Benchmarking Audiovisual Human Speech Understanding in Multimodal Large Language Models

AV-SpeakerBench: multimodal LLM benchmark with 3,212 questions evaluating audiovisual speech understanding and speaker-speech alignment in video.

Ax Haoming Liu, Jinnuo Liu, Yanhao Li, Liuyang Bai, Yunkai Ji, Yuanhe Guo, Shenji Wan, Hongyi Wen 2d ago

From Navigation to Refinement: Revealing the Two-Stage Nature of Flow-based Diffusion Models through Oracle Velocity

Analysis of flow-based diffusion models revealing two-stage behavior through oracle velocity field computation and memorization-generalization tradeoffs.

Ax Melane Navaratnarajah, David A. Kelly, Hana Chockler 2d ago

Out-of-the-box: Black-box Causal Attacks on Object Detectors

Research on adversarial perturbations for object detectors using black-box attacks to expose vulnerabilities and understand attack mechanisms.

Ax Zayne Sprague, Jack Lu, Manya Wadhwa, Sedrick Keh, Mengye Ren, Greg Durrett 2d ago

SkillFactory: Self-Distillation For Learning Cognitive Behaviors

Research on self-distillation methods for teaching language models to leverage cognitive skills like verification and backtracking without base model exposure.

Ax Thao Nguyen, Sicheng Mo, Krishna Kumar Singh, Yilin Wang, Jing Shi, Nicholas Kolkin, Eli Shechtman, Yong Jae Lee, Yuheng Li 2d ago

Relational Visual Similarity

Research on relational visual similarity in computer vision showing how humans perceive analogical relationships beyond attribute similarity.

Ax Qiushi Han, David Simchi-Levi, Renfei Tan, Zishuo Zhao 2d ago

Multi-agent Adaptive Mechanism Design

Framework combining mechanism design and online learning for sequential mechanism design where principal learns agent beliefs while ensuring truthfulness.

Ax Zibo Zhao (Arizona State University), Yuanting Zha (ShanghaiTech University), Haipeng Zhang (ShanghaiTech University), Xingcheng Xu (Shanghai Artificial Intelligence Laboratory) 2d ago

The Two-Stage Decision-Sampling Hypothesis: Understanding the Emergence of Self-Reflection in RL-Trained LLMs

Mechanistic study of self-reflection emergence in RL-trained LLMs, proposing two-stage decision-sampling hypothesis to explain unified optimization producing distinct capabilities.

Ax Frank Mollard, Marcus Becker, Florian Roehrbein 2d ago

Adversarial Evasion Attacks on Computer Vision using SHAP Values

White-box adversarial attack method on computer vision models using SHAP values to generate imperceptible evasion attacks.

Ax Jianan Wang, Nailei Hei, Li He, Huanzhen Wang, Aoxing Li, Yingkai Zhao, Yuxuan Lin, Haofen Wang, Chunyang Wang, Yan Wang, Wenqiang Zhang 2d ago

Screen, Cache, and Match: A Training-Free Causality-Consistent Reference Frame Framework for Human Animation

Training-free framework for human video animation using cached reference frames to model long-range dependencies while preserving temporal coherence.

Ax Safal Shrestha, Anubhav Shrestha, Aadim Nepal, Minwu Kim, Keith Ross 2d ago

On the Limits of Layer Pruning for Generative Reasoning in Large Language Models

Analysis showing layer pruning of LLMs degrades generative reasoning tasks beyond surface degradation, causing loss of algorithmic capabilities.

Ax Bryan Sangwoo Kim, Jonghyun Park, Jong Chul Ye 2d ago

Tiled Prompts: Overcoming Prompt Misguidance in Image and Video Super-Resolution

Method addressing prompt misguidance in diffusion-based super-resolution by using tiled prompts for localized semantic guidance.

Ax Indraveni Chebolu, Arnab Mallick, Harmesh Rana 2d ago

SPEAR: An Engineering Case Study of Multi-Agent Coordination for Smart Contract Auditing

Multi-agent framework for smart contract auditing using specialized agents for planning, execution, and recovery with coordination protocols.

Ax Eun Cheol Choi, Lindsay E. Young, Emilio Ferrara 2d ago

Overstating Attitudes, Ignoring Networks: LLM Biases in Simulating Misinformation Susceptibility

Study demonstrating LLM biases when simulating misinformation susceptibility, showing models overstate attitudes and ignore network effects present in humans.

Ax Prerna Ravi, Car\'umey Stevens, Beatriz Flamia Azevedo, Jasmine David, Brandon Hanks, Hal Abelson, Grace Lin, Emma Anderson 2d ago

Exploring Teachers' Perspectives on Using Conversational AI Agents for Group Collaboration

Qualitative study of 33 K12 teachers' perspectives on using conversational AI agents to scaffold group collaboration in classrooms.

Ax Adolfo Gonz\'alez, V\'ictor Parada 2d ago

An Adaptive Model Selection Framework for Demand Forecasting under Horizon-Induced Degradation to Support Business Strategy and Operations

Adaptive framework for demand forecasting model selection addressing horizon-induced performance degradation in inventory planning.

Ax Rong Fu, Zijian Zhang, Kun Liu, Jiekai Wu, Xianda Li, Simon Fong 2d ago

SubQuad: Near-Quadratic-Free Structure Inference with Distribution-Balanced Objectives in Adaptive Receptor framework

Pipeline combining subquadratic retrieval and GPU-accelerated kernels for analyzing immune repertoires at population scale.

Ax Joao Manoel Herrera Pinheiro, Gabriela Do Nascimento Herrera, Luciana Bueno Dos Reis Fernandes, Alvaro Doria Dos Santos, Ricardo V. Godoy, Eduardo A. B. Almeida, Helena Carolina Onody, Marcelo Andrade Da Costa Vieira, Angelica Maria Penteado-Dias, Marcelo Becker 2d ago

Descriptor: Parasitoid Wasps and Associated Hymenoptera Dataset (DAPWH)

Dataset of parasitoid wasps and hymenoptera for taxonomic identification and biodiversity monitoring.

Ax Zhaoyang Zhang, Shuli Jiang, Yantao Shen, Yuting Zhang, Dhananjay Ram, Shuo Yang, Zhuowen Tu, Wei Xia, Stefano Soatto 2d ago

Reinforcement-aware Knowledge Distillation for LLM Reasoning

Knowledge distillation method for distilling RL-trained LLMs with chain-of-thought reasoning into smaller student models while preserving reasoning capabilities.

Ax Ruinan Jin, Yingbin Liang, Shaofeng Zou 2d ago

Why Adam Can Beat SGD: Second-Moment Normalization Yields Sharper Tails

Theoretical analysis explaining why Adam optimizer outperforms SGD through second-moment normalization using stopping-time and martingale analysis.

Ax Yuan Wu, Zongxian Yang, Jiayu Qian, Songpan Gao, Guanxing Chen, Qiankun Li, Yu-An Huang, Zhi-An Huang 2d ago

Better Eyes, Better Thoughts: Why Vision Chain-of-Thought Fails in Medicine

Analysis showing chain-of-thought prompting underperforms direct answering in medical vision-language models due to perception bottlenecks in domain-specific tasks.

Ax Minh-Duong Nguyen, Thien-Thanh Dao, Le-Tuan Nguyen, Dung D. Le, Kok-Seng Wong 2d ago

Memory-efficient Continual Learning with Prototypical Exemplar Condensation

Memory-efficient continual learning method using prototypical exemplar condensation to reduce storage requirements while maintaining performance.

Ax Zhexi Lian, Haoran Wang, Xuerun Yan, Weimeng Lin, Xianhong Zhang, Yongyu Chen, Jia Hu 2d ago

Fine-tuning is Not Enough: A Parallel Framework for Collaborative Imitation and Reinforcement Learning in End-to-end Autonomous Driving

Parallel framework combining imitation and reinforcement learning for autonomous driving, addressing limitations of sequential fine-tuning approaches.

Ax Omkar Patil, Ondrej Biza, Thomas Weng, Karl Schmeckpeper, Wil Thomason, Xiaohan Zhang, Robin Walters, Nakul Gopalan, Sebastian Castro, Eric Rosen 2d ago

You've Got a Golden Ticket: Improving Generative Robot Policies With A Single Noise Vector

Method to improve pretrained generative robot policies by replacing sampled noise with optimized constant noise vectors for downstream reward optimization.

Ax Mengxian Lyu, Cheng Peng, Ziyi Chen, Mengyuan Zhang, Jieting Li Lu, Yonghui Wu 2d ago

Improving Automatic Summarization of Radiology Reports through Mid-Training of Large Language Models

Mid-training adaptation strategy for LLMs to improve automatic summarization of radiology reports, exploring domain-specific pre-training approaches.

Ax Sen Jia, Ning Zhu, Jinqin Zhong, Jiale Zhou, Huaping Zhang, Jenq-Neng Hwang, Lei Li 2d ago

RAM: Recover Any 3D Human Motion in-the-Wild

RAM: motion capture system for 3D human pose reconstruction in unconstrained video with occlusion handling and temporal smoothing.

Ax Clemens Watzenb\"ock, Daniel Aletaha, Micha\"el Deman, Thomas Deimel, Jana Eder, Ivana Janickova, Robert Janiczek, Peter Mandl, Philipp Seeb\"ock, Gabriela Supp, Paul Weiser, Georg Langs 2d ago

Chronological Contrastive Learning: Few-Shot Progression Assessment in Irreversible Diseases

ChronoCon: contrastive learning approach for disease progression assessment from longitudinal medical imaging without explicit severity annotations.

Ax Robert Aufschl\"ager, Jakob Folz, Gautam Savaliya, Manjitha D Vidanalage, Michael Heigl, Martin Schramm 2d ago

Towards Context-Aware Image Anonymization with Multi-Agent Reasoning

CAIAMAR: multi-agent framework for context-aware image anonymization in street-level imagery using agentic reasoning.

Ax Haochuan Kevin Wang, Zechen Zhang 2d ago

Kill-Chain Canaries: Stage-Level Tracking of Prompt Injection Across Attack Surfaces and Model Safety Tiers

Kill-chain canary methodology for tracking prompt injection attacks across multi-agent LLM systems with stage-level diagnostics.

Ax Hita Kambhamettu, Will Crichton, Sean Welleck, Harrison Goldstein, Andrew Head 2d ago

Explorable Theorems: Making Written Theorems Explorable by Grounding Them in Formal Representations

System for making mathematical theorems interactive by grounding LLM-generated explanations in formal representations enabling execution and stepping.

Ax Myra Cheng, Isabel Sieh, Humishka Zope, Sunny Yu, Lujain Ibrahim, Aryaman Arora, Jared Moore, Desmond Ong, Dan Jurafsky, Diyi Yang 2d ago

Verbalizing LLMs' assumptions to explain and control sycophancy

Framework for eliciting and verbalizing LLM assumptions to explain and mitigate sycophantic behavior in model outputs.

Ax Yi Zhou 2d ago

From Paper to Program: Accelerating Quantum Many-Body Algorithm Development via a Multi-Stage LLM-Assisted Workflow

Multi-stage LLM-assisted workflow for scientific algorithm development separating theory extraction, formal specification, and code generation.

Ax Cheol Woo Kim, Jai Moondra, Roozbeh Nahavandi, Andrew Perrault, Milind Tambe, Swati Gupta 2d ago

Many Preferences, Few Policies: Towards Scalable Language Model Personalization

Method for LLM personalization using a small portfolio of models capturing diverse user preferences without per-user models.

Ax Zequn Chen, Wesley J. Marrero 2d ago

Boosted Distributional Reinforcement Learning: Analysis and Healthcare Applications

Distributional reinforcement learning approach for decision-making in healthcare, accounting for uncertainty across heterogeneous populations.

Ax Jingwei Zuo, Xinze Feng, Zien Liu, Kaijian Wang, Fanjiang Ye, Ye Cao, Zhuang Wang, Yuke Wang 2d ago

ALTO: Adaptive LoRA Tuning and Orchestration for Heterogeneous LoRA Training Workloads

ALTO: system for adaptive LoRA hyperparameter tuning and orchestration across heterogeneous LLM fine-tuning workloads in multi-tenant environments.

Ax Zhengming Yu, Li Ma, Mingming He, Leo Isikdogan, Yuancheng Xu, Dmitriy Smirnov, Pablo Salamanca, Dao Mi, Pablo Delgado, Ning Yu, Julien Philip, Xin Li, Wenping Wang, Paul Debevec 2d ago

DiffHDR: Re-Exposing LDR Videos with Video Diffusion Models

DiffHDR: video diffusion model approach for converting low-dynamic-range videos to high-dynamic-range format.

Ax Yiquan Wu, Yuhang Liu, Yifei Liu, Ang Li, Siying Zhou, Kun Kuang, Fei Wu 2d ago

WisdomInterrogatory (LuWen): An Open-Source Legal Large Language Model Technical Report

WisdomInterrogatory (LuWen): open-source Chinese legal language model built on Baichuan foundation model for legal domain applications.

Ax Xue Qin, Simin Luan, John See, Cong Yang, Zhijun Li 2d ago

Governed Capability Evolution for Embodied Agents: Safe Upgrade, Compatibility Checking, and Runtime Rollback for Embodied Capability Modules

System for safe capability evolution in embodied agents with compatibility checking and runtime rollback mechanisms.

Ax Seungjae Moon, Seunghyun Oh, Youngmin Ro 2d ago