Isolater - Feed

Ax Subash Khanal, Srikumar Sastry, Aayush Dhakal, Adeel Ahmad, Abby Stylianou, Nathan Jacobs 8d ago

Sat2Sound: A Unified Framework for Zero-Shot Soundscape Mapping

Sat2Sound framework predicts soundscape distribution using satellite images and vision-language models for geospatial audio understanding.

Ax Haoning Wu, Xiao Huang, Yaohui Chen, Ya Zhang, Yanfeng Wang, Weidi Xie 8d ago

SpatialScore: Towards Comprehensive Evaluation for Spatial Intelligence

SpatialScore: comprehensive benchmark for evaluating spatial intelligence of multimodal LLMs with data-driven and agent-based assessment approaches.

Ax Chengqi Duan, Rongyao Fang, Yuqing Wang, Kun Wang, Linjiang Huang, Xingyu Zeng, Hongsheng Li, Xihui Liu 8d ago

GoT-R1: Unleashing Reasoning Capability of MLLM for Visual Generation with Reinforcement Learning

GoT-R1: reinforcement learning framework enhancing multimodal LLM reasoning for complex visual generation with precise spatial relationships and attributes.

Ax Fanjin Meng, Jingtao Ding, Jiahui Gong, Chen Yang, Hong Chen, Zuojian Wang, Haisheng Lu, Yong Li 8d ago

Tuning Language Models for Robust Prediction of Diverse User Behaviors

Fine-tuning approach for LLMs to predict diverse user behaviors, addressing overfitting to frequent behaviors while capturing long-tailed behavior distribution.

Ax Taiye Chen, Xun Hu, Zihan Ding, Chi Jin 8d ago

Learning World Models for Interactive Video Generation

World models for interactive video generation with action conditioning and autoregressive decoding to support planning and future prediction.

Ax Shulong Zhang, Mingyuan Yao, Jiayin Zhao, Daoliang Li, Yingyi Chen, Haihua Wang 8d ago

Progressive Multimodal Interaction Network for Reliable Quantification of Fish Feeding Intensity in Aquaculture

Progressive multimodal network for quantifying fish feeding intensity in aquaculture using sensor fusion and conflict resolution between modalities.

Ax Yongjie Fu, Ruijian Zha, Pei Tian, Xuan Di 8d ago

LLM-based Realistic Safety-Critical Driving Video Generation

Framework using LLMs for few-shot code generation to create safety-critical driving scenarios in CARLA simulator for autonomous driving evaluation.

Ax Takashi Izumo 8d ago

Absorption and Inertness in Coarse-Grained Arithmetic: A Heuristic Application to the St. Petersburg Paradox

Mathematical analysis of coarse-grained arithmetic applied to the St. Petersburg paradox in decision theory.

Ax Xu Yang, Chenhui Lin, Licheng Sha, Liping Yang, Shuzhou Wu, Xichen Tian, Haotian Liu, Wenchuan Wu 8d ago

Large Language Model as An Operator: An Experience-Driven Solution for Distribution Network Voltage Control

LLM-based autonomous agent for power system voltage control, using experience-driven learning to generate dispatch strategies in distribution networks.

Ax Kailai Yang, Xiao Liu, Lei Ji, Hao Li, Xiao Liang, Zhiwei Liu, Yeyun Gong, Peng Cheng, Mao Yang 8d ago

Data Mixing Agent: Learning to Re-weight Domains for Continual Pre-training

Data Mixing Agent: LLM-based method to automatically re-weight training data domains during continual pre-training, preventing catastrophic forgetting.

Ax Maciej K. Wozniak, Lianhang Liu, Yixi Cai, Patric Jensfelt 8d ago

PRIX: Learning to Plan from Raw Pixels for End-to-End Autonomous Driving

PRIX: efficient end-to-end autonomous driving model planning from raw camera pixels without LiDAR, reducing model size and computational requirements.

Ax Haris Khan, Sadia Asif, Shumaila Asif, Muhammad Zeeshan Karamat, Rajesh Upadhayaya 8d ago

Modular Delta Merging with Orthogonal Constraints: A Scalable Framework for Continual and Reversible Model Composition

MDM-OC: framework for scalable, reversible model composition enabling continual learning without task interference or catastrophic forgetting.

Ax Soumyadeep Dhar, Kei Sen Fong, Mehul Motani 8d ago

Teaching the Teacher: The Role of Teacher-Student Smoothness Alignment in Genetic Programming-based Symbolic Distillation

Genetic programming approach for symbolic distillation of neural networks, using teacher-student smoothness alignment to improve explainable AI model accuracy.

Ax Kisu Yang, Yoonna Jang, Hwanseok Jang, Kenneth Choi, Isabelle Augenstein, Heuiseok Lim 8d ago

Reliable Evaluation Protocol for Low-Precision Retrieval

Protocol for reliable evaluation of low-precision retrieval systems, addressing spurious ties and variability in relevance scoring with reduced numerical precision.

Ax Stella Su, Marc Harary, Scott J. Rodig, William Lotter 8d ago

AdvDINO: Domain-Adversarial Self-Supervised Representation Learning for Spatial Proteomics

AdvDINO: domain-adversarial self-supervised learning framework for spatial proteomics to handle batch effects in biomedical imaging.

Ax Abolfazl Ansari, Delvin Ce Zhang, Nafis Irtiza Tripto, Dongwon Lee 8d ago

Echoes of Automation: The Increasing Use of LLMs in Newsmaking

Analysis of LLM use in newsmaking across 40,000+ articles using AI-text detectors, showing increased GenAI adoption in local and college media.

Ax Peiran Peng, Tingfa Xu, Liqiang Song, Mengqi Zhu, Yuqiang Fang, Jianan Li 8d ago

COXNet: Cross-Layer Fusion with Adaptive Alignment and Scale Integration for RGBT Tiny Object Detection

COXNet: cross-layer fusion network for detecting tiny objects in multimodal RGB-thermal imagery for surveillance and autonomous navigation.

Ax Po-Hsien Yu, Yu-Syuan Tseng, Shao-Yi Chien 8d ago

FedKLPR: KL-Guided Pruning-Aware Federated Learning for Person Re-Identification

FedKLPR: federated learning approach for person re-identification with KL-guided pruning to reduce communication overhead and handle non-IID data.

Ax Wenhong Zhu, Ruobing Xie, Rui Wang, Xingwu Sun, Di Wang, Pengfei Liu 8d ago

Proximal Supervised Fine-Tuning

Proximal SFT: supervised fine-tuning method using trust-region constraints to prevent capability deterioration when adapting foundation models to new tasks.

Ax Shvetank Prakash, Andrew Cheng, Olof Kindgren, Ashiq Ahamed, Graham Knight, Jed Kufel, Francisco Rodriguez, Arya Tschand, David Kong, Mariam Elgamal, Jerry Huang, Emma Chen, Gage Hills, Richard Price, Emre Ozer, Vijay Janapa Reddi 8d ago

Lifetime-Aware Design for Item-Level Intelligence at the Extreme Edge

FlexiFlow: lifetime-aware design framework for integrated computation in disposable products using flexible electronics with kHz speeds.

Ax Nolan Platt, Pragyansmita Nayak 8d ago

Multi-Model Synthetic Training for Mission-Critical Small Language Models

LLM-based synthetic training reduces maritime domain model costs 261x by using LLMs as teachers for small language model training.

Ax Tianle Lyu, Junchuan Zhao, Ye Wang 8d ago

KSDiff: Keyframe-Augmented Speech-Aware Dual-Path Diffusion for Facial Animation

Diffusion model for audio-driven facial animation using keyframe augmentation and speech feature decomposition.

Ax Amin Karimi Monsefi, Nikhil Bhendawade, Manuel Rafael Ciosici, Dominic Culver, Yizhe Zhang, Irina Belousova 8d ago

FS-DFM: Fast and Accurate Long Text Generation with Few-Step Diffusion Language Models

FS-DFM enables fast long text generation using few-step diffusion language models with parallel position generation.

Ax Junyu Guo, Shangding Gu, Ming Jin, Costas Spanos, Javad Lavaei 8d ago

StyleBench: Evaluating thinking styles in Large Language Models

StyleBench evaluates trade-offs between structured reasoning styles and efficiency/robustness in LLM inference.

Ax Fang Wu, Aaron Tu, Weihao Xuan, Heli Qi, Xu Huang, Qingcheng Zeng, Shayan Talaei, Yijia Xiao, Peng Xia, Xiangru Tang, Yuchen Zhuang, Bing Hu, Hanqun Cao, Wenqi Shi, Rui Yang, Nan Liu, Huaxiu Yao, Ge Liu, Li Erran Li, Amin Saberi, Naoto Yokoya, Jure Leskovec, Yejin Choi 8d ago

Position: The Hidden Costs and Measurement Gaps of Reinforcement Learning with Verifiable Rewards

Position paper analyzing measurement gaps in reinforcement learning with verifiable rewards for LLMs on structured tasks.

Ax Junkai Chen, Huihui Huang, Yunbo Lyu, Junwen An, Jieke Shi, Chengran Yang, Ting Zhang, Haoye Tian, Yikun Li, Zhenhao Li, Xin Zhou, Xing Hu, David Lo 8d ago

SecureVibeBench: Evaluating Secure Coding Capabilities of Code Agents with Realistic Vulnerability Scenarios

SecureVibeBench evaluates code generation security of LLM-powered code agents against realistic vulnerability scenarios.

Ax Merve G\"ulle, Junno Yun, Ya\c{s}ar Utku Al\c{c}alar, Mehmet Ak\c{c}akaya 8d ago

PnP-CM: Consistency Models as Plug-and-Play Priors for Inverse Problems

Consistency models as plug-and-play priors for solving inverse problems with reduced neural function evaluations.

Ax Muhammad Imran Hossain, Jignesh Solanki, Sarika Khushlani Solanki 8d ago

Unsupervised Detection of Spatiotemporal Anomalies in PMU Data Using Transformer-Based BiGAN

T-BiGAN framework combining Transformers and BiGAN for unsupervised anomaly detection in power grid synchrophasor data.

Ax Bipul Thapa, Biplov Paneru, Bishwash Paneru, Khem Narayan Poudyal 8d ago

EEG-based AI-BCI Wheelchair Advancement: Hybrid Deep Learning with Motor Imagery for Brain Computer Interface

Hybrid deep learning system for EEG-based brain-computer interface wheelchair control using motor imagery.

Ax Xue-Cheng Tai, Hao Liu, Lingfeng Li, Raymond H. Chan 8d ago

A Mathematical Explanation of Transformers

Mathematical framework interpreting Transformers as discretizations of integro-differential equations.

Ax Jie Luo, Yuxuan Jiang, Xin Jin, Mingyu Liu, Yihui Fan 8d ago

Semantic Segmentation Algorithm Based on Light Field and LiDAR Fusion

Semantic segmentation combining light field and LiDAR modalities for autonomous driving scene understanding.

Ax Bryan R. Christ, Penelope Molitz, Beau LeBlond, Zachary Gottesman, Jonathan Kropko, Thomas Hartvigsen 8d ago

EDUMATH: Generating Standards-aligned Educational Math Word Problems

LLM-based system for generating standards-aligned math word problems customized to student interests and ability levels.

Ax Jigang Fan, Xiaoran Jiao, Shengdong Lin, Zhanming Liang, Weian Mao, Chenchen Jing, Hao Chen, Chunhua Shen 8d ago

Evolutionary Profiles for Protein Fitness Prediction

Protein language models for fitness prediction interpreted as inverse reinforcement learning on evolutionary sequences.

Ax Peilin Wu, Mian Zhang, Kun Wan, Wentian Zhao, Kaiyu He, Xinya Du, Zhiyu Chen 8d ago

HiPRAG: Hierarchical Process Rewards for Efficient Agentic Retrieval Augmented Generation

HiPRAG uses hierarchical process rewards to improve agentic RAG efficiency, reducing over-search and under-search behaviors.

Ax Jerome Sieber, Antonio Orvieto, Melanie N. Zeilinger, Carmen Amo Alonso 8d ago

Design Principles for Sequence Models via Coefficient Dynamics

Unified framework analyzing sequence models (Transformers, SSMs, gated RNNs) through coefficient dynamics lens.

Ax Kedi Chen, Dezhao Ruan, Yuhao Dan, Yaoting Wang, Siyu Yan, Xuecheng Wu, Yinqi Zhang, Qin Chen, Jie Zhou, Liang He, Biqing Qi, Linyang Li, Qipeng Guo, Xiaoming Shi, Wei Zhang 8d ago

A Survey of Inductive Reasoning for Large Language Models

Survey of inductive reasoning in LLMs, covering particular-to-general thinking patterns and knowledge generalization capabilities.

Ax Chris Xing Tian, Weihao Xie, Zhen Chen, Zhengyuan Yi, Hui Liu, Haoliang Li, Shiqi Wang, Siwei Ma 8d ago

Domain-Specific Data Generation Framework for RAG Adaptation

RAGen framework for generating domain-specific question-answer pairs to adapt RAG systems to specialized applications.

Ax Sarah Liaw, Benjamin Plaut 8d ago

Learning When Not to Learn: Risk-Sensitive Abstention in Bandits with Unbounded Rewards

Risk-sensitive abstention in bandit algorithms for high-stakes AI where errors are irreparable without expert guidance.

Ax Nishad Kulkarni, Krithika Iyer, Austin Tapp, Abhijeet Parida, Daniel Capell\'an-Mart\'in, Zhifan Jiang, Mar\'ia J. Ledesma-Carbayo, Syed Muhammad Anwar, Marius George Linguraru 8d ago

Post-Processing Methods for Improving Accuracy in MRI Inpainting

Post-processing methods for MRI brain image inpainting to handle lesions and tumors in medical imaging analysis.

Ax Jinliang Liu, Jiale Bai, Shaoning Zeng 8d ago

Think Parallax: Solving Multi-Hop Problems via Multi-View Knowledge-Graph-Based Retrieval-Augmented Generation

Multi-hop reasoning over knowledge graphs using multi-view RAG with LLMs, addressing Transformer attention specialization patterns.

Ax Michael Klamkin, Mathieu Tanneau, Pascal Van Hentenryck 8d ago

Self-Certifying Primal-Dual Optimization Proxies for Large-Scale Batch Economic Dispatch

Optimization proxies trained to minimize optimality gaps while providing worst-case guarantees for large-scale batch economic dispatch problems.

Ax Tiancheng Hu, Joachim Baumann, Lorenzo Lupo, Nigel Collier, Dirk Hovy, Paul R\"ottger 8d ago

SimBench: Benchmarking the Ability of Large Language Models to Simulate Human Behaviors

SimBench provides first standardized benchmark for evaluating how faithfully LLMs simulate human behaviors across diverse tasks and metrics.

Ax Haoyu Huang, Hong Ting Tsang, Jiaxin Bai, Xi Peng, Gong Zhang, Yangqiu Song 8d ago

AtlasKV: Augmenting LLMs with Billion-Scale Knowledge Graphs in 20GB VRAM

AtlasKV enables RAG systems to integrate billion-scale knowledge graphs efficiently in limited VRAM by avoiding expensive external retrieval modules.

Ax Hao Wang, Licheng Pan, Yuan Lu, Zhixuan Chu, Xiaoxi Li, Shuting He, Zhichao Chen, Haoxuan Li, Qingsong Wen, Zhouchen Lin 8d ago

DistDF: Time-Series Forecasting Needs Joint-Distribution Wasserstein Alignment

Proposes DistDF for time-series forecasting using Wasserstein alignment to handle autocorrelated label sequences better than standard approaches.

Ax Rajiv Movva, Smitha Milli, Sewon Min, Emma Pierson 8d ago

What's In My Human Feedback? Learning Interpretable Descriptions of Preference Data

Method to automatically extract and explain what features human feedback data encodes when training language models, addressing unpredictability in RLHF approaches.

Ax Deokhyung Kang, Seonjeong Hwang, Daehui Kim, Hyounghun Kim, Gary Geunbae Lee 8d ago

Why Do Multilingual Reasoning Gaps Emerge in Reasoning Language Models?

Analysis of multilingual reasoning gaps in reasoning language models, showing deficits stem from language understanding failures in low-resource languages.

Ax Uzay Macar, Paul C. Bogdan, Senthooran Rajamanoharan, Neel Nanda 8d ago

Thought Branches: Interpreting LLM Reasoning Requires Resampling

Method for interpreting LLM reasoning by resampling multiple chain-of-thought branches to measure causal influence and underlying computation.

Ax Xiaohan Wang, Yuxin Hu, Kevin Leach 8d ago

Context-Guided Decompilation: A Step Towards Re-executability

LLM-guided decompilation framework using context to improve re-executability of decompiled binaries for security analysis.

Ax Zixuan Huang, Huaidian Hou, Dmitry Berenson 8d ago

Multimodal Diffusion Forcing for Forceful Manipulation

Multimodal diffusion approach for robot learning from expert trajectories, modeling interactions between observations, actions, and rewards.

Ax Zhaoyang Wang, Yiming Liang, Xuchao Zhang, Qianhui Wu, Siwei Han, Anson Bastos, Rujia Wang, Chetan Bansal, Baolin Peng, Jianfeng Gao, Saravan Rajmohan, Huaxiu Yao 8d ago

SynthAgent: Adapting Web Agents with Synthetic Supervision

SynthAgent: Framework for web agent adaptation using synthetic data generation with quality filtering to handle hallucinations and trajectory noise.