Isolater - Feed

Ax Andi Nika, Debmalya Mandal, Parameswaran Kamalaruban, Adish Singla, Goran Radanovi\'c 18d ago

Corruption-robust Offline Multi-agent Reinforcement Learning From Human Feedback

Multi-agent reinforcement learning framework addressing robustness to data corruption in preference-based learning from human feedback.

Ax Chien-Ping Lu 18d ago

Continued AI Scaling Requires Repeated Efficiency Doublings

Analysis of AI scaling requiring repeated efficiency doublings, distinguishing logical compute from physical resource implementation efficiency.

Ax Anci Lin, Xiaohong Liu, Zhiwen Zhang, Wenju Zhao 18d ago

Biomimetic causal learning for microstructure-forming phase transitions

Biomimetic physics-informed neural networks for modeling microstructure-forming phase transitions in cellular matrices.

Ax Brandon Yee, Pairie Koh 18d ago

PI-JEPA: Label-Free Surrogate Pretraining for Coupled Multiphysics Simulation via Operator-Split Latent Prediction

Physics-informed label-free pretraining method for coupled multiphysics simulation surrogates using operator-split latent prediction.

Ax Dharmesh Tailor, Nicol\`o Felicioni, Kamil Ciosek 18d ago

A Bayesian Information-Theoretic Approach to Data Attribution

Bayesian information-theoretic approach to training data attribution that traces model predictions to influential training examples for interpretability.

Ax Minglu Liu, Cunchen Hu, Liangliang Xu, Fengming Tang, Ruijia Wang, Fu Yu 18d ago

STQuant: Spatio-Temporal Adaptive Framework for Optimizer Quantization in Large Multimodal Model Training

STQuant framework for adaptive spatio-temporal quantization of optimizer states during large multimodal model training to reduce memory costs.

Ax Nozomu Kobayashi, Yoshiyuki Suimon, Koichi Miyamoto 18d ago

Time series generation for option pricing on quantum computers using tensor network

Quantum computing approach for option pricing using tensor networks to prepare quantum states encoding asset price distributions.

Ax Tim Johnsen, Marco Levorato 18d ago

NaviSlim: Adaptive Context-Aware Navigation and Sensing via Dynamic Slimmable Networks

Adaptive neural networks for autonomous micro-drones with computational constraints via dynamic slimmable network architecture.

Ax Takuro Kutsuna 18d ago

A Probabilistic Formulation of Offset Noise in Diffusion Models

Theoretical analysis of offset noise in diffusion models to address brightness value generation challenges in large-scale models.

Ax Huawei Lin, Yingjie Lao, Weijie Zhao 18d ago

DMin: Scalable Training Data Influence Estimation for Diffusion Models

DMin framework for scalable training data influence estimation in diffusion models, enabling identification of influential training samples on generated outputs.

Ax Ximing Xing, Juncheng Hu, Ziteng Xue, Jing Zhang, Buyu Li, Sheng Wang, Dong Xu, Qian Yu 18d ago

SVGFusion: A VAE-Diffusion Transformer for Vector Graphic Generation

VAE-diffusion framework for generating high-quality SVG graphics from text with structural understanding.

Ax Antoni Kowalczuk, Jan Dubi\'nski, Franziska Boenisch, Adam Dziedzic 18d ago

Privacy Attacks on Image AutoRegressive Models

Comprehensive privacy attack analysis on image autoregressive models, identifying membership inference and extraction vulnerabilities.

Ax Mohammad Albinhassan, Pranava Madhyastha, Alessandra Russo 18d ago

$\texttt{SEM-CTRL}$: Semantically Controlled Decoding

Method for enforcing syntactic and semantic constraints in LLM decoding through MCTS-guided token-level control.

Ax Musfiqur Rahman, SayedHassan Khatoonabadi, Emad Shihab 18d ago

OpenClassGen: A Large-Scale Corpus of Real-World Python Classes for LLM Research

Large-scale corpus of 324,843 Python classes from open-source projects for training and evaluating LLMs on code generation.

Ax Dezheng Han, Yibin Jia, Ruxiao Chen, Wenjie Han, Shuaishuai Guo, Jianbo Wang 18d ago

ReCellTy: Domain-Specific Knowledge Graph Retrieval-Augmented LLMs Reasoning Workflow for Single-Cell Annotation

RAG-based LLM workflow using domain-specific knowledge graph for automated single-cell type annotation in biology.

Ax Rui Melo, Claudia Mamede, Andre Catarino, Rui Abreu, Henrique Lopes Cardoso 18d ago

Are Sparse Autoencoders Useful for Java Function Bug Detection?

Study evaluating sparse autoencoders for detecting bugs in Java code, addressing software vulnerability detection.

Ax Ozsel Kilinc, Cem Tarhan 18d ago

RQR3D: Reparametrizing the regression targets for BEV-based 3D object detection

Technique for improving BEV-based 3D object detection in autonomous driving by reparametrizing regression targets.

Ax Charig Yang, Samiul Alam, Shakhrul Iman Siam, Michael J. Proulx, Lambert Mathias, Kiran Somasundaram, Luis Pesqueira, James Fort, Sheroze Sheriffdeen, Omkar Parkhi, Carl Ren, Mi Zhang, Yuning Chai, Richard Newcombe, Hyo Jin Kim 18d ago

Reading Recognition in the Wild

Task and dataset for detecting when users are reading in egocentric smart glasses video using multimodal models.

Ax Thinh Pham, Nguyen Nguyen, Pratibha Zunjare, Weiyuan Chen, Yu-Min Tseng, Tu Vu 18d ago

SealQA: Raising the Bar for Reasoning in Search-Augmented Language Models

Benchmark dataset (SealQA) for evaluating search-augmented LLMs on fact-seeking questions with conflicting or noisy search results.

Ax Adrian-Marius Dumitran, Radu Dita, Angela Liliana Dumitran 18d ago

BacPrep: Lessons from Deploying an LLM-Based Bacalaureat Assessment Platform

Deployment case study of LLM-based platform for automated assessment of Romanian Bacalaureat exam questions using Gemini Flash.

Ax Tianjiao Yu, Vedant Shah, Muntasir Wahed, Ying Shen, Kiet A. Nguyen, Ismini Lourentzou 18d ago

Part$^{2}$GS: Part-aware Modeling of Articulated Objects using 3D Gaussian Splatting

Framework for 3D reconstruction of articulated objects using part-aware Gaussian splatting representation.

Ax Scarlett Raine, Tobias Fischer 18d ago

AI-Driven Marine Robotics: Emerging Trends in Underwater Perception and Ecosystem Monitoring

Survey of AI applications in marine robotics for ecosystem monitoring and conservation using underwater perception.

Ax Alissa A. Valentine, Lauren A. Lepow, Lili Chan, Alexander W. Charney, Isotta Landi 18d ago

Bias Detection in Emergency Psychiatry: Linking Negative Language to Diagnostic Disparities

Analysis of clinician bias in emergency psychiatry using NLP to detect negative language linked to diagnostic disparities.

Ax Himanshu Singh, A. V. Subramanyam, Shivank Rajput, Mohan Kankanhalli 18d ago

Nearest Neighbor Projection Removal Adversarial Training

Adversarial training framework for neural networks that mitigates inter-class feature overlap to improve robustness.

Ax Hyungjin Chung, Hyelin Nam, Jiyeon Kim, Hyojun Go, Byeongjun Park, Junho Kim, Joonseok Lee, Seongsu Ha, Byung-Hoon Kim 18d ago

Video Parallel Scaling: Aggregating Diverse Frame Subsets for VideoLLMs

Inference method for VideoLLMs that processes multiple frame subsets in parallel to improve temporal detail without increasing context window.

Ax Christoph Timmermann, Hyunse Lee, Woojin Lee 18d ago

SeMoBridge: Semantic Modality Bridge for Efficient Few-Shot Adaptation of CLIP

Technique to improve CLIP few-shot classification by addressing modality gap through semantic bridging between image and text embeddings.

Ax Ayan Majumdar, Feihao Chen, Jinghui Li, Xiaozhen Wang 18d ago

Evaluating LLMs for Demographic-Targeted Social Bias Detection: A Comprehensive Benchmark Study

Benchmark for evaluating LLMs on detecting demographic-targeted social biases across diverse content types and demographics.

Ax Hsien-Chin Lin, Benjamin Matthias Ruppik, Carel van Niekerk, Chia-Hao Shen, Michael Heck, Nurul Lubis, Renato Vukovic, Shutong Feng, Milica Ga\v{s}i\'c 18d ago

Prompt reinforcing for long-term planning of large language models

Method to improve LLM performance in multi-turn conversations by reinforcing long-term planning and goal tracking through prompting.

Ax Zhiyu Wang, Bingxin Zhou, Jing Wang, Yang Tan, Weishu Zhao, Pietro Li\`o, Liang Hong 18d ago

Fast and Interpretable Protein Substructure Alignment via Optimal Transport

Protein structure alignment using optimal transport for identifying and comparing local structural motifs.

Ax Gaoxiang Huang, Songning Lai, Yutao Yue 18d ago

Mitigating Spurious Background Bias in Multimedia Recognition with Disentangled Concept Bottlenecks

Lightweight Disentangled Concept Bottleneck Model addressing bias in input-to-concept mapping for interpretable multimedia recognition.

Ax Xi Zhang, Hanwei Zhu, Yan Zhong, Jiamang Wang, Weisi Lin 18d ago

BADiff: Bandwidth Adaptive Diffusion Model

Framework enabling diffusion models to adapt generation quality based on real-time network bandwidth constraints in cloud-to-device scenarios.

Ax Junpei Komiyama, Kyoungseok Jang, Junya Honda 18d ago

Rate-optimal Design for Anytime Best Arm Identification

Minimax optimal algorithm for best arm identification under fixed sampling budget with applications to A/B testing.

Ax Georgios Pantazis, Nicola Mignoni, Raffaele Carli, Mariagrazia Dotoli, Sergio Grammatico 18d ago

Adversarially and Distributionally Robust Virtual Energy Storage Systems via the Scenario Approach

Convex optimization framework for robust scheduling of aggregated EV battery storage under uncertainty.

Ax Bhuvan Sachdeva, Karan Uppal, Abhinav Java, Vineeth N. Balasubramanian 18d ago

Understanding Task Transfer in Vision-Language Models

Study of task transfer in Vision-Language Models examining how finetuning on one perception task affects performance on others.

Ax Austin Spizzirri 18d ago

The Specification Trap: Why Static Value Alignment Alone Cannot Produce Robust Alignment

Philosophical analysis arguing static value alignment approaches cannot ensure robust AI alignment under capability scaling and distribution shift.

Ax Brenda Anague, Bamdad Hosseini, Issa Karambal, Jean Medard Ngnotchouye 18d ago

Physics-Informed Neural Networks for Joint Source and Parameter Estimation in Advection-Diffusion Equations

PINNs applied to source inversion in advection-diffusion equations with sparse measurements for scientific computing.

Ax Jonathan Rystr{\o}m, Zihao Fu, Chris Russell 18d ago

OxEnsemble: Fair Ensembles for Low-Data Classification

OxEnsemble: Fair classification approach for low-data, imbalanced settings with demographic group constraints.

Ax Kohei Nishikawa, Koki Shimizu, Hiroki Hashiguchi 18d ago

Evaluating Singular Value Thresholds for DNN Weight Matrices based on Random Matrix Theory

Method for determining singular value thresholds in DNN weight compression using random matrix theory.

Ax Ayrat Abdullin, Umair Bin Waheed, Leo Eisner, Naveed Iqbal 18d ago

Parameter-Efficient Transfer Learning for Microseismic Phase Picking Using a Neural Operator

Parameter-efficient transfer learning with neural operators for microseismic phase picking across varying signal conditions.

Ax Loris Schoenegger, Benjamin Roth 18d ago

Compact Example-Based Explanations for Language Models

Study on selecting minimal training data subsets for example-based explanations of language model predictions using influence estimation.

Ax Kyriakos Stylianopoulos, Mattia Fabiani, Giulia Torcolacci, Davide Dardari, George C. Alexandropoulos 18d ago

Over-The-Air Extreme Learning Machines with XL Reception via Nonlinear Cascaded Metasurfaces

Wireless ML inference via programmable metasurfaces for over-the-air extreme learning machines in MIMO systems.

Ax Zhicheng Yang, Zhijiang Guo, Yinya Huang, Yongxin Wang, Wenlei Shi, Yiwei Wang, Xiaodan Liang, Jing Tang 18d ago

Accordion-Thinking: Self-Regulated Step Summaries for Efficient and Readable LLM Reasoning

Accordion-Thinking: Framework enabling LLMs to self-regulate reasoning step granularity through dynamic summarization for efficient inference.

Ax Antonin Sulc 18d ago

Differentiable Logical Programming for Quantum Circuit Discovery and Optimization

Neuro-symbolic framework using differentiable logic programming to design and optimize quantum circuits.

Ax Kimon Fountoulakis, David Mart\'inez-Rubio 18d ago

Complexity of Classical Acceleration for $\ell_1$-Regularized PageRank

Complexity analysis of accelerated proximal-gradient methods for ℓ1-regularized PageRank computation.

Ax Shivam Kumar, Yixin Wang, Lizhen Lin 18d ago

Flow Matching is Adaptive to Manifold Structures

Theoretical analysis of flow matching generative models' adaptation to data manifold structures.

Ax Haian Jin, Rundi Wu, Tianyuan Zhang, Ruiqi Gao, Jonathan T. Barron, Noah Snavely, Aleksander Holynski 18d ago

ZipMap: Linear-Time Stateful 3D Reconstruction via Test-Time Training

ZipMap: Stateful 3D reconstruction model achieving linear-time complexity for large image collections via test-time training.

Ax Kevin H. Guo, Chao Yan, Avinash Baidya, Katherine Brown, Xiang Gao, Juming Xiong, Zhijun Yin, Bradley A. Malin 18d ago

Stop Listening to Me! How Multi-turn Conversations Can Degrade LLM Diagnostic Reasoning

Evaluation of 17 LLMs showing diagnostic reasoning degrades across multi-turn conversations compared to single-turn benchmarks.

Ax Xiangyu Zeng, Qi Xu, Yunke Wang, Chang Xu 18d ago

HiCI: Hierarchical Construction-Integration for Long-Context Attention

HiCI: Hierarchical attention module for long-context language modeling, organizing information from local to global levels.

Ax Amuche Ibenegbu, Pierre Lafaye de Micheaux, Rohitash Chandra 18d ago

tBayes-MICE: A Bayesian Approach to Multiple Imputation for Time Series Data

tBayes-MICE: Bayesian approach to multiple imputation for time-series data with missing values via MCMC sampling.

Ax Yulin Zou, Yan Chen, Wenyan Chen, JooYoung Park, Shivaraman Nitin, Luo Tao, Francisco Romero, Dmitrii Ustiugov 18d ago

CodecSight: Leveraging Video Codec Signals for Efficient Streaming VLM Inference

CodecSight optimizes streaming vision-language model inference by leveraging video codec signals for end-to-end efficiency.