Isolater - Feed

Ax Dip Roy, Rajiv Misra, Sanjay Kumar Singh, Anisha Roy 27d ago

Posterior-Calibrated Causal Circuits in Variational Autoencoders: Why Image-Domain Interpretability Fails on Tabular Data

Investigates interpretability of VAEs across modalities, showing image-domain causal circuits fail to generalize to tabular data.

Ax Dongxia Wu, Yuhui Zhang, Serena Yeung-Levy, Emma Lundberg, Emily B. Fox 27d ago

Uncertainty Quantification for Distribution-to-Distribution Flow Matching in Scientific Imaging

Uncertainty quantification methods for distribution-to-distribution flow matching models in scientific imaging applications.

Ax Dongxia Wu, Shiye Su, Yuhui Zhang, Elaine Sui, Emma Lundberg, Emily B. Fox, Serena Yeung-Levy 27d ago

CellFluxRL: Biologically-Constrained Virtual Cell Modeling via Reinforcement Learning

CellFluxRL: reinforcement learning post-training approach for virtual cell models with biologically-constrained generative models.

Ax Panayiotis Panayiotou, \"Ozg\"ur \c{S}im\c{s}ek 27d ago

Causal Discovery in Action: Learning Chain-Reaction Mechanisms from Interventions

Causal discovery method for chain-reaction systems using interventional data on cascade-structured dynamical systems.

Ax Rustem Islamov, Grigory Malinovsky, Alexander Gaponov, Aurelien Lucchi, Peter Richt\'arik, Eduard Gorbunov 27d ago

Byzantine-Robust and Differentially Private Federated Optimization under Weaker Assumptions

Federated learning approach combining Byzantine robustness and differential privacy for distributed training.

Ax Dogan Urgun, Gokhan Gungor 27d ago

Large Language Model Guided Incentive Aware Reward Design for Cooperative Multi-Agent Reinforcement Learning

Framework using LLMs to automatically design auxiliary reward programs for cooperative multi-agent reinforcement learning systems.

Ax Fabio Ferreira, Lucca Wobbe, Arjun Krishnakumar, Frank Hutter, Arber Zela 27d ago

Can LLMs Beat Classical Hyperparameter Optimization Algorithms? A Study on autoresearch

Compares LLM agents against classical hyperparameter optimization algorithms using autoresearch testbed for tuning small language models.

Ax Haishan Ye 27d ago

Optimal High-Probability Regret for Online Convex Optimization with Two-Point Bandit Feedback

Theoretical analysis of online convex optimization with two-point bandit feedback achieving tight regret bounds.

Ax Christopher Cruz 27d ago

ATLAS-RTC: Closing the Loop on LLM Agent Output with Token-Level Runtime Control

ATLAS-RTC: runtime control system for LLM agents enforcing structured output via token-level monitoring, biasing, masking and rollback.

Ax Yufei Xu, Fanxu Meng, Fan Jiang, Yuxuan Wang, Ruijie Zhou, Zhaohui Wang, Jiexi Wu, Zhixin Pan, Xiaojuan Tang, Wenjie Pei, Tongxuan Liu, Di Yin, Xing Sun, Muhan Zhang 27d ago

HISA: Efficient Hierarchical Indexing for Fine-Grained Sparse Attention

HISA: hierarchical indexing system for efficient sparse attention in LLMs, reducing indexer bottleneck in token-level sparse mechanisms.

Ax Ya Zhou, Tianxiang Hao, Ziyi Cai, Haojie Zhu, Kejun He, Jia Liu, Xiaohan Fan, Jing Yuan 27d ago

Detecting low left ventricular ejection fraction from ECG using an interpretable and scalable predictor-driven framework

Develops interpretable ML framework for detecting low left ventricular ejection fraction from ECG data.

Ax Ikechukwu Uchendu, Swati Goel, Karly Hou, Ebrahim Songhori, Kuang-Huei Lee, Joe Wenjie Jiang, Vijay Janapa Reddi, Vincent Zhuang 27d ago

See it to Place it: Evolving Macro Placements with Vision-Language Models

Applies Vision-Language Models to chip floorplanning macro placement optimization tasks.

Ax Liliang Ren, Yang Liu, Yelong Shen, Weizhu Chen 27d ago

Rethinking Language Model Scaling under Transferable Hypersphere Optimization

Introduces HyperP, hypersphere parameterization for LLM scaling with improved stability and hyperparameter transfer.

Ax Ivan Pasichnyk 27d ago

Beta-Scheduling: Momentum from Critical Damping as a Diagnostic and Correction Tool for Neural Network Training

Proposes time-varying momentum schedule derived from critically damped harmonic oscillator for neural network training optimization.

Ax Chihan Huang, Huaijin Wang, Shuai Wang 27d ago

ReproMIA: A Comprehensive Analysis of Model Reprogramming for Proactive Membership Inference Attacks

Research on membership inference attacks against deep learning models using model reprogramming to reduce computational costs of privacy auditing.

Ax Zichao Wei 27d ago

On the Mirage of Long-Range Dependency, with an Application to Integer Multiplication

arXiv paper analyzing integer multiplication as hard problem for neural networks. Theoretical analysis challenging assumptions about long-range dependencies in neural computation.

Ax Lucas Riera Abbade, Anna Helena Reali Costa 27d ago

Realistic Market Impact Modeling for Reinforcement Learning Trading Environments

arXiv paper on realistic market impact modeling for RL trading agents. Gymnasium-compatible environments with nonlinear transaction costs for algorithmic trading research.

Ax Gabriel U. Talasso, Meghdad Kurmanji, Allan M. de Souza, Nicholas D. Lane, Leandro A. Villas 27d ago

Task-Centric Personalized Federated Fine-Tuning of Language Models

arXiv paper on personalized federated fine-tuning of language models. Federated learning approach for task-centric LLM adaptation on private distributed data.

Ax Amirhossein Dezhboro, Fateme Maleki, Arman Adibi, Erfan Amini, Jose E. Ramirez-Marquez 27d ago

Convergence of Byzantine-Resilient Gradient Tracking via Probabilistic Edge Dropout

arXiv paper on Byzantine-resilient distributed optimization with probabilistic edge dropout. Convergence analysis for distributed learning with adversarial agents.

Ax Bj\"orn Roman Kohlberger (EctoSpace, Dublin, Ireland) 27d ago

Spectral Compact Training: Pre-Training Large Language Models via Permanent Truncated SVD and Stiefel QR Retraction

arXiv paper on memory-efficient LLM pre-training via truncated SVD factorization. Method reduces memory footprint for training large language models on consumer hardware.

Ax Nikita Gabdullin, Ilya Androsov 27d ago

Using predefined vector systems to speed up neural network multimillion class classification

arXiv paper on O(1) complexity label prediction for neural networks with millions of classes. Optimization technique for efficient classification in high-dimensional spaces.

Ax Zheng Zhang, Cuong C. Nguyen, David Rosewarne, Kevin Wells, Gustavo Carneiro 27d ago

Fatigue-Aware Learning to Defer via Constrained Optimisation

arXiv paper on human-AI cooperation via fatigue-aware deferral systems. ML method modeling human fatigue to optimize when AI should defer to humans.

Ax Ken M. Nakanishi 27d ago

Screening Is Enough

arXiv paper introducing Multiscreen attention mechanism for language models. Alternative to softmax attention enabling absolute relevance scoring in transformers.

Ax Rafael Pardinas, Ehsan Kamalloo, David Vazquez, Alexandre Drouin 27d ago

Apriel-1.5-OpenReasoner: RL Post-Training for General-Purpose and Efficient Reasoning

arXiv paper on reinforcement learning post-training for reasoning models. Open-weight model training using verifiable rewards across diverse reasoning domains.

Ax Zun Li, Marc Lanctot, Kevin R. McKee, Luke Marris, Ian Gemp, Daniel Hennes, Paul Muller, Kate Larson, Yoram Bachrach, Michael P. Wellman 27d ago

Combining Tree-Search, Generative Models, and Nash Bargaining Concepts in Game-Theoretic Reinforcement Learning

arXiv paper on opponent modeling in game-theoretic reinforcement learning using tree-search and generative models. Research on scalable multi-agent RL methods.

Ax Rishabh Dixit, Mert Gurbuzbalaban, Waheed U. Bajwa 27d ago

Accelerated Gradient Methods for Nonconvex Optimization: Escape Trajectories From Strict Saddle Points and Convergence to Local Minima

Theoretical analysis of accelerated gradient methods for nonconvex optimization and convergence to local minima.

Ax Dinesh Sharma, Ankit Shah, Chaitra Gopalappa 27d ago

A Multi-Agent Reinforcement Learning Framework for Public Health Decision Analysis

Multi-agent reinforcement learning framework for HIV prevention policy optimization across U.S. regions.

Ax Ant\'onio Filgueiras, Eduardo R. B. Marques, Lu\'is M. B. Lopes, Miguel Marques, Hugo Silva 27d ago

Floralens: a Deep Learning Model for the Portuguese Native Flora

Deep CNN model trained on Portuguese native flora dataset for species identification in citizen science.

Ax Changdae Oh, Gyeongdeok Seo, Geunyoung Jung, Zhi-Qi Cheng, Hosik Choi, Jiyoung Jung, Kyungwoo Song 27d ago

Robust Adaptation of Foundation Models with Black-Box Visual Prompting

Black-box visual prompting method for parameter-efficient transfer learning of foundation models without full parameter access.

Ax Lechen Zhang, Tolga Ergen, Lajanugen Logeswaran, Moontae Lee, David Jurgens 27d ago

SPRIG: Improving Large Language Model Performance by System Prompt Optimization

SPRIG: Genetic algorithm for optimizing system prompts in LLMs to improve task performance.

Ax Muralikrishnna G. Sethuraman, Razieh Nabi, Faramarz Fekri 27d ago

MissNODAG: Differentiable Cyclic Causal Graph Learning from Incomplete Data

MissNODAG: Framework for learning cyclic causal graphs from incomplete data using differentiable methods.

Ax Haitham Kanj, Seonho Kim, Kiryung Lee 27d ago

Sparse Max-Affine Regression

Sparse Gradient Descent algorithm for variable selection in convex piecewise linear regression models.

Ax Hao Chen, Kai Yi, Yu Guang Wang 27d ago

Score-matching-based Structure Learning for Temporal Data on Networks

Score-matching causal discovery algorithm extended for temporal data on networks.

Ax Ugur Dar, Mustafa Cavus 27d ago

From XAI to MLOps: Explainable Concept Drift Detection with Profile Drift Detection

XAI-based method combining explainability with concept drift detection for monitoring model performance degradation.

Ax Aytijhya Saha, Aaditya Ramdas 27d ago

Post-detection inference for sequential changepoint localization

Framework for constructing confidence sets for changepoints in sequential analysis using data-dependent stopping times.

Ax Qi Wang, Zhipeng Zhang, Baao Xie, Xin Jin, Yunbo Wang, Shiyu Wang, Liaomo Zheng, Xiaokang Yang, Wenjun Zeng 27d ago

Disentangled World Models: Learning to Transfer Semantic Knowledge from Distracting Videos for Reinforcement Learning

World models using disentangled representations to transfer semantic knowledge from distracting videos for RL agents.

Ax Henri A\"idasso, Francis Bordeleau, Ali Tizghadam 27d ago

Towards Build Optimization Using Digital Twins

Digital twins framework for optimizing CI/CD build processes to reduce duration, failures, and flakiness.

Ax Kejie Zhao, Wenjia Hua, Aiersi Tuerhong, Luziwei Leng, Yuxin Ma, Qinghai Guo 27d ago

Threshold Modulation for Online Test-Time Adaptation of Spiking Neural Networks

Online test-time adaptation for spiking neural networks on neuromorphic chips to handle distribution shifts.

Ax Yifu Yuan, Haiqin Cui, Yibin Chen, Zibin Dong, Fei Ni, Longxin Kou, Jinyi Liu, Pengyi Li, Yan Zheng, Jianye Hao 27d ago

From Seeing to Doing: Bridging Reasoning and Decision for Robotic Manipulation

FSD framework combining vision-language models with robotic action models for zero-shot manipulation in novel scenarios.

Ax Gordana Ispirova, Michael Sebek, Giulia Menichetti 27d ago

Informatics for Food Processing

Review of ML/AI applications in food processing, classification systems, and food informatics.

Ax Yash Patel, Unique Subedi, Ambuj Tewari 27d ago

Operator Learning for Schr\"{o}dinger Equation: Unitarity, Error Bounds, and Time Generalization

Neural network surrogate for learning evolution operators in time-dependent Schrödinger equations with unitarity constraints.

Ax Edward L. Wang, Mohammad Sharifi Kiasari, Tianyu Wang, Hayden Helm, Avanti Athreya, Carey Priebe, Vince Lyzinski 27d ago

Gaussian mixture models as a proxy for interacting language models

Gaussian mixture models as computationally efficient proxy for LLM+RAG systems combining multiple models.

Ax Tianze Yang, Tyson Jordan, Ruitong Sun, Ninghao Liu, Jin Sun 27d ago

Common Inpainted Objects In-N-Out of Context

COinCO dataset with 97,722 images created via diffusion-based inpainting for training context-aware vision models.

Ax Peter Sentz, Stanley Nicholson, Yujin Cho, Sohail Reddy, Brendan Keith, Stefanie G\"unther 27d ago

Learning thermodynamic master equations for open quantum systems

Machine learning methods for learning Hamiltonian components of open quantum systems.

Ax Yingli Wang, Changwei Tu, Xiaoyu Wang, Lingjiong Zhu 27d ago

Accelerating Constrained Sampling: A Large Deviations Approach

Large deviations approach to accelerate constrained sampling algorithms for probability distributions.

Ax Nikolay Blagoev, O\u{g}uzhan Ersoy, Lydia Yiyu Chen 27d ago

All is Not Lost: LLM Recovery without Checkpoints

Technique to recover LLM training on decentralized/spot nodes from partial model loss without full checkpoints.

Ax Yukun Huang, Sanxing Chen, Jian Pei, Manzil Zaheer, Bhuwan Dhingra 27d ago

Cite Pretrain: Retrieval-Free Knowledge Attribution for Large Language Models

Method for LLMs to reliably cite source documents seen during training without external retrievers at inference time.

Ax Lujun Li, Yiqun Wang, Radu State 27d ago

Vision Transformer-Based Time-Series Image Reconstruction for Cloud-Filling Applications

Vision Transformer framework reconstructs cloud-obscured satellite imagery using time-series data for crop mapping.

Ax Takuro Kawada, Shunsuke Kitada, Sota Nemoto, Hitoshi Iyatomi 27d ago

SciGA: A Comprehensive Dataset for Designing Graphical Abstracts in Academic Papers

SciGA-145k dataset for training models to automatically design graphical abstracts for academic papers using visual data.

Ax Dixon Domfeh, Saeid Safarveisi 27d ago

CATNet: A geometric deep learning approach for CAT bond spread prediction in the primary market

CATNet applies graph convolutional networks to predict catastrophe bond spreads using relational data structures.