Isolater - Feed

Ax Jonathan Skaggs, Jacob W. Crandall 2/19/2026

Modeling Human Behavior in a Strategic Network Game with Complex Group Dynamics

Compares methods for learning behavioral models in a strategic network game to understand human network dynamics.

Ax Yingchen He, Christian D. Weilbach, Martyna E. Wojciechowska, Yuxuan Zhang, Frank Wood 2/19/2026

PLAICraft: Large-Scale Time-Aligned Vision-Speech-Action Dataset for Embodied AI

PLAICraft is a large-scale, multi-modal, time-aligned dataset of Minecraft interactions for training embodied AI agents with vision, speech, and action.

Ax Yuchen Yan, Jin Jiang, Zhenbang Ren, Yijun Li, Xudong Cai, Yang Liu, Xin Xu, Mengdi Zhang, Jian Shao, Yongliang Shen, Jun Xiao, Yueting Zhuang 2/19/2026

VerifyBench: Benchmarking Reference-based Reward Systems for Large Language Models

VerifyBench benchmarks reference-based reward systems used in reinforcement learning training of reasoning models like o1 and DeepSeek-R1.

Ax Sihan Chen, Dan Zhao, Jongwoo Ko, Colby Banbury, Huiping Zhuang, Luming Liang, Pashmina Cameron, Tianyi Chen 2/19/2026

WINA: Weight Informed Neuron Activation for Accelerating Large Language Model Inference

WINA is a training-free sparse activation method for accelerating LLM inference by selectively activating neurons based on weights.

Ax Seungjoon Lee, Suhwan Kim, Minhyeon Oh, Youngsik Yoon, Jungseul Ok 2/19/2026

Experience-based Knowledge Correction for Robust Planning in Minecraft

XENON is an LLM-based agent that algorithmically corrects flawed knowledge through experience-based learning for long-horizon planning in Minecraft.

Ax Yifei Su, Ning Liu, Dong Chen, Zhen Zhao, Kun Wu, Meng Li, Zhiyuan Xu, Zhengping Che, Jian Tang 2/19/2026

FreqPolicy: Efficient Flow-based Visuomotor Policy via Frequency Consistency

FreqPolicy accelerates flow-based visuomotor policies for robotic manipulation using frequency consistency for real-time inference.

Ax Makoto Shing, Masanori Koyama, Takuya Akiba 2/19/2026

DiffusionBlocks: Block-wise Neural Network Training via Diffusion Interpretation

DiffusionBlocks enables block-wise neural network training via diffusion interpretation to reduce memory bottlenecks in transformers.

Ax Yuta Sato, Kazuhiko Kawamoto, Hiroshi Kera 2/19/2026

Chain of Thought in Order: Discovering Learning-Friendly Orders for Arithmetic

Studies optimal ordering of chain-of-thought reasoning steps in transformers for arithmetic and multi-step reasoning tasks.

Ax Veeti Ahvonen, Maurice Funk, Damian Heiman, Antti Kuusisto, Carsten Lutz 2/19/2026

Expressive Power of Graph Transformers via Logic

Theoretical analysis of graph transformers' expressive power using logic, covering both real numbers and floating-point settings.

Ax Javier Fumanal-Idocin, Raquel Fernandez-Peralta, Javier Andreu-Perez 2/19/2026

Model-Agnostic Dynamic Feature Selection with Uncertainty Quantification

Model-agnostic dynamic feature selection method with uncertainty quantification for budget-constrained decision-making scenarios.

Ax Zhonghao Yan, Muxi Diao, Yuxuan Yang, Ruoyan Jing, Jiayuan Xu, Kaizhou Zhang, Lele Yang, Yanxi Liu, Kongming Liang, Zhanyu Ma 2/19/2026

MedReasoner: Reinforcement Learning Drives Reasoning Grounding from Clinical Thought to Pixel-Level Precision

MedReasoner uses reinforcement learning to ground clinical reasoning to pixel-level regions in medical images via multimodal LLMs.

Ax Panagiotis D. Grontas, Antonio Terpin, Efe C. Balta, Raffaello D'Andrea, John Lygeros 2/19/2026

Pinet: Optimizing hard-constrained neural networks with orthogonal projection layers

Pinet introduces an output layer using orthogonal projections to enforce convex constraints in neural networks during training and inference.

Ax Nitish Nagesh, Salar Shakibhamedan, Mahdi Bagheri, Ziyu Wang, Nima TaheriNejad, Axel Jantsch, Amir M. Rahmani 2/19/2026

FairTabGen: High-Fidelity and Fair Synthetic Health Data Generation from Limited Samples

FairTabGen uses LLMs to generate high-quality synthetic tabular healthcare data with fairness constraints from limited samples.

Ax Yassine Taoudi-Benchekroun, Klim Troyan, Pascal Sager, Stefan Gerber, Lukas Tuggener, Benjamin Grewe 2/19/2026

COGITAO: A Visual Reasoning Framework To Study Compositionality & Generalization

COGITAO is a benchmark framework for studying compositionality and generalization in visual reasoning tasks, inspired by ARC-AGI.

Ax Jerin Yasmin, Wenxin Jiang, James C. Davis, Yuan Tian 2/19/2026

Software Dependencies 2.0: An Empirical Study of Reuse and Integration of Pre-Trained Models in Open-Source Projects

Empirical study of pre-trained model reuse and integration in open-source projects, defining Software Dependencies 2.0.

Ax K. J. Kevin Feng (Jim), Tzu-Sheng Kuo (Jim), Quan Ze (Jim), Chen, Inyoung Cheong, Kenneth Holstein, Amy X. Zhang 2/19/2026

PolicyPad: Collaborative Prototyping of LLM Policies

PolicyPad system supporting collaborative policy design for LLMs in high-stakes domains via rapid prototyping and iteration.

Ax Haorui Chen, Chengze Li, Jia Li 2/19/2026

FeatBench: Towards More Realistic Evaluation of Feature-level Code Generation

FeatBench evaluates LLM code generation for realistic repository-level feature implementation with minimal data leakage.

Ax Shane Bergsma, Nolan Dey, Joel Hestness 2/19/2026

Predicting Training Re-evaluation Curves Enables Effective Data Curriculums for LLMs

Training re-evaluation curves diagnostic enabling better data curriculum design by characterizing batch retention across LLM training.

Ax Lucas Bandarkar, Chenyuan Yang, Mohsen Fayyaz, Junlin Hu, Nanyun Peng 2/19/2026

Multilingual Routing in Mixture-of-Experts

Analysis of expert routing patterns in multilingual Mixture-of-Experts LLMs revealing language-specific dynamics across layers.

Ax Weijian Li, Hong-Yu Chen, Nabeel Rehemtulla, Ved G. Shah, Dennis Wu, Dongho Kim, Qinjie Lin, Adam A. Miller, Han Liu 2/19/2026

StarEmbed: Benchmarking Time Series Foundation Models on Astronomical Observations of Variable Stars

StarEmbed benchmark for evaluating time series foundation models on irregular astronomical observations of variable stars.

Ax Daiki Chijiwa, Taku Hasegawa, Kyosuke Nishida, Shin'ya Yamaguchi, Tomoya Ohba, Tamao Sakao, Susumu Takeuchi 2/19/2026

Lossless Vocabulary Reduction for Auto-Regressive Language Models

Technique for reducing LLM vocabulary size losslessly to improve auto-regressive text generation efficiency without performance loss.

Ax Fengzhi Guo, Chih-Chuan Hsu, Sihao Ding, Cheng Zhang 2/19/2026

Uncertainty Matters in Dynamic Gaussian Splatting for Monocular 4D Reconstruction

Dynamic Gaussian Splatting method incorporating uncertainty for monocular 4D scene reconstruction under occlusion.

Ax Marco D'Alessandro, Leo D'Amato, Mikel Elkano, Mikel Uriz, Giovanni Pezzulo 2/19/2026

GENESIS: A Generative Model of Episodic-Semantic Interaction

Computational model explaining interaction between semantic and episodic memory for learning and recall in cognitive science.

Ax Zhaoyi Joey Hou, Bowei Alvin Zhang, Yining Lu, Bhiman Kumar Baghel, Anneliese Brei, Ximing Lu, Meng Jiang, Faeze Brahman, Snigdha Chaturvedi, Haw-Shiuan Chang, Daniel Khashabi, Xiang Lorraine Li 2/19/2026

CreativityPrism: A Holistic Evaluation Framework for Large Language Model Creativity

CreativityPrism framework for holistic, scalable evaluation of LLM creativity across diverse scenarios without heavy human involvement.

Ax Prajit Bhaskaran, Tom Viering 2/19/2026

Transformers can do Bayesian Clustering

Cluster-PFN uses Transformers for unsupervised Bayesian clustering with uncertainty quantification, handling missing values.

Ax Ipsita Ghosh, Ethan Nguyen, Christian K\"ummerle 2/19/2026

Q3R: Quadratic Reweighted Rank Regularizer for Effective Low-Rank Training

Q3R regularizer enabling parameter-efficient low-rank training and pre-training for large deep learning models.

Ax Zishuo Zheng, Vidhisha Balachandran, Chan Young Park, Faeze Brahman, Sachin Kumar 2/19/2026

Reasoning Up the Instruction Ladder for Controllable Language Models

Method for enforcing instruction hierarchy in LLMs to handle competing directives from multiple sources for reliable decision-making.

Ax Dong-Shan Jian, Xiang Li, Chen-Xu Yan, Hui-Wen Zheng, Zhi-Zhang Bian, You-Le Fang, Ren-Xi He, Jing-Tian Zhang, Ce Meng, Ling-Shi Meng, Bing-Rui Gong, Sheng-Qi Zhang, Yan-Qing Ma 2/19/2026

Mastering Olympiad-Level Physics with Artificial Intelligence

LOCA framework enabling AI agents to solve Olympiad-level physics problems via logical chain decomposition and verification.

Ax Jae Joong Lee 2/19/2026

Language-Guided Invariance Probing of Vision-Language Models

Language-Guided Invariance Probing benchmark evaluating vision-language model robustness to paraphrases and semantic changes on 40k images.

Ax Parth Ashokbhai Shiroya, Amod Ashtekar, Swarnagowri Shashidhar, Mohammed E. Eltayeb 2/19/2026

Refined Bayesian Optimization for Efficient Beam Alignment in Intelligent Indoor Wireless Environments

Bayesian optimization approach for beam alignment in intelligent indoor wireless environments under mobility constraints.

Ax Feilong Liu 2/19/2026

Mixture-of-Experts as Soft Clustering: A Dual Jacobian-PCA Spectral Geometry Perspective

Geometric analysis of Mixture-of-Experts architectures using Jacobian-PCA spectral methods to understand routing and function geometry.

Ax Tianyi Chen, Sihan Chen, Xiaoyi Qu, Dan Zhao, Ruomei Yan, Jongwoo Ko, Luming Liang, Pashmina Cameron 2/19/2026

StableQAT: Stable Quantization-Aware Training at Ultra-Low Bitwidths

StableQAT framework for stable quantization-aware training of large models at ultra-low bitwidths for efficient deployment.

Ax Abhijit Gupta 2/19/2026

Cardinality-Preserving Attention Channels for Graph Transformers in Molecular Property Prediction

Graph transformer architecture with cardinality-preserving attention for molecular property prediction in drug discovery.

Ax Ruixin Yang, Ethan Mendes, Arthur Wang, James Hays, Sauvik Das, Wei Xu, Alan Ritter 2/19/2026

Do Vision-Language Models Respect Contextual Integrity in Location Disclosure?

Privacy risks of vision-language models inferring sensitive locations from photos with street-level precision.

Ax Amir H. Ashouri, Shayan Shirahmad Gale Bagi, Kavin Satheeskumar, Tejas Srikanth, Jonathan Zhao, Ibrahim Saidoun, Ziwen Wang, Bryan Chan, Tomasz S. Czajkowski 2/19/2026

Protean Compiler: An Agile Framework to Drive Fine-grain Phase Ordering

Protean Compiler framework using machine learning to optimize compiler phase ordering, addressing long-standing optimization problem with agile fine-grain approach.

Ax Ross Greer, Maitrayee Keskar, Angel Martinez-Sanchez, Parthib Roy, Shashank Shriram, Mohan Trivedi 2/19/2026

Vision and Language: Novel Representations and Artificial intelligence for Driving Scene Safety Assessment and Autonomous Vehicle Planning

Vision-language models for autonomous vehicle safety assessment and planning, integrating VLM representations into perception, prediction, and planning pipelines.

Ax Zachary Pedram Dadfar 2/19/2026