Isolater - Feed

Ax Victor Zheleznov, Stefan Bilbao, Alec Wright, Simon King 2/13/2026

Stable Differentiable Modal Synthesis for Learning Nonlinear Dynamics

Ax Zihan Dong, Xiaotian Hou, Ruijia Wu, Linjun Zhang 2/13/2026

Labels or Preferences? Budget-Constrained Learning with Human Judgments over AI-Generated Outputs

Ax Olof Hallqvist Elias, Michael Selby, Phillip Stanley-Marbell 2/13/2026

Distributional Computational Graphs: Error Bounds

Ax Kartik Chari, Raid Dokhan, Anas Homsi, Niklas Kueper, Elsa Andrea Kirchner 2/13/2026

A Feature Extraction Pipeline for Enhancing Lightweight Neural Networks in sEMG-based Joint Torque Estimation

Ax Jie Tang, Chuanlong Xie, Xianli Zeng, Lixing Zhu 2/13/2026

Empirical Likelihood-Based Fairness Auditing: Distribution-Free Certification and Flagging

Ax Dani Roytburg, Matthew Bozoukov, Matthew Nguyen, Jou Barzdukas, Mackenzie Puig-Hall, Narmeen Oozeer 2/13/2026

Are LLM Evaluators Really Narcissists? Sanity Checking Self-Preference Evaluations

Ax Ran Xu, Tianci Liu, Zihan Dong, Tony Yu, Ilgee Hong, Carl Yang, Linjun Zhang, Tao Zhao, Haoyu Wang 2/13/2026

Alternating Reinforcement Learning for Rubric-Based Reward Modeling in Non-Verifiable LLM Post-Training

Ax Ruiqian Nai, Boyuan Zheng, Junming Zhao, Haodong Zhu, Sicong Dai, Zunhao Chen, Yihang Hu, Yingdong Hu, Tong Zhang, Chuan Wen, Yang Gao 2/13/2026

Humanoid Manipulation Interface: Humanoid Whole-Body Manipulation from Robot-Free Demonstrations

Ax Igor Santos-Grueiro 2/13/2026

When Evaluation Becomes a Side Channel: Regime Leakage and Structural Mitigations for Alignment Assessment

Ax Xinhai Sun 2/13/2026

Reinforcement Inference: Leveraging Uncertainty for Self-Correcting Language Model Reasoning

Ax David S. Duque-Casta\~no, Lauren Flor-Torres, Jorge I. Zuluaga 2/13/2026

Efficient reduction of stellar contamination and noise in planetary transmission spectra using neural networks

Ax Jie Jiang, Xinxun Zhang, Enming Zhang, Yuling Xiong, Jun Zhang, Jingwen Wang, Huan Yu, Yuxiang Wang, Hao Wang, Xiao Yan, Jiawei Jiang 2/13/2026

End-to-End Semantic ID Generation for Generative Advertisement Recommendation

Ax Jie Jiang, Yangru Huang, Zeyu Wang, Changping Wang, Yuling Xiong, Jun Zhang, Huan Yu 2/13/2026

Spend Search Where It Pays: Value-Guided Structured Sampling and Optimization for Generative Recommendation

HF Modi Jin, Yiming Zhang, Boyuan Sun, Dingwen Zhang, MingMing Cheng, Qibin Hou 2/13/2026

GeoAgent: Learning to Geolocate Everywhere with Reinforced Geographic Characteristics

GeoAgent: RL-based model for geolocation reasoning using fine-grained geographic characteristics and GeoSeek dataset with annotated chain-of-thought.

HF Sein Kim, Sangwu Park, Hongseok Kang, Wonjoong Kim, Jimin Seo, Yeonjun In, Kanghoon Yoon, Chanyoung Park 2/13/2026

Self-EvolveRec: Self-Evolving Recommender Systems with LLM-based Directional Feedback

LLM-driven framework for automated recommender system design using directional feedback instead of scalar metrics to guide architecture evolution.

DT Syed Mohammed Faham 2/13/2026

LLM Steering: From Prompting Tricks to Activation Control

Technical exploration of LLM control methods beyond prompting, covering activation-level steering techniques. Advances understanding of model behavior.

DT Tim Derzhavets 2/13/2026

Exercise Selection Algorithms with Equipment Constraints

Exercise recommendation system with equipment constraints and personalization; specialized ML application.

DT Chishan 2/13/2026

How Computer Vision Turns Videos into AI-Ready Prompts

Data engineering patterns for aggregating and normalizing fitness data from multiple sources; practical pipeline work.

DT Hollow House Institute 2/13/2026

A Governance Lens on Drift, Evidence, and Reliance.

Examines model drift through governance perspective, distinguishing behavioral drift from statistical drift in ML systems.

DT Dennis Traub 2/13/2026

Why Your Chatbot is the BlackBerry of the 2020s

DAG pipeline management tool. Minimal information; not AI-specific or clearly relevant.

HF Rosie Zhao, Anshul Shah, Xiaoyu Zhu, Xinke Deng, Zhongyu Jiang, Yang Yang, Joerg Liebelt, Arnab Mondal 2/13/2026

On Robustness and Chain-of-Thought Consistency of RL-Finetuned VLMs

Analysis of RL fine-tuned VLMs showing vulnerability to textual perturbations and weak visual grounding despite improved visual reasoning benchmarks.

DT AutoJanitor 2/13/2026

I Run LLMs on a 768GB IBM POWER8 Server (And It's Faster Than You Think)

Performance optimization of llama.cpp on specialized hardware achieving 8.8x speedup. Relevant for efficient LLM deployment strategies.

HF Xirui Li, Ming Li, Tianyi Zhou 2/12/2026

What does RL improve for Visual Reasoning? A Frankenstein-Style Analysis

Frankenstein-style analysis framework isolating specific visual reasoning improvements from RL versus supervised fine-tuning in vision-language models.

HF Huai-Hsun Cheng, Siang-Ling Zhang, Yu-Lun Liu 2/12/2026

Stroke of Surprise: Progressive Semantic Illusions in Vector Sketching

Novel generative framework for creating vector sketches that transform semantically through progressive stroke addition, addressing dual-constraint optimization challenges.

HF Tunyu Zhang, Xinxi Zhang, Ligong Han, Haizhou Shi, Xiaoxiao He, Zhuowei Li, Hao Wang, Kai Xu, Akash Srivastava, Hao Wang, Vladimir Pavlovic, Dimitris N. Metaxas 2/12/2026

T3D: Few-Step Diffusion Language Models via Trajectory Self-Distillation with Direct Discriminative Optimization

T3D proposes trajectory self-distillation framework to enable fast parallel token decoding in diffusion LLMs with fewer refinement steps while maintaining generation quality.

HF Dianyi Wang, Ruihang Li, Feng Han, Chaofan Ma, Wei Song, Siyuan Wang, Yibin Wang, Yi Xin, Hongjian Liu, Zhixiong Zhang, Shengyuan Ding, Tianhang Wang, Zhenglin Cheng, Tao Lin, Cheng Jin, Kaicheng Yu, Jingjing Chen, Wenjie Wang, Zhongyu Wei, Jiaqi Wang 2/12/2026

DeepGen 1.0: A Lightweight Unified Multimodal Model for Advancing Image Generation and Editing

DeepGen 1.0 is a lightweight 5B unified model for image generation and editing using Stacked Channel Bridging, achieving competitive performance to larger models with reduced deployment costs.

HF Mathieu Sibue, Andres Muñoz Garza, Samuel Mensah, Pranav Shetty, Zhiqiang Ma, Xiaomo Liu, Manuela Veloso 2/12/2026

ExStrucTiny: A Benchmark for Schema-Variable Structured Information Extraction from Document Images

ExStrucTiny benchmark evaluates VLM performance on schema-variable structured information extraction from diverse enterprise documents with flexible schemas.

HF Xiaohan He, Shiyang Feng, Songtao Huang, Lei Bai, Bin Wang, Bo Zhang 2/12/2026

Sci-CoE: Co-evolving Scientific Reasoning LLMs via Geometric Consensus with Sparse Supervision

Sci-CoE framework enables LLMs to self-improve on scientific reasoning through co-evolution as both solver and verifier with geometric consensus mechanisms.

HF Sicheng Feng, Zigeng Chen, Xinyin Ma, Gongfan Fang, Xinchao Wang 2/12/2026

dVoting: Fast Voting for dLLMs

dVoting fast voting technique for diffusion LLMs enabling parallel test-time scaling for improved reasoning performance.

HF Wenkai Yang, Weijie Liu, Ruobing Xie, Kai Yang, Saiyong Yang, Yankai Lin 2/12/2026

Learning beyond Teacher: Generalized On-Policy Distillation with Reward Extrapolation

Theoretical and empirical analysis of on-policy distillation as dense KL-constrained RL, proposing generalized reward extrapolation.

HF Pinyi Zhang, Ting-En Lin, Yuchuan Wu, Jingyang Chen, Zongqi Wang, Hua Yang, Ze Xu, Fei Huang, Kai Zhang, Yongbin Li 2/12/2026

P-GenRM: Personalized Generative Reward Model with Test-time User-based Scaling

P-GenRM enables personalized LLM alignment through scenario-specific reward models with test-time user-based scaling, addressing generalization to new users with limited feedback.

HF Xiaoyuan Liu, Tian Liang, Dongyang Ma, Deyu Zhou, Haitao Mi, Pinjia He, Yan Wang 2/12/2026

The Pensieve Paradigm: Stateful Language Models Mastering Their Own Context

StateLM foundation model framework giving LLMs agency to manage their own context and memory via database operations.

HF GigaBrain Team, Boyuan Wang, Chaojun Ni, Guan Huang, Guosheng Zhao, Hao Li, Jie Li, Jindi Lv, Jingyu Liu, Lv Feng, Mingming Yu, Peng Li, Qiuping Deng, Tianze Liu, Xinyu Zhou, Xinze Chen, Xiaofeng Wang, Yang Wang, Yifan Li, Yifei Nie, Yilong Li, Yukun Zhou, Yun Ye, Zhichao Liu, Zheng Zhu 2/12/2026

GigaBrain-0.5M*: a VLA That Learns From World Model-Based Reinforcement Learning

GigaBrain-0.5M VLA model trained via world model-based reinforcement learning for improved multi-step action prediction.

HF Bo Zhang, Jiaxuan Guo, Lijun Li, Dongrui Liu, Sujin Chen, Guanxu Chen, Zhijie Zheng, Qihao Lin, Lewen Yan, Chen Qian, Yijin Zhou, Yuyao Wu, Shaoxiong Guo, Tianyi Du, Jingyi Yang, Xuhao Hu, Ziqi Miao, Xiaoya Lu, Jing Shao, Xia Hu 2/12/2026

DeepSight: An All-in-One LM Safety Toolkit

DeepSight is a unified toolkit for LLM/MLLM safety covering workflow, evaluation, diagnosis, and alignment with integrated explainability and risk scenario grounding capabilities.

HF Xinyu Yang, Chenlong Deng, Tongyu Wen, Binyu Xie, Zhicheng Dou 2/12/2026

LawThinker: A Deep Research Legal Agent in Dynamic Environments

LawThinker autonomous legal research agent using Explore-Verify-Memorize strategy with intermediate step verification in dynamic environments.

HF Xin Xu, Clive Bai, Kai Yang, Tianhao Chen, Yangkun Chen, Weijie Liu, Hao Chen, Yang Wang, Saiyong Yang, Can Yang 2/12/2026

Composition-RL: Compose Your Verifiable Prompts for Reinforcement Learning of Large Language Models

Composition-RL optimizes RLVR training by composing verifiable prompts to balance hard and easy examples, mitigating ineffective data and enabling better prompt dataset expansion.

DT Daniel Nwaneri 2/12/2026

Making AI Coding Agents Production-Aware: Using Hud.io's MCP Server with Cloudflare Workers

Opinion piece on chatbot limitations and technology evolution. Commentary without technical substance or concrete insights.

HF Romain Froger, Pierre Andrews, Matteo Bettini, Amar Budhiraja, Ricardo Silveira Cabral, Virginie Do, Emilien Garreau, Jean-Baptiste Gaya, Hugo Laurençon, Maxime Lecanu, Kunal Malkan, Dheeraj Mekala, Pierre Ménard, Gerard Moreno-Torres Bertran, Ulyana Piterbarg, Mikhail Plekhanov, Mathieu Rita, Andrey Rusakov, Vladislav Vorotilov, Mengjue Wang, Ian Yu, Amine Benhalloum, Grégoire Mialon, Thomas Scialom 2/12/2026

Gaia2: Benchmarking LLM Agents on Dynamic and Asynchronous Environments

Gaia2 benchmark for evaluating LLM agents in realistic, asynchronous, dynamic environments with temporal constraints and collaboration.

HF Łukasz Staniszewski, Katarzyna Zaleska, Mateusz Modrzejewski, Kamil Deja 2/12/2026

TADA! Tuning Audio Diffusion Models through Activation Steering

TADA: activation steering technique for audio diffusion models to control semantic musical concepts through shared attention layers.

HF Nenad Tomašev, Matija Franklin, Simon Osindero 2/12/2026

Intelligent AI Delegation

Adaptive framework for intelligent AI agent delegation across decomposed sub-tasks with dynamic adaptation to environmental changes and failure handling.

HF Lai Wei, Liangbo He, Jun Lan, Lingzhong Dong, Yutong Cai, Siyuan Li, Huijia Zhu, Weiqiang Wang, Linghe Kong, Yue Wang, Zhuosheng Zhang, Weiran Huang 2/12/2026

Zooming without Zooming: Region-to-Image Distillation for Fine-Grained Multimodal Perception

Region-to-Image Distillation: reduces latency in multimodal LLMs' fine-grained perception by distilling zooming behavior into inference-time efficiency.

HF Hongbo Zhang, Yue Yang, Jianhao Yan, Guangsheng Bao, Yue Zhang, Yue Zhang 2/12/2026

Detecting RLVR Training Data via Structural Convergence of Reasoning

Detection method for identifying RLVR training data contamination via structural convergence signatures in reasoning trajectories, addressing benchmark contamination concerns.

HF Zhenghuang Wu, Kang Chen, Zeyu Zhang, Hao Tang 2/12/2026

Light4D: Training-Free Extreme Viewpoint 4D Video Relighting

Light4D: training-free framework for 4D video relighting under extreme viewpoints using diffusion models with temporal consistency.

HF MiniCPM Team, Wenhao An, Yingfa Chen, Yewei Fang, Jiayi Li, Xin Li, Yaohui Li, Yishan Li, Yuxuan Li, Biyuan Lin, Chuan Liu, Hezi Liu, Siyuan Liu, Hongya Lyu, Yinxu Pan, Shixin Ren, Xingyu Shen, Zhou Su, Haojun Sun, Yangang Sun, Zhen Leng Thai, Xin Tian, Rui Wang, Xiaorong Wang, Yudong Wang, Bo Wu, Xiaoyue Xu, Dong Xu, Shuaikang Xue, Jiawei Yang, Bowen Zhang, Jinqian Zhang, Letian Zhang, Shengnan Zhang, Xinyu Zhang, Xinyuan Zhang, Zhu Zhang, Hengyu Zhao, Jiacheng Zhao, Jie Zhou, Zihan Zhou, Shuo Wang, Chaojun Xiao, Xu Han, Zhiyuan Liu, Maosong Sun 2/12/2026