Isolater - Feed

HF Zedong Chu, Shichao Xie, Xiaolong Wu, Yanfen Shen, Minghua Luo, Zhengbo Wang, Fei Liu, Xiaoxu Leng, Junjun Hu, Mingyang Yin, Jia Lu, Yingnan Guo, Kai Yang, Jiawei Han, Xu Chen, Yanqing Zhu, Yuxiang Zhao, Xin Liu, Yirong Yang, Ye He, Jiahang Wang, Yang Cai, Tianlin Zhang, Li Gao, Liu Liu, Mingchao Sun, Fan Jiang, Chiyu Wang, Zhicheng Liu, Hongyu Pan, Honglin Han, Zhining Gu, Kuan Yang, Jianfang Zhang, Di Jing, Zihao Guan, Wei Guo, Guoqing Liu, Di Yang, Xiangpo Yang, Menglin Yang, Hongguang Xing, Weiguo Li, Mu Xu 2/12/2026

ABot-N0: Technical Report on the VLA Foundation Model for Versatile Embodied Navigation

ABot-N0 unified Vision-Language-Action foundation model for embodied robot navigation across five core tasks using hierarchical brain-action architecture.

HF Jinrui Zhang, Chaodong Xiao, Aoqi Wu, Xindong Zhang, Lei Zhang 2/12/2026

Pretraining A Large Language Model using Distributed GPUs: A Memory-Efficient Decentralized Paradigm

SPES enables memory-efficient decentralized LLM pretraining using mixture-of-experts and distributed GPUs without full model replication on each node.

HF Hanbing Liu, Chunhao Tian, Nan An, Ziyuan Wang, Pinyan Lu, Changyuan Yu, Qi Qi 2/12/2026

Budget-Constrained Agentic Large Language Models: Intention-Based Planning for Costly Tool Use

INTENT framework for budget-constrained LLM agents solving multi-step tasks under monetary constraints via intention-based planning.

HF David Wan, Han Wang, Ziyang Wang, Elias Stengel-Eskin, Hyunji Lee, Mohit Bansal 2/12/2026

Multimodal Fact-Level Attribution for Verifiable Reasoning

MuRGAt benchmark evaluates multimodal LLM attribution and factual grounding across complex reasoning tasks involving multiple modalities and information sources.

HF Yejin Kim, Wilbert Pumacay, Omar Rayyan, Max Argus, Winson Han, Eli VanderBilt, Jordi Salvador, Abhay Deshpande, Rose Hendrix, Snehal Jauhri, Shuo Liu, Nur Muhammad Mahi Shafiullah, Maya Guru, Ainaz Eftekhar, Karen Farley, Donovan Clay, Jiafei Duan, Arjun Guru, Piper Wolters, Alvaro Herrasti, Ying-Chun Lee, Georgia Chalvatzaki, Yuchen Cui, Ali Farhadi, Dieter Fox, Ranjay Krishna 2/11/2026

MolmoSpaces: A Large-Scale Open Ecosystem for Robot Navigation and Manipulation

MolmoSpaces open ecosystem for large-scale benchmarking of robot navigation and manipulation policies with diverse scenarios.

HF Alexander H. Liu, Andy Ehrenberg, Andy Lo, Chen-Yo Sun, Guillaume Lample, Jean-Malo Delignon, Khyathi Raghavi Chandu, Patrick von Platen, Pavankumar Reddy Muddireddy, Rohin Arora, Sanchit Gandhi, Sandeep Subramanian, Soham Ghosh, Srijan Mishra, Abhinav Rastogi, Alan Jeffares, Albert Jiang, Alexandre Sablayrolles, Amélie Héliou, Andrew Bai, Angele Lenglemetz, Anmol Agarwal, Anton Eliseev, Antonia Calvi, Arjun Majumdar, Baptiste Bout, Baptiste Rozière, Baudouin De Monicault, Benjamin Tibi, Clémence Lanfranchi, Connor Chen, Corentin Barreau, Corentin Sautier, Cyprien Courtot, Darius Dabert, Diego de las Casas, Elliot Chane-Sane, Enguerrand Paquin, Faruk Ahmed, Federico Baldassarre, Gabrielle Berrada, Gaëtan Ecrepont, Gauthier Guinet, Genevieve Hayes, Georgii Novikov, Giada Pistilli, Guillaume Martin, Gunjan Dhanuka, Gunshi Gupta, Han Zhou, Indraneel Mukherjee, Irene Zhang, Jaeyoung Kim, Jan Ludziejewski, Jason Rute, Joachim Studnia, John Harvill, Jonas Amar, Josselin Somerville Roberts, Julien Tauran, Karmesh Yadav, Kartik Khandelwal, Kush Jain, Laurence Aitchison, Léonard Blier, Lingxiao Zhao, Louis Martin, Lucile Saulnier, Luyu Gao, Maarten Buyl, Manan Sharma, Margaret Jennings, Marie Pellat, Mark Prins, Mathieu Poirée, Mathilde Guillaumin, Matthieu Dinot, Matthieu Futeral, Maxime Darrin, Maximilian Augustin, Mert Unsal, Mia Chiquier, Nathan Grinsztajn, Neha Gupta, Olivier Bousquet, Olivier Duchenne, Patricia Wang, Paul Jacob, Paul Wambergue, Paula Kurylowicz, Philomène Chagniot, Pierre Stock, Piotr Miłoś, Prateek Gupta, Pravesh Agrawal, Quentin Torroba, Ram Ramrakhya, Rishi Shah, Romain Sauvestre, Roman Soletskyi, Rosalie Millner, Sagar Vaze, Samuel Humeau, Siddharth Gandhi, Sumukh Aithal, Szymon Antoniak, Teven Le Scao, Théo Cachet, Theo Simon Sorg, Thibaut Lavril, Thomas Chabal, Thomas Foubert, Thomas Robert, Thomas Wang, Tim Lawson, Tom Bewley, Tom Edwards, Tyler Wang, Valeriia Nemychnikova, Van Phung, Vedant Nanda, Victor Jouault, Virgile Richard, Vladislav Bataev, Wassim Bouaziz, Wen-Ding Li, William Marshall, Xinghui Li, Xingran Guo, Xinyu Yang, Yannic Neuhaus, Yihan Wang, Zaccharie Ramzi, Zhenlin Xu 2/11/2026

Voxtral Realtime

Voxtral Realtime streaming speech recognition model achieving sub-second latency with end-to-end training for audio-text alignment.

HF Wayne Chi, Yixiong Fang, Arnav Yayavaram, Siddharth Yayavaram, Seth Karten, Qiuhong Anna Wei, Runkun Chen, Alexander Wang, Valerie Chen, Ameet Talwalkar, Chris Donahue 2/11/2026

GameDevBench: Evaluating Agentic Capabilities Through Game Development

GameDevBench evaluation framework tests multimodal AI agent capabilities on game development tasks combining code, shaders, sprites, and animations.

HF Yandan Yang, Shuang Zeng, Tong Lin, Xinyuan Chang, Dekang Qi, Junjin Xiao, Haoyun Liu, Ronghan Chen, Yuzhi Chen, Dongjie Huo, Feng Xiong, Xing Wei, Zhiheng Ma, Mu Xu 2/11/2026

ABot-M0: VLA Foundation Model for Robotic Manipulation with Action Manifold Learning

ABot-M0: VLA framework with action manifold learning for robotic manipulation, includes data curation pipeline for heterogeneous embodiment data.

HF Yitian Gong, Kuangwei Chen, Zhaoye Fei, Xiaogui Yang, Ke Chen, Yang Wang, Kexin Huang, Mingshu Chen, Ruixiao Li, Qingyuan Cheng, Shimin Li, Xipeng Qiu 2/11/2026

MOSS-Audio-Tokenizer: Scaling Audio Tokenizers for Future Audio Foundation Models

MOSS-Audio-Tokenizer proposes end-to-end discrete audio tokenization using homogeneous architectures for improved reconstruction and scaling in audio foundation models.

YT DeepLearningAI 2/11/2026

Use A2A to connect agents across different frameworks and teams

A2A framework enables connecting AI agents across different frameworks and teams for interoperability.

HF Jiahao Yuan, Yike Xu, Jinyong Wen, Baokun Wang, Yang Chen, Xiaotong Lin, Wuliang Huang, Ziyi Gao, Xing Fu, Yu Cheng, Weiqiang Wang 2/11/2026

How Do Decoder-Only LLMs Perceive Users? Rethinking Attention Masking for User Representation Learning

Research study on attention masking strategies in decoder-only LLMs for user representation learning using contrastive learning on large-scale behavioral data.

HF Guangzhi Xiong, Sanchit Sinha, Aidong Zhang 2/11/2026

Neural Additive Experts: Context-Gated Experts for Controllable Model Additivity

Neural Additive Experts framework balancing interpretability and accuracy in generalized additive models through feature interaction gating.

HF Chenhao Zhang, Yazhe Niu, Hongsheng Li 2/11/2026

MetaphorStar: Image Metaphor Understanding and Reasoning with End-to-End Visual Reinforcement Learning

MetaphorStar uses end-to-end visual RL to improve MLLM understanding of metaphorical content in images, enabling multi-hop reasoning and cultural context awareness.

HF Zhongzhi Li, Xuansheng Wu, Yijiang Li, Lijie Hu, Ninghao Liu 2/11/2026

Less is Enough: Synthesizing Diverse Data in Feature Space of LLMs

Feature Activation Coverage (FAC): measures post-training data diversity in LLM feature space for more effective downstream task performance.

HF Zhiling Yan, Dingjie Song, Zhe Fang, Yisheng Ji, Xiang Li, Quanzheng Li, Lichao Sun 2/10/2026

LiveMedBench: A Contamination-Free Medical Benchmark for LLMs with Automated Rubric Evaluation

Contamination-free medical benchmark for evaluating LLMs with automated rubric evaluation, addressing data leakage and temporal misalignment in clinical settings.

HF Weihao Liu, Dehai Min, Lu Cheng 2/10/2026

Latent Thoughts Tuning: Bridging Context and Reasoning with Fused Information in Latent Tokens

Method for reasoning in continuous latent space rather than discrete tokens, addressing feature collapse in latent reasoning paradigms for LLMs.

YT DeepLearningAI 2/10/2026

Andrew Ng on Vibe Coding

Quote reference with no content provided.

HF Shih-Lun Wu, Ge Zhu, Juan-Pablo Caceres, Cheng-Zhi Anna Huang, Nicholas J. Bryan 2/10/2026

Stemphonic: All-at-once Flexible Multi-stem Music Generation

Proposes method for multi-stem music generation with flexible instrument control. Relevant to ML research but outside core AI agent/LLM focus.

HF Chenxu Wang, Chaozhuo Li, Songyang Liu, Zejian Chen, Jinyu Hou, Ji Qi, Rui Li, Litian Zhang, Qiwei Ye, Zheng Liu, Xu Chen, Xi Zhang, Philip S. Yu 2/10/2026

The Devil Behind Moltbook: Anthropic Safety is Always Vanishing in Self-Evolving AI Societies

Theoretical and empirical analysis of safety alignment challenges in self-evolving multi-agent LLM systems; identifies self-evolution trilemma.

HF Checheng Yu, Chonghao Sima, Gangcheng Jiang, Hai Zhang, Haoguang Mai, Hongyang Li, Huijie Wang, Jin Chen, Kaiyang Wu, Li Chen, Lirui Zhao, Modi Shi, Ping Luo, Qingwen Bu, Shijia Peng, Tianyu Li, Yibo Yuan 2/9/2026

χ_{0}: Resource-Aware Robust Manipulation via Taming Distributional Inconsistencies

χ0 identifies distributional shift across human demonstrations, policy inductive bias, and test-time execution as robustness bottleneck in robotic manipulation, proposing alignment approach.

HF Suraj Ranganath, Atharv Ramesh 2/9/2026

StealthRL: Reinforcement Learning Paraphrase Attacks for Multi-Detector Evasion of AI-Text Detectors

StealthRL reinforcement learning framework stress-tests AI text detector robustness via adversarial paraphrasing using GRPO and LoRA adapters.

HF Feilong Tang, Xiang An, Yunyao Yan, Yin Xie, Bin Qin, Kaicheng Yang, Yifei Shen, Yuanhan Zhang, Chunyuan Li, Shikun Feng, Changrui Chen, Huajie Tan, Ming Hu, Manyuan Zhang, Bo Li, Ziyong Feng, Ziwei Liu, Zongyuan Ge, Jiankang Deng 2/9/2026

OneVision-Encoder: Codec-Aligned Sparsity as a Foundational Principle for Multimodal Intelligence

OneVision-Encoder: codec-aligned sparsity principle for multimodal architectures that process sparse discriminative information efficiently.

YT Julia Turc 2/9/2026

Why are diffusion LLMs so fast?

Opinion piece questioning whether certain AI approaches represent viable path to artificial general intelligence.

HF Xiangbo Gao, Renjie Li, Xinghao Chen, Yuheng Wu, Suofei Feng, Qing Yin, Zhengzhong Tu 2/9/2026

PISCO: Precise Video Instance Insertion with Sparse Control

Video generation framework for precise instance insertion into existing footage with sparse control, moving beyond prompt-engineering toward fine-grained controllable generation.

HF Konstantinos Mitsides, Maxence Faldor, Antoine Cully 2/9/2026

Dreaming in Code for Curriculum Learning in Open-Ended Worlds

Curriculum learning approach using code generation for agents to progressively learn in open-ended environments with foundation models.

HF Bulent Soykan, Sean Mondesire, Ghaith Rabadi, Grace Bochenek 2/8/2026

Graph-Enhanced Deep Reinforcement Learning for Multi-Objective Unrelated Parallel Machine Scheduling

Applies deep reinforcement learning with graph neural networks to optimize parallel machine scheduling. Relevant to ML research but not directly related to LLMs or AI agents.

HF Zhenyuan Zhang, Xianzhang Jia, Zhiqin Yang, Zhenbo Song, Wei Xue, Sirui Han, Yike Guo 2/8/2026

MemFly: On-the-Fly Memory Optimization via Information Bottleneck

MemFly: memory optimization framework using information bottleneck principles for LLM agents to balance compression and retrieval precision in long-term memory.

HF Sindhuja Chaduvula, Jessee Ho, Kina Kim, Aravind Narayanan, Mahshid Alinoori, Muskan Garg, Dhanesh Ramachandram, Shaina Raza 2/6/2026

From Features to Actions: Explainability in Traditional and Agentic AI Systems

Research on explainability methods for agentic AI systems that operate over multi-step trajectories, extending beyond single-prediction interpretability.

YT DeepLearningAI 2/6/2026

The Biggest Mistake AI Beginners Make

Clickbait title with no content provided.

YT DeepLearningAI 2/5/2026

The Boring Way to Learn AI (That Actually Works)

Opinion on common pitfalls encountered by beginners starting AI learning journey.

HF Hai Zhang, Siqi Liang, Li Chen, Yuxian Li, Yukuan Xu, Yichao Zhong, Fu Zhang, Hongyang Li 2/5/2026

Sparse Video Generation Propels Real-World Beyond-the-View Vision-Language Navigation

Sparse video generation framework enables vision-language navigation agents to navigate unknown environments with minimal high-level instructions via beyond-the-view reasoning.

HF Zhiqi Yu, Zhangquan Chen, Mengting Liu, Heye Zhang, Liangqiong Qu 2/5/2026

Unveiling Implicit Advantage Symmetry: Why GRPO Struggles with Exploration and Difficulty Adaptation

Analysis of GRPO reinforcement learning limitations in LLM reasoning due to implicit advantage symmetry; proposes improvements for exploration and difficulty adaptation.

HF Guoqing Ma, Siheng Wang, Zeyu Zhang, Shan Yu, Hao Tang 2/4/2026

GeneralVLA: Generalizable Vision-Language-Action Models with Knowledge-Guided Trajectory Planning

GeneralVLA: vision-language-action model with knowledge-guided trajectory planning to improve zero-shot generalization in robotic control.

HF Junyu Chen, Jungang Li, Jing Xiong, Wenjie Wang, Qingyao Yang, He Xiao, Zhen Li, Taiqiang Wu, Mengzhao Chen, Zhen Peng, Chaofan Tao, Long Shi, Hongxia Yang, Ngai Wong 2/4/2026

BPDQ: Bit-Plane Decomposition Quantization on a Variable Grid for Large Language Models

BPDQ: bit-plane decomposition quantization with variable grid for efficient 2-3 bit LLM inference under memory constraints.

HF Ian Wu, Yuxiao Qu, Amrith Setlur, Aviral Kumar 2/3/2026

Reasoning Cache: Continual Improvement Over Long Horizons via Short-Horizon RL

Reasoning Cache (RC) algorithm enables LLMs to improve over long horizons via test-time adaptation and RL, improving extrapolation beyond training distribution.

YT Julia Turc 2/3/2026

An image is worth NxN words | Diffusion Transformers (ViT, DiT, MMDiT)

Investigates computational efficiency advantages of diffusion-based language models versus standard approaches.

HF Yinggan Xu, Risto Miikkulainen, Xin Qiu 2/3/2026

Quantized Evolution Strategies: High-precision Fine-tuning of Quantized LLMs at Low-precision Cost

Novel method for fine-tuning quantized LLMs using evolution strategies instead of backpropagation, enabling high-precision adaptation on discrete, non-differentiable parameter spaces.

HF Zhiyu Huang, Yun Zhang, Johnson Liu, Rui Song, Chen Tang, Jiaqi Ma 2/2/2026

TIC-VLA: A Think-in-Control Vision-Language-Action Model for Robot Navigation in Dynamic Environments

TIC-VLA framework for robot navigation that models delayed semantic reasoning in vision-language-action models for real-time control in dynamic environments.

HF Jie Xiao, Meng Chen, Qingnan Ren, Jingwei Song, Jiaqi Huang, Yangshen Deng, Chris Tong, Wanyi Chen, Suli Wang, Ziqian Bi, Shuo Lu, Yiqun Duan, Xu Wang, Rymon Yu, Ween Yang, Lynn Ai, Eric Yang, Bill Shi, Song Jingwei 2/2/2026

ECHO-2: A Large-Scale Distributed Rollout Framework for Cost-Efficient Reinforcement Learning

ECHO-2 distributed RL framework for LLM post-training with remote inference workers, addressing cost efficiency and policy coordination challenges.

YT DeepLearningAI 1/28/2026

Learn to equip AI agents with reusable skills

Analysis of immigration policy intersection with AI talent acquisition and workforce development.

YT DeepLearningAI 1/26/2026

Is vibe coding real coding?

Discusses trust and governance frameworks in AI deployment and policy.

YT DeepLearningAI 1/26/2026

Unlock data from your files with Agentic Document Extraction

Opinion article debating whether prompt-driven development qualifies as legitimate programming practice.

YT DeepLearningAI 1/23/2026

Document AI: How Agents add the brain to OCR's eyes

Technical guide on implementing agentic workflows for automated document processing and data extraction.

YT Julia Turc 1/22/2026

The Physics of Diffusion Models

Technical overview of diffusion transformers including vision transformers and diffusion transformer variants.

YT Julia Turc 1/17/2026

Text Diffusion: A new LLM paradigm

Explores text diffusion models as emerging alternative paradigm for language model development.

BL 12/17/2025

The state of enterprise AI

Overview of enterprise AI adoption, challenges, and potential for funding accessible AI. Discusses organizational AI implementation but lacks technical depth.

BL 12/16/2025

Staying ahead in the age of AI

Leadership guide on organizational AI adoption from OpenAI experience with enterprise clients.

BL 11/19/2025

How Scania is accelerating work with AI across its global workforce

Scania deploys ChatGPT Enterprise across global engineering teams to accelerate learning, building, and innovation in industrial operations.

YT Julia Turc 11/17/2025

I asked them to show me their RAG pipeline...

Technical overview of retrieval-augmented generation pipelines used in LLM applications.

BL 11/14/2025

Introducing OpenAI for Ireland

OpenAI launches localized initiative in Ireland partnering with government and labs to help SMEs and startups adopt AI tools.