Isolater - Feed

Ax Ruichuan An, Sihan Yang, Ziyu Guo, Wei Dai, Zijun Shen, Haodong Li, Renrui Zhang, Xinyu Wei, Guopeng Li, Wenshan Wu, Wentao Zhang 1d ago 90

GENIUS: Generative Fluid Intelligence Evaluation Suite

researchpaper

Ax Gongye Liu, Bo Yang, Yida Zhi, Zhizhou Zhong, Lei Ke, Didan Deng, Han Gao, Yongxiang Huang, Kaihao Zhang, Hongbo Fu, Wenhan Luo 1d ago 90

Beyond VLM-Based Rewards: Diffusion-Native Latent Reward Modeling

researchpaper

Ax Manuel Mondal, Ljiljana Dolamic, G\'er\^ome Bovet, Philippe Cudr\'e-Mauroux, Julien Audiffren 1d ago 90

Implicit Probabilistic Reasoning Does Not Reflect Explicit Answers in Large Language Models

researchpaper

Ax Prakhar Godara, Tilman Diego Alem\'an 1d ago 90

Metareasoning in uncertain environments: a meta-BAMDP framework

researchpaper

Ax Cristian Daniel P\u{a}duraru, Antonio B\u{a}rb\u{a}lau, Radu Filipescu, Andrei Liviu Nicolicioiu, Elena Burceanu 1d ago 90

Bridging Explainability and Embeddings: BEE Aware of Spuriousness

researchpaper

Ax Abdelrhman Shaheen, Anas Badr, Ali Abohendy, Hatem Alsaadawy, Nadine Alsayad, Ehab H. El-Shazly 1d ago 90

Reinforcement Learning in Strategy-Based and Atari Games: A Review of Google DeepMinds Innovations

researchpaper

Ax Haokun Liu, Sicong Huang, Jingyu Hu, Yangqiaoyu Zhou, Chenhao Tan 1d ago 90

HypoBench: Towards Systematic and Principled Benchmarking for Hypothesis Generation

researchpaper

Ax Shuhang Xu, Weijian Deng, Yixuan Zhou, Fangwei Zhong 1d ago 90

Is Your LLM Really Mastering the Concept? A Multi-Agent Benchmark

researchpaper

Ax Yisen Gao, Jiaxin Bai, Tianshi Zheng, Qingyun Sun, Ziwei Zhang, Xingcheng Fu, Jianxin Li, Yangqiu Song 1d ago 90

Controllable Logical Hypothesis Generation for Abductive Reasoning in Knowledge Graphs

researchpaper

Ax Lintao Wang, Encheng Su, Jiaqi Liu, Pengze Li, Jiabei Xiao, Wenlong Zhang, Xinnan Dai, Xi Chen, Yuan Meng, Lei Bai, Wanli Ouyang, Shixiang Tang, Aoran Wang, Xinzhu Ma 1d ago 90

PhysUniBench: A Multi-Modal Physics Reasoning Benchmark at Undergraduate Level

researchpaper

Ax Li Du, Hanyu Zhao, Yiming Ju, Tengfei Pan 1d ago 90

Scaling Towards the Information Boundary of Instruction Sets: The Infinity Instruct Subject Technical Report

researchpaper

Ax Jackson Eshbaugh, Chetan Tiwari, Jorge Silveyra 1d ago 90

Synthetic Homes: An Accessible Multimodal Pipeline for Producing Residential Building Data with Generative AI

researchpaper

Ax Xuemiao Zhang, Can Ren, Chengying Tu, Rongxiang Weng, Shuo Wang, Hongfei Yan, Jingang Wang, Xunliang Cai 1d ago 90

Expanding Reasoning Potential in Foundation Model by Learning Diverse Chains of Thought Patterns

researchpaper

Ax Yiquan Wang, Tin-Yeh Huang, Qingyun Gao, Yuhan Chang, Jialin Zhang 1d ago 90

AI Driven Discovery of Bio Ecological Mediation in Cascading Heatwave Risks

researchpaper

Ax Yu Zeng, Wenxuan Huang, Shiting Huang, Xikun Bao, Yukun Qi, Yiming Zhao, Qiuchen Wang, Lin Chen, Zehui Chen, Huaian Chen, Wanli Ouyang, Feng Zhao 1d ago 90

Agentic Jigsaw Interaction Learning for Enhancing Visual Perception and Reasoning in Vision-Language Models

researchpaper

Ax Rashid Mushkani 1d ago 90

Measuring What Matters: The AI Pluralism Index

researchpaper

Ax Yisen Gao, Jiaxin Bai, Yi Huang, Xingcheng Fu, Qingyun Sun, Yangqiu Song 1d ago 90

Unifying Deductive and Abductive Reasoning in Knowledge Graphs with Masked Diffusion Model

researchpaper

Ax Deniz Gorur, Antonio Rago, Francesca Toni 1d ago 90

Retrieval- and Argumentation-Enhanced Multi-Agent LLMs for Judgmental Forecasting (Extended Version with Supplementary Material)

researchpaper

Ax Shengqi Xu, Xinpeng Zhou, Yabo Zhang, Ming Liu, Tao Liang, Tianyu Zhang, Yalong Bai, Zuxuan Wu, Wangmeng Zuo 1d ago 90

PreferThinker: Reasoning-based Personalized Image Preference Assessment

researchpaper

Ax Haebin Seong, Sungmin Kim, Yongjun Cho, Myunchul Joe, Geunwoo Kim, Yubeen Park, Sunhoo Kim, Yoonshik Kim, Suhwan Choi, Jaeyoon Jung, Jiyong Youn, Jinmyung Kwak, Sunghee Ahn, Jaemin Lee, Younggil Do, Seungyeop Yi, Woojin Cheong, Minhyeok Oh, Minchan Kim, Seongjae Kang, Samwoo Seong, Youngjae Yu, Yunsung Lee 1d ago 90

CostNav: A Navigation Benchmark for Real-World Economic-Cost Evaluation of Physical AI Agents

researchpaper

Ax Austin Spizzirri 1d ago 90

The Specification Trap: Why Content-Based AI Value Alignment Cannot Produce Robust Alignment

researchpaper

Ax Shengji Tang, Weihao Lin, Peng Ye, Jingqi Ye, Hao Li, Yiqun Zhang, Xiaosong Wang, Bo Zhang, Shuyue Hu, Tao Chen, Lei Bai, Wanli Ouyang 1d ago 90

Beyond Gemini-3-Pro: Revisiting LLM Routing and Aggregation at Scale

researchpaper

Ax Marc Lanctot, Kate Larson, Ian Gemp, Michael Kaisers 1d ago 90

Active Evaluation of General Agents: Problem Definition and Comparison of Baseline Algorithms

researchpaper

Ax Haoran Ye, Xuning He, Vincent Arak, Haonan Dong, Guojie Song 1d ago 90

Meta Context Engineering via Agentic Skill Evolution

researchpaper

Ax Lakshya Gupta, Litao Li, Yizhe Liu, Sriram Ganapathi Subramanian, Kaheer Suleman, Zichen Zhang, Haoye Lu, Sumit Pasupalak 1d ago 90

World of Workflows: A Benchmark for Bringing World Models to Enterprise Systems

researchpaper

Ax Bowen Cao, Dongdong Zhang, Yixia Li, Junpeng Liu, Shijue Huang, Chufan Shi, Hongyuan Lu, Yaokang Wu, Guanhua Chen, Wai Lam, Furu Wei 1d ago 90

From Abstract to Contextual: What LLMs Still Cannot Do in Mathematics

researchpaper

Ax Mengxuan Wang, Yuxin Chen, Gang Xu, Tao He, Hongjie Jiang, Ming Li 1d ago 90

Risk Awareness Injection: Calibrating Vision-Language Models for Safety without Compromising Utility

researchpaper

Ax Guozhi Liu, Weiwei Lin, Tiansheng Huang, Ruichao Mo, Qi Mu, Xiumin Wang, Li Shen 1d ago 90

Surgery: Mitigating Harmful Fine-Tuning for Large Language Models via Attention Sink

researchpaper

Ax Chris Zhu, Sasha Cui, Will Sanok Dufallo, Runzhi Jin, Zhen Xu, Linjun Zhang, Daylian Cain 1d ago 90

PieArena: Frontier Language Agents Achieve MBA-Level Negotiation Performance and Reveal Novel Behavioral Differences

researchpaper

Ax Finn Rietz, Mart Karta\v{s}ev, Petter \"Ogren, Johannes A. Stork 1d ago 90

Progress Constraints for Reinforcement Learning in Behavior Trees

researchpaper

Ax Congcong Hu, Yuang Shi, Fan Huang, Yang Xiang, Zhou Ye, Ming Jin, Shiyu Wang 1d ago 90

EventCast: Hybrid Demand Forecasting in E-Commerce with LLM-Based Event Knowledge

researchpaper

Ax Guanglong Sun, Hongwei Yan, Liyuan Wang, Zhiqi Kang, Shuang Cui, Hang Su, Jun Zhu, Yi Zhong 1d ago 90

MePo: Meta Post-Refinement for Rehearsal-Free General Continual Learning

researchpaper

Ax Yuhang Wang, Feiming Xu, Zheng Lin, Guangyu He, Yuzhe Huang, Haichang Gao, Zhenxing Niu, Shiguo Lian, Zhaoxiang Liu 1d ago 90

From Assistant to Double Agent: Formalizing and Benchmarking Attacks on OpenClaw for Personalized Local AI Agent

researchpaper

Ax Xinhai Sun 1d ago 90

Reinforcement Inference: Leveraging Uncertainty for Self-Correcting Language Model Reasoning

researchpaper

Ax Aditya Gulati, Nuria Oliver 1d ago 90

Why do we Trust Chatbots? From Normative Principles to Behavioral Drivers

researchpaper

Ax Andr\'es Holgado-S\'anchez, Peter Vamplew, Richard Dazeley, Sascha Ossowski, Holger Billhardt 1d ago 90

Learning the Value Systems of Societies with Preference-based Multi-objective Reinforcement Learning

researchpaper

Ax Furong Jia, Ling Dai, Wenjin Deng, Fan Zhang, Chen Hu, Daxin Jiang, Yu Liu 1d ago 90

SpotAgent: Grounding Visual Geo-localization in Large Vision-Language Models through Agentic Reasoning

researchpaper

Ax Shiwei Lyu, Xidong Wang, Lei Liu, Hao Zhu, Chaohe Zhang, Jian Wang, Jinjie Gu, Benyou Wang, Yue Shen 1d ago 90

ClinAlign: Scaling Healthcare Alignment from Clinician Preference

researchpaper

Ax Richard Bornemann, Pierluigi Vito Amadori, Antoine Cully 1d ago 90

CODE-SHARP: Continuous Open-ended Discovery and Evolution of Skills as Hierarchical Reward Programs

researchpaper

Ax Zhaoyang Wang, Canwen Xu, Boyi Liu, Yite Wang, Siwei Han, Zhewei Yao, Huaxiu Yao, Yuxiong He 1d ago 90

Agent World Model: Infinity Synthetic Environments for Agentic Reinforcement Learning

researchpaper

Ax Daniel Fern\'andez-Gonz\'alez 1d ago 90

Structured Sentiment Analysis as Transition-based Dependency Graph Parsing

researchpaper

Ax Yoav Kolumbus, Joe Halpern, \'Eva Tardos 1d ago 90

Games with Payments between Learning Agents

researchpaper

Ax Wilson G. Gregory, Josu\'e Tonelli-Cueto, Nicholas F. Marshall, Andrew S. Lee, Soledad Villar 1d ago 90

Tensor learning with orthogonal, Lorentz, and symplectic symmetries

researchpaper

Ax Jiayi Lin, Yanlin Wang, Yibiao Yang, Lei Zhang, Yutao Xie 1d ago 90

Towards Better Code Understanding in Decoder-Only Models with Contrastive Learning

researchpaper

Ax Jialiang Wang, Hanmo Liu, Shimin Di, Zhili Wang, Jiachuan Wang, Lei Chen, Xiaofang Zhou 1d ago 90

Proficient Graph Neural Network Design by Accumulating Knowledge on Large Language Models

researchpaper

Ax Elia Bonetto, Aamir Ahmad 1d ago 90

ZebraPose: Zebra Detection and Pose Estimation using only Synthetic Data

researchpaper

Ax Simon Sinong Zhan, Philip Wang, Qingyuan Wu, Yixuan Wang, Ruochen Jiao, Chao Huang, Qi Zhu 1d ago 90

Enhancing Inverse Reinforcement Learning through Encoding Dynamic Information in Reward Shaping

researchpaper

Ax Jiankun Wei, Abdulrahman Abdulrazzag, Tianchen Zhang, Adel Muursepp, Gururaj Saileshwar 1d ago 90

When Speculation Spills Secrets: Side Channels via Speculative Decoding In LLMs

researchpaper

Ax Hao Shu 1d ago 90

Symmetrization Weighted Binary Cross-Entropy: Modeling Perceptual Asymmetry for Human-Consistent Neural Edge Detection

researchpaper

Ax Akshay Kudva, Wei-Ting Tang, Joel A. Paulson 1d ago 90

Multi-Objective Bayesian Optimization for Networked Black-Box Systems: A Path to Greener Profits and Smarter Designs

researchpaper