Isolater - Feed

Ax Rafael da Silva, Jeff Eicher, Gregory Longo 11d ago

Temporal Dropout Risk in Learning Analytics: A Harmonized Survival Benchmark Across Dynamic and Early-Window Representations

Survival-oriented benchmark for temporal student dropout risk modeling using Open University Learning Analytics Dataset.

Ax Rafael da Silva, Jeff Eicher, Gregory Longo 11d ago

A Mathematical Framework for Temporal Modeling and Counterfactual Policy Simulation of Student Dropout

Temporal survival modeling framework for predicting student dropout using LMS engagement data and administrative records.

Ax Tokio Kajitsuka, Ukyo Honda, Sho Takase 11d ago

Revisiting the Capacity Gap in Chain-of-Thought Distillation from a Practical Perspective

Re-examines capacity gap in chain-of-thought distillation, finding student models often outperform teacher distillation baselines.

Ax Chengjie Fan, Cong Pan, Zijian Liu, Ningzhong Liu, Jie Qin 11d ago

HTNav: A Hybrid Navigation Framework with Tiered Structure for Urban Aerial Vision-and-Language Navigation

HTNav framework for aerial vision-and-language navigation combining visual perception with language instructions in urban environments.

Ax Xinyu Zhang, Zurong Mai, Qingmei Li, Zjin Liao, Yibin Wen, Yuhang Chen, Xiaoya Fan, Chan Tsz Ho, Bi Tianyuan, Haoyuan Liang, Ruifeng Su, Zihao Qian, Juepeng Zheng, Jianxi Huang, Yutong Lu, Haohuan Fu 11d ago

HM-Bench: A Comprehensive Benchmark for Multimodal Large Language Models in Hyperspectral Remote Sensing

HM-Bench benchmark evaluates multimodal LLMs on hyperspectral remote sensing image understanding tasks.

Ax Hang Gao, Kunyu Li, Huang Hong, Baoquan Cui, Fengge Wu 11d ago

A Closer Look at the Application of Causal Inference in Graph Representation Learning

Analysis of causal inference methods applied to graph representation learning and their limitations with graph-structured data.

Ax Mohsen Yaghoubi Suraki 11d ago

Adaptive Dual Residual U-Net with Attention Gate and Multiscale Spatial Attention Mechanisms (ADRUwAMS)

ADRUwAMS deep learning model with attention mechanisms for automated brain tumor glioma segmentation in medical imaging.

Ax Zecheng Hao, Shenghao Xie, Kang Chen, Wenxuan Liu, Zhaofei Yu, Tiejun Huang 11d ago

Ge$^\text{2}$mS-T: Multi-Dimensional Grouping for Ultra-High Energy Efficiency in Spiking Transformer

Ge2mS-T improves energy efficiency in Spiking Vision Transformers through multi-dimensional grouping and optimized training methods.

Ax Yuanting Fan, Jun Liu, Bin-Bin Gao, Xiaochen Chen, Yuhuan Lin, Zhewei Dai, Jiawei Zhan, Chengjie Wang 11d ago

Large-Scale Universal Defect Generation: Foundation Models and Datasets

UDG dataset with 300K samples for training defect/anomaly generation models with improved generalization across defect categories.

Ax Hengran Zhang, Minghao Tang, Keping Bi, Jiafeng Guo 11d ago

Beyond Relevance: Utility-Centric Retrieval in the LLM Era

RAG systems should optimize for utility (task completion) rather than topical relevance when retrieving documents for LLMs.

Ax Rares-Alexandru Roscan, Gabriel Petre1, Adrian-Marius Dumitran, Angela-Liliana Dumitran 11d ago

MuTSE: A Human-in-the-Loop Multi-use Text Simplification Evaluator

MuTSE: Human-in-the-loop evaluator tool for systematically comparing LLM text simplification outputs across different prompting strategies and architectures.

Ax Mintae Kim, Koushil Sreenath 11d ago

WOMBET: World Model-based Experience Transfer for Robust and Sample-efficient Reinforcement Learning

WOMBET: Framework for reinforcement learning that generates and transfers experience data between source and target robotic tasks for sample efficiency.

Ax Keyu Li, Jin Gao, Dequan Wang 11d ago

Aligned Agents, Biased Swarm: Measuring Bias Amplification in Multi-Agent Systems

Aligned Agents, Biased Swarm: Empirical study measuring how multi-agent system topologies and feedback loops amplify bias in emergent behaviors.

Ax Avni Mittal, Shanu Kumar, Sandipan Dandapat, Monojit Choudhury 11d ago

Litmus (Re)Agent: A Benchmark and Agentic System for Predictive Evaluation of Multilingual Models

Litmus ReAgent: Benchmark and agentic system for evaluating multilingual LLM performance prediction across 1,500 questions spanning six tasks and five evidence scenarios.

Ax Yi Luo, Xu Sun, Guangchun Luo, Aiguo Chen 11d ago

Neighbourhood Transformer: Switchable Attention for Monophily-Aware Graph Learning

Neighbourhood Transformer: Graph neural network architecture using switchable attention to handle heterophilic graph learning where dissimilar nodes are frequently connected.

Ax Jihwan Oh, Soowon Oh, Murad Aghazada, Minchan Jeong, Sungnyun Kim, Se-Young Yun 11d ago

PerMix-RLVR: Preserving Persona Expressivity under Verifiable-Reward Alignment

PerMix-RLVR: Training method for aligning LLM personas with reward models while preserving output diversity, avoiding inference-time computation overhead.

Ax Zhiyu Zhou, Peilin Liu, Ruoxuan Zhang, Luyang Zhang, Cheng Zhang, Hongxia Xie, Wen-Huang Cheng 11d ago

PinpointQA: A Dataset and Benchmark for Small Object-Centric Spatial Understanding in Indoor Videos

PinpointQA dataset and benchmark for evaluating small object localization and spatial reasoning in video MLLMs.

Ax Xiaoke Guo, Songze Li, Zhiqiang Liu, Zhaoyan Gong, Yuanxiang Liu, Huajun Chen, Wen Zhang 11d ago

ASTRA: Adaptive Semantic Tree Reasoning Architecture for Complex Table Question Answering

ASTRA: adaptive semantic tree reasoning architecture for LLM-based complex table question answering.

Ax Wenxi Li, Xihao Wang, Weiwei Sun 11d ago

Towards Linguistically-informed Representations for English as a Second or Foreign Language: Review, Construction and Application

Survey and construction of linguistically-informed representations for English as a second/foreign language.

Ax Carlos Jimeno Miguel, Raul Orduna, Francesco Zola 11d ago

Identification and Anonymization of Named Entities in Unstructured Information Sources for Use in Social Engineering Detection

Named entity identification and anonymization system for cybercrime datasets using speech-to-text and image processing.

Ax Andre Bacellar 11d ago

Regime-Conditional Retrieval: Theory and a Transferable Router for Two-Hop QA

Regime-conditional retrieval with transferable router for two-hop question answering with theoretical foundations.

Ax Qixuan Huang, Khalid Zaman, Masashi Unoki 11d ago

Noise-Aware In-Context Learning for Hallucination Mitigation in ALLMs

Noise-aware in-context learning approach to mitigate hallucinations in auditory large language models.

Ax Zedian Shao, Hongbin Liu, Yuepeng Hu, Neil Zhenqiang Gong 11d ago

Leave My Images Alone: Preventing Multi-Modal Large Language Models from Analyzing Images via Visual Prompt Injection

ImageProtector prevents multi-modal LLMs from analyzing images via visual prompt injection attacks.

Ax Chenjie Yang, Yutian Jiang, Chenyu Wu 11d ago

Skill-Conditioned Visual Geolocation for Vision-Language

Vision-language models for image geolocation with structured geographic reasoning and autonomous self-evolution.

Ax Yeonjun Hwang, Sungyong Park, Minju Kim, Dongha Lee, Jinyoung Yeo 11d ago

CONDESION-BENCH: Conditional Decision-Making of Large Language Models in Compositional Action Space

CONDESION-BENCH evaluates LLM decision-making with compositional action spaces and conditional feasibility constraints.

Ax Salva R\"uhling Cachay, Duncan Watson-Parris, Rose Yu 11d ago

U-Cast: A Surprisingly Simple and Efficient Frontier Probabilistic AI Weather Forecaster

U-Cast: simple probabilistic weather forecasting using standard U-Net architecture achieving frontier performance.

Ax Mauricio Fadel Argerich, Jonathan F\"urst, Marta Pati\~no-Mart\'inez 11d ago

Watt Counts: Energy-Aware Benchmark for Sustainable LLM Inference on Heterogeneous GPU Architectures

Watt Counts: open-access energy consumption benchmark for LLM inference across 50 models and 10 GPU architectures.

Ax Min Young Baeg, Yoon-Yeong Kim 11d ago

PDE-regularized Dynamics-informed Diffusion with Uncertainty-aware Filtering for Long-Horizon Dynamics

PDYffusion combines diffusion models with physics-informed dynamics for long-horizon spatiotemporal prediction.

Ax Guoqing Wang, Pin Tang, Xiangxuan Ren, Guodongfang Zhao, Bailan Feng, Chao Ma 11d ago

Learning Vision-Language-Action World Models for Autonomous Driving

Vision-Language-Action models for autonomous driving combining perception, reasoning, and temporal dynamics modeling.

Ax Yuxi Zhou, Zhengbo Zhang, Jingyu Pan, Zhiyu Lin, Zhigang Tu 11d ago

Frequency-Enhanced Diffusion Models: Curriculum-Guided Semantic Alignment for Zero-Shot Skeleton Action Recognition

Frequency-enhanced diffusion models for zero-shot skeleton action recognition in computer vision.

Ax Parjanya Aditya Shukla, Shubham Kumar Nigam, Debtanu Datta, Balaramamahanthi Deepak Patnaik, Noel Shallum, Pradeep Reddy Vanga, Saptarshi Ghosh, Arnab Bhattacharya 11d ago

NyayaMind- A Framework for Transparent Legal Reasoning and Judgment Prediction in the Indian Legal System

NyayaMind framework for transparent legal reasoning and judgment prediction in Indian courts using LLMs.

Ax Harry Proshian, Nikita Severin, Sergey Nikolenko, Kireev Ivan, Andrey Savchenko, Ivan Sergeev, Maria Postnova, Ilya Makarov 11d ago

Beyond Isolated Clients: Integrating Graph-Based Embeddings into Event Sequence Models

Method integrating graph-based embeddings into event sequence models for improved user prediction on digital platforms.

Ax Li Huang, Zhongxin Liu, Yifan Wu, Tao Yin, Dong Li, Jichao Bi, Nankun Mu, Hongyu Zhang, Meng Yan 11d ago

DeepGuard: Secure Code Generation via Multi-Layer Semantic Aggregation

DeepGuard improves secure code generation by LLMs through multi-layer semantic aggregation to mitigate vulnerable patterns.

Ax Akshit Jindal, Saket Anand, Chetan Arora, Vikram Goyal 11d ago

CLIP-Inspector: Model-Level Backdoor Detection for Prompt-Tuned CLIP via OOD Trigger Inversion

CLIP-Inspector detects backdoor attacks in prompt-tuned vision-language models through out-of-distribution trigger inversion.

Ax Tommy Shaffer Shane, Simon Mylius, Hamish Hobbs 11d ago

Scheming in the wild: detecting real-world AI scheming incidents with open-source intelligence

Research on detecting covert misaligned AI behavior in real-world settings using open-source intelligence methods.

Ax Chenhao Ye, Huaizheng Zhang, Mingcong Han, Baoquan Zhong, Xiang Li, Qixiang Chen, Xinyi Zhang, Weidong Zhang, Kaihua Jiang, Wang Zhang, He Sun, Wencong Xiao, Andrea C. Arpaci-Dusseau, Remzi H. Arpaci-Dusseau 11d ago

TensorHub: Scalable and Elastic Weight Transfer for LLM RL Training

TensorHub introduces Reference-Oriented Storage for efficient weight transfer in LLM reinforcement learning across heterogeneous computational resources.

Ax Changi Hong, Yoonah Song, Hwayoung Park, Chaewoon Bang, Dayeon Gu, Do Hyun Lee, Hong Kook Kim 11d ago

PS-TTS: Phonetic Synchronization in Text-to-Speech for Achieving Natural Automated Dubbing

PS-TTS method for phonetic synchronization in automated dubbing, addressing duration and lip-sync challenges in AI-based video translation.

Ax Peng Wang (X-LANCE Lab, Shanghai Jiao Tong University), Yanqiao Zhu (X-LANCE Lab, Shanghai Jiao Tong University), Zixuan Jiang (X-LANCE Lab, Shanghai Jiao Tong University), Qinyuan Chen (School of Computer Science, Fudan University), Xingjian Zhao (School of Computer Science, Fudan University), Xipeng Qiu (School of Computer Science, Fudan University), Wupeng Wang (Tongyi Fun Team, Alibaba Group), Zhifu Gao (Tongyi Fun Team, Alibaba Group), Xiangang Li (Tongyi Fun Team, Alibaba Group), Kai Yu (X-LANCE Lab, Shanghai Jiao Tong University), Xie Chen (X-LANCE Lab, Shanghai Jiao Tong University) 11d ago

Interactive ASR: Towards Human-Like Interaction and Semantic Coherence Evaluation for Agentic Speech Recognition

Interactive ASR system with human-like interaction and semantic coherence evaluation, replacing WER metric with agent-based correction mechanisms.

Ax Yi-Lun Liao, Alexander J. Hoffman, Sabrina C. Shen, Alexandre Duval, Sam Walton Norwood, Tess Smidt 11d ago

EquiformerV3: Scaling Efficient, Expressive, and General SE(3)-Equivariant Graph Attention Transformers

EquiformerV3: SE(3)-equivariant graph attention Transformer for 3D atomistic modeling, improving efficiency, expressivity, and physical consistency.

Ax Yushi Feng, Junye Du, Qifan Wang, Zizhan Ma, Qian Niu, Yutaka Matsuo, Long Feng, Lequan Yu 11d ago

CORA: Conformal Risk-Controlled Agents for Safeguarded Mobile GUI Automation

CORA framework for risk-controlled GUI automation agents using conformal prediction to provide formally verified, user-tunable safety guarantees for VLM-powered mobile automation.

Ax Fatma Bet\"ul G\"ure\c{s}, Tanya Nazaretsky, Seyed Parsa Neshaei, Tanja K\"aser 11d ago

Structuring versus Problematizing: How LLM-based Agents Scaffold Learning in Diagnostic Reasoning

LLM-based agents for scaffolding diagnostic reasoning in educational settings, combining scenario-based learning with learning analytics and personalized support.

Ax Yuqin Yang, Haowu Zhou, Haoran Tu, Zhiwen Hui, Shiqi Yan, HaoYang Li, Dong She, Xianrong Yao, Yang Gao, Zhanpeng Jin 11d ago

Persona-E$^2$: A Human-Grounded Dataset for Personality-Shaped Emotional Responses to Textual Events

Dataset for personality-shaped emotional responses to text events, addressing limitations of LLM role-playing and personality illusion in affective computing.

Ax Mansour Zoubeirou a Mayaki 11d ago

Generalization and Scaling Laws for Mixture-of-Experts Transformers

Theoretical analysis of generalization and scaling laws for Mixture-of-Experts Transformers, separating active capacity from routing combinatorics with covering-number bounds.

Ax Avni Mittal 11d ago

Do LLMs Follow Their Own Rules? A Reflexive Audit of Self-Stated Safety Policies

Symbolic-Neural Consistency Audit framework extracting and formalizing LLM self-stated safety policies.

Ax Francesca Fati, Felipe Coutinho, Marika Reinius, Marina Rosanu, Gabriel Funingana, Luigi De Vitis, Gabriella Schivardi, Hannah Clayton, Alice Traversa, Zeyu Gao, Guilherme Penteado, Shangqi Gao, Francesco Pastori, Ramona Woitek, Maria Cristina Ghioni, Giovanni Damiano Aletti, Mercedes Jimenez-Linan, Sarah Burge, Nicoletta Colombo, Evis Sala, Maria Francesca Spadea, Timothy L. Kline, James D. Brenton, Jaime Cardoso, Francesco Multinu, Elena De Momi, Mireia Crispin-Ortuzar, Ines P. Machado 11d ago

Vision Transformers for Preoperative CT-Based Prediction of Histopathologic Chemotherapy Response Score in High-Grade Serous Ovarian Carcinoma

Vision transformer application predicting chemotherapy response in ovarian cancer from preoperative CT scans.

Ax Anas Hattay, Fred Ngole Mboula, Eric Gascard, Zakaria Yahoun 11d ago

Statistical Properties of the King Wen Sequence: An Anti-Habituation Structure That Does Not Improve Neural Network Training

Statistical analysis of I-Ching King Wen sequence showing no improvements to neural network training.