Isolater - Feed

Ax Xuecong Liu, Mengzhu Ding, Zixuan Sun, Zhang Li, Xichao Teng 25d ago

CRFT: Consistent-Recurrent Feature Flow Transformer for Cross-Modal Image Registration

CRFT transformer-based framework using feature flow learning for robust cross-modal image registration in coarse-to-fine approach.

Ax Guan-Yan Yang, Wei-Ling Wen, Shu-Yuan Ku, Farn Wang, Kuo-Hui Yeh 25d ago

SemLink: A Semantic-Aware Automated Test Oracle for Hyperlink Verification using Siamese Sentence-BERT

SemLink tool using Siamese Sentence-BERT for semantic-aware automated test oracles detecting hyperlink rot and semantic drift in web applications.

Ax Jiaren Peng, Zeqin Li, Chang You, Yan Wang, Hanlin Sun, Xuan Tian, Shuqiao Zhang, Junyi Liu, Jianguo Zhao, Renyang Liu, Haoran Ou, Yuqiang Sun, Jiancheng Zhang, Yutong Jiao, Kunshu Song, Chao Zhang, Fan Shi, Hongda Sun, Rui Yan, Cheng Huang 25d ago

Hackers or Hallucinators? A Comprehensive Analysis of LLM-Based Automated Penetration Testing

Systematic analysis and benchmark comparing LLM-based automated penetration testing frameworks for autonomous security testing.

Ax Amit Vaisman, Gal Pomerants, Raz Lapid 25d ago

On the Robustness of Diffusion-Based Image Compression to Bit-Flip Errors

Analysis of diffusion-based image compressors' robustness to bit-flip errors compared to classical and learned codecs.

Ax Tim Lukas Adam, Phongsakon Mark Konrad, Riccardo Terrenzi, Florian Girardo Lukas, Rahime Yilmaz, Krzysztof Sierszecki, Serkan Ayvaz 25d ago

CAKE: Cloud Architecture Knowledge Evaluation of Large Language Models

CAKE benchmark with 188 expert-validated questions evaluating LLMs' understanding of cloud-native software architecture across Bloom's taxonomy levels.

Ax Joosung Lee, Hwiyeol Jo, Donghyeon Ko, Kyubyung Chae, Cheonbok Park, Jeonghoon Kim 25d ago

What Models Know, How Well They Know It: Knowledge-Weighted Fine-Tuning for Learning When to Say "I Don't Know"

Fine-tuning technique using instance-level knowledge scores to reduce LLM hallucinations by aligning pre-training and fine-tuning knowledge.

Ax Fernando L\'opez, Paula Delgado-Santos, Pablo G\'omez, David Solans, Jordi Luque 25d ago

"OK Aura, Be Fair With Me": Demographics-Agnostic Training for Bias Mitigation in Wake-up Word Detection

Demographics-agnostic training method for mitigating bias in wake-up word detection across diverse speaker populations.

Ax Panagiotis Andrikopoulos, Siamak Mehrkanoon 25d ago

EEG-MFTNet: An Enhanced EEGNet Architecture with Multi-Scale Temporal Convolutions and Transformer Fusion for Cross-Session Motor Imagery Decoding

EEG-MFTNet deep learning architecture combining multi-scale temporal convolutions and transformers for cross-session motor imagery decoding in BCIs.

Ax Junsoo Park, Youssef Medhat, Htet Phyo Wai, Ploy Thajchayapong, Ashok K. Goel 25d ago

Evaluating Learner Representations for Differentiation Prior to Instructional Outcomes

Representation-level evaluation metric for learner representations in educational AI systems measuring distinctiveness between students.

Ax Osama Orabi, Artur Zagitov, Hadi Salloum, Viktor A. Lobachev, Kasymkhan Khubiev, Yaroslav Kholodov 25d ago

Neural Network Pruning via QUBO Optimization

Neural network pruning formulated as QUBO optimization problem with principled objective formulations capturing filter interactions.

Ax Fatih Uenal 25d ago

Swiss-Bench 003: Evaluating LLM Reliability and Adversarial Security for Swiss Regulatory Contexts

Swiss-Bench 003 benchmark extending HAAS framework to evaluate LLM reliability and adversarial security in Swiss regulatory and financial contexts.

Ax Antonio D. Villegas-Yeguas, Xavier Abreau-Freire, Guillermo R-Garc\'ia, Andrea Valsecchi, Teresa Pinho, Daniel P\'erez-Mongiovi, Oscar Ib\'a\~nez, Oscar Cord\'on 25d ago

Automatic dental superimposition of 3D intraorals and 2D photographs for human identification

Method for automated dental superimposition comparing 3D intraoral scans and 2D photos for human identification in forensic contexts.

Ax Jungwon Park, Jungmin Ko, Dongnam Byun, Wonjong Rhee 25d ago

Selective Aggregation of Attention Maps Improves Diffusion-Based Visual Interpretation

Technique for improving text-to-image diffusion model interpretability through selective aggregation of cross-attention maps from relevant attention heads.

Ax Mamoona Ghafoor, Tatsuya Akutsu 25d ago

ReLU Networks for Exact Generation of Similar Graphs

Neural network method using ReLU networks for generating graphs constrained by specified graph edit distance for cheminformatics and data augmentation.

Ax Naen Xu, Jiayi Sheng, Changjiang Li, Chunyi Zhou, Yuyuan Li, Tianyu Du, Jun Wang, Zhihui Fu, Jinbao Li, Shouling Ji 25d ago

"I See What You Did There": Can Large Vision-Language Models Understand Multimodal Puns?

Benchmark evaluating vision-language models' ability to understand multimodal puns combining visual and textual elements.

Ax Jingbo Sun, Qichao Zhang, Songjun Tu, Xing Fang, Yupeng Zheng, Haoran Li, Ke Chen, Dongbin Zhao 25d ago

Saliency-Guided Representation with Consistency Policy Learning for Visual Unsupervised Reinforcement Learning

Successor representation method for zero-shot unsupervised RL in visual environments using saliency-guided representations and consistency policy learning.

Ax Kai Yu, Zhenhao Zhou, Junhao Zeng, Ying Wang, Xueying Du, Zhiqiang Yuan, Junwei Liu, Ziyu Zhou, Yujia Wang, Chong Wang, Xin Peng 25d ago

Does Pass Rate Tell the Whole Story? Evaluating Design Constraint Compliance in LLM-based Issue Resolution

Evaluation method for LLM-based issue resolution agents beyond pass rates, assessing compliance with implicit design constraints and architectural conventions.

Ax Nirajan Acharya, Gaurav Kumar Gupta 25d ago

A Formal Security Framework for MCP-Based AI Agents: Threat Taxonomy, Verification Models, and Defense Mechanisms

Formal security framework for MCP-based AI agents, including threat taxonomy, verification models, and defense mechanisms for tool-connected LLM systems.

Ax Xiaojie Gu, Ziying Huang, Weicong Hong, Jian Xie, Renze Lou, Kai Zhang 25d ago

The Model Agreed, But Didn't Learn: Diagnosing Surface Compliance in Large Language Models

Study on surface compliance in LLMs: models agree with knowledge edits but don't internalize changes, affecting reliability of edited parametric memory.

Ax Uloma Okoro, Tammy Mckenzie, Branislav Radeljic 25d ago

Governance and Regulation of Artificial Intelligence in Developing Countries: A Case Study of Nigeria

Qualitative case study examining legal professionals' perceptions on AI governance, regulatory gaps, and institutional readiness in Nigeria.

Ax Gustav Keppler, Moritz Gst\"ur, Veit Hagenmeyer 25d ago

CritBench: A Framework for Evaluating Cybersecurity Capabilities of Large Language Models in IEC 61850 Digital Substation Environments

CritBench: evaluation framework for cybersecurity capabilities of LLM agents in operational technology (OT) environments like IEC 61850 digital substations.

Ax Maria Mahbub, Gregory M. Dams, Josh Arnold, Caitlin Rizy, Sudarshan Srinivasan, Elliot M. Fielstein, Minu A. Aghevli, Kamonica L. Craig, Elizabeth M. Oliva, Joseph Erdos, Jodie Trafton, Ioana Danciu 25d ago

A Multi-Stage Validation Framework for Trustworthy Large-scale Clinical Information Extraction using Large Language Models

Multi-stage validation framework for trustworthy clinical information extraction using LLMs at scale without annotation-intensive reference standards.

Ax Ben Wigler, Maria Tsfasman, Tiffany Matej Hrkalovic 25d ago

Stories of Your Life as Others: A Round-Trip Evaluation of LLM-Generated Life Stories Conditioned on Rich Psychometric Profiles

Evaluation of LLM personality simulation using psychometric profiles and life story generation, comparing model outputs against real human psychological data.

Ax Junbin Zhang, Meng Cao, Feng Tan, Yikai Lin, Yuexian Zou 25d ago

Graph-PiT: Enhancing Structural Coherence in Part-Based Image Synthesis via Graph Priors

Framework using graph priors to improve structural coherence in part-based image synthesis by modeling spatial and semantic relationships.

Ax Juekai Lin, Yun Zhu, Honglin Lin, Sijing Li, Tianwei Lin, Zheng Liu, Xiaoyang Wang, Wenqiao Zhang, Lijun Wu 25d ago

Scientific Graphics Program Synthesis via Dual Self-Consistency Reinforcement Learning

Method using dual self-consistency reinforcement learning to synthesize TikZ graphics code from images, addressing precision challenges in multimodal LLM code generation.

Ax Olexander Mazurets, Olexander Barmak, Leonid Bedratyuk, Iurii Krak 25d ago

LAG-XAI: A Lie-Inspired Affine Geometric Framework for Interpretable Paraphrasing in Transformer Latent Spaces

Framework modeling paraphrasing as affine transformations in transformer embedding spaces to improve interpretability of language model latent spaces.

Ax Changgeon Ko, Jisu Shin, Hoyun Song, Huije Lee, Eui Jun Hwang, Jong C. Park 25d ago

Social Dynamics as Critical Vulnerabilities that Undermine Objective Decision-Making in LLM Collectives

Research on how social dynamics in multi-agent LLM systems (conformity, expertise perception, dominance) undermine objective decision-making by representative agents.

Ax Hamed Jelodar, Samita Bai, Tochukwu Emmanuel Nwankwo, Parisa Hamedi, Mohammad Meymani, Roozbeh Razavi-Far, Ali A. Ghorbani 25d ago

LLM4CodeRE: Generative AI for Code Decompilation Analysis and Reverse Engineering

Research paper LLM4CodeRE uses domain-adapted LLMs for malware decompilation analysis and reverse engineering of obfuscated code.

Ax Hao Chen, Fang Qiu, Fangchao Dong, Defei Yang, Eve Bohnett, Li An 25d ago

Lightweight Multimodal Adaptation of Vision Language Models for Species Recognition and Habitat Context Interpretation in Drone Thermal Imagery

Research paper on lightweight multimodal VLM adaptation for thermal drone imagery species recognition and habitat analysis via projector alignment.

Ax Pranjal Aggarwal, Graham Neubig, Sean Welleck 25d ago

Gym-Anything: Turn any Software into an Agent Environment

Research paper on Gym-Anything, a framework converting any software into agent environments for training computer-use agents on complex, long-horizon tasks.

Ax David Picard, Nicolas Dufour, Lucas Degeorge, Arijit Ghosh, Davide Allegro, Tom Ravaud, Yohann Perron, Corentin Sautier, Zeynep Sonat Baltaci, Fei Meng, Syrine Kalleli, Marta L\'opez-Rauhut, Thibaut Loiseau, S\'egol\`ene Albouy, Raphael Baena, Elliot Vincent, Loic Landrieu 25d ago

PoM: A Linear-Time Replacement for Attention with the Polynomial Mixer

Research paper introducing Polynomial Mixer (PoM), a linear-time token mixing mechanism replacing self-attention in transformers with preserved universality.

Ax Basil Kyriacou, Viktoria Patapovich, Maniraman Periyasamy, Alexey Melnikov 25d ago

Shot-Based Quantum Encoding: A Data-Loading Paradigm for Quantum Neural Networks

Shot-based quantum encoding distributes quantum resources for efficient data loading in quantum neural networks.

Ax Yanis Labrak, David Gr\"unert, S\'everin Baroudi, Jiyun Chun, Pawel Cyrta, Sergio Burdisso, Ahmed Hassoon, David Liu, Adam Rothschild, Reed Van Deusen, Petr Motlicek, Andrew Perrault, Ricard Marxer, Thomas Schaaf 25d ago

Generating Synthetic Doctor-Patient Conversations for Long-form Audio Summarization

Synthetic pipeline generates doctor-patient conversations for training and evaluating long-form audio summarization models.

Ax Andrew Kurtz, Klaudia Krawiecka 25d ago

Who Governs the Machine? A Machine Identity Governance Taxonomy (MIGT) for AI Systems Operating Across Enterprise and Geopolitical Boundaries

MIGT taxonomy addresses governance of machine identities and automated agents in enterprise and geopolitical contexts.

Ax Qimin Zhong, Hao Liao, Haiming Qin, Mingyang Zhou, Rui Mao, Wei Chen, Naipeng Chao 25d ago

Toward Consistent World Models with Multi-Token Prediction and Latent Semantic Enhancement

Analyzes multi-token prediction's gradient inductive bias for developing coherent world models compared to next-token prediction.

Ax Yuchi Wang, Haiyang Yu, Weikang Bian, Jiefeng Long, Xiao Liang, Chao Feng, Hongsheng Li 25d ago

MMEmb-R1: Reasoning-Enhanced Multimodal Embedding with Pair-Aware Selection and Adaptive Control

MMEmb-R1 incorporates chain-of-thought reasoning into multimodal embeddings with pair-aware selection and adaptive control mechanisms.

Ax Zhengming Yu, Li Ma, Mingming He, Leo Isikdogan, Yuancheng Xu, Dmitriy Smirnov, Pablo Salamanca, Dao Mi, Pablo Delgado, Ning Yu, Julien Philip, Xin Li, Wenping Wang, Paul Debevec 25d ago

DiffHDR: Re-Exposing LDR Videos with Video Diffusion Models

Diffusion model approach for converting low dynamic range video to HDR through scene radiance estimation.

Ax Guhao Feng, Shengjie Luo, Kai Hua, Ge Zhang, Di He, Wenhao Huang, Tianle Cai 25d ago

In-Place Test-Time Training

Test-time training method updates LLM fast weights at inference to adapt dynamically to new information streams.

Ax Alaa Saleh, Sasu Tarkoma, Praveen Kumar Donta, Anders Lindgren, Naser Hossein Motlagh, Schahram Dustdar, Susanna Pirttikangas, Lauri Lov\'en 25d ago

UserCentrix: An Agentic Memory-augmented AI Framework for Smart Spaces

UserCentrix is a hybrid agentic orchestration framework for smart spaces combining memory augmentation with multi-agent coordination.

Ax Tianyu Liu, Simeng Han, Hanchen Wang, Xiao Luo, Pan Lu, Biqing Zhu, Yuge Wang, Keyi Li, Jiapeng Chen, Rihao Qu, Yufeng Liu, Xinyue Cui, Aviv Yaish, Yuhang Chen, Minsheng Hao, Chuhan Li, Kexing Li, Yinsheng Lu, Xinyu Wei, Qinzhe Xing, Antonia Panescu, Mengbo Wang, Vibha Annaswamy, Alicia Sanchez, Jack Cloherty, Arman Cohan, Hua Xu, Mark Gerstein, James Zou, Hongyu Zhao 25d ago

Advancing AI Research Assistants with Expert-Involved Learning

ARIEL framework pairs expert-vetted biomedical tasks with LLMs for evaluation and optimization of AI research assistants.

Ax Bohan Tang, Dezhao Luo, Jianheng Liu, Jingxuan Chen, Shaogang Gong, Jianye Hao, Jun Wang, Kun Shao 25d ago

Beyond Syntax: Action Semantics Learning for App Agents

Fine-tunes open-source LLMs for smartphone app control by learning action semantics rather than syntax, reducing API costs.

Ax Michael Grosskopf, Nathan Debardeleben, Russell Bent, Rahul Somasundaram, Isaac Michaud, Arthur Lui, Alexius Wadell, Warren D. Graham, Golo A Wimmer, Sachin Shivakumar, Joan Vendrell Gallart, Harsha Nagarajan, Earl Lawrence 25d ago

URSA: The Universal Research and Scientific Agent

URSA framework enables LLMs to conduct autonomous research through complex reasoning, planning, coding, and multi-agent collaboration.

Ax Andrew Sellergren, Sahar Kazemzadeh, Tiam Jaroensri, Atilla Kiraly, Madeleine Traverse, Timo Kohlberger, Shawn Xu, Fayaz Jamil, C\'ian Hughes, Charles Lau, Justin Chen, Fereshteh Mahvar, Liron Yatziv, Tiffany Chen, Bram Sterling, Stefanie Anna Baby, Susanna Maria Baby, Jeremy Lai, Samuel Schmidgall, Lu Yang, Kejia Chen, Per Bjornsson, Shashir Reddy, Ryan Brush, Kenneth Philbrick, Mercy Asiedu, Ines Mezerreg, Howard Hu, Howard Yang, Richa Tiwari, Sunny Jansen, Preeti Singh, Yun Liu, Shekoofeh Azizi, Aishwarya Kamath, Johan Ferret, Shreya Pathak, Nino Vieillard, Ramona Merhej, Sarah Perrin, Tatiana Matejovicova, Alexandre Ram\'e, Morgane Riviere, Louis Rouillard, Thomas Mesnard, Geoffrey Cideron, Jean-bastien Grill, Sabela Ramos, Edouard Yvinec, Michelle Casbon, Elena Buchatskaya, Jean-Baptiste Alayrac, Dmitry Lepikhin, Vlad Feinberg, Sebastian Borgeaud, Alek Andreev, Cassidy Hardin, Robert Dadashi, L\'eonard Hussenot, Armand Joulin, Olivier Bachem, Yossi Matias, Katherine Chou, Avinatan Hassidim, Kavi Goel, Clement Farabet, Joelle Barral, Tris Warkentin, Jonathon Shlens, David Fleet, Victor Cotruta, Omar Sanseviero, Gus Martins, Phoebe Kirk, Anand Rao, Shravya Shetty, David F. Steiner, Can Kirmizibayrak, Rory Pilgrim, Daniel Golden, Lin Yang 25d ago