Isolater - Feed

Ax Tomer Krichli, Bhiksha Raj, Joseph Keshet 27d ago

WhisperRT -- Turning Whisper into a Causal Streaming Model

Modification of Whisper ASR model to enable low-latency streaming transcription through architectural and training changes.

Ax Yifu Yuan, Haiqin Cui, Yaoting Huang, Yibin Chen, Fei Ni, Zibin Dong, Pengyi Li, Yan Zheng, Hongyao Tang, Jianye Hao 27d ago

Embodied-R1: Reinforced Embodied Reasoning for General Robotic Manipulation

Vision-language model for robotic manipulation using embodiment-agnostic pointing representation to address generalization in embodied AI.

Ax Wangsong Yin, Daliang Xu, Mengwei Xu, Gang Huang, Xuanzhe Liu 27d ago

ShadowNPU: System and Algorithm Co-design for NPU-Centric On-Device LLM Inference

System co-design for efficient on-device LLM inference on NPU hardware, optimizing attention operations for privacy-preserving deployment.

Ax Xinwen Liu, Lei Qian, Song Xi Chen, Niansheng Tang 27d ago

Partially Functional Dynamic Backdoor Diffusion-based Causal Model

Diffusion-based causal inference method for spatio-temporal data with unmeasured confounders and multi-resolution observations.

Ax Ivan Lau, Jonathan Scarlett 27d ago

Sequential 1-bit Mean Estimation with Near-Optimal Sample Complexity

Theoretical work on distributed mean estimation with 1-bit communication constraints using interval queries, achieving near-optimal sample complexity.

Ax Vincent Nguyen, Guilherme Herzog, Jos\'e Cambronero, Marcus Revaj, Aditya Kini, Alexander Fr\"ommgen, Maxim Tabachnyk 27d ago

Smart Paste: Automatically Fixing Copy/Paste for Google Developers

Google developer tool using deep learning to automatically fix copy/paste code, predicting required edits from formatting to cross-language translation.

Ax Sicheng Lyu, Yu Gu, Xinyu Wang, Jerry Huang, Sitao Luan, Yufei Cui, Xiao-Wen Chang, Peng Lu 27d ago

EvoEdit: Evolving Null-space Alignment for Robust and Efficient Knowledge Editing

Knowledge editing method for LLMs enabling sequential updates through null-space alignment, improving robustness in continual model editing scenarios.

Ax Chun Chet Ng, Zhen Hao Chu, Jia Yu Lim, Yin Yin Boon, Wei Zeng Low, Jin Khye Tan 27d ago

AI-BAAM: AI-Driven Bank Statement Analytics as Alternative Data for Malaysian MSME Credit Scoring

AI system for credit scoring of Malaysian MSMEs using bank statement data as alternative to traditional credit bureau data.

Ax Pankaj K Mishra, Sanni Laaksonen, Jochen Kamm, Anand Singh 27d ago

Three-dimensional inversion of gravity data using implicit neural representations and scientific machine learning

Scientific machine learning approach using implicit neural representations for 3D gravity inversion, modeling subsurface density as continuous field.

Ax Hashem Omrani, Raha Imanirad, Adam Diamant, Utkarsh Verma, Amol Verma, Fahad Razak 27d ago

Endogenous Aggregation of Multiple Data Envelopment Analysis Scores for Large Data Sets

Data envelopment analysis method for dynamic efficiency evaluation across multiple organizational dimensions with regularization for large-scale settings.

Ax Anubhab Ghosh, Yonina C. Eldar, Saikat Chatterjee 27d ago

pDANSE: Particle-based Data-driven Nonlinear State Estimation from Nonlinear Measurements

Data-driven nonlinear state estimation method for model-free processes using RNNs with noisy nonlinear measurements.

Ax Ilyass Moummad, Kawtar Zaher, Herv\'e Go\"eau, Alexis Joly 27d ago

Image Hashing via Cross-View Code Alignment in the Age of Foundation Models

Image hashing method using foundation models for efficient large-scale retrieval with compact binary codes instead of high-dimensional embeddings.

Ax Saeedeh Javadi, Sara Mirabi, Manan Gangar, Bahadorreza Ofoghi 27d ago

Contradictions in Context: Challenges for Retrieval-Augmented Generation in Healthcare

Study of RAG limitations in healthcare domain, showing how retrieval-augmented generation fails when source documents contain contradictory or outdated information.

Ax Md Tanvirul Alam, Saksham Aggarwal, Justin Yang Chae, Nidhi Rastogi 27d ago

SPHINX: A Synthetic Environment for Visual Perception and Reasoning

Sphinx synthetic environment for visual perception and reasoning with procedurally generated puzzles covering 25 task types, enabling precise evaluation and large-scale dataset construction.

Ax Ivan Yee Lee, Cheng Yang, Taylor Berg-Kirkpatrick 27d ago

Optical Context Compression Is Just (Bad) Autoencoding

Analysis showing optical context compression via vision tokens is functionally equivalent to lossy autoencoding, questioning effectiveness of DeepSeek-OCR's compression pipeline.

Ax Leijie Wang, Otilia Stretcu, Wei Qiao, Thomas Denby, Krishnamurthy Viswanathan, Enming Luo, Chun-Ta Lu, Tushar Dogra, Ranjay Krishna, Ariel Fuxman 27d ago

Agile Deliberation: Concept Deliberation for Subjective Visual Classification

Human-in-the-loop approach for visual classification through iterative concept deliberation, addressing subjective vision tasks in content moderation and curation.

Ax Benjamin C. Koenig, Sili Deng 27d ago

Learning continuous state of charge dependent thermal decomposition kinetics for Li-ion cathodes using Kolmogorov-Arnold Chemical Reaction Neural Networks (KA-CRNNs)

Application of Kolmogorov-Arnold neural networks to model thermal decomposition kinetics in lithium-ion batteries with state-of-charge dependence.

Ax Benyamin Hosseiny, Kamirul Kamirul, Odysseas Pappas, Alin Achim 27d ago

NASTaR: NovaSAR Automated Ship Target Recognition Dataset

Synthetic Aperture Radar dataset for ship type classification using deep learning models, focused on maritime activity monitoring.

Ax Rahul Baxi 27d ago

The Drill-Down and Fabricate Test (DDFT): A Protocol for Measuring Epistemic Robustness in Language Models

DDFT protocol measures epistemic robustness of language models under stress conditions, distinguishing knowledge gaps from verification mechanism failures beyond static benchmarks.

Ax Binxu Wang, Jingxuan Fan, Xu Pan 27d ago

Circuit Mechanisms for Spatial Relation Generation in Diffusion Transformers

Mechanistic interpretability study of how Diffusion Transformers generate correct spatial relations in text-to-image generation.

Ax Mayank Sharma, Roy Pea, Hari Subramonyam 27d ago

ConvoLearn: A Dataset for Fine-Tuning Dialogic AI Tutors

ConvoLearn dataset of 2,134 tutor-student dialogues for fine-tuning dialogue-based AI tutors grounded in knowledge-building theory.

Ax Viacheslav Sydora, Guner Dilsad Er, Michael Muehlebach 27d ago

Teaching Machine Learning Fundamentals with LEGO Robotics

Open-source educational platform teaching ML fundamentals to students aged 12-17 using LEGO robotics.

Ax Ellen Xiaoqing Tan, Jack Lanchantin, Shehzaad Dhuliawala, Danwei Li, Thao Nguyen, Jing Xu, Ping Yu, Ilia Kulikov, Sainbayar Sukhbaatar, Jason Weston, Xian Li, Olga Golovneva 27d ago

Self-Improving Pretraining: using post-trained models to pretrain better models

Pretraining approach using post-trained models to incorporate reasoning and safety behaviors earlier in LLM development.

Ax Zixuan Xia, Hao Wang, Pengcheng Weng, Yanyu Qian, Yangxin Xu, William Dan, Fei Wang 27d ago

Improving Multimodal Learning with Dispersive and Anchoring Regularization

Regularization techniques for improving multimodal representation learning by addressing collapse and inconsistency issues.

Ax Henri A\"idasso, Francis Bordeleau, Ali Tizghadam 27d ago

Predicting Intermittent Job Failure Categories for Diagnosis Using Few-Shot Fine-Tuned Language Models

Few-shot fine-tuned language models for diagnosing intermittent CI pipeline failures in software development.

Ax Ilyass Moummad, Marius Miron, David Robinson, Kawtar Zaher, Herv\'e Go\"eau, Olivier Pietquin, Pierre Bonnet, Emmanuel Chemla, Matthieu Geist, Alexis Joly 27d ago

Compact Hypercube Embeddings for Fast Text-based Wildlife Observation Retrieval

Compact embeddings for fast text-based wildlife observation retrieval from large biodiversity archives.

Ax Ilyass Moummad, Marius Miron, Lukas Rauch, David Robinson, Alexis Joly, Olivier Pietquin, Emmanuel Chemla, Matthieu Geist 27d ago

Audio-to-Image Bird Species Retrieval without Audio-Image Pairs via Text Distillation

Cross-modal learning for bird species recognition using audio-to-image retrieval without paired training data.

Ax Qian Wang, Xuandong Zhao, Zirui Zhang, Zhanzhi Lou, Nuo Chen, Dawn Song, Bingsheng He 27d ago

Making Bias Non-Predictive: Training Robust LLM Reasoning via Reinforcement Learning

Training LLMs to resist cognitive biases in reasoning via reinforcement learning rather than prompting.

Ax Chenyu Yang, Denis Tarasov, Davide Liconti, Hehui Zheng, Robert K. Katzschmann 27d ago

SERNF: Sample-Efficient Real-World Dexterous Policy Fine-Tuning via Action-Chunked Critics and Normalizing Flows

Dexterous robotic manipulation policy fine-tuning using diffusion models and normalizing flows for real-world scenarios.

Ax William Lugoloobi, Thomas Foster, William Bankes, Chris Russell 27d ago

LLMs Encode Their Failures: Predicting Success from Pre-Generation Activations

Research on predicting LLM success from internal pre-generation activations to optimize inference efficiency in reasoning tasks.

Ax Bowen Liu, Zhi Wu, Runquan Xie, Zhanhui Kang, Jia Li 27d ago

Scaling the Scaling Logic: Agentic Meta-Synthesis of Logic Reasoning

SSLogic agentic meta-synthesis framework where LLM agents iteratively generate and refine task specifications for logic reasoning.

Ax Camile Lendering, Erkut Akdag, Egor Bondarev 27d ago

SubspaceAD: Training-Free Few-Shot Anomaly Detection via Subspace Modeling

Training-free few-shot anomaly detection using subspace modeling of vision foundation model features.

Ax A. M. A. S. D. Alagiyawanna, Asoka Karunananda 27d ago

Noise Models Impacts and Mitigation Strategies in Photonic Quantum Machine Learning

Analysis of noise models and mitigation strategies in photonic quantum machine learning systems.

Ax Houston Haynes 27d ago

Adaptive Domain Models: Bayesian Evolution, Warm Rotation, and Principled Training for Geometric and Neuromorphic AI

Training framework for geometric and neuromorphic AI using alternative arithmetic substrates.

Ax Rong Fu, Jiekai Wu, Haiyun Wei, Xiaowen Ma, Shiyin Lin, Kangan Qian, Chuang Liu, Jianyuan Ni, Simon James Fong 27d ago

SwiftGS: Episodic Priors for Immediate Satellite Surface Recovery

SwiftGS system for rapid 3D satellite surface reconstruction via meta-learned Gaussian primitives.

Ax Abdul Rahman 27d ago

CSTS: A Canonical Security Telemetry Substrate for AI-Native Cyber Detection

Canonical Security Telemetry Substrate for standardizing cybersecurity data formats for AI-driven detection.

Ax Ousmane Tom Bechir, Ad\'an Jos\'e-Garc\'ia, Zaineb Chelly Garcia, Vincent Sobanski, Clarisse Dhaenens 27d ago

A Firefly Algorithm for Mixed-Variable Optimization Based on Hybrid Distance Modeling

Firefly algorithm adaptation for mixed-variable optimization problems.

Ax German Sh\^ama Wache, Chaithya G R, Asma Tanabene, Sebastian Neumayer 27d ago

Weakly Convex Ridge Regularization for 3D Non-Cartesian MRI Reconstruction

Weakly convex ridge regularizer for 3D non-Cartesian MRI reconstruction.

Ax Michael Bidollahkhani, Freja Nordsiek, Julian M. Kunkel 27d ago

When GPUs Fail Quietly: Observability-Aware Early Warning Beyond Numeric Telemetry

Early warning system for GPU hardware failures using structural observability beyond numeric telemetry.

Ax Haiyue Song, Masao Utiyama 27d ago

OptiMer: Optimal Distribution Vector Merging Is Better than Data Mixing for Continual Pre-Training

OptiMer framework for optimizing data mixture ratios during continual LLM pre-training without manual tuning.

Ax Chang Sun, Rui Shi, Tsukasa Koike, Tetsuro Sekine, Akio Morita, Tetsuya Sakai 27d ago

Segmentation of Gray Matters and White Matters from Brain MRI data

Brain tissue segmentation from MRI using deep learning and foundation models.

Ax Hillary Mutisya, John Mugane, Gavin Nyamboga, Brian Chege, Maryruth Gathoni 27d ago

The Thiomi Dataset: A Large-Scale Multimodal Corpus for Low-Resource African Languages

Multimodal dataset of 601k text annotations and 385k audio recordings across 10 African languages.

Ax Kavindu Herath, Joshua Zhao, Saurabh Bagchi 27d ago

Beyond Corner Patches: Semantics-Aware Backdoor Attack in Federated Learning

Realistic backdoor attack methods for federated learning using semantically meaningful triggers.

Ax Dan Oprisa, Peter Toth 27d ago

Metriplector: From Field Theory to Neural Architecture

Novel neural architecture primitive based on field theory and metriplectic dynamics.

Ax Jack Young 27d ago

S0 Tuning: Zero-Overhead Adaptation of Hybrid Recurrent-Attention Models

S0 tuning method for efficient LLM adaptation via state matrix optimization, outperforming LoRA on code generation tasks.

Ax Jinsu Shin, Sungeun Hong, JinYeong Bak 27d ago

CASHG: Context-Aware Stylized Online Handwriting Generation

Neural architecture for generating online handwriting with stroke continuity and stylistic consistency.

HN latchkey 27d ago

Milla-jovovich/mempalace: The highest-scoring AI memory system ever benchmarked

Stub article about mempalace AI memory system benchmark.

HN alexchen_dev 27d ago

OpenClaw Plugin for Claude Code CLI – Persistent Worker Pool with Smart OAuth

OpenClaw provider plugin routes LLM requests through Claude Code CLI with persistent worker pool and OAuth, enabling Claude Pro/Max access without API credentials.

HN allgrips 28d ago

AI workout plan generator for Indian personal trainers (coachiq.in)

LLM-based workout plan generator for personal trainers in India with WhatsApp integration and exercise library.

HN asamassekou 28d ago

Memory poisoning in AI coding agents

Ship Safe v7.0.0: AI-powered security platform running 19 specialized agents to scan code for vulnerabilities including LLM/agentic AI security risks.