arXivDaily每日学术速递，同步arXiv全量数据，AI总结、翻译，覆盖人工智能、机器人、计算机、金融、统计学、数学、物理学、生物学、经济学、电气&系统等方向。

2605.00401 2026-05-04 cs.CV q-bio.NC

SIMON: Saliency-aware Integrative Multi-view Object-centric Neural Decoding

YuSheng Lin, Ji-Hwa Tsai, Chun-Shu Wei

详情

英文摘要

Recent EEG-to-image retrieval methods leverage pretrained vision encoders and foveation-inspired priors, but typically assume a fixed, center-focused view. This center bias conflicts with content-driven human attention, creating a geometric-semantic dissociation between visual features and EEG responses. We propose SIMON, a saliency-aware multi-view framework for zero-shot EEG-to-image retrieval. SIMON combines foreground segmentation and saliency prediction to select fixation centers via Saliency-Aware Sampling (SAS), then generates foveated views that emphasize informative object regions while suppressing background clutter. On THINGS-EEG, SIMON achieves state-of-the-art performance in both intra-subject and inter-subject settings, reaching an average Top-1 accuracy of 69.7% and 19.6%, respectively, consistently outperforming recent competitive baselines. Analyses across sampling granularity, EEG channel topology, and visual/brain encoder backbones further support the robustness of saliency-aware multi-view integration. Our code and models are publicly available at https://github.com/simonlink666/SIMON.

URL PDF HTML ☆

赞 0 踩 0

2605.00398 2026-05-04 cs.LG physics.ao-ph stat.ML

M-CaStLe: Uncovering Local Causal Structures in Multivariate Space-Time Gridded Data

J. Jake Nichol, Michael Weylandt, G. Matthew Fricke, Jhayron Perez-Carrasquilla, Melanie E. Moses

Comments 19 pages and 6 figures in the main text; 33 pages and 11 figures total

2605.00397 2026-05-04 cs.RO

MiniVLA-Nav v1: A Multi-Scene Simulation Dataset for Language-Conditioned Robot Navigation

Ali Al-Bustami, Jaerock Kwon

Comments 9 pages, 12 figures, 7 tables. Dataset paper

2605.00393 2026-05-04 cs.LG

Model-Based Reinforcement Learning with Double Oracle Efficiency in Policy Optimization and Offline Estimation

Haichen Hu, Jian Qian, David Simchi-Levi

2605.00390 2026-05-04 cs.LG

Towards Robust and Scalable Density-based Clustering via Graph Propagation

Yingtao Zheng, Hugo Phibbs, Ninh Pham

Comments arXiv admin note: substantial text overlap with arXiv:2508.02989

2605.00385 2026-05-04 cs.LG

PILIR: Physics-Informed Local Implicit Representation

Jianfeng Li, Feng Wang, Ke Tang

2605.00384 2026-05-04 cs.RO

PrefMoE: Robust Preference Modeling with Mixture-of-Experts Reward Learning

Ziqin Yuan, Ruiqi Wang, Dezhong Zhao, Baijian Yang, Byung-Cheol Min

Comments IROS 2026

2605.00383 2026-05-04 cs.CL

Agentic AI for Substance Use Education: Integrating Regulatory and Scientific Knowledge Sources

Kosar Haghani, Zahra Kolagar, Mohammed Atiquzzaman

Comments 22 pages, 6 figures, 2 tables

2605.00374 2026-05-04 cs.LG

Advancing Edge Classification through High-Dimensional Causal Modeling of Node-Edge Interplay

Duanyu Feng, Li Ding, Hongru Liang, Wenqiang Lei

2605.00373 2026-05-04 cs.CL

Language-free Experience at Expo 2025 Osaka

Michael Paul, Kenji Imamura, Xiaolin Wang, Shohei Higashiyama, Masao Utiyama

2605.00371 2026-05-04 cs.SD cs.AI

GaMMA: Towards Joint Global-Temporal Music Understanding in Large Multimodal Models

Zuyao You, Zhesong Yu, Mingyu Liu, Bilei Zhu, Yuan Wan, Zuxuan Wu

2605.00367 2026-05-04 cs.CV

Flow matching for Sentinel-2 super-resolution: implementation, application, and implications

Dakota Hester, Vitor S. Martins, Lucas B. Ferreira, Thainara M. A. Lima, Juliana A. Araújo

Comments 41 pages, 16 figures, 7 tables. Submitted in ISPRS Open Journal of Photogrammetry and Remote Sensing

2605.00365 2026-05-04 cs.LG cs.CL stat.ML

Uniform-Correct Policy Optimization: Breaking RLVR's Indifference to Diversity

Anamika Lochab, Bolian Li, Ruqi Zhang

2605.00364 2026-05-04 cs.CL

Unlearning What Matters: Token-Level Attribution for Precise Language Model Unlearning

Jiawei Wu, DouDou Zhou

Comments 17 pages, 2 figures

2605.00362 2026-05-04 cs.CV

Time-series Meets Complex Motion Modeling: Robust and Computational-effective Motion Predictor for Multi-object Tracking

Nhat-Tan Do, Le-Huy Tu, Nhi Ngoc-Yen Nguyen, Dieu-Phuong Nguyen, Trong-Hop Do

2605.00360 2026-05-04 cs.LG stat.ME

Binomial flows: Denoising and flow matching for discrete ordinal data

Yair Shenfeld, Ricardo Baptista, Stefano Peluchetti

Comments 41 pages, 9 figures

2605.00356 2026-05-04 cs.CL cs.AI

MemRouter: Memory-as-Embedding Routing for Long-Term Conversational Agents

Tianyu Hu, Weikai Lin, Weizhi Zhang, Jing Ma, Song Wang

2605.00354 2026-05-04 cs.LG cs.AI

VQ-SAD: Vector Quantized Structure Aware Diffusion For Molecule Generation

Farshad Noravesh, Reza Haffari, Layki Soon, Arghya Pal

Comments 17 pages

2605.00351 2026-05-04 cs.LG cs.AI

Hypergraph and Latent ODE Learning for Multimodal Root Cause Localization in Microservices

Xin Liu, Yuhang He, Sichen Zhao, Kejian Tong, Xingyu Zhang

2605.00350 2026-05-04 cs.CV

CURE-OOD: Benchmarking Out-of-Distribution Detection for Survival Prediction

Wenjie Zhao, Jia Li, Mingrui Liu, Jing Wang, Yunhui Guo

2605.00347 2026-05-04 cs.LG cs.AI cs.CL

Odysseus: Scaling VLMs to 100+ Turn Decision-Making in Games via Reinforcement Learning

Chengshuai Shi, Wenzhe Li, Xinran Liang, Yizhou Lu, Wenjia Yang, Ruirong Feng, Seth Karten, Ziran Yang, Zihan Ding, Gabriel Sarch, Danqi Chen, Karthik Narasimhan, Chi Jin

2605.00345 2026-05-04 cs.CV

Pose-Aware Diffusion for 3D Generation

Zihan Zhou, Luxi Chen, Jingzhi Zhou, Yuhao Wan, Min Zhao, Baoyu Fan, Chongxuan Li

2605.00342 2026-05-04 cs.CL

Making Every Verified Token Count: Adaptive Verification for MoE Speculative Decoding

Lehan Pan, Ziyang Tao, Ruoyu Pang, Xiao Wang, Jianjun Zhao, Yanyong Zhang

2605.00337 2026-05-04 cs.LG

Free Energy Surface Sampling via Reduced Flow Matching

Zichen Liu, Tiejun Li

2605.00336 2026-05-04 cs.CL cs.AI

Budget-Aware Routing for Long Clinical Text

Khizar Qureshi, Geoffrey Martin, Yifan Peng

2605.00334 2026-05-04 cs.AI cs.CL

AgentFloor: How Far Up the tool use Ladder Can Small Open-Weight Models Go?

Ranit Karmakar, Jayita Chatterjee

2605.00330 2026-05-04 cs.LG

Conformalized Quantum DeepONet Ensembles for Scalable Operator Learning with Distribution-Free Uncertainty

Purav Matlia, Christian Moya, Guang Lin

2605.00329 2026-05-04 cs.SD eess.AS

Fast Text-to-Audio Generation with One-Step Sampling via Energy-Scoring and Auxiliary Contextual Representation Distillation

Kuan-Po Huang, Bo-Ru Lu, Byeonggeun Kim, Mihee Lee, Zalan Fabian, Renard Korzeniowski, Qingming Tang, Greg Ver Steeg, Hung-yi Lee, Chieh-Chi Kao, Chao Wang

2605.00326 2026-05-04 cs.CL cs.CV

Prompt-Induced Score Variance in Zero-Shot Binary Vision-Language Safety Classification

Charles Weng, Dingwen Li, Alexander Martin

Comments Preprint. 19 pages, 5 figures

2605.00323 2026-05-04 cs.CV cs.LG

Online Self-Calibration Against Hallucination in Vision-Language Models

Minghui Chen, Chenxu Yang, Hengjie Zhu, Dayan Wu, Zheng Lin, Qingyi Si

Comments IJCAI 2026