arXivDaily每日学术速递，同步arXiv全量数据，AI总结、翻译，覆盖人工智能、机器人、计算机、金融、统计学、数学、物理学、生物学、经济学、电气&系统等方向。

2603.12721 2026-03-16 cs.CV cs.AI

CMHANet: A Cross-Modal Hybrid Attention Network for Point Cloud Registration

Dongxu Zhang, Yingsen Wang, Yiding Sun, Haoran Xu, Peilin Fan, Jihua Zhu

详情

英文摘要

Robust point cloud registration is a fundamental task in 3D computer vision and geometric deep learning, essential for applications such as large-scale 3D reconstruction, augmented reality, and scene understanding. However, the performance of established learning-based methods often degrades in complex, real world scenarios characterized by incomplete data, sensor noise, and low overlap regions. To address these limitations, we propose CMHANet, a novel Cross-Modal Hybrid Attention Network. Our method integrates the fusion of rich contextual information from 2D images with the geometric detail of 3D point clouds, yielding a comprehensive and resilient feature representation. Furthermore, we introduce an innovative optimization function based on contrastive learning, which enforces geometric consistency and significantly improves the model's robustness to noise and partial observations. We evaluated CMHANet on the 3DMatch and the challenging 3DLoMatch datasets. \rev{Additionally, zero-shot evaluations on the TUM RGB-D SLAM dataset verify the model's generalization capability to unseen domains.} The experimental results demonstrate that our method achieves substantial improvements in both registration accuracy and overall robustness, outperforming current techniques. We also release our code in \href{https://github.com/DongXu-Zhang/CMHANet}{https://github.com/DongXu-Zhang/CMHANet}.

URL PDF HTML ☆

赞 0 踩 0

2603.12719 2026-03-16 cs.CV cs.AI

IGASA: Integrated Geometry-Aware and Skip-Attention Modules for Enhanced Point Cloud Registration

Dongxu Zhang, Jihua Zhu, Shiqi Li, Wenbiao Yan, Haoran Xu, Peilin Fan, Huimin Lu

2603.12717 2026-03-16 cs.RO cs.AI cs.LG

Altered Thoughts, Altered Actions: Probing Chain-of-Thought Vulnerabilities in VLA Robotic Manipulation

Tuan Duong Trinh, Naveed Akhtar, Basim Azam

2603.12716 2026-03-16 cs.CV cs.LG eess.IV

UNIStainNet: Foundation-Model-Guided Virtual Staining of H&E to IHC

Jillur Rahman Saurav, Thuong Le Hoai Pham, Pritam Mukherjee, Paul Yi, Brent A. Orr, Jacob M. Luber

2603.12710 2026-03-16 cs.AI cs.CL

AI Planning Framework for LLM-Based Web Agents

Orit Shahnovsky, Rotem Dror

2603.12708 2026-03-16 cs.CV

HFP-SAM: Hierarchical Frequency Prompted SAM for Efficient Marine Animal Segmentation

Pingping Zhang, Tianyu Yan, Yuhao Wang, Yang Liu, Tongdan Tang, Yili Ma, Long Lv, Feng Tian, Weibing Sun, and Huchuan Lu

Comments Accepted by TIP2026. More modifications may be performed

2603.12707 2026-03-16 cs.LG cs.AI cs.DC

Cost-Efficient Multimodal LLM Inference via Cross-Tier GPU Heterogeneity

Donglin Yu

2603.12698 2026-03-16 cs.CL

EvolveCoder: Evolving Test Cases via Adversarial Verification for Code Reinforcement Learning

Chi Ruan, Dongfu Jiang, Huaye Zeng, Ping Nie, Wenhu Chen

2603.12694 2026-03-16 cs.LG q-bio.QM

RXNRECer Enables Fine-grained Enzymatic Function Annotation through Active Learning and Protein Language Models

Zhenkun Shi, Jun Zhu, Dehang Wang, BoYu Chen, Qianqian Yuan, Zhitao Mao, Fan Wei, Weining Wu, Xiaoping Liao, Hongwu Ma

2603.12693 2026-03-16 cs.CV cs.AI

HSEmotion Team at ABAW-10 Competition: Facial Expression Recognition, Valence-Arousal Estimation, Action Unit Detection and Fine-Grained Violence Classification

Andrey V. Savchenko, Kseniia Tsypliakova

Comments to be submitted to ABAW-10 workshop of CVPR 2026

2603.12690 2026-03-16 cs.CV

CM-Bench: A Comprehensive Cross-Modal Feature Matching Benchmark Bridging Visible and Infrared Images

Liangzheng Sun, Mengfan He, Xingyu Shao, Binbin Li, Zhiqiang Yan, Chunyu Li, Ziyang Meng, Fei Xing

2603.12688 2026-03-16 cs.CV cs.LG

STRAP-ViT: Segregated Tokens with Randomized -- Transformations for Defense against Adversarial Patches in ViTs

Nandish Chattopadhyay, Anadi Goyal, Chandan Karfa, Anupam Chattopadhyay

Comments Accepted for publication at IEEE/ACM Design Automation Conference (DAC) 2026

2603.12686 2026-03-16 cs.RO

Learning Athletic Humanoid Tennis Skills from Imperfect Human Motion Data

Zhikai Zhang, Haofei Lu, Yunrui Lian, Ziqing Chen, Yun Liu, Chenghuai Lin, Han Xue, Zicheng Zeng, Zekun Qi, Shaolin Zheng, Qing Luan, Jingbo Wang, Junliang Xing, He Wang, Li Yi

2603.12685 2026-03-16 cs.CV

RSONet: Region-guided Selective Optimization Network for RGB-T Salient Object Detection

Bin Wan, Runmin Cong, Xiaofei Zhou, Hao Fang, Chengtao Lv, Sam Kwong

2603.12684 2026-03-16 cs.LG cs.AI cs.DC

Federated Hierarchical Clustering with Automatic Selection of Optimal Cluster Numbers

Yue Zhang, Chuanlong Qiu, Xinfa Liao, Yiqun Zhang

Comments 29 pages, 7 figures

2603.12669 2026-03-16 cs.CV cs.LG

Vision Verification Enhanced Fusion of VLMs for Efficient Visual Reasoning

Selim Furkan Tekin, Yichang Xu, Gaowen Liu, Ramana Rao Kompella, Margaret L. Loper, Ling Liu

2603.12667 2026-03-16 cs.CV cs.AI eess.IV

Marker-Based 3D Reconstruction of Aggregates with a Comparative Analysis of 2D and 3D Morphologies

Haohang Huang, Jiayi Luo, Issam Qamhia, Erol Tutumluer, John M. Hart, Andrew J. Stolba

2603.12663 2026-03-16 cs.CV cs.RO

Learning Geometric and Photometric Features from Panoramic LiDAR Scans for Outdoor Place Categorization

Kazuto Nakashima, Hojung Jung, Yuki Oto, Yumi Iwashita, Ryo Kurazume, Oscar Martinez Mozos

Comments Published in Advanced Robotics on 31 Jul 2018

2603.12659 2026-03-16 cs.CV

AVION: Aerial Vision-Language Instruction from Offline Teacher to Prompt-Tuned Network

Yu Hu, Jianyang Gu, Hao Liu, Yue Cao, Jozsef Hamari, Zheng Liu, Mohsen Zardadi

Comments Accepted to CVPR 2026

2603.12658 2026-03-16 cs.CL cs.AI

Continual Learning in Large Language Models: Methods, Challenges, and Opportunities

Hongyang Chen, Zhongwu Sun, Hongfei Ye, Kunchi Li, Xuemin Lin

2603.12657 2026-03-16 cs.CV

VFM-Recon: Unlocking Cross-Domain Scene-Level Neural Reconstruction with Scale-Aligned Foundation Priors

Yuhang Ming, Tingkang Xi, Xingrui Yang, Lixin Yang, Yong Peng, Cewu Lu, Wanzeng Kong

Comments 19 pages, 5 figures, 4 tables

2603.12655 2026-03-16 cs.CV

VGGT-World: Transforming VGGT into an Autoregressive Geometry World Model

Xiangyu Sun, Shijie Wang, Fengyi Zhang, Lin Liu, Caiyan Jia, Ziying Song, Zi Huang, Yadan Luo

2603.12652 2026-03-16 cs.LG

Sobolev--Ricci Curvature

Kyoichi Iwasaki, Tam Le, Hideitsu Hino

Comments 42 pages, 13 figures

2603.12649 2026-03-16 cs.RO

Autonomous Integration and Improvement of Robotic Assembly using Skill Graph Representations

Peiqi Yu, Philip Huang, Chaitanya Chawla, Guanya Shi, Jiaoyang Li, Changliu Liu

2603.12648 2026-03-16 cs.CV

From Sparse to Dense: Multi-View GRPO for Flow Models via Augmented Condition Space

Jiazi Bu, Pengyang Ling, Yujie Zhou, Yibin Wang, Yuhang Zang, Tianyi Wei, Xiaohang Zhan, Jiaqi Wang, Tong Wu, Xingang Pan, Dahua Lin

2603.12646 2026-03-16 cs.CL

98$\times$ Faster LLM Routing Without a Dedicated GPU: Flash Attention, Prompt Compression, and Near-Streaming for the vLLM Semantic Router

Xunzhuo Liu, Bowei He, Xue Liu, Andy Luo, Haichen Zhang, Huamin Chen

2603.12645 2026-03-16 cs.LG cs.AI

LightMoE: Reducing Mixture-of-Experts Redundancy through Expert Replacing

Jiawei Hao, Zhiwei Hao, Jianyuan Guo, Li Shen, Yong Luo, Han Hu, Dan Zeng

2603.12638 2026-03-16 cs.CL cs.HC

Using a Human-AI Teaming Approach to Create and Curate Scientific Datasets with the SCILIRE System

Necva Bölücü, Jessica Irons, Changhyun Lee, Brian Jin, Maciej Rybinski, Huichen Yang, Andreas Duenser, Stephen Wan

Comments 17pages, 9 figures, EACL demo track

2603.12635 2026-03-16 cs.LG nlin.CD physics.flu-dyn

Adaptive Diffusion Posterior Sampling for Data and Model Fusion of Complex Nonlinear Dynamical Systems

Dibyajyoti Chakraborty, Hojin Kim, Romit Maulik

2603.12634 2026-03-16 cs.LG cs.AI

Spend Less, Reason Better: Budget-Aware Value Tree Search for LLM Agents

Yushu Li, Wenlong Deng, Jiajin Li, Xiaoxiao Li