MASt3R-Nav: WayPixel Navigation in Relative 3D Maps
MASt3R-Nav: 相对3D地图中的WayPixel导航
AI总结 提出一种基于像素相对连接性的地图表示,通过相对3D坐标系中的像素对应构建地图,并利用像素级图进行全局路径规划,训练控制器预测轨迹,实现高精度导航。
Comments 2026 IEEE International Conference on Robotics & Automation (ICRA)
MASt3R-Nav: 相对3D地图中的WayPixel导航
AI总结 提出一种基于像素相对连接性的地图表示,通过相对3D坐标系中的像素对应构建地图,并利用像素级图进行全局路径规划,训练控制器预测轨迹,实现高精度导航。
Comments 2026 IEEE International Conference on Robotics & Automation (ICRA)
EvoCode-Bench:评估多轮迭代交互中的编码智能体
AI总结 提出EvoCode-Bench基准,通过多轮状态化任务和累积测试评估编码智能体在需求变化下维持代码库工作的能力,发现多轮指标远低于单轮指标,且最强智能体多轮成功率仅约50%。
Comments Work in Progress; 32 pages, 10 figures, preprint
克服地球观测中的“物理冲击”:面向PINN洪水推断的异方差不确定性框架
AI总结 提出一种不确定性感知的物理信息神经网络框架,通过动态热身启动和异方差不确定性建模,解决遥感洪水映射中物理约束与噪声数据冲突导致的梯度发散问题,在Sen1Floods11数据集上IoU提升25%。
Comments This article is accepted in IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing
D2-V2X: 面向自动驾驶的深度驱动协同V2X推理
AI总结 针对单车辆视觉语言模型受传感器遮挡限制的问题,提出D2-V2X基准和基线模型,通过融合3D LiDAR特征与VLM潜空间,利用链式思维推理实现遮挡目标识别和空间估计,在识别遮挡危险和降低空间估计误差上取得显著提升。
Comments Accepted to the DriveX Workshop at CVPR 2026 (Non-archival)
Verified SHAP: 神经网络精确Shapley值的可证明界
AI总结 利用神经网络验证技术,提出一种计算SHAP值精确上下界的算法,可扩展到比现有精确方法大数个数量级的搜索空间。
Comments Accepted at ICML 2026. 34 pages, 13 figures
WideDepth: 用于鱼眼深度估计的毫米级精度基准
AI总结 提出首个室内鱼眼深度估计数据集WideDepth,包含101个场景的5K高分辨率立体对和毫米级真值,并引入基于LiDAR的立体鱼眼图像生成方法,评估多种模型,微调后性能提升高达62%。
Comments Accepted to IEEE International Conference on Robotics and Automation (ICRA) 2026
距离感知的联合时空图对比学习用于重度抑郁症诊断
AI总结 针对动态功能连接在重度抑郁症诊断中的噪声、频域信息利用不足及时空分离建模问题,提出基于霍克斯过程先验的联合时空图对比学习框架HWSTCL,通过谱节点描述符、指数距离衰减边权重和核加权对比目标,实现可靠时空表示并提升诊断性能。
fMRI-Diffusion: 用于重度抑郁症诊断的基于时间Transformer扩散模型的fMRI时间序列生成
AI总结 提出fMRI-Diffusion框架,通过时间Transformer扩散模型合成ROI级fMRI时间序列而非功能连接矩阵,以保留时间信息并提升小样本下MDD诊断准确率。
超关系知识图谱上的生成式表示学习:基于掩码离散扩散
AI总结 针对超关系知识图谱中任意掩码查询的补全与事实生成任务,提出基于掩码离散扩散的生成式表示学习方法KREPE,统一链接预测与事实生成,性能达到最优。
Comments 28 pages, 16 figures, 18 tables, 43rd International Conference on Machine Learning (ICML 2026)
基于人体通信的联邦学习用于体表边缘智能:综述、分类法与BODYFED-HBC调度示例
AI总结 本文综述了人体通信与联邦学习在可穿戴设备中的交叉领域,提出了一种区分体内、体中心、跨用户和临床云联邦学习部署的分类法,并引入BODYFED-HBC参考架构和调度算法以解决体信道感知的联邦学习问题。
符号胜过浮点:面向设备端微调的低秩双二值适配器
AI总结 提出LoRDBA,一种用二值符号载波和通道级缩放替代低秩因子的适配器,在保持LoRA兼容性的同时显著降低存储和计算开销,并在设备端微调中匹配或超越低比特基线性能。
Comments 34 pages, 3 figures
特征彩票?概念涌现的分岔理论
AI总结 提出一种基于分岔理论的方法,通过损失Hessian驱动的超临界叉形分岔检测表示动力学中的结构涌现,并引入无标签相位坐标β/β_c,在多种设置下验证了四个不同的转变阶段,揭示了特征可解释性的早期可预测性。
Cascade-KDE:面向分布外脉冲损坏的鲁棒时间序列恢复
AI总结 提出Cascade-KDE无训练框架,通过二维密度估计、密度截断鲁棒期望和指数级联自适应停止,在保留局部结构的同时鲁棒恢复被高斯噪声和脉冲异常损坏的时间序列。
打破概率的锁链:中智逻辑作为大型语言模型中认知不确定性的新框架
AI总结 本文提出使用中智逻辑(Truth、Indeterminacy、Falsity三个独立维度)替代传统概率框架,通过实验发现该框架能更丰富地表示LLM的内部状态,并在35%的评估中自发出现超真状态,为透明、可靠和伦理感知的AI系统提供关键步骤。
Comments Published in Neutrosophic Sets and Systems, Vol. 99 (2026). Author's preprint version. Open code and data available at: github.com/mleyvaz/neutrosophic-llm-logic
移动众包中用于LLM微调的诚实在线偏好聚合
AI总结 针对移动众包中工人可能策略性谎报偏好反馈的问题,提出一种动态贝叶斯博弈模型和在线加权聚合机制,确保工人诚实反馈并实现次线性遗憾。
互补代理混合:鲁棒的大语言模型集成
AI总结 将大语言模型选择视为组合选择问题,提出基于互补性的贪心选择算法,在性能与成本间取得最佳平衡。
EMMA: 从多模态数据中提取多个物理参数
AI总结 提出EMMA框架,利用物理信息多模态融合和LTC网络,从原始视频、音频和图像时间序列中联合推断系统动力学参数,无需先验条件或专用传感器,在100+场景中优于单模态方法。
Comments Accepted at CVPR 2026 (main conference)
大规模数据集与基准:蛋白质-配体模型学习的是结合位点还是仅仅结合可能性?
AI总结 针对现有基准无法评估模型是否定位结合位点的问题,提出包含约10万对蛋白质-配体的InteractBind数据集和细粒度基准,通过结合位点定位任务揭示模型在强二元预测下定位能力有限。
Comments Under Review for the NeurIPS 2026 Conference, Track on Evaluations and Datasets
RED:面向环境动态的自适应实时DAG调度用于机器人推理
AI总结 提出RED框架,通过截止时间感知调度器和MIMONet结构对齐,在资源受限机器人平台上实现多任务深度神经网络工作负载的实时调度,适应环境动态并保证端到端时序约束。
Comments Extension version of RTSS'23
LLM-AutoSciLab:通过LLM主动实验进行闭环科学发现
AI总结 提出LLM-AutoSciLab闭环框架,通过假设生成与实验选择迭代优化,在预算约束下实现主动数据采集,在三个基准上优于现有方法且样本效率提升2-5倍。
学习像人类一样看:基于注视对齐的骑行安全预测
AI总结 提出眼动追踪引导的感知骑行安全框架(EG-PCS),通过将注视数据集成到基于视觉Transformer的成对学习流程中,使模型注意力与人类注视模式对齐,提升预测准确性和可解释性。
Comments Accepted to be published as part of the 2026 IEEE 29th International Conference on Intelligent Transportation Systems (ITSC), Naples, Italy, September 15-18, 2026
模式即序列:将多模态运动预测转化为统一序列模式建模
AI总结 提出Mode-as-Sequence框架,将无序模式集转化为有序模式序列并显式建模模式间依赖,通过ModeSeq和Parallel ModeSeq两种实例化方法解决多模态运动预测中的模式坍塌和置信度排序问题,在Waymo数据集上取得领先性能。
迈向可验证的Transformer:求解器可检查的电路解释
AI总结 提出Verifiable Transformers框架,通过将任务局部Transformer电路转化为有界、求解器可检查的声明,实现电路属性的形式化验证。
面向大模型特征编码
AI总结 本文提出大模型特征编码(LaMoFC)基准与评估框架,通过构建涵盖4类16场景的特征数据集LaMoFCBench,揭示现有编码范式与大模型特征异构性之间的严重错位。
通过因果路由门控减轻大型视觉语言模型中的幻觉
AI总结 针对大型视觉语言模型中因文本路径主导导致幻觉的问题,提出一种无训练、决策对齐的干预方法,通过分解注意力头为视觉和文本路由并抑制文本路由,有效减少幻觉错误。
Comments Accepted as a Spotlight Paper at ICML 2026. 33 pages, 8 figures
锥束CT中鲁棒投影选择的软Tuy完备性
AI总结 基于Tuy完备性理论,提出连续软近正交评分和分辨率感知饱和覆盖目标,通过次模贪心算法和混合整数线性规划实现投影选择,并引入有效空间分辨率作为轨迹级诊断指标。
Comments Preprint
理解视觉与语言信息并与人类及环境交互的机器智能
AI总结 本文提出GRIT、LTMI和两阶段指令解释框架,分别改进图像描述、视觉对话和交互式指令跟随任务,在准确性和效率上取得领先结果。
Comments Doctoral dissertation, Tohoku University, 2022. Uploaded for archival purposes. 146 pages
MGVQ:协同多维敏感度感知与梯度-海森融合的向量量化
AI总结 提出MGVQ框架,通过敏感度引导的结构化混合精度量化和梯度感知的二阶误差补偿,实现视觉-语言模型的超低位向量量化,在2-bit量化下最高提升4.9个点。
EvoSci: 一种受生物启发的多智能体框架用于科学发现的演化
AI总结 提出EvoSci框架,结合生物启发式演化与知识图谱建模,通过多角色智能体协作迭代生成、评估和优化研究想法,显著提升科学探索的连贯性和创造力。
Comments ACL 2026 Main Conference
SkySeg: 野外异构无人机协同机载语义分割
AI总结 针对资源受限无人机在动态环境中实时语义分割的挑战,提出SkySeg异构多无人机空-空协作框架,结合高效信息融合推理与跨设备测试时自适应策略,实现低成本传感器下的机载分割,加速约3.6倍并提升精度5.91%。