Towards a Physics Foundation Model
迈向物理基础模型
发表机构 * University of Cambridge(剑桥大学)
AI总结 提出通用物理变换器(GPhyT),通过在大规模多样化模拟数据上训练,实现单一模型在多个物理领域(如流固耦合、冲击波、热对流和多相流)的零样本泛化与长期稳定预测,性能超越专用架构7倍以上。
Comments ICML-AI4Physics 2026
迈向物理基础模型
发表机构 * University of Cambridge(剑桥大学)
AI总结 提出通用物理变换器(GPhyT),通过在大规模多样化模拟数据上训练,实现单一模型在多个物理领域(如流固耦合、冲击波、热对流和多相流)的零样本泛化与长期稳定预测,性能超越专用架构7倍以上。
Comments ICML-AI4Physics 2026
面向临床神经科学中基于Transformer的语言模型的稳定可解释性的单语义归因框架
发表机构 * Department of Computer Science and Technology(计算机科学与技术系) ; Cancer Research UK(癌症研究英国公司) ; Cambridge Institute(剑桥研究所) ; University of Cambridge(剑桥大学) ; United Kingdom(英国) ; DIMES(迪梅斯) ; University of Calabria(卡拉布里亚大学) ; Italy(意大利) ; Department of Computer Automatic and Management Engineering (DIAG)(计算机自动与管理工程系) ; Sapienza Università di Roma(罗马大学萨皮恩扎) ; Department of Psychiatry(精神病学系) ; School of Computing(计算学院) ; University of Kent(肯特大学) ; Department of Psychology(心理学系)
AI总结 提出一种通过单语义特征提取整合归因与机制视角的统一可解释性框架,生成稳定的输入级重要性分数,促进语言模型在认知健康和神经退行性疾病中的安全应用。
大语言模型时代生成式命名实体识别的评估
发表机构 * College of Computer Science and Software Engineering, Shenzhen University(深圳大学计算机科学与软件工程学院)
AI总结 本文系统评估了开源大语言模型在平面和嵌套命名实体识别任务上的性能,发现参数高效微调结合结构化格式可达到与传统模型竞争的性能,且NER能力源于指令遵循和生成能力而非记忆,微调对通用能力影响很小。
扰动对相似个体间准确性和公平性的影响
发表机构 * University of New South Wales(新南威尔士大学) ; The Hong Kong University of Science and Technology(香港科学与技术大学) ; Key Laboratory of System Software, Institute of Software, Chinese Academy of Sciences(中国科学院软件研究所系统软件重点实验室) ; Fudan University(复旦大学) ; Hangzhou Institute for Advanced Study, University of Chinese Academy of Sciences(中国科学院大学杭州先进研究所) ; The University of Sydney(悉尼大学)
AI总结 提出鲁棒个体公平性(RIF)概念,并开发黑盒对抗框架RIFair,通过解耦扰动策略暴露模型在语义保持扰动下同时存在的鲁棒性和公平性缺陷。
寻找关键:通过演化索引锚定上下文知识进行迭代检索
发表机构 * School of Computer Science and Engineering, Northeastern University, China(东北大学计算机科学与工程学院) ; Department of Computer Science and Technology, Institute for AI, Tsinghua University, China(清华大学人工智能研究院计算机科学与技术系) ; Beijing National Research Center for Information Science and Technology, China(北京信息科学与技术国家研究中心) ; School of Computer Science, Beijing University of Posts and Telecommunications, China(北京邮电大学计算机学院)
AI总结 提出KAIR框架,通过迭代检索中动态更新的知识索引锚定关键证据,引导大语言模型在多跳问答中有效推理并缓解噪声干扰。
MASCOT: 迈向多智能体社会协作伴侣系统
发表机构 * Georgia Institute of Technology(佐治亚理工学院)
AI总结 针对多智能体系统中的人格崩溃和社会谄媚问题,提出MASCOT框架,通过双层优化策略(人格感知行为对齐与协作对话优化)提升角色一致性和对话贡献。
Comments 15 pages, 9 figures. https://hello-diana.github.io/MASCOT/
高度可变形本体感觉膜用于实时三维形状重建
发表机构 * arXiv.org ; cs.RO(计算机机器人学)
AI总结 提出一种基于光波导传感的柔性可拉伸本体感觉硅胶膜,通过数据驱动模型解码变形相关光强信号,实现实时三维形状重建,在140mm方形膜上达到90Hz更新率和1.307mm平均重建误差。
Comments 13 pages, 9 figures
面向双臂操作的语义-几何任务表示:从人类示范到机器人动作规划
发表机构 * Interactive Robot Perception & Learning (PEARL) Lab, Computer Science Dept., TU Darmstadt, Germany(图腾大学达姆施塔特分校计算机科学系交互机器人感知与学习实验室) ; Hessian.AI, Darmstadt, Germany(黑森人工智能公司) ; Robotics Institute Germany (RIG)(德国机器人研究所) ; Interactive AI Algorithms & Cognitive Models for Human-AI Interaction (IKIDA), Computer Science Dept., TU Darmstadt, Germany(人机交互的交互人工智能算法与认知模型(IKIDA),图腾大学达姆施塔特分校计算机科学系) ; Center for Cognitive Science, TU Darmstadt, Germany(图腾大学达姆施塔特分校认知科学中心)
AI总结 提出一种语义-几何图任务表示,通过消息传递神经网络编码器和Transformer解码器联合编码对象身份、语义关系和运动历史,实现从人类示范中学习结构化任务表示,并支持跨实体迁移和双臂操作规划。
Comments 9 pages, 7 figures, preprint
SAR图像中舰船目标的分类感知超分辨率框架
发表机构 * University of Malaya(马来亚大学)
AI总结 提出一种将分类目标融入超分辨率过程的算法,通过优化兼顾图像质量和分类性能的损失函数,提升SAR图像分辨率并改善分类精度。
通用健康查询的共情适用性建模
发表机构 * University of Michigan(密歇根大学) ; Lahore University of Management Sciences(拉合尔管理科学大学)
AI总结 提出共情适用性框架(EAF),基于临床、语境和语言线索对患者查询的情感反应和解释适用性进行分类,以支持异步医疗中的共情沟通。
Comments Accepted at Findings of ACL 2026
导航现实差距:面向临床电话的ASR设备端持续适应
发表机构 * BITS Pilani, Pilani Campus, India(印度比斯帕利尼学院帕利尼校区) ; Qure.ai, India(印度Qure.ai)
AI总结 针对临床电话场景中ASR性能严重下降的问题,使用Gram Vaani语料库作为代理,研究设备端持续适应方法,发现经验回放与弹性权重巩固之间的关键交互作用。
Comments 17 pages. Under review
LocalSearchBench:现实本地生活服务中的智能搜索基准测试
发表机构 * Meituan, Beijing, China(美团,北京,中国) ; East China Normal University Shanghai Innovation Institute(东华大学上海创新研究院) ; University of Science and Technology of China(中国科学技术大学) ; Shanghai Jiaotong University(上海交通大学) ; North China University of Technology, Beijing, China(华北理工大学,北京,中国) ; East China Normal University Shanghai China(东华大学上海)
AI总结 针对本地生活服务领域,提出包含130万商家条目和900个多跳问答任务的基准测试LocalSearchBench,并开发统一环境LocalPlayground,实验表明现有大推理模型性能不足。
Comments 12 pages; accepted to KDD 2026
原型性偏差揭示多模态评估指标中的盲点
发表机构 * University of Technology Nuremberg(图恩大学)
AI总结 本文通过构建受控诊断基准PROTOBIAS,发现并验证了多模态评估指标中存在原型性偏差,即倾向于选择视觉或社会原型性高但语义错误的图像,并提出了轻量级对比训练评估器PROTOSCORE作为缓解基线。
Grokking 的几何:零损失流形上的范数最小化
发表机构 * ETH Zurich(苏黎世联邦理工学院)
AI总结 本文通过约束优化视角,证明在极小学习率和权重衰减系数下,梯度下降在零损失流形上最小化权重范数,并引入近似解耦参数子集的学习动力学,推导出两层网络第一层后记忆动力学的闭式表达式,实验验证了该框架能复现 grokking 的延迟泛化和表征学习特征。
使用深度学习求解微分方程的实践方面:入门指南
发表机构 * International Centre for Neuromorphic Systems(神经形态系统国际中心) ; Department of Computer Science(计算机科学系) ; University of Manchester(曼彻斯特大学)
AI总结 本文介绍深度学习核心概念,重点阐述如何利用神经网络求解偏微分方程,包括实现方法、超参数选择及精度提升技巧,并强调无需GPU即可复现。
Comments 34 pages, 13 figures, primer (tutorial)
SARA: 音频深度伪造检测中的压力测试推理
发表机构 * Indiana University(印第安纳大学) ; Cisco Research(思科研究)
AI总结 提出SARA框架,通过声学感知、推理-判决一致性与不和谐三个维度评估音频语言模型在对抗攻击下的推理可靠性,发现声学攻击降低一致性而语言攻击保持一致性但成功率更高,且推理轨迹的文本一致性可作为检测对抗样本的潜在指标。
Comments Preprint for ACL 2026 submission
VLM4VLA:重新审视视觉-语言-动作模型中的视觉-语言模型
发表机构 * Institute for Interdisciplinary Information Sciences, Tsinghua University(清华大学交叉信息研究院) ; Qwen Team, Alibaba Inc.(阿里巴巴公司Qwen团队)
AI总结 本文通过VLM4VLA最小适配管道,系统研究视觉-语言模型(VLM)的选择和能力如何影响下游视觉-语言-动作(VLA)策略性能,发现VLM通用能力无法预测下游任务表现,且视觉模块是性能瓶颈。
Avatar Forcing:用于自然对话的实时交互式头部化身生成
发表机构 * KAIST(韩国科学技术院) ; NTU Singapore(新加坡国立大学) ; DeepAuto.ai
AI总结 提出Avatar Forcing框架,通过扩散强制实现实时交互式头部化身生成,利用直接偏好优化进行无标签学习,在低延迟(约500ms)下生成富有表现力的反应动作。
Comments CVPR 2026. Project page: https://taekyungki.github.io/AvatarForcing/
IntraStyler: 跨模态MRI域适应的域内风格合成
发表机构 * Siemens Healthineers(西门子医疗) ; Princeton, NJ, USA(新泽西州普林斯顿) ; Vanderbilt University(范德比尔特大学) ; Mayo Clinic(梅奥诊所) ; Johnson & Johnson Innovative Medicine(强生创新医学)
AI总结 针对T2 MRI中前庭神经鞘瘤和耳蜗分割的域适应问题,提出IntraStyler方法,通过对比学习提取与解剖解耦的风格嵌入,自动发现并合成目标域内多样化的风格图像,提升下游分割模型的泛化性。
Comments Extension of our 1st place solution for the CrossMoDA 2023 challenge
立场:当前基准测试阻碍了时间序列预测深度学习的真正进展
发表机构 * University of Cambridge(剑桥大学)
AI总结 本文指出当前基准测试实践未能识别影响性能的关键设计因素,尤其是全局性与局部性等被忽视的方面对预测方法类别和实验结果有重大影响,并提出辅助预测模型卡以改进架构比较。
Comments ICML 2026
IMA++: ISIC档案多标注者皮肤镜皮损分割数据集
发表机构 * Medical Image Analysis Lab, School of Computing Science, Simon Fraser University(医学影像分析实验室,计算科学学院,西蒙弗雷泽大学) ; AIP Labs(AIP实验室)
AI总结 提出ISIC MultiAnnot++数据集,包含14,967张皮肤镜图像和17,684个分割掩码,其中2,394张图像有2-5个标注,并附带标注者技能水平和工具元数据,支持多标注者医学图像分割研究。
Comments Published in IEEE Data Descriptions, 12 pages, 7 figures
退化感知度量提示用于高光谱图像恢复
发表机构 * arXiv.org ; cs.CV(计算机视觉)
AI总结 提出退化感知度量提示(DAMP)框架,通过可解释的空间-光谱度量作为退化提示,结合退化自适应混合专家(DAMoE)模块,实现多维度退化统一恢复,在自然和遥感高光谱数据集上达到最先进性能并展现零样本泛化能力。
Comments Accepted by ICML 2026
揭示大型语言模型及其基准测试中的能力差距
发表机构 * University of Zurich(苏黎世大学)
AI总结 提出一种基于稀疏自编码器概念激活的新方法,自动发现模型在细粒度概念上的弱点(模型差距)和基准测试覆盖不平衡(基准差距),并通过内部表示评估和跨基准比较进行验证。
离散扩散VLA:将离散扩散引入视觉-语言-动作策略中的动作解码
发表机构 * arXiv.org ; University of Science and Technology of China(中国科学技术大学)
AI总结 提出离散扩散VLA,通过将动作块离散化并在统一Transformer骨干内使用离散扩散模式进行渐进细化,实现自适应解码顺序和错误纠正,在多个基准上取得高性能并保留预训练的视觉-语言先验。
Comments Accepted by ICML 2026. 17 pages
硬标签登场!重新思考硬标签在缓解局部语义漂移中的作用
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 针对软标签在稀疏监督下导致的局部语义漂移问题,提出混合硬标签与软标签的HALD训练范式,在数据集蒸馏和大规模分类任务中提升泛化性能。
Comments ICML 2026. Code at: https://github.com/Jiacheng8/HALD
通过奖励划分实现无价值函数策略优化
发表机构 * LIPN, Université Paris 13(巴黎第十三大学LIPN实验室) ; Université Paris 13(巴黎第十三大学) ; Université de Versailles Saint-Quentin Paris(巴黎- versaillies圣quentin大学)
AI总结 提出Reward Partition Optimization (RPO)方法,通过基于划分的奖励归一化消除价值函数学习,实现稳定、高效的策略优化。
事件相机三维重建综述
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 本文首次全面综述了基于事件相机的三维重建方法,按输入模态(立体、单目、多模态)和重建技术(几何、深度学习、神经渲染如NeRF和3DGS)分类,并讨论了数据集、评估、表示和动态场景重建等挑战。
Comments This survey has been accepted for publication in the Computational Visual Media Journal
强化学习低层四旋翼控制中的动态熵调节:随机性与确定性
发表机构 * arXiv.org
AI总结 研究在四旋翼控制中,通过动态熵调节训练随机策略的强化学习算法,并与确定性策略算法对比,发现动态熵调节可防止灾难性遗忘并提高探索效率。
Comments This is the Author Accepted Manuscript version of a paper accepted for publication. The final published version is available via IEEE Xplore
基于软演员-评论家(SAC)的四旋翼强化学习位置控制
发表机构 * arXiv.org
AI总结 提出一种基于强化学习的四旋翼推力矢量控制架构,使用软演员-评论家算法训练,相比传统RPM控制器训练更快、路径跟踪更平滑准确。
Comments This is the Author Accepted Manuscript version of a paper accepted for publication. The final published version is available via IEEE Xplore
MGRegBench:一个带有解剖标志的乳腺X线图像配准新型基准数据集
发表机构 * MSU(莫斯科国立大学)
AI总结 为解决乳腺X线图像配准中缺乏公开数据集和标准化基准的问题,提出了MGRegBench,包含5000多对图像和100对带手动标注解剖标志的数据集,并评估了多种配准方法。