HOLA: Holistic Multi-Modal Alignment for Open-Set 3D Recognition
HOLA: 面向开放集3D识别的全息多模态对齐
发表机构 * Technion – Israel Institute of Technology(技术ion-以色列理工学院)
AI总结 提出HOLA方法,通过解耦多正例对比损失和对齐点云与多视图图像及文本描述,实现开放集3D识别中的全息多模态对齐,在长尾基准上取得最先进零样本性能。
HOLA: 面向开放集3D识别的全息多模态对齐
发表机构 * Technion – Israel Institute of Technology(技术ion-以色列理工学院)
AI总结 提出HOLA方法,通过解耦多正例对比损失和对齐点云与多视图图像及文本描述,实现开放集3D识别中的全息多模态对齐,在长尾基准上取得最先进零样本性能。
S2M-Trek: 从单球到多球运输:基于轮腿机器人的逐帧深度集方法
发表机构 * School of Mechanical Science and Engineering, Huazhong University of Science and Technology(华中科技大学机械科学与工程学院) ; School of Mathematics, Harbin Institute of Technology(哈尔滨工业大学数学学院)
AI总结 针对轮腿四足机器人背部同时运输多个自由滚动球体的动态操作问题,提出逐帧深度集(PFDS)编码器,通过逐帧置换不变池化解决历史拼接编码器的置换对称性不匹配,实现五球100%无掉落运输。
使用约束满足问题的不平衡解的条件化蛋白质自由能密度
发表机构 * CIMS, NYU(纽约大学应用数学与计算科学中心)
AI总结 本文通过将条件化非均匀Curie-Weiss自旋哈密顿量的对数配分函数(自由能)简化为不平衡$2 \to 1$范数计算,并设计多项式时间SDP算法,应用于泛素蛋白以探索自由能景观并识别柔性区域。
DiffuSent:面向方面级情感分析的统一扩散框架
发表机构 * University of Electronic Science and Technology of China(电子科技大学) ; Southwest Petroleum University(西南石油大学) ; Southwest Minzu University(西南民族大学)
AI总结 提出非自回归扩散框架DiffuSent,将方面级情感分析的所有子任务统一为边界去噪扩散过程,通过对比去噪训练策略解决重复预测问题,在28个设置上优于现有生成式和跨度式系统,并实现高达181倍的推理加速。
TukaBench: 一个基于文化的非洲语言越狱基准
发表机构 * Mila - Quebec AI Institute(魁北克人工智能研究院) ; McGill University(麦吉尔大学) ; Microsoft AI for Good Research Lab(微软人工智能造福人类研究实验室) ; Canada CIFAR AI Chair(加拿大CIFAR人工智能主席)
AI总结 针对大型语言模型在非洲低资源语言上的安全评估缺失,提出TUKABENCH基准,通过四种设置(直接翻译、文化适应翻译、人工策划提示、代码切换提示)评估语言、文化背景和提示规避性对模型安全的影响,发现非洲语言提示降低拒绝率,并引入Deflection指标和人工验证以解决模型理解失败和评判可靠性问题。
Comments Under review
DeblurNVS:基于几何潜在扩散的稀疏运动模糊图像新视角合成
发表机构 * School of AI for Science, Peking University Shenzhen Graduate School(人工智能科学学院,北京大学深圳研究生院) ; School of Electronic and Computer Engineering, Peking University Shenzhen Graduate School(电子与计算机工程学院,北京大学深圳研究生院)
AI总结 提出DeblurNVS框架,利用几何潜在扩散从稀疏运动模糊图像中直接合成高保真新视角,无需逐场景优化。
SkillSmith: 技能与工具的协同进化用于自我改进的智能体系统
发表机构 * Shanghai Jiao Tong University(上海交通大学) ; Eastern Institute of Technology(东部技术研究所) ; University of Science and Technology of China(中国科学技术大学) ; Southeast University(东南大学) ; Ningbo Institute of Digital Twin(宁波数字孪生研究所)
AI总结 提出SkillSmith框架,通过统一提案空间和Lotka-Volterra生态效用模型实现技能与工具的协同进化,在多个基准测试中显著提升性能。
PSG-Nav: 通过多元宇宙决策的概率场景图导航
发表机构 * Tsinghua University(清华大学)
AI总结 提出PSG-Nav方法,通过构建3D概率场景图并利用多元宇宙决策从联合分布中采样最可能的世界设置,以处理开放词汇导航中的感知不确定性,并引入证据经验校准器实现在线终身适应,在多个基准上取得最新最优结果。
Comments 21 pages, 7 figures. ICML 2026
SkillAdaptor:基于轨迹的LLM智能体自适应技能
发表机构 * Zhejiang University(浙江大学) ; Ant Digital Technologies, Ant Group(蚂蚁集团数字技术部) ; Zhejiang University - Ant Group Joint Laboratory of Knowledge Graph(浙江大学-蚂蚁集团知识图谱联合实验室)
AI总结 提出SkillAdaptor,一种无训练的步骤级技能自适应框架,通过显式故障归因和针对性更新,提升LLM智能体在长程交互任务中的表现。
Comments Work in progress
FAiT:面向多元时间序列预测的频率感知倒置Transformer
发表机构 * University of Electronic Science and Technology of China(电子科技大学)
AI总结 提出FAiT,通过倒置注意力机制和动态时频调制,解决Transformer在多元时间序列预测中忽略高频信号和时变频谱特性的问题。
单纯复形序列建模中的结构与规模
发表机构 * Department of Computer Science, University of Oxford(牛津大学计算机科学系)
AI总结 本文通过训练小型Transformer预测隐马尔可夫模型输出,发现性能缩放模式与内部表征之间存在相关性,为行为缩放定律与涌现机制的联系提供了初步证据。
Comments HiLD 2026: 4th Workshop on High-dimensional Learning Dynamics
Med-HEAL:通过幻觉感知的上下文学习分析与缓解医学大语言模型中的幻觉
发表机构 * University of Maryland, Baltimore County(马里兰大学巴尔的摩县) ; Medical College of Wisconsin(威斯康星医学学院)
AI总结 提出Med-HEAL框架,利用临床数据构建幻觉数据集,并通过自我批评和检索增强上下文学习策略缓解医学大语言模型中的幻觉,实验表明自我批评策略可提升多数模型准确率。
Comments 12 pages, 5 figures. Preprint full version of an accepted ACM-BCB 2026 short paper
ChronosAD:利用时间序列基础模型进行精确异常检测
发表机构 * PR Veneto FESR 2021-2027(普罗文托地区FESR 2021-2027项目) ; Action 1.1.1(行动1.1.1) ; DGR 792 ; CUP D19J24000810007
AI总结 提出ChronosAD架构,通过时间序列基础模型提取特征并结合BiLSTM与多头注意力机制,实现跨域鲁棒的异常检测,在11个基准上平均AUC提升4.72%,AP提升6.60%。
Comments Accepted at the 24th IEEE International Conference on Industrial Informatics (INDIN) 2026
Challenger at MultiPRIDE: 这是仇恨言论还是被重新使用的语言?
发表机构 * University of Tabriz(塔布里兹大学)
AI总结 针对仇恨言论与重新使用语言的区分难题,提出一种结合语义嵌入、标签噪声过滤(Cleanlab+逻辑回归)和MLP分类器的可解释方法,在资源受限下实现稳健性能。
Comments 9 pages, 2 figures, Published in EVALITA 2026, CEUR Workshop Proceedings Vol. 4195
Journal ref CEUR Workshop Proceedings, Vol. 4195, 2026
不要阅读一切:用于线性注意力的曲率条件查询
发表机构 * Nanyang Technological University(南洋理工大学) ; National University of Singapore(国立新加坡大学) ; VinUniversity(文理大学)
AI总结 针对线性注意力在上下文检索和长上下文任务中的不足,提出曲率条件查询(CCQ)机制,通过二阶泰勒展开构建局部二次模型,利用运行键协方差收缩查询向量,仅修改读取步骤,兼容现有线性注意力骨干,在困惑度、零样本下游准确率、检索和长上下文任务上取得提升。
Comments 19 pages
什么造就了一个强模型?高维线性回归中知识迁移的统一谱分析
发表机构 * Department of Computer Science(计算机科学系) ; Cranberry-Lemon University(Cranberry-Lemon 大学) ; Department of Computational Neuroscience(计算神经科学系) ; University of the Witwatersrand(沃特瓦特斯兰大学)
AI总结 本文通过高维线性回归中SGD动力学的统一谱分析,揭示了知识蒸馏中的谱视界扩展和弱到强泛化中的谱去噪两种机制,统一解释了不同知识迁移范式的有效性。
从特征到动态:面向零样本时间序列预测的特征空间到自回归策略
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 提出FSA框架,通过从可解释特征空间到自回归策略空间的映射,在零样本单变量时间序列预测中引入显式归纳偏置,分离全局趋势、周期成分和局部动态,以更少数据假设实现跨域泛化,在受控实验中优于Transformer架构。
超越视觉记忆:潜在视觉推理的机制诊断
发表机构 * Amap, Alibaba Group(阿里集团亚马通) ; Shanghai Innovation Institute(上海创新研究院)
AI总结 通过分解潜在令牌为三个可测试组件,发现边界标记和格式而非潜在槽贡献了主要性能提升,揭示了潜在视觉推理的真正机制。
知识密集型视频生成
发表机构 * Fudan University(复旦大学) ; Shanghai Jiao Tong University(上海交通大学)
AI总结 针对文本到视频生成在事实性和实用性方面的不足,提出知识密集型视频生成(KIVI)任务,构建KIVI-Bench基准和自动评估指标,实验表明现有模型在视觉属性、操作过程和信息呈现上落后于人类。
AdaKernel: 为时空图神经网络学习自适应核参数
发表机构 * Sichuan University(四川大学) ; PLA Academy of Military Science(中国人民解放军军事科学院) ; The Hong Kong University of Science and Technology (Guangzhou)(香港科技大学(广州))
AI总结 针对图神经网络中固定核参数导致模型容量受限的问题,提出AdaKernel方法,通过结构保持策略学习自适应核参数,在数据稀疏场景下优于固定先验和全隐式图结构方法。
Comments 17 pages, 15 figures, including appendix
KG-FairDiff: 知识图谱引导的提示词精炼用于人口统计公平的文本到图像生成
发表机构 * University of Science and Technology of China(中国科学技术大学) ; Sharif University of Technology(谢赫·伊斯兰大学) ; Iran University of Science and Technology(伊朗科学技术大学)
AI总结 提出KG-FairDiff框架,通过知识图谱引导的提示词精炼,在推理时优化公平性损失,减少文本到图像生成中的性别、种族、年龄等人口统计偏差,同时保持语义保真度。
RLVR 无需无效样本:面向 LLM 推理的群体优先级离策略优化
发表机构 * Department of Automation, Tsinghua University(清华大学自动化系)
AI总结 针对强化学习中无效样本导致学习信号不足的问题,提出群体优先级离策略优化(POPO),通过优先级群体重放和解耦重要性采样,在不增加额外采样开销的情况下提升推理性能。
太空中的事件视觉:应用、趋势与未来方向
发表机构 * Interdisciplinary Transformation University of Austria(交叉学科转型奥地利大学) ; ETH Zurich(苏黎世联邦理工学院)
AI总结 本文综述了事件视觉传感器在太空领域的应用,通过分类四个主要领域(大气与高速观测、环境监测与变化检测、操作支持与星上处理、地理空间建模与预测分析),指出神经形态工程是解决现代遥感与可持续太空探索关键瓶颈的范式转变。
Comments Accepted at the XXIV Annual Conference on Sensors and Microsystems (AISEM) 2026
ANDES:用于自主指令对齐的智能体原生数据演化合成工具
发表机构 * Peking University(北京大学) ; Sichuan University, Chengdu(四川大学,成都)
AI总结 提出ANDES框架,通过自进化世界树路由和可操作诊断报告,将数据生成重构为即插即用的智能体技能,使基础较弱的智能体在严格计算约束下实现自动对齐,在PostTrainBench上取得最先进性能。
DeepIPCv3: 面向突发行人穿越避让的事件感知多模态传感器融合
发表机构 * Department of Computer Science and Electronics, Universitas Gadjah Mada(计算机科学与电子系,加雅马达大学) ; Department of Computer Science and Engineering, Toyohashi University of Technology(计算机科学与工程系,东福士大学)
AI总结 提出DeepIPCv3框架,通过Transformer交叉模态注意力融合LiDAR点云与DVS事件流,实现突发行人穿越场景下的高反应性避让,在自定义多模态数据集上达到最优轨迹与控制精度。
词中世界:基于多智能体协调的古代汉语文本文化翻译
发表机构 * NLP2 CT Lab, Department of Computer and Information Science, University of Macau(澳门大学自然语言处理与计算机实验室,计算机与信息科学系) ; Institute of International Language Services Studies, Macau Millennium College(澳门 millennium 学院国际语言服务研究学院)
AI总结 针对古代汉语文本中文化负载词的翻译难题,提出多智能体文化感知翻译框架MACAT,通过选择性显化策略动态识别文化短语并注入简洁解释,在中医经典和《论语》上优于基线模型。
Comments The preprint manuscript is 20 pages long and is currently under review
GLIDE: 面向时空点过程扩散估计的图引导跳跃推理
发表机构 * University of Electronic Science and Technology of China(电子科技大学)
AI总结 提出GLIDE框架,利用多尺度历史图编码和双流架构作为条件,结合先验引导的跳跃推理机制,实现高效且准确的时空点过程下一个事件建模与预测。
利用传感器内计算实现节能地球观测
发表机构 * Interdisciplinary Transformation University of Austria(跨学科转型奥地利大学) ; ETH Zurich(苏黎世联邦理工学院) ; University of Verona(威尼斯大学)
AI总结 针对卫星数据下行带宽瓶颈,提出基于TinyML和索尼IMX500传感器的传感器内计算框架,在8MB约束下达到96.68%精度和42.26 GMAC/J能效。
Comments Accepted at the XXIV Annual Conference on Sensors and Microsystems (AISEM) 2026
PALTO:面向垂直供电的Tri-Gate FinFET设计优化的物理信息主动学习
发表机构 * University of Illinois Chicago(伊利诺伊大学香槟分校) ; Center for Heterogeneous Integration of Micro Electronic Systems(微电子异构集成中心) ; Joint University Microelectronics Program (JUMP) 2.0(联合大学微电子计划(JUMP)2.0) ; Semiconductor Research Corporation (SRC)(半导体研究公司(SRC)) ; Defense Advanced Research Project Agency (DARPA)(国防高级研究计划局(DARPA))
AI总结 提出物理信息主动学习框架,高效探索GaN tri-gate FinFET的高维设计空间,优化关键结构参数(如GaN-to-AlGaN厚度比),发现两种优化器件,其中D1在300-fin配置下驱动电流和开关效率优于D2。
IndoBias:印尼语言中大语言模型偏见评估的双轨文化基准
发表机构 * Mohamed bin Zayed University of Artificial Intelligence(莫扎德大学人工智能大学) ; Universitas Indonesia(印度尼西亚大学) ; Independent Researcher(独立研究员)
AI总结 提出IndoBias基准,通过深度和广度双轨评估,发现现有LLM在印尼语和三种地方语言中表现出显著偏见,且预训练数据来源和语言多样性影响偏见程度。