Learning to Reason by Analogy via Retrieval-Augmented Reinforcement Fine-Tuning
通过检索增强强化微调进行类比推理学习
发表机构 * Meta Superintelligence Labs(Meta超级智能实验室) ; Rice University(莱斯大学)
AI总结 提出RA-RFT框架,通过黄金相关性蒸馏训练检索器,并结合强化微调利用类比推理轨迹,提升数学推理性能。
通过检索增强强化微调进行类比推理学习
发表机构 * Meta Superintelligence Labs(Meta超级智能实验室) ; Rice University(莱斯大学)
AI总结 提出RA-RFT框架,通过黄金相关性蒸馏训练检索器,并结合强化微调利用类比推理轨迹,提升数学推理性能。
Mana: 铰接工具的灵巧操作
发表机构 * UC Berkeley(加州大学伯克利分校) ; CMU(卡内基梅隆大学) ; Stanford University(斯坦福大学) ; Amazon FAR(亚马逊FAR)
AI总结 提出Mana框架,将灵巧操作重解释为动画问题,通过粗到细的流水线自动生成操作轨迹,实现铰接工具的零样本仿真到现实迁移。
Comments Project Page: https://zhaohengyin.github.io/mana
模态强制实现可扩展的空间生成
发表机构 * Carnegie Mellon University(卡内基梅隆大学) ; World Labs
AI总结 提出Modality Forcing方法,通过为每个模态分配独立噪声水平,实现单DiT的联合图像-深度生成,利用稀疏深度数据训练,继承T2I预训练的可扩展性,在深度估计上取得竞争性能。
SpatialClaw:重新思考智能体空间推理的动作接口
发表机构 * KAIST(韩国科学技术院) ; NVIDIA(英伟达)
AI总结 提出SpatialClaw框架,以代码作为动作接口,通过状态化Python内核和感知几何原语,使VLM智能体逐步执行并灵活组合中间结果,在20个3D/4D空间推理基准上平均准确率59.9%,比现有方法高11.2个百分点。
Comments Project page: https://spatialclaw.github.io/
理解图神经网络的截断位置编码
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 研究截断位置编码(如前k个特征空间或邻接矩阵幂)对图神经网络表达能力的影响,理论证明截断后多种位置编码的表达能力存在本质差异,且截断谱位置编码不再强于1-WL测试,实验表明混合截断编码优于单一类型。
Comments 28 pages, 4 figures, ICML 2026
使用大型语言模型自动评估社会与行为科学的可重复性
发表机构 * LMU Munich(慕尼黑大学) ; Munich Center for Machine Learning(慕尼黑机器学习中心) ; University of Cologne(科隆大学)
AI总结 本研究利用大型语言模型(LLMs)自动评估社会与行为科学研究的可重复性,在76项研究中,LLM在41%的研究中恢复了原始效应量,在96%的案例中得出了与原始研究相同的定性结论,优于人类再分析。
Agents-K1:迈向智能体原生的知识编排
发表机构 * PJLab(上海人工智能实验室)
AI总结 提出Agents-K1管道,将原始文档转化为智能体原生科学知识图谱,通过多模态解析器、GRPO训练的4B信息抽取骨干和三源智能体接口,实现科学信息抽取、知识图谱构建和多跳推理。
Influcoder:将解码器的梯度影响排名蒸馏到编码器用于数据归因
发表机构 * Centre Inria de l’Université de Lille, CRIStAL, Université de Lille(里尔大学Inria中心,CRIStAL,里尔大学)
AI总结 针对大型语言模型训练数据归因中影响函数方法计算和存储成本高的问题,提出Influcoder方法,通过将解码器梯度影响排名蒸馏到编码器,实现快速且成本高效的大规模数据归因。
Comments 8 pages, 2 figures
HyperTool:超越逐步工具调用的工具增强型智能体
发表机构 * Shanghai Jiao Tong University(上海交通大学) ; IQuest Research ; Beijing University of Aeronautics and Astronautics(北京航空航天大学)
AI总结 针对工具增强型LLM中逐步调用导致执行粒度不匹配的问题,提出HyperTool统一可执行接口,将确定性工具子流程折叠为单次调用,在多步工具任务上显著提升准确率。
世界追踪:超越可见表面的生成式像素对齐几何
发表机构 * World Labs ; University of Illinois Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校)
AI总结 提出世界追踪(World Tracing),一种生成式像素对齐几何表示,通过扩散变压器预测有序点栈,同时重建可见表面和生成遮挡几何,在多个基准上超越深度预测和图像到3D方法。
Comments World Labs Technical Report; Page: https://haoz19.github.io/world-tracing-page/
Operadic一致性:LLM中组合推理失败的无标签信号
发表机构 * Incubilate ; University of Cambridge(剑桥大学) ; Allen Institute for Artificial Intelligence(艾伦人工智能研究所)
AI总结 提出Operadic一致性(OC)作为检测大语言模型组合推理失败的无标签信号,在四个多跳QA数据集上与准确率强相关(Pearson r≥0.86),优于自一致性等方法。
SkMTEB:斯洛伐克大规模文本嵌入基准与模型适配
发表机构 * Comenius University in Bratislava(布拉迪斯拉发夸美纽斯大学) ; Cisco Systems(思科系统) ; Technical University of Košice(科希策技术大学) ; Kempelen Institute of Intelligent Technologies(肯佩伦智能技术研究所)
AI总结 针对低资源西斯拉夫语斯洛伐克语,构建首个MTEB风格文本嵌入基准SkMTEB(含31个数据集、7类任务),并开发高效本地部署模型e5-sk-small/large,通过词汇裁剪与微调在参数减少62%下达到与商业API相当的竞争力。
Comments ACL 2026
Surflo:具有全局状态的一致3D表面流模型
发表机构 * LIX, École polytechnique(LIX,巴黎综合理工学院) ; Kyoto University(京都大学) ; Kyutai ; UC Berkeley(加州大学伯克利分校)
AI总结 提出Surflo模型,通过将可变数量的无位姿RGB视图压缩为全局潜变量,并利用流匹配从噪声中独立传输3D表面点,实现任意分辨率的一致表面重建,推理时通过光度梯度引导消除局部不一致性。
Comments Project webpage: https://anttwo.github.io/surflo/
递归智能体框架
发表机构 * PricewaterhouseCoopers, U.S.(普华永道(美国))
AI总结 提出递归智能体框架(RAH),通过代码优先的框架递归扩展模型递归,在长上下文推理中显著提升编码智能体性能。
移动的无人机:在声音与虚拟之间协商能动性
发表机构 * Massachusettes Institute of Technology(麻省理工学院) ; Harvard University(哈佛大学)
AI总结 基于印度斯坦音乐,通过Max/MSP循环器和生成式AI模型GaMaDHaNi,将传统静态无人机变为动态、主动的虚拟音乐代理,探讨人机协作中的能动性。
Comments Published in NIME music track 2026
稳定恢复流形:持续学习中可恢复性的几何原理
发表机构 * ResNet-18 ; Split CIFAR-100
AI总结 通过分析Split CIFAR-100上ResNet-18的顺序学习,发现遗忘知识在表示重组后仍可紧凑解码,提出稳定恢复流形假说,表明灾难性遗忘主要是可访问性和流形对齐问题。
Comments 9 pages, 8 figures, 8 tables
从词元到面部:探究用于3D面部动画的离散语音表示
发表机构 * Univ. Estadual de Campinas (UNICAMP), Brazil(巴西坎皮纳斯州立大学(UNICAMP)) ; Univ. Grenoble Alpes, CNRS, Grenoble INP, GIPSA-lab, France(法国格勒诺布尔阿尔卑斯大学,CNRS,格勒诺布尔国立理工学院,GIPSA实验室) ; Inria at Univ. Grenoble Alpes, CNRS, LJK, France(法国格勒诺布尔阿尔卑斯大学Inria,CNRS,LJK)
AI总结 研究评估四种语音表示在3D面部合成中的效果,发现编码音素类别有利于准确预测面部动画,并基于此提出音频视觉文本到语音管线。
Comments This work has been accepted in Interspeech 2026
重新审视长尾监控场景中的车辆颜色识别
发表机构 * Pontifical Catholic University of Paraná(巴拉那天主教大学) ; National High Court of Brazil(巴西国家高等法院) ; Federal University of Paraná(巴拉那联邦大学)
AI总结 针对监控场景中车辆颜色分布高度不平衡的问题,本文提出结合生成式数据增强、视觉表征、损失重加权等方法的综合方案,在UFPR-VeSV数据集上实现94.6%微平均和79.7%宏平均准确率,宏平均比近期文献提升8.2个百分点。
Comments Accepted for presentation at the 2026 International Conference on Pattern Recognition (ICPR) - V3SC Workshop
超越统一令牌:时间序列语言模型的自适应压缩
发表机构 * Zhejiang University(浙江大学) ; Harbin Institute of Technology(哈尔滨工业大学) ; Shandong University(山东大学)
AI总结 针对时间序列语言模型中令牌效率低的问题,提出自适应令牌预算框架,通过频域结构压缩时间序列令牌并逐层减少提示令牌,实现高达7.68倍推理加速并在78%设置中提升性能。
超越运行时强制:作为对抗网络可防御性分析的盾牌合成
发表机构 * Information and Computer Science Department, King Fahd University of Petroleum and Minerals(信息与计算机科学系,法赫德国王石油矿产大学)
AI总结 提出将盾牌合成重新解释为设计时分析工具,通过约束双人安全博弈生成可防御性判定,并融合拓扑度量和强化学习行为形成可防御性指纹,揭示系统安全的结构性见解。
Comments 26 pages, 7 figures, 7 tables. Under review at JAIR. Code: https://github.com/AchrafHsain7/Bastion
一个被污染的页面就够了:评估生成式推荐系统中的网页内容污染
发表机构 * The Chinese University of Hong Kong(香港中文大学)
AI总结 本研究提出FORGE基准,评估搜索增强LLM在检索结果被污染时推荐虚假产品的脆弱性,发现单个污染页面即可导致高达27%的推荐错误率,且推理能力无法缓解此问题。
基于延迟市场反馈的多智能体强化学习在三方调度中的目标权重自适应
发表机构 * DoorDash
AI总结 提出在DoorDash部署的强化学习系统,利用延迟信号自适应调整调度目标权重,通过离线策略学习在噪声和耦合反馈下优化配送质量与批处理效率的权衡。
Comments Accepted at ICML 2026 Workshop on Reinforcement Learning from World Feedback (RLxF)
超越承诺边界:探究大型推理模型中的附带思维链
发表机构 * CLCG, University of Groningen(格罗宁根大学CLCG) ; University of Milano-Bicocca(米兰-布雷拉大学) ; University of Trieste(特里耶大学) ; Khoury College of Computer Sciences, Northeastern University(东北大学Khoury计算机科学学院)
AI总结 通过早期退出估计思维链步骤的因果重要性,发现推理中存在从瞬态猜测到稳定答案的“承诺边界”,后续步骤为附带现象,可提前退出以缩短推理长度达55%而不影响性能。
EpiBench:人工智能代理在表观基因组学分析中的可验证评估
发表机构 * LatchBio
AI总结 提出EpiBench基准,通过106个评估任务测试AI代理在表观基因组学工作流中的决策能力,发现最佳系统GPT-5.5/Pi通过率仅45%,失败多因缺乏深度科学判断。
MCR-Bionic Hand: 用于灵巧操作的解剖结构先验
发表机构 * University of Salford(索尔福德大学)
AI总结 本文提出MCR-Bionic Hand,一种基于人体手部解剖结构先验的仿生机械手,通过结构智能实现低维控制到灵巧操作的映射,在接触密集型任务中验证了其有效性。
多智能体编排的奖励建模
发表机构 * Rutgers University(罗杰斯大学) ; Salesforce AI Research(Salesforce人工智能研究)
AI总结 提出OrchRM框架,通过自监督学习从多智能体执行中间产物构建奖励模型,无需人工标注,实现高效编排器训练和测试时扩展,在多个领域提升性能并降低计算成本。
Comments Preprint; work in progress
带有聚合置信信号的多智能体协议
发表机构 * University of Illinois Chicago(伊利诺伊大学芝加哥分校)
AI总结 提出三种协议,通过转换原始置信信号并采用软投票或贝叶斯融合,为多智能体系统输出聚合置信度,在保持正确性的同时显著提升判别能力。
Comments 22 pages and 5 figures, 9 pages and 2 figures before the appendix
面向杂乱背景下的自动废物回收的有效废物分割
发表机构 * University of Science and Technology Beijing(北京科技大学)
AI总结 提出一种结合空间域和谱域的级联分割网络,并引入辅助特征增强模块,在杂乱场景下实现高效废物分割,在三个数据集上验证了有效性。
Comments accepted at ICML 2026
EvTexture++: 事件驱动的视频超分辨率纹理增强
发表机构 * MOE Key Laboratory of Brain-Inspired Intelligent Perception and Cognition, University of Science and Technology of China(中国科学技术大学,脑启发智能感知与认知教育部重点实验室) ; Midea Group(美的集团)
AI总结 提出首个事件驱动的视频超分辨率纹理增强框架EvTexture++,利用事件的高频时空细节逐步恢复纹理,并通过时间纹理对齐模块增强帧间一致性,在多个数据集上达到最优性能。
Comments IEEE TPAMI 2026. Extended version of arXiv:2406.13457 (ICML 2024). Project page: https://dachunkai.github.io/evtexture-project-page/
Journal ref IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 48, no. 6, pp. 6642-6659, June 2026
与模拟器学习:计算受限世界中的无悔学习
发表机构 * MIT(麻省理工学院) ; Microsoft Research(微软研究院)
AI总结 提出可模拟过程框架,利用模拟器近似任意复杂依赖的数据分布,恢复VC维误差界,并展示条件采样的统计与计算优势。
Comments To appear at COLT 2026