A Two-Dimensional Framework for AI Agent Design Patterns: Cognitive Function and Execution Topology
AI智能体设计模式的二维框架:认知功能与执行拓扑
AI总结 提出一个结合认知功能(7类)和执行拓扑(6种结构)的二维分类框架,识别28种命名模式,并通过跨领域分析得出模式选择的五条经验法则。
Comments 10 pages, 6 tables, 28 named patterns
AI智能体设计模式的二维框架:认知功能与执行拓扑
AI总结 提出一个结合认知功能(7类)和执行拓扑(6种结构)的二维分类框架,识别28种命名模式,并通过跨领域分析得出模式选择的五条经验法则。
Comments 10 pages, 6 tables, 28 named patterns
经典规划中提升动作模式的可微学习
AI总结 提出一种神经网络架构,从完全可观测状态但动作参数未观测的轨迹中学习提升动作模式,实现近乎完美的结构恢复。
涌现性失调中的人格模型崩溃
AI总结 提出人格模型崩溃假说,通过道德易感性(S)和道德稳健性(R)两个指标,证明在有害数据上微调大语言模型会导致模型模拟、区分和维持一致角色的内部能力恶化,从而引发涌现性失调。
Comments 23 pages, 7 figures, 7 tables; NeurIPS 2026 submission; Corrected code repository URL
在线策略蒸馏的多种面貌:陷阱、机制与修复
AI总结 本文通过实证研究分析了在线策略蒸馏(OPD)和在线策略自蒸馏(OPSD)在大语言模型后训练中的有效性、失败机制及修复方法。
SURGE: 二值神经网络中的替代梯度自适应
AI总结 针对二值神经网络中梯度失配和固定范围梯度裁剪导致的信息损失问题,提出一种基于理论的可学习梯度补偿框架SURGE,通过双路径梯度补偿器和自适应梯度缩放器实现偏差减少的梯度估计与动态平衡,在图像分类、目标检测和语言理解任务上达到最优性能。
Comments Accepted as a poster at the 43rd International Conference on Machine Learning (ICML 2026)
跟随均值:参考引导的流匹配
AI总结 提出通过改变参考集均值来引导预训练流匹配模型实现可控生成,无需微调或额外网络。
Flow-OPD:面向流匹配模型的在线策略蒸馏
AI总结 提出Flow-OPD框架,通过两阶段对齐策略(单奖励GRPO微调专家+流式冷启动与在线策略蒸馏)解决流匹配模型在多任务对齐中的奖励稀疏和梯度干扰问题,并引入流形锚点正则化抑制美学退化,在GenEval和OCR指标上显著提升。
Comments Project Page: https://costaliya.github.io/Flow-OPD/ , Code: https://github.com/CostaliyA/Flow-OPD
TRAS:一种用于追踪树木年轮横截面的交互式软件
AI总结 提出TRAS开源图形软件,集成三种检测算法(CS-TRD、DeepCS-TRD、INBD),实现树木年轮自动勾画、手动校正和测量,在松木横截面图像上DeepCS-TRD达到81.0% F值,显著减少手动校正工作量。
Comments This manuscript has been accepted for publication in Forestry: An International Journal of Forest Research, published by Oxford University Press. This is an author-produced version and may differ from the final Version of Record. The final published version will be available through the journal website
自动简答题评分中的质量条件一致性:中等范围退化与任务特定适应的影响
AI总结 研究自动简答题评分中不同模型的任务适应程度与质量条件评分一致性的关系,发现所有AI模型在完全正确和完全错误的回答上表现良好,但在中等范围回答上出现显著退化,且退化程度与任务特定数据量相关。
Comments PRE-PRINT VERSION Accepted to ACL 21st Workshop on Innovative Use of NLP for Building Educational Applications (BEA26)
PACZero: 通过符号量化的语言模型PAC隐私微调
AI总结 提出PACZero系列零阶机制,通过符号量化实现零互信息下的PAC隐私微调,在SST-2和SQuAD上取得竞争性结果。
基于随机洗牌的DP-SGD的权衡函数:紧的上界和下界
AI总结 本文在$f$-DP框架下,针对基于随机洗牌子采样的差分隐私随机梯度下降(DP-SGD),推导了权衡函数的紧致分析,得到了透明且可解释的闭式界,并展示了单轮训练中达到有意义的差分隐私所需的参数设置。
使用行为树和LLM的组合任务奖励塑造与动作掩码
AI总结 提出MRBT结构,结合LLM自动生成奖励和动作掩码,通过SMT验证和神经符号RL循环,提升组合任务训练效率和成功率。
全谱图神经网络:表达力与可扩展性
AI总结 提出全谱图神经网络(FSpecGNN),通过将信号从节点域提升到节点对域并将单变量谱滤波器扩展为双变量滤波器,实现了对节点对信号的通用逼近,同时保持可扩展性。
Comments 41 pages, 4 figures. Accepted to ICML 2026
将结果监督内化为过程监督:推理强化学习的新范式
AI总结 提出一种监督内化方法,使模型在仅结果监督下自动提取过程级学习信号,实现细粒度策略优化。
基于增量构建占据栅格地图的全向机器人闭式双障碍CBF安全滤波器
AI总结 提出一种闭式双障碍控制障碍函数安全滤波器,通过解析推导占据栅格地图的符号距离场,同时避免已映射障碍物并限制进入未探索区域,实现全向机器人在资源受限平台上的实时安全控制。
通过测试时后验调整缓解表格上下文学习中的标签偏移
AI总结 针对TabPFN在表格数据上下文学习中对标签偏移敏感的问题,提出DistPFN方法,通过测试时后验调整重新缩放类别概率,无需修改架构或额外训练,在250多个OpenML数据集上显著提升分类性能。
Comments ICML 2026
从肌肉爆发到运动意图:面向异质EMG的自监督令牌建模
AI总结 提出AEMG自监督学习方法,通过事件级令牌建模和Transformer编码,从异质EMG数据中提取可复用的神经肌肉表征,提升跨用户、跨会话的鲁棒性并减少校准数据需求。
Comments After further verification, we identified issues in the current version that may affect the reliability and reproducibility of the reported experimental results. In particular, part of the evaluation relies on a dataset for which the public-release/redistribution status and supporting validation remain unresolved
稀疏混合专家模型中的软到硬路由
AI总结 本文通过边界层微积分方法,研究了稀疏混合专家模型中softmax路由随温度趋于零时趋近于硬top-1路由的极限过程,并给出了基于路由界面邻域概率的定量误差界。
可靠AI需要外化隐性知识:人机协作视角
AI总结 本文从人机协作视角提出,可靠AI需要基础设施将隐性知识外化为可验证的形式,通过知识对象(KOs)实现人类验证,从而提升可靠性。
Comments Accepted at ICML 2026 (Position Paper Track). 14 pages, 2 figures, 1 table
监控视频中罕见交通事件的两次通过零样本时空定位
AI总结 提出一种无需微调的管道,通过粗到细的两遍分解和专家角色分配,利用冻结视觉语言模型实现罕见交通事件在时间、空间和碰撞类型上的联合定位。
Comments Accepted at CVPR 2026 AUTOPILOT Workshop (Non-Archival Track). 7 pages (4 main + references + appendix), 3 figures, 5 tables
证据链:面向迭代检索增强生成的像素级视觉归因
AI总结 提出Chain of Evidence (CoE)框架,利用视觉语言模型直接对检索到的文档截图进行推理,输出精确边界框以可视化完整推理链,解决迭代检索增强生成中的粗粒度归因和视觉语义丢失问题。
当LLM停止遵循步骤:语言模型中程序执行的诊断研究
AI总结 本研究通过构建受控诊断基准,评估大型语言模型在程序执行任务中的忠实性,发现随着步骤增加准确率从63%降至20%,并揭示了缺失答案、过早答案、自我修正和执行不完整等失败模式。
Comments 86 pages, 124 figures, 4 Tables
生成式结构搜索:高效且多样地发现分子和晶体结构
AI总结 提出生成式结构搜索(GSS)框架,结合扩散模型和随机结构搜索,利用数据先验加速采样并保持能量引导的局部极小探索,以低于随机结构搜索十分之一的成本恢复多样亚稳态结构。
MoBayes:一种用于对话式临床决策支持中推理与语言分离的模块化贝叶斯框架
AI总结 提出MoBayes框架,通过将LLM作为语言接口、贝叶斯模块进行概率推理,实现推理与语言分离,在临床决策支持中优于独立前沿LLM医生。
Comments 50 pages including appendix, 13 figures, 22 tables. Preprint
印度之声:面向印度真实世界语音识别的大规模基准
AI总结 针对现有Indic ASR基准的局限性,提出基于非脚本电话对话的封闭源基准Voice of India,覆盖15种主要印度语言和139个区域集群,包含306230条语音(536小时),并分析地理、音频质量、语速、性别和设备类型等因素对ASR性能的影响。
Comments 6 pages, 4 figures
Copy-as-Decode: 面向LLM编辑的语法约束并行预填充
AI总结 提出Copy-as-Decode机制,通过语法约束的并行预填充加速LLM编辑,实现高达303倍的自回归解码加速,并保持高覆盖率与无损性。
Comments The authors have decided to withdraw this version following internal review regarding authorship and contribution agreements
深度寄存器解锁 SwiGLU 上的 W4A4:一种读取器/生成器分解
AI总结 本研究通过深度寄存器和铰链损失(DR+sink)训练时干预,将 SwiGLU 解码器语言模型的 W4A4 量化困惑度从 1727 降至 119,并分解出残差轴读取器主导误差,而生成器 w2 的双线性输入是剩余差距的主因。
Comments The authors have decided to withdraw this version following internal review regarding authorship and contribution agreements
用于光滑可微且高效可向量化的接触流形构建的新算法
AI总结 针对接触丰富场景中机器人行为优化,提出一种以光滑二次可微性和GPU大规模可向量化为优先的新碰撞检测流水线,包括可微SDF表示、宽/窄阶段例程和凸分解接触融合。
Comments This version adds late-breaking results in preparation for the CR2 workshop in ICRA 2026
重新思考序列级强化学习中的比较单元:从损失校正到样本构建的等长配对训练框架
AI总结 本文提出序列级相对强化学习中的长度问题本质是比较单元构建问题,并基于此提出等长配对训练框架EqLen,通过双轨同步生成、前缀继承和段掩码构建可比较的训练样本。
文本上的联邦:多智能体推理的洞察共享
AI总结 提出一种类似联邦学习的框架FoT,通过迭代聚合多个客户端的本地推理过程,构建跨任务元认知洞察库,无需共享问题实例或任务指令,显著提升推理效果和效率。
Comments 46 pages