Geometric Workspace Analysis and Transmission-Aware Dynamics of a Serial Spherical Tool for Microsurgery
显微外科用串行球形工具的几何工作空间分析与传动感知动力学
AI总结 提出一种用于显微外科的串行球形机构(带额外平移自由度)的运动学与传动感知设计框架,通过解析工作空间公式和传动感知动力学方法实现快速设计评估。
显微外科用串行球形工具的几何工作空间分析与传动感知动力学
AI总结 提出一种用于显微外科的串行球形机构(带额外平移自由度)的运动学与传动感知设计框架,通过解析工作空间公式和传动感知动力学方法实现快速设计评估。
强化学习的收缩反馈语义
AI总结 本文通过将单步决策过程视为开放随机组件,并利用收缩反馈环实现无限时域策略评估,建立了强化学习的组合语义,并推导出近似等价、状态抽象和合约规范的理论结果。
智能体不确定性量化的适当评分规则
AI总结 针对语言模型智能体轨迹中的不确定性信号,提出严格适当的轨迹评分规则TPS,用于评估逐步骤成功概率过程,并处理删失数据。
Comments 38 pages, 2 figures
使用多智能体语言模型自动检测和分类自然音频日记中的妄想相关内容
AI总结 提出一种多智能体LLM流水线,从自然音频日记中自动检测和分类妄想信念、情感和行为反应,通过多数投票实现稳健性能。
Comments Accepted by CLPych 2026
运动补偿权重压缩
AI总结 提出运动补偿权重压缩(MCWC)方法,通过对齐置换对称块并利用层序预测和熵编码,有效压缩神经网络权重,在Transformer语言建模和视觉分类任务中提升率-精度帕累托前沿。
Comments 54 pages, 17 tables, 6 Figures
点云中的鬼影:瞬态域中的LiDAR去眩光
AI总结 针对固态LiDAR内部多径眩光导致的伪影问题,提出基于瞬态眩光扩散函数(TGSF)的物理模型和无训练算法,在点云形成前抑制眩光,保留真实场景结构。
Comments CVPR 2026
从Ising模型中学习采样的计算相变
AI总结 本研究构造了谱阈值以上的有界宽度Ising模型族,证明在标准密码学假设下学习采样是计算困难的,从而在谱阈值处建立了尖锐的计算相变。
用于多轮LLM微调的合成轨迹的双层优化
AI总结 提出BOOST双层优化框架,通过内层加权训练和外层轻量级重加权头学习,解决合成轨迹质量异质性导致的LLM多轮交互性能下降问题。
通过InChIfied不变量将分子图解释与化学身份对齐
AI总结 提出基于InChI的节点、边和图特征(InChIfied Invariants),确保化学等价分子图具有一致表示,从而提升预测和解释的一致性。
可达性的强化学习:保证渐近最优性
AI总结 针对可达性规格的强化学习,提出一种基于PAC学习的迭代方法,在无需已知MDP内部参数的情况下实现渐近最优策略,并通过实验验证收敛动态。
Comments Main text and appendix of work accepted in ICML 2026
谁来评判评判者?基于指标的治理:面向持续LLM合规监控的运行时框架
AI总结 针对AI合规作为审计时二元判定而非生产系统持续可测量属性的问题,提出基于指标的治理原则,并开发开源框架govllm,通过运行时可观测性信号实现持续合规监控,验证了多模型陪审团设计在监管评估中的有效性。
Comments 41 pages, 8 figures, preprint
StepGap:一种用于多跳问答中步骤级证据缺口检测的混合NLI-LLM检查器
AI总结 提出混合NLI-LLM决策树StepGap,用于检测多跳问答中的步骤级证据缺口并输出三类标签,在82个问题上达到sF1=72.0,且作为GRPO过程奖励可提升模型精确匹配率。
从整板到微小缺陷:面向高分辨率PCB缺陷检测的尺度感知瓦片推理与拓扑感知合并
AI总结 针对高分辨率PCB图像缩放导致微小缺陷丢失的问题,提出基于瓦片推理的尺度一致训练策略和拓扑感知合并方法,无需重新训练即可显著提升缺陷检测精度。
校准具有标注者分歧的概率目标检测器
AI总结 针对目标检测中因物体模糊性导致标注者分歧的问题,提出一种无需真实标注即可校准概率目标检测器的方法,通过设计分类和定位校准误差指标及训练时/事后校准器,使模型预测不确定性匹配标注分布。
ROC分析用于评估翻译质量估计系统
AI总结 本文提出使用接收者操作特征(ROC)分析评估自动翻译质量估计(QE)系统,该方法与现有方法结果一致,并能为商业决策提供可操作的性能洞察。
Comments 16 pages, 8 PNG figures, 3 tables, uses acl.sty
世界状态转换用于神经符号交互式故事讲述
AI总结 本研究探索在神经符号架构中利用LLM预测规则系统中的世界状态转换,以解决纯LLM方法的故事连贯性问题,并通过实验表明该方法能保持世界状态一致性并促进玩家创造性输入。
Comments To be presented at the 17th International Conference on Computational Creativity (ICCC'26)
25种欧洲语言的Tokenizer税:领域不变性、跨语言少样本效应与乌克兰语惩罚
AI总结 研究测量了10个基础模型在25种欧洲语言上的tokenizer生育率,揭示了从英语到其他语言的成本差异,并发现乌克兰语因预训练数据不足而支付额外成本。
Comments 16 pages, 3 figures, 8 tables. Dataset: https://huggingface.co/datasets/overthelex/tokenizer-fertility-map
面向语音情感识别的硬件感知联邦学习
AI总结 提出一种硬件感知联邦学习框架,通过硬件性能分析、Top-K客户端选择和自适应本地轮数,在IEMOCAP数据集上实现情感识别,相比FedAvg减少约36.5%训练时间和40%通信成本。
Comments 4 pages, 3 figures, 4 Tables
μP 下宽神经网络中的特征学习:平均场极限的可辨识性与稀疏字典分解
AI总结 本文在最大更新参数化(μP)下,针对宽两层神经网络,建立了特征学习的四个结构结果,包括平均场极限的全局存在唯一性、可辨识性刻画、稀疏字典分解以及总特征学习误差分解,并揭示了架构-数据对的自然学习单元。
Comments 86 pages
部分可观测下的流式强化学习与实时循环学习
AI总结 提出使用递归迹单元(RTU)实现精确实时循环学习(RTRL),在参数数量上具有线性时间和内存复杂度,解决了部分可观测环境下流式强化学习的梯度计算瓶颈,并在离散和连续控制任务中保持性能。
Comments 16 pages, 4 figures
TS-Skill: 用于评估时间序列问答中分析技能的基准
AI总结 提出TS-Skill基准,通过三种可组合的分析技能(时间尺度选择、时间定位和跨区间整合)来诊断时间序列问答中模型的信号级能力,并开发SKEvol框架自动构建基准,实验揭示不同技能上的能力差距。
图像-文本度量是否尊重语义不变性?
AI总结 通过空间、物体和社会语言框架三个维度的语义保持扰动,系统评估了五种流行图像-文本评估器(CLIPScore、PAC-S、UMIC、FLEUR和确定性LLM评判)的语义不变性,发现它们对非语义变化敏感,并提出了不变性校准评分作为后处理调整方法。
MDIA:HealthBench Professional上的多智能体诊断智能流水线
AI总结 提出MDIA多智能体诊断系统,通过7节点专业路由临床推理图架构,在非微调LLM上实现HealthBench Professional基准性能提升3.72个百分点,归因于系统架构设计而非提示工程。
Comments 33 pages, 10 figures
路径很重要:学习扩散语言模型的令牌提交策略
AI总结 本文提出TraceLock,一种轻量级可插拔控制器,通过学习可复用的轨迹状态策略来优化扩散语言模型中的令牌提交决策,从而改善质量与步数之间的权衡。
CP-Agent: 一种用于反馈驱动竞赛编程的校准风险控制智能体
AI总结 提出CP-Agent,通过校准停止过程建模反馈驱动求解,结合双重粒度验证、测试增强和经验驱动自我进化机制,在不更新参数的情况下显著提升竞赛编程性能。
Comments Code: https://github.com/NineAbyss/CP-Agent
AdaFuse-Det: 自适应跨模态融合事件相机用于低光照RGB图像中的鲁棒目标检测
AI总结 提出AdaFuse-Det双流框架,通过基于最小方差线性估计的自适应跨模态融合模块融合CLAHE增强RGB与事件数据,在低光照下实现鲁棒目标检测,在LLE-VOS基准上召回率65.54%、精确率53.85%、F1分数59.12%。
运动规划的动态引导代价和扩散模型
AI总结 提出一种基于扩散模型的高泛化运动规划方法,通过总碰撞代价梯度引导去噪过程并动态选择引导起始步,在Mπnets数据集上取得最优性能。
Comments Accepted at the Frontiers of Optimization for Robotics Workshop at the IEEE International Conference of Robotics & Automation (ICRA), 2026
HoloFair: 统一的T2I公平性评估与Fair-GRPO去偏
AI总结 提出HoloFair基准框架,通过多属性组间偏差指数(MGBI)评估文本到图像模型的公平性,并引入基于强化学习的Fair-GRPO方法进行去偏,在SD3.5-Medium模型上显著提升多维公平性且保持图像质量。
Comments Accepted to ICML 2026. Code and dataset are available at https://github.com/1059684669/HoloFair
大型语言模型中的情商在感知、认知和交互上存在碎片化
AI总结 本文提出FACET框架,基于Mayer-Salovey-Caruso四分支能力模型评估大型语言模型的情商,发现其并非单一能力,而是在认知和交互维度上碎片化,且隐藏情绪识别是普遍瓶颈。
超越聚合困境:多模态图的先验保持解耦学习
AI总结 针对多模态属性图学习中强制聚合导致性能反转的聚合困境,提出解耦双路径架构SUPRA,通过保持先验特征的独立性和轻量级共享GNN捕获结构协同,并辅以深度监督缓解梯度饥饿,实现SOTA性能且显著降低计算开销。