KACE: Knowledge-Adaptive Context Engineering for Mathematical Reasoning
KACE: 知识自适应上下文工程用于数学推理
发表机构 * School of Computing, University of Georgia(计算学院,佐治亚大学)
AI总结 提出KACE方法,通过难度和领域分层的知识库与分层自一致性,解决数学推理中上下文膨胀问题,在AIME 2025上达到62.2%准确率。
KACE: 知识自适应上下文工程用于数学推理
发表机构 * School of Computing, University of Georgia(计算学院,佐治亚大学)
AI总结 提出KACE方法,通过难度和领域分层的知识库与分层自一致性,解决数学推理中上下文膨胀问题,在AIME 2025上达到62.2%准确率。
ProactiveLLM: 学习流式大语言模型的主动交互
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 提出ProactiveLLM,利用模型内生状态指导交互决策,通过掩码流式建模和同步特权自蒸馏实现主动交互,减少延迟并保持质量。
DriveAnchor: 用于自动驾驶规划的渐进式基于锚点的流学习
发表机构 * Meituan Autonomous Driving(美团自动驾驶) ; Xi’an Jiaotong University(西安交通大学) ; Beijing Institute of Technology(北京理工大学)
AI总结 提出三阶段框架DriveAnchor,通过示范流预训练、引导流后训练和奖励精炼流微调,实现行为多样性、可控性和安全性,在200万场景中近距碰撞率降低89%,平均奖励提升32%。
与AI行动:基于交互的代理侵权责任框架
发表机构 * Yiheng Yao(姚艺恒)
AI总结 本文基于Bratman规划理论和普通法人类协同行动原则,提出一种交互分类框架(自主漂移、纯工具使用、协作规划)来分配AI代理系统的侵权责任,并引入“合理代理”标准。
基于阈值的独占批处理用于LLM推理
发表机构 * arXiv.org
AI总结 针对混合批处理中预填充与解码干扰导致边际成本上升的问题,提出基于GPU内存带宽、模型大小和工作负载的EB-MB性能交叉条件及最优切换阈值,优化后的独占批处理在带宽受限GPU上吞吐量提升高达41.9%。
PaCo-VLA: 用于富接触视觉-语言-动作操控的被动屏蔽柔顺先验
发表机构 * Southwest Jiaotong University(西南交通大学) ; University of Leeds(莱斯特大学)
AI总结 提出PaCo-VLA框架,通过被动屏蔽将VLA模型输出转化为任务级柔顺建议,并利用能量罐和边界检查防止无效预测绕过底层接触物理,实现安全精确的富接触操控。
在重建空间中生成,在语义空间中匹配:一步生成的传输几何
发表机构 * Genentech(基因泰克)
AI总结 本文研究自监督表示学习(SSL)特征在一步生成模型中的作用,提出在语义特征空间中使用Sinkhorn散度进行分布匹配,显著降低ImageNet FID,并揭示了评估指标与训练特征之间的潜在冲突。
带噪声代理协变量的半监督学习:泛化界与分布回归
发表机构 * arXiv.org
AI总结 针对带噪声代理协变量的半监督回归问题,提出两阶段估计器,利用所有代理协变量学习核本征特征,并在标记数据上拟合岭回归,理论证明在代理扰动可控且未标记代理协变量充足时能恢复快速标记样本率,实验表明在低标记率下优于监督和半监督基线。
显著性感知模型合并
发表机构 * arXiv.org
AI总结 提出SA-Merging方法,利用结构剪枝中的连通性显著性(如SynFlow)进行数据无关模型合并,通过任务向量显著性评分和合并感知调制减少任务干扰,并在视觉和语言任务上验证有效性。
技能还是跳过?通过双粒度偏好学习在智能体任务中学习选择性技能调用
发表机构 * Meituan(美团) ; Fudan University(复旦大学) ; Shanghai Jiao Tong University(上海交通大学) ; Nanjing University(南京大学) ; Peking University(北京大学)
AI总结 提出SelSkill框架,通过双粒度偏好学习实现选择性技能调用,在ALFWorld和BFCL上显著提升任务成功率和执行精度。
复杂介质中偏振形状恢复的结构感知一致性先验
发表机构 * arXiv.org ; cs.CV(计算机视觉)
AI总结 针对复杂介质(以冰为例)中偏振观测与表面法线间的非线性映射问题,提出基于自相关函数的结构感知偏振先验,并设计双分支网络IceSfP通过跨模态注意力和多尺度特征融合实现精确法线估计,在首个真实冰SfP数据集上达到16.01°的平均角度误差。
V-LynX: 视频+X 大语言模型的令牌接口对齐
发表机构 * arXiv.org ; cs.CV(计算机视觉)
AI总结 本文发现视频大语言模型中存在令牌接口连续流形,并提出V-LynX框架,通过轻量辅助路径对齐注意力响应和统计分布,无需配对监督即可集成新模态,在音视频问答、3D推理等任务上达到最优效率。
LaSR:通过潜在推理实现上下文感知的语音识别
发表机构 * Shanghai Jiao Tong University(上海交通大学) ; Ant Group(蚂蚁集团)
AI总结 提出LaSR训练范式,利用潜在推理轨迹增强语音大语言模型的上下文感知能力,在学术术语识别上显著提升性能且不增加延迟。
EnergyMamba:一种用于能耗预测的具有不确定性感知的图增强选择性状态空间模型
发表机构 * Florida State University(佛罗里达州立大学)
AI总结 提出EnergyMamba框架,通过图增强选择性状态空间模型(GE-Mamba)和自适应序列分位数回归(AS-CQR)模块,实现时空联合建模与不确定性量化,在能耗预测中提升准确率约5%、不确定性量化约6%。
TabChange: 表格数据中的精确属性变化
发表机构 * The University of Texas at Arlington(德克萨斯大学阿灵顿分校) ; National Institute of Standards and Technology(美国国家标准与技术研究院) ; Information Technology Laboratory(信息技术实验室)
AI总结 针对表格数据中修改属性时破坏自然性的问题,提出TabChange方法,通过分析属性间关系并利用对抗框架去除潜在空间中的属性信息,实现精确且自然的属性修改。
OptiWorld: 物理约束下的视频世界生成最优控制
发表机构 * Purdue University(普渡大学) ; University of Oxford(牛津大学) ; SixteenMiles Labs(SixteenMiles 实验室)
AI总结 提出OptiWorld框架,在推理时结合经典最优控制与视频生成,通过提取紧凑世界状态、规划最优轨迹并生成条件视频,实现符合物理约束的动态优化。
大规模神经相位分析的环面图模型
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 提出一种随机得分匹配方法,将环面图模型的计算复杂度从O(d^6)降至O(d^2),使其能处理数千变量,并扩展至隐马尔可夫模型和自回归模型,用于分析脑状态依赖的相位耦合和方向性交互。
CT分割系统的部署前鲁棒性压力测试:使用临床驱动的多损坏增强
发表机构 * Seoul National University(首尔国立大学) ; Google Inc.(谷歌公司)
AI总结 提出RAMP框架,通过多损坏增强提升CT分割模型在临床异质成像条件下的鲁棒性,显著缩小干净与损坏图像性能差距。
TAPS: 面向扩散草稿推测解码的目标感知前缀树选择
发表机构 * The Hong Kong University of Science and Technology (Guangzhou)(香港科学与技术大学(广州))
AI总结 提出TAPS方法,通过目标感知的前缀树选择优化扩散模型草稿的验证效率,实现最高7.9倍无损加速。
文本编辑能否泛化到视觉生成?统一多模态模型中的跨模态知识编辑基准
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; Stanford University(斯坦福大学) ; University of Toronto(多伦多大学) ; University of Washington(华盛顿大学)
AI总结 提出跨模态知识编辑基准UniKE,发现文本编辑在图像生成中效果显著下降(VQA准确率仅18.5%),并提出推理增强参数编辑方法提升跨模态迁移效果。
做他们所说的,而不是他们所推理的:定位LLM智能体中的忠实性差距
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 通过将忠实性差距分解为推理-结论和结论-行动两个步骤,在可控的德克萨斯扑克模拟器中研究LLM智能体是否按照其陈述的推理行动。
CodeCytos: 通过代码增强的智能体动作空间实现AI辅助空间分子成像分析
发表机构 * University of Houston, Department of Electrical and Computer Engineering(德克萨斯大学休斯顿分校电子与计算机工程系) ; Houston Methodist Hospital, Department of Systems Medicine and Biomedical Engineering(休斯顿 Methodist 医院系统医学与生物医学工程系)
AI总结 提出CodeCytos框架,通过代码驱动的推理智能体实现空间分子成像数据的动态可编程分析,提升自动化与定制化能力,并在多种组织类型数据集上验证其优于基线方法。
MUSCLE-NET:面向行人轨迹预测的预测多尺度感知网络
发表机构 * Guangdong Provincial Key Laboratory of Fully Actuated System Control Theory and Technology, School of Automation and Intelligent Manufacturing, Southern University of Science and Technology (SUSTech), Shenzhen(广东省全主动系统控制理论与技术重点实验室,自动化与智能制造学院,南方科技大学(SUSTech),深圳) ; Department of Mechanical Engineering, City University of Hong Kong, Hong Kong SAR, China(香港城市大学机械工程系,香港特别行政区,中国)
AI总结 提出MUSCLE-NET,通过多尺度多模态特征提取和尺度自适应预测机制,解决现有方法对观测信息利用不足及忽视未来运动尺度依赖的问题,在JAAD和PIE数据集上取得竞争性能。
基于外翻壳体的被动通用抓取机构
发表机构 * Indian Institute of Science(印度科学研究院)
AI总结 提出一种基于弹性可变形双稳态壳体外翻的被动单片柔性抓取机构,通过梁段构成的抓取臂与外翻壳体协同工作,实现对任意形状刚性物体的包络抓取。
论大语言模型适应性的局限:模型内化先验对标注任务性能的影响
发表机构 * University of Washington(华盛顿大学)
AI总结 通过毒性检测实验,研究大语言模型内化先验与指令交互的三个维度,发现近三分之二的零样本错误难以通过提示纠正,并引入定义特定熟悉度(DSF)指标,证明其与性能正相关,而文本记忆指标则无此关联。
短文本改写与 Phi Silica
发表机构 * IEEE ICAD
AI总结 本研究通过数据集整理、提示蒸馏、参数高效微调和评估,将小语言模型 Phi Silica 适配于短文本改写任务,结果表明微调提高了语义保真度、减少了幻觉并提升了与 GPT-5-chat 改写的偏好胜率。
SALSA: 通过学习的引导激活向量实现语音感知的LLM适配
发表机构 * University of Illinois Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校) ; Korea Advanced Institute of Science and Technology(韩国科学技术院)
AI总结 提出SALSA方法,通过监督学习优化逐层引导向量,在儿童语音、多语种语音和普通话-英语代码切换基准上显著提升零样本推理和语音上下文学习性能,最高相对提升46.8%。
物理人机交互中节能控制的自适应PD增益
发表机构 * University of Calgary(卡尔加里大学) ; University of Waterloo RoboHub(多伦多大学罗布hub)
AI总结 提出一种自适应PD控制器,通过限制机器人动能和势能实现安全物理人机交互,并给出稳定性证明与实验验证。
超越静态高斯:动态3D场景重建架构范式的实证研究
发表机构 * University of Waterloo(滑铁卢大学)
AI总结 本文通过实证比较结构引导与高斯中心两种动态3D高斯溅射范式,揭示重建质量/紧凑性与渲染速度之间的根本权衡。
ProtStructQA: 蛋白质结构推理中的指称阈值
发表机构 * University of Georgia(佐治亚大学)
AI总结 提出可执行基准ProtStructQA,通过将自然语言问题编译为DSL程序并在AlphaFold结构上执行来评估蛋白质语言模型,发现模型在1.7B到4B参数之间存在指称阈值,低于该阈值时工具辅助推理占优,高于该阈值时思维链成为最强策略。