Lightweight Latent Reasoning for Narrative Tasks
面向叙事任务的轻量级潜在推理
发表机构 * School of Informatics, University of Edinburgh(爱丁堡大学信息学院) ; CIFAR Fellow
AI总结 提出LiteReason方法,通过轻量级推理投影器生成连续潜在令牌,在强化学习中动态切换潜在与离散推理,将推理长度减少77-92%,同时保持接近非潜在RL的性能。
面向叙事任务的轻量级潜在推理
发表机构 * School of Informatics, University of Edinburgh(爱丁堡大学信息学院) ; CIFAR Fellow
AI总结 提出LiteReason方法,通过轻量级推理投影器生成连续潜在令牌,在强化学习中动态切换潜在与离散推理,将推理长度减少77-92%,同时保持接近非潜在RL的性能。
神经算子混合体降低算子学习中的主动复杂度
发表机构 * McMaster University and Vector Institute(麦斯特大学和向量研究所) ; Shimane University(岛根大学) ; Rice University(里士满大学) ; University of Helsinki(赫尔辛基大学)
AI总结 通过路由混合神经算子(MoNO)与固定单神经算子构造的比较,证明MoNO在主动专家规模上具有更优的深度、宽度和秩缩放,且对Lipschitz目标这些量以O(ε^{-1})为界。
迷失在序列化中:LLM图推理器的不变性与泛化能力
发表机构 * University of Cambridge(剑桥大学) ; ETH Zurich(苏黎世联邦理工学院)
AI总结 研究LLM图推理器对图表示对称性的缺乏不变性,通过分解序列化因素并评估微调影响,发现大模型更鲁棒,微调降低节点重标敏感但增加结构和格式敏感,且不保证泛化。
Comments ICML 2026 Workshop on Graph Foundation Models
基于被动声学的复合指数用于嘈杂热带水域的珊瑚礁健康监测
发表机构 * University of Technology, Sydney(悉尼科技大学) ; Nanyang Technological University(南洋理工大学) ; National Institute of Oceanography and Environmental Physics(国家海洋与环境物理研究所) ; Institute of Marine and Coastal Sciences, University of Connecticut(康乃狄克大学海洋与海岸科学研究所) ; Indian Institute of Technology, Bombay(印度班加罗尔理工学院)
AI总结 提出使用卷积神经网络去噪器处理低频噪声,结合声压级、声学复杂度指数和虾鸣率等声学指标,实现与潜水评估一致的珊瑚礁健康监测。
CGES:面向高效准确自一致性的置信引导早停方法
发表机构 * University of Massachusetts Amherst(马萨诸塞大学阿姆赫斯特分校)
AI总结 提出贝叶斯框架CGES,通过自适应停止采样减少自一致性推理调用次数,在5个推理基准上平均减少58%调用且精度损失仅0.4个百分点。
Comments Extended version. A preliminary version was accepted at the Efficient Reasoning Workshop @ NeurIPS 2025. Code: https://github.com/EhsanAghazadeh/cges
如何评估人机交互?软件代理设计案例研究
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 提出PULSE框架,通过用户反馈和模型预测结合评估人机交互,在15k用户实验中验证其能减少40%置信区间,并揭示基准测试与真实结果的差异。
Comments ICML 2026
学习引导的积分轮廓构建用于快速大规模广义特征值求解器
发表机构 * University of Science(科学技术大学)
AI总结 提出Deepcontour混合框架,结合深度学习谱预测器与核密度估计自动构建优化积分轮廓,加速大规模广义特征值求解,实现最高5.63倍加速并保持数值精度。
整合生物信息递归神经网络用于葡萄糖-胰岛素动态建模
发表机构 * Department of Management, Information and Production Engineering, University of Bergamo(管理、信息与生产工程系,贝加莫大学)
AI总结 本文提出生物信息递归神经网络框架,用于更准确地建模葡萄糖-胰岛素动态,以提高人工胰腺系统的个性化血糖调节能力。
Comments Accepted for publication in the proceedings of the Engineering Diabetes Technologies (EDT 2025). 7 pages, 2 figures and 1 table
Journal ref IFAC-PapersOnLine, 59(2), 2025, pp. 91-96
基于多模态视觉和骨骼特征的运动员肌肉骨骼风险分类的细粒度注意力与几何对应模型
发表机构 * Department of Computer Science and Engineering, United International University(计算机科学与工程系,国际联合大学) ; Department of Data Science and Artificial Intelligence, Monash University(数据科学与人工智能系,墨尔本大学) ; Faculty of Science and Technology, Charles Darwin University(科学与技术学院,查尔斯达尔文大学) ; Applied Artificial Intelligence and Intelligent Systems (AAIINS) Laboratory, Dhaka(应用人工智能与智能系统实验室,达卡)
AI总结 提出ViSK-GAT多模态框架,融合图像和骨骼坐标特征,通过细粒度注意力模块和几何对应模块实现运动员肌肉骨骼风险八级分类,关键指标超93%。
Comments Published in Computers and Electrical Engineering
Journal ref Computers and Electrical Engineering, Vol. 138, 111281, 2026
提升图神经网络对后门攻击的鲁棒性:过度相似性视角
发表机构 * Beijing University of Posts and Telecommunications(北京邮电大学)
AI总结 针对图后门攻击中触发器与干净节点难以区分的问题,提出基于过度相似性检测的防御方法SimGuard,利用对比学习训练检测器分离触发器,在保持干净节点性能的同时有效防御多种后门攻击。
Comments After discussions with one of the co-authors, it was decided that this version should not be made public at this time. To respect the co-author's perspective and ensure alignment among all authors, I am requesting the withdrawal of this article
影响动力学与分阶段数据归因
发表机构 * University College London(伦敦大学学院) ; Independent(独立) ; University of Melbourne(墨尔本大学) ; Timaeus
AI总结 针对神经网络训练中样本影响动态变化的问题,基于奇异学习理论提出分阶段数据归因框架,预测影响非单调变化(符号翻转、尖峰),并在玩具模型和语言模型中验证与模型学习阶段的对应。
Comments 28 pages, 15 figures
启发式访谈与需求之间的自动对齐
发表机构 * University of Bologna(博洛尼亚大学)
AI总结 提出将访谈转录与用户故事需求自动对齐的任务,定义忠实度和覆盖率两个度量,利用大语言模型和嵌入模型实现自动评估,在四个数据集上达到0.86 macro-F1。
Comments 8 pages
重新审视印度语言机器翻译和摘要细粒度评估的度量可靠性
发表机构 * Sharif University of Technology(谢里夫理工学院) ; Vellore Institute of Technology(韦洛雷理工学院) ; IIT Kharagpur(印度理工学院达卡分校) ; Mohamed bin Zayed University of Artificial Intelligence(穆罕默德·本·扎耶德人工智能大学)
AI总结 针对印度语言评估不足的问题,提出ITEM基准,系统评估29种自动度量与人工判断的对齐,发现基于LLM的评估器表现最佳,并揭示了异常值影响、任务差异及扰动鲁棒性等关键发现。
Comments 18 pages, 14 figures
通过图修正构建LLM智能体中的连贯空间记忆
发表机构 * Chair of Cartography and Visual Analytics(制图学与视觉分析教授会)
AI总结 提出LLM-MapRepair框架,通过版本控制和边影响评分检测并修正增量构建的导航图中的结构不一致性,在多个基准上显著提升节点和边召回率。
GRID:持续提示调优中任务无关推理的规模化
发表机构 * State University of New York at Buffalo(纽约州立大学布法罗分校) ; Department of Computer Science and Engineering(计算机科学与工程系) ; Institute for Artificial Intelligence and Data Science(人工智能与数据科学研究院)
AI总结 提出GRID框架,通过输出空间感知解码和梯度引导提示选择,解决持续学习中任务无关推理的性能退化与可扩展性问题,在长序列和负迁移基准上提升后向迁移并减少提示内存。
TruthRL: 通过强化学习激励诚实的LLM
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 提出TruthRL框架,使用GRPO和三值奖励直接优化LLM的诚实性,减少幻觉并允许不确定时弃权,在知识密集型基准上显著提升诚实性。
Comments ICML 2026. Code: https://github.com/facebookresearch/TruthRL
不确定性感知的深度学习用于野火危险预测
发表机构 * Aix-Marseille University(艾克斯-马赛大学) ; University of Cambridge(剑桥大学) ; University of Malaga(马拉加大学) ; University of Crete(希腊克里特大学)
AI总结 提出不确定性感知深度学习框架,联合捕获认知不确定性和偶然不确定性,提升短期野火危险预测的准确性和可靠性,F1分数提高2.3%,预期校准误差降低2.1%。
NoiseSDF2NoiseSDF: 从含噪监督中学习干净的神经场
发表机构 * University of Cambridge(剑桥大学)
AI总结 提出NoiseSDF2NoiseSDF方法,通过最小化含噪SDF表示之间的MSE损失,从含噪点云中学习干净的神经SDF,实现隐式去噪和表面优化。
Comments 16 pages, 7 figures
对机器文本检测器的攻击保留风格指纹
发表机构 * GitHub ; University of California, Berkeley(加州大学伯克利分校)
AI总结 研究机器文本检测器对抗攻击的局限性,提出一种同时优化不可检测性和特定人类风格的 paraphrasing 方法,发现单文档检测不可靠,需多文档分析。
CoT-Space: 一种通过强化学习实现内部慢思考的理论框架
发表机构 * Zeyu Gan, Yi Hao, Yong Liu(GAN 赵毅、LIU 刘永)
AI总结 本文提出CoT-Space理论框架,通过强化学习将推理过程从离散的token预测任务转化为连续的推理层面语义空间中的优化过程,揭示了测试时扩展中最优CoT长度的收敛是欠拟合与过拟合基本权衡的自然结果。
Comments Preprint Edition
CapStARE: 基于胶囊的序列架构实现鲁棒高效的目光估计
发表机构 * University of the Basque Country(巴斯克大学)
AI总结 提出CapStARE,结合冻结ConvNeXt骨干、注意力路由胶囊和双GRU解码器,在ETH-XGaze等数据集上实现实时高精度目光估计,兼顾空间鲁棒性与计算效率。
Comments Preprint for Patter Recognition Journal
FG-Attn:在视频扩散模型中利用细粒度稀疏注意力
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 针对视频扩散模型中注意力层计算开销大的问题,提出FG-Attn,一种低开销的细粒度稀疏注意力机制,在MxN块粒度上跳过分数计算,实现最高2.45倍加速。
CAST: 反事实标签提升视觉-语言-动作模型中的指令跟随能力
发表机构 * University of California Berkeley(加州大学伯克利分校) ; Princeton University(普林斯顿大学)
AI总结 针对VLA模型难以遵循细粒度指令的问题,提出利用视觉语言模型生成反事实标签增强数据集,提升语言基础多样性,实验表明该方法在导航和操作任务中显著提升指令跟随成功率。
基于优化的在线共形预测用于多步预测
发表机构 * University of Michigan(密歇根大学)
AI总结 提出O2CP框架,通过双层优化结构建模多步误差依赖,在保证边际覆盖有效性的同时生成更窄的预测区间,实验表明在自动驾驶、气候预测等领域优于现有方法。
CoTAL:面向可泛化形成性评估评分与反馈的人机协同提示工程
发表机构 * Vanderbilt University(范德比大学)
AI总结 提出CoTAL方法,结合证据中心设计、人机协同提示工程和思维链提示,迭代优化LLM评分,在多个领域提升GPT-4评分性能达38.9%,并获师生认可。
Comments Submitted to Computers and Education: Artificial Intelligence. Currently under review
Whisfusion: 基于掩码扩散的并行ASR解码
发表机构 * Seoul National University(首尔国立大学) ; Soongsil University(顺天大学) ; NVIDIA Corporation(英伟达公司)
AI总结 提出Whisfusion,在冻结的Whisper音频嵌入上训练专用掩码扩散解码器,通过并行扩散解码实现非自回归ASR,在多种语言基准上超越Whisper-large-v3,速度提升4-5倍。
Comments 16 pages, 3 figures
CITRAS: 协变量感知的Transformer时间序列预测
发表机构 * Research & Development Group, Hitachi, Ltd.(日立有限公司研发部)
AI总结 提出CITRAS,一种仅解码器Transformer,通过KV移位和注意力分数平滑机制灵活整合已知协变量的未来部分,并捕获局部和全局跨变量依赖,提升预测精度。
Journal ref IEEE Access, vol. 14, pp. 77983-77998, 2026
MeMo: 视觉受损条件下的实时视听目标说话人提取的注意力动量
发表机构 * Department of Electrical and Electronic Engineering, Faculty of Engineering, The Hong Kong Polytechnic University(电子工程系,工程学院,香港理工大学) ; Department of Systems Engineering and Engineering Management, The Chinese University of Hong Kong(系统工程与工程管理系,香港中文大学) ; School of Artificial Intelligence (SAI), The Chinese University of Hong Kong, Shenzhen(人工智能学院(SAI),香港中文大学深圳校区) ; School of Intelligence Science and Technology, Nanjing University(智能科学与技术学院,南京大学) ; Tongyi Lab, Alibaba Group, Singapore(通义实验室,阿里巴巴集团,新加坡)
AI总结 提出MeMo框架,通过两个自适应记忆库存储注意力信息,在视觉线索缺失时维持注意力动量,实现实时目标说话人提取,SI-SNR提升至少2dB。
基于SE(3)的机器人统一力-阻抗控制的几何公式化
发表机构 * University of California, Berkeley, USA(加州大学伯克利分校)
AI总结 提出一种在SE(3)流形上的阻抗控制框架,通过能量罐增强实现力跟踪与无源性,并解决非因果实现问题,继承SE(3)不变性以提高学习效率。
打破维度诅咒:扩散模型高效学习低维分布
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 提出新数学框架,证明扩散模型通过等价于子空间聚类,能以线性于内在维度的样本复杂度学习低维分布,避免维度诅咒。
Comments 37 pages, 8 figures, 2 tables