Skim: Speculative Execution for Fast and Efficient Web Agents
Skim:用于快速和高效网络代理的推测执行
发表机构 * Princeton University(普林斯顿大学) ; Microsoft Research(微软研究院)
AI总结 Skim通过利用专门构建网站的可预测结构,提出了一种推测执行框架,以降低网络代理的任务成本和延迟,同时保持准确性。
Comments 14 pages, 21 figures
Skim:用于快速和高效网络代理的推测执行
发表机构 * Princeton University(普林斯顿大学) ; Microsoft Research(微软研究院)
AI总结 Skim通过利用专门构建网站的可预测结构,提出了一种推测执行框架,以降低网络代理的任务成本和延迟,同时保持准确性。
Comments 14 pages, 21 figures
嵌套时空时间序列预测
发表机构 * Fudan University, Shanghai(复旦大学) ; Department of Computer Science and Technology, Nanjing University(南京大学计算机科学与技术系) ; ByteDance(字节跳动)
AI总结 本文提出了一种嵌套预测框架,通过结合未来宏观区域趋势与微观历史观测,实现了精细化预测,并通过谱聚类方法构建语义连贯的区域,有效过滤系统性噪声并保留关键趋势,实验表明该方法在多个高维数据集上优于现有最先进基线。
Comments Accept by ICML 2026
BAPR: 基于贝叶斯遗忘的分段鲁棒强化学习用于非平稳连续控制
发表机构 * Central South University(中南大学)
AI总结 该研究提出BAPR方法,结合贝叶斯在线变化检测与鲁棒集合强化学习,解决非平稳连续控制中的鲁棒性与适应性问题,通过形式化验证确保算法稳定性与收敛性。
STABLE: 通过语义-物理双系统生成仿真准备的桌面布局
发表机构 * Shanghai AI Laboratory(上海人工智能实验室)
AI总结 本文提出STABLE,一种通过语义-物理双系统生成仿真准备的桌面布局的方法,通过语义推理模块生成粗略布局,物理校正模块校正布局以确保物理合理性,从而提升场景的物理有效性。
Comments ICML 2026
预训练目标在极低数据细粒度视觉分类中的影响:一个骨干网络控制研究
发表机构 * Santa Clara University(圣克拉拉大学) ; IAAIR
AI总结 本文研究了在极低数据细粒度视觉分类中预训练目标对下游表示质量的影响,通过比较四种冻结的ViT-B/16编码器,得出了在数据稀缺时优先选择边界增强预训练目标的结论。
Comments Presented at the 13th Workshop on Fine-Grained Visual Categorization (FGVC13) at CVPR 2026
Journal ref 13th Workshop on Fine-Grained Visual Categorization (FGVC13), CVPR 2026
DeltaPrompts: 逃离多模态蒸馏中的零delta陷阱
发表机构 * NVIDIA Research(NVIDIA研究院)
AI总结 本文提出DeltaPrompts,通过量化教师与学生之间的答案分歧(Δ)来生成高分歧的推理问题,从而解决传统蒸馏中因零delta提示导致的学习信号不足问题,实验表明DeltaPrompts在多个场景下显著提升了模型性能。
递归学习系统中的沉默崩溃
发表机构 * China Mobile Research Institute(中国移动研究院) ; China Mobile GBA (Greater Bay Area) Innovation Institute(中国移动大湾区创新研究院)
AI总结 本文研究了递归学习系统中模型内部分布逐渐退化的现象,提出MTR框架通过监测轨迹统计量和调整学习强度来提前预警并防止沉默崩溃。
面向网络的双线性分块化用于脑功能连接表示学习
发表机构 * Department of Radiology, Weill Cornell Medicine, New York, NY, USA.(韦尔·科恩医学中心放射科, 纽约, NY, 美国) ; School of Electrical and Computer Engineering, Cornell University and Cornell Tech, New York, NY, USA.(康奈尔大学电气与计算机工程学院及康奈尔科技, 纽约, NY, 美国)
AI总结 本文提出了一种面向网络的双线性分块化方法,用于改进脑功能连接的表示学习,通过重新定义功能连接的分块方式,提升模型在跨群体评估中的稳定性和可迁移性。
Comments Author-submitted version, provisionally accepted at MICCAI 2026
Dywave: 为异构物联网传感信号设计的事件对齐动态分词方法
发表机构 * University of Illinois Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校) ; Hong Kong University of Science(香港科学大学) ; Shanghai Jiao Tong University(上海交通大学)
AI总结 本文提出Dywave,一种用于异构物联网传感信号的动态分词框架,通过小波基层次分解构建紧凑的输入表示,以适应内在时间结构和底层物理事件,从而在活动识别、压力评估和附近物体检测等任务中提升准确率并提高计算效率。
基于LLM的论证挖掘系统
发表机构 * Universidade de São Paulo Center for Artificial Intelligence (C4AI)(圣保罗大学人工智能中心(C4AI)) ; Instituto Mauá de Tecnologia Núcleo de Sistemas Eletrônicos Embarcados (NSEE)(马乌阿技术研究所电子系统嵌入核(NSEE))
AI总结 本文提出一个基于大语言模型的端到端系统,用于从自然语言文本中提取论证并构建抽象论证图,通过多阶段流程识别论证组件、选择相关元素并揭示其逻辑关系,实验表明该系统能有效恢复论证结构并在不同标注方案下表现良好。
VERA-MH:心理健康领域伦理和负责任AI的验证
发表机构 * Spring Health ; Yale University(耶鲁大学)
AI总结 本研究提出VERA-MH,一种用于评估心理健康支持聊天机器人安全性的新型临床验证方法,重点评估聊天机器人在识别自杀倾向风险方面的表现。
FIKA-Bench: 从细粒度识别到细粒度知识获取
发表机构 * Wangxuan Institute of Computer Technology, Peking University(北京大学计算机技术研究所)
AI总结 本文提出FIKA-Bench,一个包含311个公开来源和现实实例的细粒度知识获取基准,通过过滤和审计确保实例质量,评估最新多模态模型和代理发现细粒度识别任务仍具挑战性,需改进代理设计以提升知识获取能力。
Comments Project page with code: https://ligeng0197.github.io/FIKA-Bench.github.io/
MambaPanoptic:基于视觉Mamba的结构状态空间框架用于全景分割
发表机构 * Technical University of Munich(慕尼黑技术大学) ; Munich Center for Machine Learning (MCML)(慕尼黑机器学习中心) ; Polytechnic University of Milan(米兰理工大学) ; University of Stuttgart(斯图加特大学) ; Wuhan University(武汉大学) ; Karlsruhe University of Applied Sciences(卡尔斯鲁厄应用科学大学)
AI总结 本研究提出MambaPanoptic,一种基于视觉Mamba的结构状态空间框架,旨在解决全景分割中长程上下文建模、多尺度特征表示和高效密集预测的挑战,通过引入MambaFPN和改进的PanopticFCN风格核生成器实现统一的实例和物质预测。
Comments Accepted to ISPRS Congress 2026, camera-ready version
在噪声时间自监督下利用对比学习进行结肠镜视频处理
发表机构 * Department of Mathematics, University of Padova, Padova, Italy(帕多瓦大学数学系) ; LTCI, Telecom Paris, Institut Polytechnique de Paris, Palaiseau, France(巴黎电信学院) ; Cosmo Intelligent Medical Devices, Dublin, Ireland(都柏林智能医疗设备公司)
AI总结 本文提出一种在噪声时间自监督下利用对比学习进行结肠镜视频处理的方法,通过利用结肠镜检查的顺序流程来推导自监督关联,引入噪声感知的对比损失以处理噪声关联,从而在多项下游任务中取得了优于现有自监督和监督基线方法的性能。
Comments Accepted to MICCAI 2026
测试时推测
发表机构 * The University of Texas at Austin(德克萨斯大学奥斯汀分校)
AI总结 本文研究了测试时推测方法,通过在线蒸馏技术提升长响应任务中推测器的接受长度,从而提高LLM推理效率。
技能新词:迈向基于技能的持续学习
发表机构 * University of Cambridge(剑桥大学)
AI总结 本文提出了一种基于技能的新词(skill neologisms)方法,通过在模型词汇中集成软token,以提高模型在特定技能上的能力,同时支持零样本组合其他技能,从而实现可扩展的基于技能的持续学习。
通过预测误差的切线空间投影进行决策聚焦学习
发表机构 * Department of Industrial Engineering, Ulsan National Institute of Science and Technology(乌山国立科学与技术研究院工业工程系)
AI总结 本文提出了一种基于预测误差切线空间投影的决策聚焦学习方法,通过几何特征简化了后悔梯度的计算,提升了下游决策质量并提高了计算效率。
Comments 21 pages, 4 figures, 11 tables
通过深度感知移除遗忘特定方向实现类别反学习
发表机构 * Johns Hopkins University(约翰霍普金斯大学)
AI总结 本文提出DAMP方法,通过深度感知移除遗忘特定方向,改进类别反学习的选性遗忘,同时更好地保留保留类性能并减少深层残留遗忘结构。
Comments Accepted for oral presentation at the CVPR 2026 Workshop on Machine Unlearning for Vision (MUV). Code: https://github.com/armanhtm/DAMP
能够评估集体行为模型的机器人
发表机构 * Department of computer science, Freie Universität Berlin(自由大学柏林计算机科学系) ; SCIoI Excellence Cluster, Technische Universität Berlin(柏林技术大学SCIoI卓越中心) ; Faculty of Life Sciences, Humboldt-Universität zu Berlin(柏林洪堡大学生命科学学院) ; Department of Fish Biology, Fisheries, and Aquaculture, Leibniz Institute of Freshwater Ecology and Inland Fisheries(莱比锡淡水生态与内陆渔业研究所鱼类生物学、渔业与水产养殖系)
AI总结 本文提出了一种基于强化学习的框架,利用仿生机器人鱼评估活鱼行为的计算模型,通过闭环交互量化真实鱼与模拟鱼行为的差异,展示了学习驱动的机器人实验如何发现行为模型的不足。
在分布偏移下从弱监督中学习稳定的预测器
发表机构 * University of Central Florida(中央佛罗里达大学)
AI总结 本文研究了在分布偏移下从弱监督中学习稳定预测器的问题,通过CRISPR-Cas13d转录组扰动实验,探讨了监督漂移现象,并展示了弱监督在域内学习和部分跨细胞系迁移中的有效性,同时揭示了时间迁移中的失败源于监督漂移而非模型容量或简单协变量偏移。
无需硬负样本:基于概念的学习在不降低对比模型零样本能力的情况下实现组合性
发表机构 * Samsung AI Center(三星人工智能中心)
AI总结 本文提出了一种基于概念的学习方法,无需使用硬负样本即可在不损害对比模型零样本和检索能力的情况下实现组合性,通过简单的方法改进了文本和图像编码器的全局池化问题。
Comments Accepted at CVPR 2026. 2nd rev: update github repo URL
音频迁移学习中类本体和数据规模的影响
发表机构 * CHI – Chair of Health Informatics(健康信息学系) ; Technical University of Munich(慕尼黑技术大学) ; MCML – Munich Center for Machine Learning(慕尼黑机器学习中心) ; Munich Center for Machine Learning(慕尼黑机器学习中心) ; Munich Data Science Institute(慕尼黑数据科学研究所) ; Group on Language, Audio, & Music(语言、音频与音乐小组) ; Imperial College(帝国学院)
AI总结 本文研究了在音频到音频迁移学习中,类本体和数据规模如何影响迁移学习的效果,发现增加样本和类别的数量对迁移学习有积极影响,但相似性在下游任务中起主导作用。
语言模型使用置信度驱动行为的因果证据
发表机构 * Google DeepMind(谷歌深Mind) ; Princeton University(普林斯顿大学)
AI总结 研究探讨了语言模型是否利用置信度信号来控制行为,如决定回答或 abstain,通过四个阶段实验发现模型使用多维内部置信表示和阈值策略来实现 abstention,揭示了结构化的元认知控制机制。
RE-SAC:在公交车队控制中解耦偶然风险和本质风险:一种稳定且稳健的集成深度强化学习方法
发表机构 * Central South University(中南大学)
AI总结 该研究提出RE-SAC方法,通过解耦偶然风险和本质风险来提升公交车队控制的稳定性与鲁棒性,采用积分概率度量(IPM)基于的权重正则化和多样化Q-集成来应对不同类型的不确定性。
对比推理对齐:从隐藏表示中学习强化学习
发表机构 * Northwestern University(西北大学) ; University of Michigan(密歇根大学) ; Illinois Institute of Technology(伊利诺伊理工学院)
AI总结 本文提出了一种基于对比学习和强化学习的框架CRAFT,通过优化隐藏状态空间中的目标来提升对抗攻击的鲁棒性,核心贡献是通过隐藏空间的几何结构实现推理层面的安全对齐。
Comments International Conference on Machine Learning (ICML) 2026
在LLM代理中治理演化的记忆:风险、机制以及稳定性与安全性的治理记忆(SSGM)框架
发表机构 * College of Intelligent Science and Engineering(智能科学与工程学院)
AI总结 本文研究了LLM代理中记忆治理的问题,提出了一种新的SSGM框架,通过一致性验证、时间衰减建模和动态访问控制来缓解记忆腐蚀风险,提高记忆系统的稳定性与安全性。
结构化风格重写与思维链规划用于低资源字符对话
发表机构 * Guangdong University of Finance(广东金融学院)
AI总结 本文提出了一种结构化风格重写框架,结合思维链规划,以解决低资源条件下中文字符驱动生成中的风格分离问题,通过分解角色风格为可解释的格式签名、语法和语用维度,并利用思维链监督进行显式风格规划,实验表明该方法在保持语义忠实性的同时提升了风格质量。
Comments 30 pages, 5 figures. Preprint
世界不会静止:为智能体基准测试的可编程进化
发表机构 * Amazon(亚马逊公司) ; UC Berkeley(伯克利大学)
AI总结 本文研究了结构化环境进化作为智能体基准测试构建问题,提出了一种基于图的框架ProEvolve,使环境进化可编程,并在电商和航班预订领域验证了其在质量、实现有效性及失败模式方面的表现。
基于奖励的强化学习
发表机构 * University of Warsaw(华沙大学) ; Nomagic ; UC Berkeley, Amazon FAR(伯克利大学,亚马逊FAR)
AI总结 本文提出基于奖励的强化学习(RCRL),通过在收集经验时使用单一名义目标,使智能体在不额外交互的情况下暴露于多种奖励目标,从而提高样本效率并支持零样本行为调整。
Comments preprint
NGL:自然服装语言用于无训练缝纫图案估计
发表机构 * Max Planck Institute for Intelligent Systems(马克斯·普朗克智能系统研究所)
AI总结 本研究提出NGL自然服装语言,通过利用视觉语言模型的自然描述能力,实现无训练的缝纫图案估计,解决了传统方法在泛化能力、真实世界关联性和多层服装处理上的不足。
Comments 12 pages, 7 figures