Trust Region On-Policy Distillation
信任区域在线策略蒸馏
发表机构 * Samsung Research(三星研究院) ; University of Oxford(牛津大学) ; Peking University(北京大学)
AI总结 提出信任区域在线策略蒸馏(TrOPD),通过信用分配策略和信任区域学习解决师生分布差异导致的训练不稳定问题,在数学推理、代码生成和通用基准上超越现有方法。
信任区域在线策略蒸馏
发表机构 * Samsung Research(三星研究院) ; University of Oxford(牛津大学) ; Peking University(北京大学)
AI总结 提出信任区域在线策略蒸馏(TrOPD),通过信用分配策略和信任区域学习解决师生分布差异导致的训练不稳定问题,在数学推理、代码生成和通用基准上超越现有方法。
DiscourseFlip: 面向黑盒检索增强生成的非直述式语篇级观点操纵攻击
发表机构 * Wuhan University(武汉大学) ; East China Normal University(华东师范大学) ; Nanyang Technological University(南洋理工大学) ; Worcester Polytechnic Institute(沃思堡理工学院)
AI总结 提出一种基于图引导的代理攻击方法DiscourseFlip,通过语义查询网络中的协同影响在有限预算下最大化语篇级观点偏差,实验证明其有效性和隐蔽性,并揭示现有防御的不足。
AMP:一种用于智能体内存操作的供应商中立线格式
发表机构 * Independent Researcher(独立研究者)
AI总结 提出一种基于JSON-Schema 2020-12的供应商中立线格式memorywire,支持五种内存操作和四种内存类型,通过参考实现和基准测试验证其性能与兼容性。
地毯制造中用于训练质量控制AI的数据收集
发表机构 * Independent Researcher(独立研究者)
AI总结 针对地毯生产中视觉检测慢、主观且不一致的问题,提出一种在线机器视觉系统设计,通过同步线扫描相机和组合照明实时检测缺陷,并系统收集标注数据以持续训练质量控制模型,最终通过DMAIC方法量化质量改进。
SkyShield:占用作为低空无人机自主飞行的安全接口
发表机构 * Xiamen University(厦门大学) ; Jiangxi Academy of Sciences(江西省科学院)
AI总结 针对低空无人机自主飞行中的三维空间理解问题,提出首个前视单目语义占用基准SkyShield、动态感知度量KAR-mIoU和几何优先基线SkyOcc,将占用作为安全接口。
SHARP: 基于睡眠的分层加速重放用于长程非平稳时间模式识别
发表机构 * Department of Computer Engineering, University of Texas at San Antonio, USA(德克萨斯大学圣安东尼奥分校计算机工程系) ; Department of Computer Science, University of Rochester, USA(罗切斯特大学计算机科学系) ; Department of Psychology, University of Texas at San Antonio, USA(德克萨斯大学圣安东尼奥分校心理学系)
AI总结 提出SHARP框架,通过将时间学习分解为记忆模块和模式识别模块,并引入离线睡眠阶段加速重放时间结构记忆,实现长程非平稳序列模式的高效学习。
自动解释标签的泛化程度:跨语言、文字和改写的受控研究
发表机构 * Columbia University(哥伦比亚大学)
AI总结 通过塞尔维亚双文字系统控制实验,研究稀疏自编码器特征的自然语言标签是否真正泛化到不同语言和文字,发现标签在语义内容匹配上存在显著偏差,且随网络深度增加而加剧。
LastAct: 轨迹引导的最新活动定位用于实时智能家居活动识别
发表机构 * School of Computing, University of Georgia(佐治亚大学计算学院)
AI总结 提出LastAct框架,通过轨迹图像序列和边界定位器解决滑动窗口中的边界污染问题,实现实时智能家居活动识别。
DraDDP:多模态多方对话话语解析数据集
发表机构 * School of Computer Science and Technology, Soochow University(苏州大学计算机科学与技术学院)
AI总结 针对现有研究局限于文本或双方对话的问题,构建了基于美剧的首个公开英文多模态多方对话话语解析数据集DraDDP,并验证了多模态信息在捕捉对话结构和关系类型中的价值。
表示强制:无瓶颈统一多模态模型
发表机构 * University of Hong Kong(香港大学) ; ByteDance Seed(字节跳动种子) ; The Chinese University of Hong Kong(香港中文大学) ; Nanjing University(南京大学) ; Tsinghua University(清华大学)
AI总结 提出表示强制(RF)技术,通过让解码器自回归预测视觉表示作为中间令牌,再在相同骨干网络中引导像素扩散,从而消除统一多模态模型对预训练VAE的依赖,实现无瓶颈的端到端模型。
BenHalluEval:孟加拉语大语言模型的多任务幻觉评估框架
发表机构 * Department of Computer Science and Engineering, Islamic University of Technology(伊斯兰科技大学计算机科学与工程系) ; Department of Computer Science and Engineering, University of California(加州大学计算机科学与工程系)
AI总结 针对孟加拉语大语言模型幻觉评估的空白,提出BenHalluEval框架,涵盖四项任务,构建12000个幻觉候选,并提出双轨校准指标BenHalluScore,揭示模型间幻觉校准的显著差异。
可追溯性设计:用于欧盟监管咨询分析的LLM流程与仪表板
发表机构 * Utrecht University(乌特勒支大学) ; Maastricht University(马斯特里赫特大学)
AI总结 提出基于LLM的端到端流程与交互式仪表板,从监管咨询提交中提取结构化主题,确保逐字引用、完全可追溯和透明性,并以欧盟数字公平法案为例验证。
在没有社会语言学标签的情况下提取巴西葡萄牙语的口音特征
发表机构 * PEE/COPPE, UFRJ(PEE/COPPE,UFRJ) ; Faculdade de Engenharia Elétrica e Computação (FEEC), UNICAMP(电子工程与计算学院(FEEC),UNICAMP) ; DEL/Poli & PEE/COPPE, UFRJ(DEL/Poli与PEE/COPPE,UFRJ)
AI总结 针对巴西葡萄牙语口音分类中标签缺乏的问题,提出一种仅使用声学标签的新工作流,通过隔离区域口音地标和基于音素的强制对齐器提取特征,在口音相关任务上优于通用架构。
AI中介的后果性决策中的选择错觉
发表机构 * arXiv.org ; GitHub
AI总结 基于Ullmann-Margalit的选择概念,揭示当前AI系统造成一种“选择错觉”,即看似有意义的后果性选择实则削弱了主体的真正选择能力,并提出通过存在诚实、生态理性和反事实修复三个规范要义来保护和发展元能力。
图数据上具有差异化网络效应的处理效应估计
发表机构 * Kyoto University(京都大学) ; The Institute of Statistical Mathematics(统计数学研究所) ; Tohoku University(东北大学) ; RIKEN AIP(理化学研究所AIP)
AI总结 针对图数据中个体处理效应估计受邻居干扰且存在差异化网络效应的问题,提出一种结合部分注意力机制和消息放大器的干扰建模方法,以捕获邻居重要性和规模差异,提升估计精度。
Grimlock: 使用eBPF和认证通道保护高代理系统
发表机构 * Roblox
AI总结 针对代理系统中用户编排代码带来的安全挑战,提出Grimlock代理守卫,通过eBPF强制流量拦截和TLS 1.3通道绑定认证,实现透明、可审计、作用域绑定的代理间通信。
量子蒙特卡洛符号问题的神经自回归控制变量
发表机构 * Beijing National Laboratory for Condensed Matter Physics and Institute of Physics, Chinese Academy of Sciences, Beijing 100190, China(北京凝聚态物理国家实验室和物理研究所,中国科学院,北京100190,中国) ; University of Chinese Academy of Sciences, Beijing 100049, China(中国科学院大学,北京100049,中国)
AI总结 通过训练一对自回归模型构造零均值控制变量,有效缓解量子蒙特卡洛模拟中的符号问题,在三角晶格海森堡反铁磁体上实现平均符号标准误差降低一个数量级,能量估计误差降低三到五倍。
不再需要K-means:用于高效多向量检索的单阶段稀疏编码
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; Stanford University(斯坦福大学)
AI总结 针对多向量检索中K-means聚类导致的索引延迟和语义损失问题,提出单阶段稀疏检索(SSR),利用稀疏自编码器将词元嵌入投影为高维稀疏表示,结合倒排索引实现高效检索,在BEIR基准上索引时间减少15倍、检索延迟减半且性能提升。
在不损失对齐的情况下恢复多样性:面向后训练大语言模型的DPO配方
发表机构 * University of Maryland, College Park(马里兰大学 College Park 分校)
AI总结 提出REDIPO数据构建流程,通过离线DPO从基础模型生成中恢复多样性答案,同时保持指令模型的对齐性能。
标签胜过逻辑?源标签如何比LLMs更严重地偏差人类的谬误判断
发表机构 * The Pennsylvania State University(宾夕法尼亚州立大学)
AI总结 通过在线实验和LLM对比,发现人类在评估逻辑谬误时显著受到内容源标签(如人类、AI等)的影响,而LLM评估相对稳定,表明源标签偏差主要是人类的弱点。
迈向可验证的多模态深度研究:用于交错报告生成的多智能体框架
发表机构 * Gaoling School of Artificial Intelligence, Renmin University of China(中国人民大学北京校区人工智能学院)
AI总结 提出多智能体框架Ptah,通过规划、研究和写作阶段生成交错文本与视觉证据的多模态报告,并引入验证器确保事实准确性和跨模态一致性。
GAPD:面向知识库问答中智能体强化学习的金动作策略蒸馏
发表机构 * University of Science and Technology of China(中国科学技术大学) ; NLPR, MAIS, Institute of Automation, Chinese Academy of Sciences(中国科学院自动化研究所) ; ShanghaiTech University(上海科技大学) ; Ant Group(蚂蚁集团)
AI总结 提出GAPD框架,通过中间锚点匹配将金动作序列与在线策略对齐,为基于强化学习的知识库问答提供密集的令牌级指导,在多个基准上取得最优结果。
DiScoFormer: 基于Transformer的即插即用密度与得分估计
发表机构 * arXiv.org ; cs.LG(计算机学习)
AI总结 提出DiScoFormer,一种可一次训练、任意推理的等变Transformer,通过自注意力机制实现跨分布和样本规模的密度与得分估计,证明其泛化核密度估计并优于KDE。
SafeSearch: 基于LLM的搜索代理的自动化红队测试
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 提出SafeSearch自动化红队框架,系统评估基于LLM的搜索代理在五个风险类别中的安全性,发现GPT-4.1-mini在搜索工作流中攻击成功率高达90.5%,且常见防御措施效果有限。
为何只问一个专家?学习将任务推迟到Top-$k$专家
发表机构 * School of Computing, National University of Singapore(新加坡国立大学计算机学院) ; Fédération ENAC, ISAE-SUPAERO, ONERA, Université de Toulouse(ENAC联合会、ISAE-SUPAERO、ONERA、图卢兹大学) ; Agency for Science, Technology and Research, Institute for Infocomm Research(科技研究局、信息通信研究所)
AI总结 提出Top-$k$学习推迟框架,通过将查询分配给最优的$k$个专家,实现多专家协作,并开发了与$k$无关的替代损失函数,在准确性和成本之间取得更优权衡。
基于LLM的抽取式问答中的最优查询分配:一个具有理论保证的学习-推迟框架
发表机构 * School of Computing, National University of Singapore(新加坡国立大学计算机学院) ; Fédération ENAC ISAE-SUPAERO ONERA, Université de Toulouse, France(法国图卢兹大学ENAC ISAE-SUPAERO ONERA联合体) ; Institute for Infocomm Research (A*STAR), Singapore(新加坡信息与通信研究院(A*STAR)) ; IPAL, IRL 2955, Singapore(新加坡IPAL实验室)
AI总结 提出一个学习-推迟框架,通过将查询分配给专门专家,在保证高置信度预测的同时优化计算效率,并在SQuADv1、SQuADv2和TriviaQA上验证了其提高答案可靠性和降低计算开销的效果。
LoopFM:从基础模型的历史表示中学习用于推荐
发表机构 * Meta
AI总结 针对知识蒸馏中传递标量导致转移率下降的问题,提出LoopFM框架,通过将基础模型的中间嵌入作为输入特征传递给下游垂直模型,实现高带宽知识转移,并在理论和实验中证明其有效性。
结构化提示优化结合强化学习实现复杂文本的全局与局部可解释性
发表机构 * Carnegie Mellon University(卡内基梅隆大学) ; Amazon(亚马逊)
AI总结 提出eXTC框架,通过结构化提示优化、基于SOP的推理蒸馏和强化学习扩展,在分类性能和解释质量上显著优于现有范式。
Aryabhata 2:扩展强化学习以提升高级STEM推理能力
发表机构 * PhysicsWallah
AI总结 本文提出Aryabhata 2,一个通过强化学习后训练在竞争性STEM考试中提升推理能力的语言模型,在JEE、NEET等基准上超越基础模型且输出token减少高达64%。
解剖锚定的自监督:蒸馏视觉基础模型用于不变超声表示
发表机构 * Hunan University(湖南大学) ; Shenzhen Maternity and Child Healthcare Hospital(深圳妇幼保健医院)
AI总结 提出解剖锚定的超声自监督框架ANAUS,通过可学习潜在提示引擎和领域自适应实现无标注解剖分割,并设计双策略自监督学习(语义感知解剖分离对齐和上下文核心区域预测)来增强表示学习,在六个公开数据集上超越现有方法。