Probabilistic Recurrent Intention Switching Model
概率递归意图切换模型
发表机构 * Department of Computer Science, University of Freiburg(弗赖堡大学计算机科学系)
AI总结 提出PRISM模型,利用轻量级递归网络建模非平稳意图切换,实现精确EM分解和闭式求解,在网格世界、小鼠迷宫和机器人操作任务中取得最优似然并恢复可解释意图。
概率递归意图切换模型
发表机构 * Department of Computer Science, University of Freiburg(弗赖堡大学计算机科学系)
AI总结 提出PRISM模型,利用轻量级递归网络建模非平稳意图切换,实现精确EM分解和闭式求解,在网格世界、小鼠迷宫和机器人操作任务中取得最优似然并恢复可解释意图。
机器遗忘在视觉-语言模型中的鲁棒性研究
发表机构 * Xiamen University(厦门大学)
AI总结 本文首次系统调查了视觉-语言模型机器遗忘的鲁棒性,通过提出三种攻击范式揭示现有方法往往隐藏而非彻底移除目标知识。
通过优化开发与测试人类感知的ergoCub机器人迈向人形机器人的共享具身智能
发表机构 * GenerativeBionics(生成生物技术) ; Artificial and Mechanical Intelligence(人工与机械智能) ; School of Computer Science, University of Manchester(曼彻斯特大学计算机科学学院) ; Humanoid Sensing and Perception(人形感知与感知) ; iCub Tech Facility(iCub技术设施) ; DiMEILA, Istituto Nazionale Assicurazione Infortuni sul Lavoro (INAIL)(DiMEILA,意大利国家职业伤害保险机构(INAIL))
AI总结 提出一种融合共享智能与具身认知的架构,通过优化机器人硬件与控制以符合人体工学指标,实现人机物理协作,并以ergoCub人形机器人为具体实现。
TED:基于关联方交易的异构图偷漏税检测
发表机构 * School of Computer Science and Technology, Xi’an Jiaotong University(西安交通大学计算机科学与技术学院) ; School of Distance Education, Xi’an Jiaotong University(西安交通大学继续教育学院) ; School of Computing and Augmented Intelligence, Arizona State University(亚利桑那州立大学计算与增强智能学院)
AI总结 针对现有偷漏税检测方法未能充分利用税务场景中丰富交互信息的问题,提出一种基于异构图神经网络的TED模型,通过关联方交易组过滤噪声并设计层次注意力机制捕获深层语义,在真实数据集上显著优于现有方法。
Comments Accepted by Data Mining and Knowledge Discovery (DMKD25)
PashtoTTS-Bench:低资源非拉丁文字文本转语音的自动化筛选
发表机构 * Independent Researcher(独立研究员)
AI总结 针对低资源非拉丁文字TTS评估中单一ASR往返WER的不足,提出INSV报告框架及其自动化筛选子集INSV-A,并实例化为PashtoTTS-Bench基准,通过多指标评估多个TTS系统。
非光滑优化的谱下降收敛性
发表机构 * School of Mathematical Sciences, Zhejiang University, Hangzhou, China(浙江大学数学科学学院,杭州,中国)
AI总结 研究Muon优化器的简化变体谱下降(SD)及其截断版本(TSD)在非光滑凸优化中的全局线性收敛性,并应用于鲁棒低秩矩阵恢复。
RLVR 数据集及其查找方法:通过数据溯源寻找更好的训练数据
发表机构 * National Key Laboratory for Multimedia Information Processing, Peking University(北京大学多媒体信息处理国家重点实验室) ; School of Computer Science, Peking University(北京大学计算机科学学院) ; LLM Department, Tencent(腾讯LLM部门)
AI总结 针对可验证奖励强化学习(RLVR)数据集来源不清的问题,提出基于谱系感知搜索的原子源追踪框架(ATLAS),追溯超过99.7%的实例至20个原子源,并基于源级反事实归因(SCA)原则构建去污染数据集DAPO++,其质量分数Q与下游RLVR性能强相关。
Comments 7 figures, 12 tables
Recon:基于重建指导的推理合成用于用户建模
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 提出Recon方法,通过动作重建分数评估推理轨迹的预测能力,以改进用户建模中的推理合成,在多个领域优于事后合理化基线。
CodecCap: 高保真度编解码器启发的残差建模用于密集视频字幕生成
发表机构 * ERNIE Team, Baidu(百度ERNIE团队) ; College of Artificial Intelligence, Inner Mongolia University(内蒙古大学人工智能学院)
AI总结 提出CodecCap框架,通过关键帧和残差字幕模拟视频编解码器,在保持细粒度视觉证据的同时减少冗余,并引入VidCapQA基准验证其高保真度。
Comments 11 pages, 4 figures
Tournament-GRPO:面向开放式长文本生成强化学习的群组锦标赛奖励
发表机构 * Renmin University of China(中国人民大学) ; University of Southern California(南加州大学) ; Zhejiang University(浙江大学) ; Xiaohongshu Inc.(小红书公司)
AI总结 针对开放式长文本生成中缺乏可靠参考答案和自动评估指标的问题,提出Tournament-GRPO框架,通过同一查询生成结果间的多轮锦标赛比较将基于规则的LLM评判转化为相对奖励,在Deep Research Bench上取得4.52分提升。
JuICE:评估LLM裁判识别文化错误的基准
发表机构 * KAIST(韩国科学技术院) ; Google(谷歌) ; Universitas Gadjah Mada(加查马达大学)
AI总结 提出JuICE基准,包含7470个文化语言错误标注的多语言数据集,用于评估LLM裁判在长文本中识别深层文化错误的能力,发现最强模型F1仅0.52且常遗漏本地人易识别的错误。
基于策略内在知识边界增强的高效智能体强化学习
发表机构 * Tencent Inc(腾讯公司) ; The Chinese University of Hong Kong(香港中文大学) ; Shenzhen MSU-BIT University(深圳MSU-BIT大学)
AI总结 提出AKBE方法,通过双路径(有工具和无工具)在线策略训练动态探测模型内在知识边界,构建针对性监督信号,在保持准确率的同时减少工具调用。
DinoComplete: 利用蒸馏语义先验和状态空间模型进行3D形状补全
发表机构 * Chair of Media Technology(媒体技术教授职位) ; Munich Institute of Robotics and Machine Intelligence(慕尼黑机器人与机器智能研究所) ; School of Computation Information and Technology, Technical University of Munich(计算信息科学学院,慕尼黑技术大学)
AI总结 提出DinoComplete框架,通过从DINO特征中蒸馏语义先验并结合多尺度体素Mamba模块,实现高效、鲁棒的3D形状补全,在未见类别和真实噪声扫描上优于现有方法。
用于抓取的目标姿态与形状估计:有效吗?
发表机构 * Robotics Research Center, IIIT Hyderabad(IIIT海得拉巴机器人研究中心) ; National University of Singapore(新加坡国立大学)
AI总结 本文通过对比端到端抓取合成方法与模块化方法(先估计目标姿态和形状再采样抓取),评估现有姿态和形状估计方法在抓取任务中的有效性。
Comments 9 pages, 8 figures
负责任的基于LLM的人机协商:通过共生脚手架扩展集体智能
发表机构 * Northwestern University in Qatar(卡塔尔西北大学)
AI总结 提出一个三层共生人机框架,通过多样性放大、条款级溯源和人类主导批准,在扩展集体智能的同时保持主体性和合法性。
Comments Accepted at the LREC 2026 / 2nd Workshop on Language-driven Deliberation Technology
超越问题:评估大型语言模型(实际)知道什么
发表机构 * ScaDS.AI Dresden/Leipzig & TU Dresden, Germany(ScaDS.AI 德尔布兰德/莱比锡及德累斯顿技术大学,德国)
AI总结 提出开放知识评估新范式,通过开放式提示(如“告诉我关于M.L. King的一切”)评估模型自然表达的知识,并构建BeQu基准测试10,000个实体。
DunbaaBERT: 从牺牲到语义
发表机构 * Research and Development Center for Large Language Models (LLMC), National Institute of Informatics, Tokyo(大型语言模型研发中心(LLMC),信息研究所,东京) ; School of Computation, Information and Technology, Technical University of Munich, Germany(计算、信息与技术学院,慕尼黑技术大学,德国) ; Institute of General Practice, Faculty of Medicine and Medical Center, University of Freiburg, Germany(临床医学系,弗赖堡大学医学院及医学中心,德国)
AI总结 本文提出DunbaaBERT,一种从零训练的乌尔都语RoBERTa-base模型族,通过不同词汇表大小在17GB语料上预训练,在多项下游任务中达到与强多语言基线相当的性能,并发现较大词汇表并不持续提升效果。
推理深度与环境复杂度:逻辑推理任务中RLVR数据分配的受控研究
发表机构 * Kyoto University(京都大学) ; University of Tokyo(东京大学) ; NII LLMC(日本信息处理学会LLMC) ; RIKEN(理化学研究所)
AI总结 通过将推理空间划分为深度和复杂度两个维度,并考虑四种推理形式,在合成知识图谱环境中进行受控实验,发现联合深度-复杂度覆盖优于单轴策略,不同推理家族对RLVR覆盖的反应非均匀,且均匀混合优于分阶段课程。
Comments Pre-print
利用文本到图像扩散模型进行无监督视觉目标跟踪
发表机构 * Information Systems Technology and Design Pillar, Singapore University of Technology and Design(新加坡科技设计大学信息系统技术与设计学院) ; State Key Laboratory of Information Engineering in Surveying, Mapping and Remote Sensing, Wuhan University(武汉大学测绘遥感信息工程国家重点实验室) ; Department of Computer Science and Engineering, University at Buffalo, State University of New York(纽约州立大学布法罗分校计算机科学与工程系) ; School of Computer Science, Wuhan University(武汉大学计算机学院)
AI总结 提出Diff-Tracking方法,利用预训练文本到图像扩散模型的跨注意力机制,通过初始提示学习器和在线提示更新器实现无监督目标跟踪。
Comments Accepted by IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2026
从规范到指标 (N2I-RAG): 一种用于法律指标计算的智能检索增强生成框架
发表机构 * LISI Laboratory(LISI实验室) ; Cadi Ayyad University(卡迪·阿亚德大学) ; Univ Brest(布列塔尼大学) ; IRD, Univ Brest, CNRS, Ifremer, LEMAR(IRD、布列塔尼大学、CNRS、Ifremer、LEMAR)
AI总结 提出N2I-RAG框架,通过自适应检索、基于LLM的智能体和验证机制,实现从法律文本到指标的透明、可追溯的自动计算,在法国海洋环境法语料库上优于基线方法。
学习适应SFT数据以实现更好的推理泛化
发表机构 * Beihang University(北京航空航天大学) ; Tsinghua University(清华大学) ; Nanyang Technological University(南洋理工大学) ; Hangzhou International Innovation Institute(杭州国际创新研究院) ; Beijing Advanced Innovation Center for Future Blockchain and Privacy Computing(北京未来区块链与隐私计算高级创新中心)
AI总结 提出DART方法,通过强化学习训练映射器将分布不匹配的SFT数据转化为模型自适应的监督,提升推理泛化能力。
视频模型是教育领域的零样本学习者和推理者吗?EduVideoBench:面向教育视频生成的知识-技能-态度基准
发表机构 * Korea University Sejong Campus(韩国大学世宗校区) ; Cardiff Metropolitan University(卡迪夫 Metropolitan 大学) ; Seoul National University(首尔国立大学) ; Bugil Academy(Bugil 学院) ; Gyeonggi Provincial Office of Education(京畿省教育厅) ; Loughborough University(洛桑大学) ; Korea National University of Education(韩国教育大学) ; Korea University(韩国大学) ; Korean Educational Development Institute(韩国教育发展院) ; Sungshin Women’s University(顺天堂女子大学) ; Seoul National University of Education(首尔国立教育大学) ; Korea Institute for Curriculum and Evaluation(韩国课程评价院) ; Indiana University Bloomington(印第安纳大学布卢明顿分校)
AI总结 提出基于知识-技能-态度框架的教育视频生成基准EduVideoBench,评估五个前沿视频生成模型在教育有效性上的不足,并发现教育有效性是多维度的,单一元素不匹配即可使视频失效。
TADDLE: 一种用于检测有缺陷的LLM生成同行评审的工具增强型代理
发表机构 * East China Normal University(东华大学)
AI总结 针对LLM生成的同行评审难以检测缺陷的问题,提出TADDLE工具增强型代理,通过四个专用分析工具和两阶段半监督学习,在二元检测和多标签分类任务上表现优异。
关于因子图中可交换因子检测的充要条件
发表机构 * Institute for Humanities-Centered Artificial Intelligence, University of Hamburg, Germany(人文导向人工智能研究所,汉堡大学,德国)
AI总结 本文重新审视了因子图中可交换因子检测的理论基础,指出现有算法依赖的定理仅为必要条件而非充分条件,并提出了修正算法以保证正确性和效率。
SPHERE-JEPA: 均匀嵌入的球面预测
发表机构 * Université Paris-Saclay, CNRS, Advanced Track and Trace(巴黎萨克雷大学,国家科学研究中心,先进跟踪与追溯) ; ENS Paris-Saclay, Centre Borelli, Advanced Track and Trace(巴黎萨克雷高等师范学院,博雷利中心,先进跟踪与追溯) ; Université Paris-Saclay, CNRS(巴黎萨克雷大学,国家科学研究中心) ; ENS Paris-Saclay, Centre Borelli(巴黎萨克雷高等师范学院,博雷利中心)
AI总结 本文提出SPHERE-JEPA框架,通过将Cramér-Wold投影机制调整为强制超球面均匀性而非高斯先验,解决了自监督学习中高斯嵌入导致各向异性k-NN邻域的问题,在纹理检索和ImageNet-1K线性探测上取得显著提升。
微不足道的大小,显著的效果:大型语言模型中的尺度向量
发表机构 * Peking University(北京大学)
AI总结 本文系统研究了大型语言模型中的尺度向量,发现其虽参数占比极小但对预训练至关重要,通过自放大预条件效应优化优化过程,并提出了三种轻量级改进策略,在多种模型规模上一致提升性能。
Comments 36 pages
SIMPC: 学习自诱导镜像点一致性用于无监督点云去噪
发表机构 * National Key Laboratory of Microwave Imaging, Aerospace Information Research Institute, Chinese Academy of Sciences, Beijing, China(微波成像国家重点实验室,航天信息研究所,中国科学院,北京,中国) ; School of Computing, National University of Singapore, Singapore(计算学院,新加坡国立大学,新加坡)
AI总结 提出自诱导镜像点一致性(SIMPC)方法,通过几何先验生成镜像点并约束去噪目标一致性,实现无监督点云去噪,在合成和真实数据集上超越现有无监督及部分有监督方法。
Comments Accepted by ICML 2026. 17 pages, 8 figures, 8 tables
GeoFaith: 时空双视角下的忠实思维链
发表机构 * Xidian University(西安电子科技大学) ; Xi’an Jiaotong University(西安交通大学) ; Mohamed bin Zayed University of Artificial Intelligence(穆罕默德·本·扎耶德人工智能大学) ; The Hong Kong University of Science and Technology (Guangzhou)(香港科学与技术大学(广州)) ; University of Science and Technology of China(中国科学技术大学)
AI总结 针对思维链推理中的事后合理化问题,提出基于潜在几何结构和熵动力学的时空框架GeoFaith,通过可扩展的引导流水线构建忠实性检测器并联合优化结果正确性、过程忠实性和轨迹一致性。
通过对齐单目视频中的高阶时间动态恢复自然人体运动
发表机构 * Zhejiang University(浙江大学) ; Ant Group(蚂蚁集团) ; The University of Texas at Austin(德克萨斯大学奥斯汀分校)
AI总结 提出HTD-Refine框架,利用PVA-Net估计的高阶时间动态(速度和加速度)优化全局轨迹,恢复自然人体运动。
Comments 13 pages, 6 figures. Accepted as an Oral presentation and Best Paper Candidate at CVPR 2026. Project page: https://zju3dv.github.io/htd-refine/
多方利益相关者LLM对齐:从聚合中分解估计
发表机构 * AMAP, Alibaba Group(阿里集团AMAP) ; Beihang University(北京航空航天大学)
AI总结 针对多方利益相关者任务中用户偏好冲突的问题,提出DecompR方法,通过反事实校准权重固定查询结构,独立估计角色效用,消除候选依赖的权重漂移并降低估计噪声。