Sentence Curve Language Models
句子曲线语言模型
发表机构 * Ulsan National Institute of Science and Technology(全南国立科学研究所) ; Handong Global University(翰昂全球大学)
AI总结 提出句子曲线表示,将扩散语言模型扩展为预测句子曲线而非静态词嵌入,以增强全局结构建模,并在IWSLT14和WMT14上取得最优性能。
句子曲线语言模型
发表机构 * Ulsan National Institute of Science and Technology(全南国立科学研究所) ; Handong Global University(翰昂全球大学)
AI总结 提出句子曲线表示,将扩散语言模型扩展为预测句子曲线而非静态词嵌入,以增强全局结构建模,并在IWSLT14和WMT14上取得最优性能。
信任区域持续学习作为隐式元学习器
发表机构 * Georgia Institute of Technology(佐治亚理工学院)
AI总结 本文提出信任区域持续学习,通过结合生成重放和Fisher度量信任区域约束,实现隐式元学习效果,在任务增量扩散图像生成和持续扩散策略控制中取得最佳性能。
Comments 21 pages, 21 tables
聚焦分割:在干扰物存在下引导潜在动作模型
发表机构 * Karlsruhe Institute of Technology(卡尔斯鲁厄理工学院) ; University of Oxford(牛津大学)
AI总结 针对动作相关视觉干扰导致潜在动作模型失效的问题,提出MaskLAM方法,利用分割基础模型(如SAM)零样本获取智能体掩码,限制重建目标于智能体像素,迫使潜在动作编码内源动态,显著提升下游策略性能。
ECHO: 测试时强化学习的熵-置信度混合优化
发表机构 * Northeastern University, Shenyang, China(东北大学(沈阳)) ; Shenzhen Campus of Sun Yat-sen University, China(中山大学深圳校区)
AI总结 针对测试时强化学习中高熵分支导致rollout崩溃和早期伪标签噪声引发过拟合的问题,提出熵-置信度混合组相对策略优化(ECHO),通过自适应分支控制和置信度剪枝缓解崩溃,并采用置信度自适应裁剪和优势塑造增强训练鲁棒性。
Comments 19 ppages
SAME: 用于多模态持续指令调优的稳定混合专家模型
发表机构 * State Key Laboratory of Novel Software Technology, Nanjing University, China(南京大学新型软件技术国家重点实验室) ; School of Artificial Intelligence, Nanjing University, China(南京大学人工智能学院)
AI总结 针对多模态持续指令调优中专家路由漂移和专家漂移问题,提出稳定混合专家模型(SAME),通过正交子空间分解路由动态和曲率感知缩放更新专家,实现无重放的状态最优性能。
Comments Accepted to ICML 2026. Code is available at https://github.com/LAMDA-CL/Prism
概率-熵校准:一种用于自适应微调的弹性指标
发表机构 * The Chinese University of Hong Kong(香港中文大学) ; Peking University(北京大学) ; Tsinghua University(清华大学) ; University of the Chinese Academy of Sciences(中国科学院大学)
AI总结 提出概率-熵校准信号(相对排名指标)进行token级重加权,以平衡预训练先验与下游对齐,在数学推理、分布外推理和代码生成任务上优于仅基于概率或熵的方法。
Comments Accepted by ICML 2026
平坦感知随机梯度Langevin动力学
发表机构 * UNIST InnoCORE AI-Space Solar Initiative, Ulsan National Institute of Science and Technology (UNIST), Ulsan, 44919, Republic of Korea(UNIST InnoCORE AI-Space Solar Initiative,乌山国立科学与技术研究所(UNIST),乌山,44919,韩国) ; Artificial Intelligence Graduate School, Ulsan National Institute of Science and Technology (UNIST), Ulsan, 44919, Republic of Korea(人工智能研究生院,乌山国立科学与技术研究所(UNIST),乌山,44919,韩国) ; Department of Industrial Engineering, Ulsan National Institute of Science and Technology (UNIST), Ulsan, 44919, Republic of Korea(工业工程系,乌山国立科学与技术研究所(UNIST),乌山,44919,韩国) ; School of Mathematics, University of Edinburgh, Edinburgh, United Kingdom(爱丁堡大学数学学院,爱丁堡,英国) ; Department of Mathematics, National Technical University of Athens, Athens, Greece(雅典国家技术大学数学系,雅典,希腊) ; Archimedes, Athena Research and Innovation Centre, Marousi, Greece(Archimedes,雅典研究与创新中心,Marousi,希腊)
AI总结 提出平坦感知随机梯度Langevin动力学(fSGLD),通过理论规定的噪声尺度与逆温度耦合,在保持计算效率的同时偏向平坦盆地,并提供非渐近理论分析和实验验证。
Comments Accepted by ICML 2026
Journal ref ICML 2026
超越模型排名:时间序列预测的可预测性对齐评估
发表机构 * Department of Electronic Engineering, Tsinghua University, Beijing, China.(清华大学电子工程系,北京,中国)
AI总结 针对基准排行榜评估混淆模型性能与数据内在不可预测性的问题,提出基于谱相干的可预测性对齐诊断框架,包含SCP分数和LUR工具,揭示可预测性漂移和模型架构权衡。
注意力汇聚在注意力层中锻造原生MoE:针对头部坍塌的汇聚感知训练
发表机构 * Institute for Artificial Intelligence, Peking University, Beijing(人工智能研究院,北京大学,北京) ; School of Integrated Circuits, Peking University, Beijing(集成电路学院,北京大学,北京)
AI总结 本文通过理论和实证证明注意力汇聚自然构建了注意力层内的混合专家机制,并提出汇聚感知训练算法以缓解头部坍塌问题,提升模型性能。
Comments 2026 International Conference on Machine Learning (ICML)
基于严格实验设置的轻量级自主激光雷达无人机系统在北方森林环境中的现场评估与优化
发表机构 * Finnish Geospatial Research Institute in National Land Survey of Finland(芬兰地理研究 institute 在芬兰国家土地测绘局)
AI总结 提出标准化实验设置评估自主林下无人机系统,通过轻量级激光雷达四旋翼在北方森林中的93次真实飞行验证,优化后系统在中难度森林中1m/s和2m/s速度下成功率分别为12/15和15/15,在困难森林中为12/15和5/15。
Comments This work has been submitted to the IEEE for possible publication
粒子引导的偏微分方程扩散模型
发表机构 * Department of Computer and Information Science, Linköping University, Linköping, Sweden(计算机与信息科学系,林雪平大学,林雪平,瑞典)
AI总结 提出一种粒子引导的随机采样方法,结合扩散模型与基于PDE残差和观测约束的物理引导,通过序贯蒙特卡洛框架实现可扩展的生成式PDE求解器,在多个基准和多物理场系统中数值误差低于现有方法。
哪些注意力头对推理重要?RL引导的KV缓存压缩
发表机构 * Westlake University(西华大学) ; McGill University(麦吉尔大学) ; Mila - Quebec AI Institute(魁北克AI研究院) ; Zhejiang University(浙江大学) ; Mohamed bin Zayed University of Artificial Intelligence(穆罕默德·本·扎耶德智能大学)
AI总结 提出RLKV方法,利用强化学习识别对推理质量关键的注意力头,并对其保留完整KV缓存而对其他头进行激进压缩,实现20-60%缓存减少且性能近乎无损。
PICACO: 通过总相关优化实现大语言模型的多元情境价值对齐
发表机构 * Johns Hopkins University, Baltimore, MD, USA(约翰霍普金斯大学) ; North Carolina State University, Raleigh, NC, USA(北卡罗来纳州立大学) ; Microsoft Research Asia, Beijing, China(微软亚洲研究院) ; Tongji University, Shanghai, China(同济大学)
AI总结 针对情境对齐中价值冲突导致的指令瓶颈问题,提出PICACO方法,通过优化元指令并最大化指定价值与模型响应的总相关,无需微调即可实现多元价值平衡对齐。
Comments ICML 2026
SONIC-O1:用于评估多模态大语言模型在音视频理解上的真实世界基准
发表机构 * Vector Institute for Artificial Intelligence(向量人工智能研究所) ; University of Groningen(Groningen大学) ; York University(约克大学)
AI总结 提出SONIC-O1基准,包含60小时人工验证的音视频数据,评估多模态大语言模型在开放摘要、多项选择问答和时序定位上的能力,发现模型在时序定位上存在显著性能差距和人口统计偏差。
学习推荐什么:逻辑斯蒂老虎机中极小化最优简单遗憾
发表机构 * University of Alberta(阿尔伯塔大学) ; University of Washington, Seattle(华盛顿大学(西雅图)) ; OpenAI(开放人工智能研究所)
AI总结 针对简单遗憾目标下的随机逻辑斯蒂老虎机,提出两种曲率感知算法(MULog和THATS),实现与下界匹配的遗憾上界,并揭示最优动作处sigmoid逆斜率κ_*决定极小化难度。
语言模型的神经权重压缩
发表机构 * POSTECH(POSTECH大学) ; Samsung Electronics Co., Ltd(三星电子公司)
AI总结 提出神经权重压缩(NWC)框架,通过训练神经编解码器在预训练权重数据集上实现高效压缩,解决张量异质性和重建损失与下游性能不匹配问题,在4-6比特区间取得优异精度-压缩权衡。
Transformer的语法:语言模型中句法知识可解释性研究的系统综述
发表机构 * Universitat Pompeu Fabra(巴塞罗那庞培乌法布拉大学) ; ICREA(加泰罗尼亚国家研究委员会)
AI总结 通过对337篇文章的系统综述,评估基于Transformer的语言模型(TLM)的句法能力,发现TLM编码了非平凡的句法知识,但句法-语义接口现象表现较弱,且研究集中在英语和BERT类模型上。
基于外生锚点的注意力投影混合
发表机构 * Independent Researcher(独立研究者)
AI总结 针对早期注意力投影跨层重用中内部锚点设计存在的结构冲突,提出ExoFormer模型,通过学习序列层外的外生锚点投影,并引入统一归一化混合框架,在减少令牌使用量的同时提升下游准确率。
Mask-GCG:对抗性后缀中的所有标记对于越狱攻击都是必要的吗?
发表机构 * Politecnico di Milano(米兰理工学院) ; Beihang University(北京航空航天大学) ; East China Normal University(华东师范大学) ; Fudan University(复旦大学) ; University of the Chinese Academy of Sciences(中国科学院大学) ; AI Security Lab(360人工智能安全实验室)
AI总结 提出Mask-GCG方法,通过可学习的标记掩码识别后缀中高影响力标记并剪枝低影响力标记,降低计算开销并保持攻击成功率,揭示LLM提示中的标记冗余。
Comments Accepted to ICASSP 2026
Journal ref 2026 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), pp. 13887-13891, 2026
脚本即一切:一个用于长程对话到电影视频生成的智能体框架
发表机构 * Tencent(腾讯)
AI总结 提出一个端到端智能体框架,通过训练ScripterAgent将对话转化为精细脚本,并利用DirectorAgent跨场景连续生成策略,实现长程对话到电影视频的连贯生成,显著提升脚本忠实度和时间保真度。
BEAR: 面向多文档推理的预算化证据分配
发表机构 * Qiyuan Tech(启元科技)
AI总结 提出BEAR框架,通过构建分层语义索引并在查询时进行由粗到细的证据访问,在固定证据预算下实现高效的多文档推理。
统一深度学习中的低维谱
发表机构 * Mathematical Institute, University of Oxford(牛津大学数学研究所)
AI总结 本文利用无约束特征模型(UFM)证明深度神经坍缩(DNC)是多种深度学习矩阵(如Hessian、梯度和权重)中低维谱结构的统一来源,并给出了特征值和特征向量的解析构造。
Comments revised version; title changed slightly. 45 pages, 20 figures. Accepted at the International Conference on Machine Learning 2026
PEAR:机器翻译中自动相对评分的成对评估
发表机构 * Sapienza University of Rome(罗马萨皮恩扎大学) ; Microsoft(微软)
AI总结 提出PEAR,一种监督式质量估计指标族,通过成对比较实现无参考机器翻译评估,预测质量差异方向和幅度,在WMT24基准上优于单候选基线,并有效用于最小贝叶斯风险解码。
Comments ACL 2026 Main Conference. 19 pages
通过双流知识蒸馏实现鲁棒半监督回归
发表机构 * Chongqing Institute of Green and Intelligent Technology, Chinese Academy of Sciences(重庆绿色智能技术研究所,中国科学院) ; Chongqing School, University of Chinese Academy of Sciences(中国科学院大学重庆学院) ; Singapore Management University(新加坡管理大学) ; Beijing University of Posts and Telecommunications(北京邮电大学)
AI总结 针对半监督回归中未标记数据利用不足和伪标签噪声问题,提出双流知识蒸馏框架(DKD),通过蒸馏连续值知识和分布信息,并结合解耦分布对齐模块,提升回归预测的鲁棒性和样本效率。
Comments 12 pages
强化学习算法在大规模流动控制中的即插即用基准测试
发表机构 * TU Dortmund University(图卢兹大学) ; Lamarr Institute for Machine Learning(拉马尔机器学习研究所) ; Technical University Munich(慕尼黑技术大学) ; Munich Center for Machine Learning(慕尼黑机器学习中心)
AI总结 提出首个完全基于PyTorch、可微分的强化学习流动控制基准套件FluidGym,通过标准化评估协议实现控制方法的系统比较。
Comments Accepted to ICML 2026. Code available at https://github.com/safe-autonomous-systems/fluidgym
EVADE-Bench:用于评估和增强规避性内容检测的多模态基准
发表机构 * SIAT, Chinese Academy of Sciences(中国科学院深圳先进技术研究院) ; University of Chinese Academy of Sciences(中国科学院大学) ; Alibaba Group(阿里巴巴集团) ; University of New South Wales(新南威尔士大学)
AI总结 针对电商平台中LLM/VLM易受规避性内容攻击的问题,提出首个专家标注的中文多模态基准EVADE-Bench,评估26个模型并发现规则分类可提升检测一致性,多智能体分解策略能显著提高准确率。
Comments SIGIR 2026
基于嵌入的主题建模和LLM分析癌症患者的体验
发表机构 * Leiden Institute of Advanced Computer Science (LIACS), Leiden, The Netherlands(莱顿高级计算机科学研究所(LIACS),莱顿,荷兰) ; Leiden University Medical Center (LUMC), Leiden, The Netherlands(莱顿大学医学中心(LUMC),莱顿,荷兰)
AI总结 本研究利用BERTopic和Top2Vec等神经主题建模方法,结合LLM(GPT4)进行主题标注,从癌症患者访谈数据中提取有意义主题,并评估不同嵌入模型的效果,发现领域特定的BioClinicalBERT嵌入能提高主题精度和可解释性。
Comments accepted by the CLIN journal. The CLIN Journal is the journal for research in computational linguistics in The Netherlands and Belgium
Alterbute: 编辑图像中物体的内在属性
发表机构 * Google(谷歌) ; The Hebrew University of Jerusalem(耶路撒冷希伯来大学) ; Reichman University(雷赫曼大学)
AI总结 提出Alterbute方法,通过扩散模型结合松弛训练目标和视觉命名实体,在保持物体身份和场景上下文的同时编辑颜色、纹理、材质和形状等内在属性。
Comments ICML 2026. Project page is available at https://talreiss.github.io/alterbute/
卷积神经网络逆问题求解器的解析理论
发表机构 * IRIT \& CBI, CNRS \& Université Toulouse, France ; Toulouse School of Economics, Université Toulouse Capitole, France
AI总结 通过最小均方误差估计器引入平移等变性和有限感受野的归纳偏置,推导出局部等变MMSE的解析公式,并在多种逆问题、数据集和架构上验证其与神经网络输出高度一致。
Journal ref Forty-Third International Conference on Machine Learning, 2026
CALM-IT: 通过双角色对话动态追踪生成逼真的长形式动机访谈对话
发表机构 * Georgia Institute of Technology(佐治亚理工学院) ; Northwell Health(北well健康) ; Columbia University(哥伦比亚大学)
AI总结 提出CALM-IT框架,通过显式建模客户与咨询师状态的演变来生成和评估长形式动机访谈对话,在8,232个合成对话语料上优于基线方法,尤其在MITI 4.2全局评分和客户接受率上表现最佳。
Comments 53 pages, in submission to EMNLP