Pruning and Distilling Mixture-of-Experts into Dense Language Models
将混合专家模型剪枝和蒸馏为密集语言模型
发表机构 * KRAFTON ; KAIST(韩国科学技术院)
AI总结 提出首个将混合专家(MoE)模型转换为标准密集架构的系统框架,通过专家评分、选择、分组、拼接和知识蒸馏,在参数匹配条件下比密集到密集剪枝平均下游准确率提升6.3个百分点,训练速度提升1.6倍。
将混合专家模型剪枝和蒸馏为密集语言模型
发表机构 * KRAFTON ; KAIST(韩国科学技术院)
AI总结 提出首个将混合专家(MoE)模型转换为标准密集架构的系统框架,通过专家评分、选择、分组、拼接和知识蒸馏,在参数匹配条件下比密集到密集剪枝平均下游准确率提升6.3个百分点,训练速度提升1.6倍。
面向LLM深度压缩的局部感知冗余剪枝
发表机构 * University of Southern California(美国南加州大学) ; Neural Superintelligence Lab, MODULABS(MODULABS神经超级智能实验室) ; Seoul National University(首尔国立大学) ; Inha University(釜山大学)
AI总结 提出LoRP,一种基于表示局部性的无训练单次深度剪枝框架,通过引入表示局部性分数(RLS)来识别和剪除冗余层,在多种LLM上提升了困惑度和下游任务准确率。
最强的教师并不总是最好的教师:以学生为中心的答案选择
发表机构 * University of Washington(华盛顿大学) ; University of Texas at Austin(德克萨斯大学奥斯汀分校) ; University of Southern California(南加州大学) ; Independent Researcher(独立研究者) ; National University of Singapore(新加坡国立大学) ; Microsoft(微软) ; Google(谷歌) ; Mohamed bin Zayed University of Artificial Intelligence(穆罕默德·本·扎耶德人工智能大学) ; Northwestern University(西北大学) ; Allen Institute for AI (AI2)(人工智能研究院(AI2))
AI总结 提出以学生为中心的答案采样(SCAS)框架,通过估计学生中心的学习成本选择教师生成的答案,从而提升学生模型性能。
Wasserstein策略梯度在熵正则化强化学习中的全局收敛性
发表机构 * Shanghai Jiao Tong University(上海交通大学) ; The University of Texas at Austin(德克萨斯大学奥斯汀分校) ; The Chinese University of Hong Kong, Shenzhen(香港中文大学(深圳))
AI总结 本文通过利用熵正则化强化学习的Bellman结构,证明了Wasserstein策略梯度(WPG)方法的全局收敛性,并建立了分布Polyak-Łojasiewicz条件。
鲁棒Koopman控制屏障滤波器用于安全演员-评论家强化学习
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 提出鲁棒Koopman-CBF SAC框架,通过数据驱动学习Koopman预测器、构建提升空间中的仿射CBF约束并利用二次规划安全层实施,同时通过投影残差裕度处理近似误差,实现零约束违反或减少违规。
Comments 17 pages, 7 figures
通过奖励倾斜分布匹配增强少步生成器
发表机构 * Tencent Hunyuan(腾讯文英) ; Hong Kong University of Science and Technology(香港科技大学) ; Westlake University(西湖大学)
AI总结 提出奖励倾斜分布匹配蒸馏(RTDMD)两阶段框架,结合分布匹配蒸馏与奖励引导强化学习,在仅4步推理下实现文本到图像生成的最新性能。
Comments Code and models are available at https://github.com/Harahan/RTDMD
BORA: 弥合离线强化学习与在线残差适应以实现真实世界灵巧VLA模型
发表机构 * Shanghai Jiao Tong University(上海交通大学) ; CASIA(中国科学院自动化研究所) ; Shanghai AI Laboratory(上海人工智能实验室) ; USTC(中国科学技术大学)
AI总结 提出BORA框架,通过离线构建动作条件价值引导的评论家,并结合在线冻结VLA基础、引入人类在环的分块残差适应机制,解决灵巧操作中高维探索导致的时间不一致、样本低效和硬件风险问题,在五个真实灵巧任务上平均成功率提升33%。
Comments 24 pages,11 figures
AI天气模型能否预测两周以上?长期推演的定量基准与分析
发表机构 * ETH AI Center(ETH人工智能中心) ; ETH Zurich(苏黎世联邦理工学院) ; Swiss Data Science Center(瑞士数据科学中心) ; Scalable Parallel Computing Lab(可扩展并行计算实验室) ; Dep. of Applied Mathematics and Theoretical Physics(应用数学与理论物理系) ; University of Cambridge(剑桥大学) ; Institute of Geodesy and Photogrammetry(大地测量与摄影测量研究所) ; Seminar for Applied Mathematics(应用数学研讨会)
AI总结 通过九种AI天气模型的一年推演,将长期不稳定性分类为爆发、漂移和季节性丧失三种模式,并发现稳定性取决于对小时空尺度的处理。
中点生成模型
发表机构 * AXXX, Russia(俄罗斯AXXX) ; Applied AI Institute, Russia(俄罗斯应用人工智能研究所) ; Kandinsky Lab, Russia(俄罗斯康德斯基实验室)
AI总结 提出中点生成模型(MGM),利用流匹配的对称性定义中点散度,并通过变分目标训练单步生成模型,在性能上与现有方法竞争。
通过多项式表示量化和优化简单性
发表机构 * [cs.AI](计算机科学与人工智能)
AI总结 提出多项式表示作为分布感知的低维神经函数代理,通过正交多项式基近似网络预测行为,以有效度作为简单性度量,并导出可微正则化器以提升泛化。
Comments ICML 2026
跟随一切:具有目标感知适应的领导者跟随与避障框架
发表机构 * Institute of Robotics and Automatic Information System, Nankai University, China(南开大学机器人与自动化信息系统研究所) ; Centre for Data Science, University of Macau, China(澳门大学数据科学中心) ; Electrical and Computer Engineering Department, Hong Kong University of Science and Technology, China(香港科学与技术大学电子与计算机工程系) ; Department of Computer Science, University College London, UK(伦敦大学学院计算机科学系) ; Department of Aeronautical and Aviation Engineering, The Hong Kong Polytechnic University, Hong Kong, China(香港理工大学航空与航空工程系)
AI总结 提出统一框架,用分割模型替代检测模型以跟随任意形态领导者,并设计目标感知适应机制和基于图的规划器,实现领导者暂时离开视野时的鲁棒跟随与避障。
MOOSE-Copilot:一个基于网络的交互式助手,用于统一探索性和细粒度科学假设发现
发表机构 * Central Conservatory of Music(中央音乐学院) ; Nanyang Technological University(南洋理工大学)
AI总结 提出MOOSE-Copilot,通过形式化的人机交互协议,将发散性探索和收敛性细化统一,利用蓝图、路由和反馈三种信号引导生成,显著优于纯自主基线。
Comments Accepted to ACL 2026 (System Demonstrations)
基于环空间感知的电力系统自编码器盲假数据注入攻击检测
发表机构 * Faculty of Computer and Information Science, Ben-Gurion-University, Be’er Sheva, Israel(计算机与信息科学学院,本·古里安大学,贝尔谢巴,以色列)
AI总结 针对自编码器利用测量流形零空间生成的盲假数据注入攻击,提出基于拓扑环空间检测器,利用最小环基实现最优泛化误差,有效检测数据驱动攻击。
Comments 13 pages, 11 figures
S3Mem:用于长时域交互式问答的结构化时空场景-事件记忆
发表机构 * University of Science and Technology of China(中国科学技术大学) ; Shanghai Jiao Tong University(上海交通大学) ; Shanghai AI Laboratory(上海人工智能实验室) ; City University of Hong Kong(香港城市大学) ; The Chinese University of Hong Kong(香港中文大学) ; Fudan University(复旦大学) ; The University of Sydney(悉尼大学) ; Beihang University(北航)
AI总结 提出S3MEM框架,通过结构化场景-事件记忆和锚点敏感检索,在长时域交互式问答中实现比通用记忆接口更优的准确率-效率平衡。
OpenCompass:大型语言模型的通用评估平台
发表机构 * OpenCompass Team(OpenCompass团队) ; Shanghai AI Laboratory(上海人工智能实验室)
AI总结 提出OpenCompass,一个模块化、高兼容性、灵活且高并发的通用LLM评估平台,支持多种任务场景和主流基准数据集。
面向多自由变量复杂逻辑查询的神经可扩展符号搜索框架
发表机构 * Department of Mathematical Sciences, Tsinghua University(清华大学数学科学系) ; Squarepoint Capital(Squarepoint资本) ; Department of Computer Science and Engineering, Hong Kong University of Science and Technology(香港科学与技术大学计算机科学与工程系) ; Department of Computer Sciences, University of Rochester(罗切斯特大学计算机科学系)
AI总结 针对知识图谱上多自由变量复杂查询的联合排序难题,提出神经可扩展符号搜索(NS3)框架,通过预算约束和超节点合并近似联合排序,显著提升性能。
Comments 10 pages, 5 figures
P1SCO:从视角主义视角看社会维度
发表机构 * Independent Researcher(独立研究者) ; CENTAI, Turin(CENTAI,都灵) ; IT University of Copenhagen(哥本哈根技术大学)
AI总结 本文提出P1SCO数据集,从三个平台收集社交媒体评论并按十个社会维度标注,以捕捉社会互动和感知的多样性,支持细粒度分析及跨平台、个体差异研究。
黎曼流形操控:用于无标签操控的几何感知生成自编码器
发表机构 * Martian ; Harvard University(哈佛大学) ; Thoughtworks ; University of Utah(犹他大学)
AI总结 提出将语言模型操控重新定义为激活空间上的黎曼测地线计算,通过基于输出空间Hellinger距离学习的编码器实现无标签、无拓扑先验的流形操控。
X-Foresight:一种通过预测世界建模的联合视觉-动作因果预测网络
发表机构 * PWM Team(PWM团队) ; XPeng Inc.(XPeng公司)
AI总结 提出X-Foresight,一种将预测世界模型直接集成到VLA架构中的方法,通过长程分块自回归策略和课程学习,联合学习世界建模与实时动作控制,以解决视频预测中的低熵冗余和长程因果建模难题。
QuoVLA:视觉-语言-动作模型的商空间
发表机构 * Department of Automation(自动化系)
AI总结 针对VLA模型预训练VLM潜在表示动作信息不足的观点,提出商空间框架QuoVLA,通过量化模块和双分支设计压缩潜在表示为动作充分表示,在多个基准上提升泛化性能。
先聚焦后聆听:探索用于噪声鲁棒的大规模音频语言模型的即插即用音频增强器
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; University of Washington(华盛顿大学)
AI总结 提出即插即用的音频增强器FTL,通过分离语音与非语音并利用模态路由器预测目标模态,生成任务自适应增强信号,无需微调即可提升LALMs在噪声环境下的性能。
Comments Accepted by ICML 2026 Workshop (Machine Learning for Audio)
基于元学习的成本效益模型评估
发表机构 * Griffith University(格里菲斯大学) ; Edith Cowan University(埃迪斯科文大学) ; The University of Queensland(昆士兰大学)
AI总结 提出MetaEvaluator,一种基于元学习的模型无关框架,通过参考模型池实现无标签数据上的快速、准确且成本效益高的新模型评估。
Comments Accepted by KDD 2026
通过机器学习加速可分负载处理:大规模工作负载的实用框架
发表机构 * Department of Electrical and Computer Engineering, National University of Singapore(电子与计算机工程系,新加坡国立大学)
AI总结 提出首个机器学习框架,使用前馈神经网络预测单级树网络架构中的最优处理时间,实现97-99%准确率和1-5%平均绝对百分比误差,推理时间小于1毫秒,相比传统方法加速10-100倍。
潜在缓存流:无需文本的模型间通信
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; Stanford University(斯坦福大学)
AI总结 提出潜在缓存流(LCF)方法,通过联合翻译和压缩键值缓存实现高效模型间通信,在上下文不同场景下比基于文本的通信准确率提高23%、速度提升8.5倍。
Comments 6 pages, 5 figures
面向智能体AI的技能检索增强
发表机构 * Department of Computer Science and Technology, Tsinghua University(清华大学计算机科学与技术系) ; ByteDance Inc.(字节跳动公司)
AI总结 针对现有智能体系统在技能库扩展时上下文窗口不足、技能识别准确率下降的问题,提出技能检索增强(SRA)范式,通过动态检索外部技能库提升智能体性能,并构建SRA-Bench基准揭示技能整合中的瓶颈。
用AI驱动的形式证明搜索推进数学研究
发表机构 * Google DeepMind(谷歌DeepMind) ; Aarhus University(奥胡斯大学)
AI总结 本文研究了如何利用大型语言模型生成形式证明,以解决开放性数学问题,并展示了AI辅助形式证明搜索在数学研究中的应用和贡献。
从单视角视频中基于3D无标记运动学的罗达和格雷厄姆步态分类量化
发表机构 * Department of Biomedical Informatics, Emory University(埃默里大学生物医学信息学系) ; Shriners Children’s(夏皮罗儿童医院) ; The Wallace H. Coulter Department of Biomedical Engineering, Emory University and Georgia Institute of Technology(埃默里大学和佐治亚理工学院的沃克·H·库勒生物医学工程系)
AI总结 本文提出了一种基于单视角视频的无标记步态分析方法,用于量化罗达和格雷厄姆步态分类中的膝踝z分数,从而在资源有限的临床环境中实现可扩展的客观步态评估。
Comments 29 pages, 8 figures, 9 tables (including 1 supplementary table); manuscript prepared in PLOS ONE format
Ishigaki-IDS-Bench: 一个用于从BIM信息需求生成信息交付规范的基准
发表机构 * ONESTRUCTION Inc.(ONESTRUCTION公司) ; AWS GenAI Innovation Center(AWS生成式人工智能创新中心)
AI总结 本文提出Ishigaki-IDS-Bench基准,用于评估大型语言模型生成符合行业标准的XML信息交付规范(IDS)的能力,通过166个由BIM/IDS专家编写和验证的示例,结合内容一致性评估和结构审核,展示了当前LLM在生成满足IDS标准和IFC词汇约束的XML方面的局限性。
Comments 7 pages; benchmark data and evaluation scripts are available on GitHub and Hugging Face
CrossVLA: 跨范式后训练和推理优化用于视觉-语言-动作模型
发表机构 * Tianjin University(天津大学)
AI总结 本文研究了视觉-语言-动作(VLA)模型的跨范式后训练方法,提出了CrossVLA框架,通过改进的连续动作流匹配估计器、对比LoRA和DoRA参数高效层的性能,并揭示了推理过程中去噪循环对延迟的影响,最终实现了在LIBERO数据集上的显著提升。
Comments Workshop draft, 14 pages, 4 figures. Code, ckpts, data: https://github.com/lz-googlefycy/vla-lab
基于漂移模型的语音增强
发表机构 * Victoria University of Wellington(维多利亚大学) ; Lincoln University(林肯大学) ; GN Advanced Science(GN先进科学)
AI总结 本文提出了一种基于漂移模型的语音增强框架DriftSE,通过将去噪问题建模为平衡问题,实现单步推理,从而在无需配对数据的情况下实现高质量语音增强。
Comments 6 pages, 2 figures