Hybrid Neural World Models
混合神经世界模型
发表机构 * Lossfunk
AI总结 提出混合神经世界模型,通过单网络连续视界条件训练直接预测未来状态,并利用误差图隐式捕捉不连续性,实现高效且可靠的物理动力学模拟。
Comments Preprint. Under review
混合神经世界模型
发表机构 * Lossfunk
AI总结 提出混合神经世界模型,通过单网络连续视界条件训练直接预测未来状态,并利用误差图隐式捕捉不连续性,实现高效且可靠的物理动力学模拟。
Comments Preprint. Under review
HardMTBench:知识密集型领域的中英翻译压力测试
发表机构 * Large Language Model Department, Tencent(腾讯大语言模型部门)
AI总结 针对现有中英翻译基准饱和问题,提出HardMTBench,一种难度感知的诊断基准,通过多阶段构建和难度融合规则,在12个知识密集型领域上显著扩大系统性能差异并暴露术语和知识弱点。
基于大语言模型的论证质量评估:一种成对Bradley-Terry方法
发表机构 * Centrum Wiskunde & Informatica, The Netherlands(荷兰代尔夫特理工大学) ; Vrije Universiteit Amsterdam, The Netherlands(荷兰阿姆斯特丹自由大学)
AI总结 本研究利用12种开源大语言模型,通过成对比较和Bradley-Terry模型评估论证质量,发现Llama-70B与人类专家判断具有中等一致性(Cohen's κ=0.493),其他模型表现各异但互补。
EventShiftFlow:面向硬件高效的基于FPGA的流估计
发表机构 * University of Pennsylvania(宾夕法尼亚大学)
AI总结 提出一种基于事件相机的流估计方法,通过离散化事件、构建1位空间占用网格并并行评估速度假设,仅使用固定宽度整数逻辑实现,无需帧重建、浮点运算或迭代优化,适用于低延迟机器人感知。
Comments 10 pages, 5 figures. Accepted to the IEEE ICRA 2026 Workshop on Challenges and Opportunities of Neuromorphic Field Robotics and Automation
学习评估随机优化中运行次数估计的可靠性
发表机构 * Jožef Stefan Institute(乔泽夫·斯蒂凡研究所)
AI总结 针对随机优化中运行次数估计的可靠性问题,提出一种基于学习的扩展方法,利用统计和形状特征训练分类器预测估计可靠性,在内部配置场景下实现高少数类召回率。
Comments Preprint version of a poster accepted at the Genetic and Evolutionary Computation Conference 2026 (GECCO 2026)
HELEA: 用于鲁棒实体对齐的硬负样本基准和基于LLM的重排序
发表机构 * SungKyunKwan University(全州大学)
AI总结 针对现有实体对齐基准中模型依赖名称重叠而非关系结构的问题,提出同名的硬负样本增强策略生成质量可控的评估基准和训练语料,并设计HELEA两阶段框架(实体编码器检索+LLM重排序),在硬负样本基准上实现鲁棒对齐。
Comments 10 pages, 3 figures, 9 tables. Code and benchmarks available at https://github.com/Wnsdnl/HELEA
面向混合专家模型中多语言下游任务的路由对齐微调
发表机构 * City University of Hong Kong(香港城市大学) ; Carnegie Mellon University(卡内基梅隆大学) ; The University of Hong Kong(香港大学)
AI总结 针对混合专家模型在多语言下游任务中的路由结构异构问题,提出RA-MoE三阶段框架,通过中间层语言通用对齐区识别任务相关专家,并引入路由对齐损失增强目标语言路由,实验表明该方法优于标准微调和强基线。
重新审视大语言模型推理中的拟人化反思标记
发表机构 * Kyoto University(京都大学)
AI总结 本文通过提示级和令牌级干预抑制拟人化反思标记,发现这些标记并非推理性能的必要条件,且抑制后模型仍能进行无标记验证,表明它们更多是表面线索而非可靠反思代理。
Comments 15 pages, 12 figures
自回归模型中通过Logit组合实现组合泛化
发表机构 * COATI, CNRS, Inria, I3S, Université Coté d’Azur, France(COATI研究所、国家科学研究中心、Inria、I3S、法国埃克塞特大学)
AI总结 本文受扩散模型组合方法的启发,提出一种新的自回归系统组合策略,在因子化条件假设下实现投影组合,并证明该组合在输出空间平滑重参数化下保持长度泛化行为。
从事实覆写到知识演化:基于同策略自蒸馏的因果编辑
发表机构 * State Key Laboratory of Cognitive Intelligence(认知智能国家重点实验室)
AI总结 针对知识编辑中静态事实覆写范式导致认知失调的问题,提出基于因果引导的同策略蒸馏方法CODE,将事实注入转化为连贯的知识演化,显著降低自反驳率并提升多跳准确性。
解聚能走多远?面向高效 MoE LLM 服务的 Attention-FFN 解聚设计空间探索
发表机构 * Georgia Institute of Technology(佐治亚理工学院) ; Intel(英特尔) ; Google(谷歌) ; Google DeepMind(谷歌深Mind) ; Infravana
AI总结 本文系统探索了从分块预填充、预填充-解码解聚到算子级 Attention-FFN 解聚 (AFD) 的不同解聚层次在 MoE 模型推理中的收益与局限,通过融合设备内核测量与高保真网络仿真的框架,在严格 TTFT/TPOT SLO 下 AFD 可在 DeepSeek-V3.2 上维持约 4k tokens/s 的系统吞吐量,并给出了联合优化吞吐与交互性的具体设计原则。
更高的准确率,更差的推理:医学思维链蒸馏的步骤级审计
发表机构 * School of Health & Wellbeing, University of Glasgow(健康与福祉学院,格拉斯哥大学) ; Department of Respiratory and Critical Care Medicine, Shanghai Sixth People’s Hospital, Shanghai Jiao Tong University School of Medicine(呼吸与危重医学科,上海第六人民医院,上海交通大学医学院) ; School of Life Science and Technology, University of Electronic Science and Technology of China(生命科学与技术学院,电子科技大学) ; Institute of Health Informatics, University College London(健康信息学研究所,伦敦大学学院)
AI总结 通过蒸馏大模型思维链训练小模型,发现医学问答中答案准确率提升但推理步骤的事实错误率上升,表明答案质量与推理真实性可能背道而驰。
T-GINEE:基于张量的多层图表示学习
发表机构 * City University of Hong Kong(香港城市大学) ; Beihang University(北京航空航天大学) ; Independent Researcher(独立研究者) ; Peking University(北京大学) ; Fudan University(复旦大学) ; Shanghai Academy of AI for Science(上海人工智能科学研究院)
AI总结 针对现有方法无法捕捉多层网络层间复杂依赖的问题,提出T-GINEE框架,结合张量分解与广义估计方程显式建模跨网络相关性,理论证明一致性与渐近正态性,实验验证有效性。
Comments Accepted by ICML 2026
REED: 面向跨域语言隐写分析的后训练表示编辑
发表机构 * China Agricultural University(中国农业大学) ; Jiangsu Normal University(江苏师范大学)
AI总结 提出一种后训练表示编辑方法,通过构造域偏移向量和源域封面到隐写方向指导编辑,实现无需架构修改或参数更新的高效跨域语言隐写分析。
基于MATE-TPC的12C + 12C反应事件分类和顶点重建的机器学习方法
发表机构 * College of Science, Southern University of Science and Technology(南方科技大学科学学院) ; Institute of Modern Physics, Chinese Academy of Sciences(中国科学院现代物理研究所) ; School of Nuclear Science and Technology, University of Chinese Academy of Sciences(中国科学院大学核科学与技术学院) ; School of Physics, Peking University(北京大学物理学院)
AI总结 采用ResNet和VGG等深度学习模型对12C + 12C反应事件进行分类,准确率达97%(模拟)和90%(实验),并利用CNN重建反应顶点。
Rollouts 的起点:面向 RLVR 的低负载、高杠杆的首 token 多样化
发表机构 * Department of Artificial Intelligence, Yonsei University(延世大学人工智能系)
AI总结 本文提出 REFT 方法,通过在推理标记后的第一个 token 处进行均匀采样多样化,以低开销显著提升 RLVR 中 rollout 的多样性,从而改善推理模型的 Pass@k 性能。
CIRF:将思维链分词化为可重用的功能单元,用于大型语言模型的高效潜在推理
发表机构 * Boston University(波士顿大学) ; Hankuk University of Foreign Studies(韩国民法大学)
AI总结 提出CIRF框架,通过将显式思维链中的语义连贯推理单元映射为离散功能令牌,实现动态序列推理,在数学、符号和常识推理基准上取得优于现有隐式CoT方法的准确率-延迟权衡。
Comments 17 pages, 7 figures
上下文匹配市场的自适应Bandit算法
发表机构 * Center for Statistical Science, School of Mathematical Sciences, Peking University(北京大学数学科学学院统计科学中心) ; INRIA, FairPlay Joint Team(INRIA公平玩联合团队) ; Criteo AI lab, FairPlay Joint Team(Criteo AI实验室,公平玩联合团队) ; Technion - Israel Institute of Technology(技术学院-以色列理工学院)
AI总结 针对上下文匹配市场中的bandit学习问题,提出自适应算法,在随机和对抗性上下文下分别实现实例相关的多对数遗憾上界和次线性遗憾界。
Comments Accepted to ICML 2026
AtomComposer: 基于强化学习从第一性原理发现化学空间
发表机构 * Dept. of Energy Conversion and Storage, Technical University of Denmark(丹麦技术大学能源转换与存储系) ; Dept. of Applied Mathematics and Computer Science, Technical University of Denmark(丹麦技术大学应用数学与计算机科学系) ; Pioneer Center for Accelerating P2X Materials Discovery (CAPeX), Kgs. Lyngby, Denmark(加速P2X材料发现的先锋中心(CAPeX),Lyngby,丹麦)
AI总结 提出AtomComposer,一种无需预训练数据、通过在线强化学习自主构建有效3D异构体的智能体,在未见化学式上发现的异构体数量比现有方法多一个数量级。
PrunePath:迈向高度结构化稀疏语言模型
发表机构 * Department of Applied Mathematics, The Hong Kong Polytechnic University(应用数学系,香港理工大学)
AI总结 提出PrunePath框架,通过软最大归一化路由和累积质量阈值实现自适应预算的结构化稀疏化,在自然语言理解、生成和指令调优中取得优越的稀疏-性能权衡,并利用Triton内核将结构化稀疏转化为实际内存节省和解码速度提升。
ResearchLoop: 一种用于AI辅助研究的证据门控控制平面
发表机构 * Shenzhen University(深圳大学)
AI总结 提出ResearchLoop,一种通过证据门控控制平面来确保AI辅助研究中声明可审计的协议,包括状态模型、转换规则和实验验证。
Comments 32 pages, 4 figures, 6 tables; technical report
IMU传播作为预积分
发表机构 * State Key Lab of Info Engineering in Surveying, Mapping and Remote Sensing(信息工程测绘遥感国家重点实验室) ; Wuhan University(武汉大学)
AI总结 本文证明IMU预积分与传播在计算上等价,提出一种与约定无关的视角,通过包装现有传播例程获得预积分测量、偏差雅可比和协方差,反之亦然,从而简化代码复用并支持一致性检查。
Comments 6 pages, 2 figures, to present in ISPRS2026 Thematic Session 10 on Radar Perception
LLMs 是否从文本构建世界模型?多语言空间推理诊断
发表机构 * University of New South Wales(新南威尔士大学) ; Essential Energy ; University of Alabama at Birmingham(阿拉巴马大学伯明翰分校) ; Zhejiang University(浙江大学) ; Fudan University(复旦大学) ; Tsinghua University(清华大学)
AI总结 通过多语言诊断基准 MentalMap 评估大语言模型的空间推理能力,发现所有模型在视角推理上存在普遍的性能瓶颈(L3 推理悬崖),表明该限制源于纯文本工作记忆约束而非特定架构。
Commit to the Bit: Reactive Reinforcement Learning Done Right
发表机构 * Max Planck Institute for Intelligent Systems(马克斯·普朗克智能系统研究所) ; University of Tübingen(图宾根大学) ; University of Technology Nuremberg(纽伦堡技术大学)
AI总结 针对确定性观测的有限环境,提出Committed Q-learning算法,在弱于$q_\star$-可实现性的rewire-鲁棒性假设下,证明其几乎必然收敛到最优反应策略。
全局策略空间响应预言机用于两人零和博弈
发表机构 * Department of Electronic Engineering, Tsinghua University, Beijing, China(清华大学电子工程系,北京,中国) ; Qiyuan Lab, Beijing, China(启元实验室,北京,中国)
AI总结 提出Global PSRO框架,通过直接最小化种群可利用性(PE)来引导策略种群扩展,以更少的策略迭代逼近纳什均衡。
Comments Accepted by ICML 2026
EchoAvatar: 从音频流实时生成动画虚拟化身
发表机构 * State Key Lab of CAD\&CG, Zhejiang University(浙江大学计算机辅助设计与图形学国家重点实验室)
AI总结 提出统一流式架构,从流式语音和音乐中低延迟生成连续全身运动,通过强化学习优化在线生成质量,并利用工具调用接口实现意图驱动控制。
Comments SIGGRAPH 2026; Project Page: https://robinwitch.github.io/EchoAvatar-Page
LV-OSD: 语言-视觉互补的开放集目标检测
发表机构 * College of Intelligence and Computing, Tianjin University(智能与计算学院,天津大学) ; Faculty of Computer Science and Artificial Intelligence, Shenzhen University of Advanced Technology(计算机科学与人工智能学院,深圳先进技术大学)
AI总结 提出语言-视觉互补开放集目标检测问题,设计双分支检测框架LVDor,通过目标引导提示动态加权模块和提示随机掩码机制实现文本与图像提示的灵活组合与语义对齐。
Every9D-21M:日常物体的大规模真实世界9D规范化
发表机构 * University of Freiburg(弗赖堡大学) ; CISPA Helmholtz Center for Information Security(信息安全赫尔姆霍茨研究中心)
AI总结 针对真实世界9D姿态数据缺乏的问题,提出包含2180万张图像、700类物体的Every9D-21M数据集,通过多视图几何重建点云并跨实例对齐实现大规模标注,验证了其在多个基准上的性能提升。
基于高阶超图表示的动态主题建模
发表机构 * Department of Statistics, University of California, Irvine(加州大学 Irvine 分校统计学系) ; Department of Mathematics and Department of Developmental & Cell Biology, University of California, Irvine(加州大学 Irvine 分校数学系及发育与细胞生物学系) ; Department of Statistics and Applied Probability, University of California, Santa Barbara(加州大学 Santa Barbara 分校统计学与应用概率系)
AI总结 针对传统主题模型忽略词间高阶交互和动态语料中语义重叠的问题,提出超图表示文本并构建动态主题建模框架,通过结构化低秩分解和时间正则化实现,理论保证收敛性和误差界,实验优于现有模型。
Comments 34 pages, 4 figures
基于受控向量场的参数高效生成建模
发表机构 * Department of Computer Sciences, University of Wisconsin, Madison, WI, 53706(威斯康星大学麦迪逊分校计算机科学系)
AI总结 提出一种基于Chow-Rashevskii定理的连续时间生成建模框架,通过少量固定向量场和学习的标量控制构建表达流,实现参数高效的分布变换。