Mechanical Field Networks: Structured Neural Dynamics for Multivariate Systems
机械场网络:多变量系统的结构化神经动力学
发表机构 * Xi’an Jiaotong University(西安交通大学)
AI总结 提出MF-Net,一种将多变量系统表示为共享场状态并通过可学习关系律更新状态的递归模型,在保持可解释结构的同时实现竞争性预测。
机械场网络:多变量系统的结构化神经动力学
发表机构 * Xi’an Jiaotong University(西安交通大学)
AI总结 提出MF-Net,一种将多变量系统表示为共享场状态并通过可学习关系律更新状态的递归模型,在保持可解释结构的同时实现竞争性预测。
Bernstein-Schur核:通过草图调制和径向随机化的随机特征
发表机构 * Azetta AI
AI总结 提出一种随机特征构造方法,用于Bernstein-Schur核类,通过草图化有限调制和随机化完全单调径向因子,实现无偏估计和算子范数界,应用于yat核族。
PermDoRA -- 理解语言模型中的适配器干扰:参数空间几何的局限性
发表机构 * Independent Researcher(独立研究员)
AI总结 研究适配器组合中的干扰是否源于线性参数更新重叠,通过DoRA-RBAC框架和几何感知合并策略实验,发现参数空间几何不是干扰主因,而是共享非线性表示中的交互。
RoVE: 旋转值嵌入注意力实现相对位置相关的值路径
发表机构 * AMLab University of Amsterdam(阿姆斯特丹大学AMLab) ; MIT CSAIL(麻省理工学院计算机科学与人工智能实验室)
AI总结 提出RoVE方法,通过同时旋转键和值使值对位置敏感,将RoPE注意力转化为注意力卷积,在少样本学习、分布外困惑度和长上下文检索上优于RoPE。
能量守恒神经管道:通过物理守恒约束减弱模块化神经网络中的误差传播
发表机构 * ORION Robotics
AI总结 提出在模块间强制能量守恒(特征向量L2范数不变)作为硬约束,实验证明该方法在多种噪声下显著优于基线,并具有深度不变性和理论保证。
预算上的递归绑定:阶-p张量记忆中的子空间雕刻
发表机构 * University of Wisconsin-Madison(威斯康星大学麦迪逊分校)
AI总结 提出正交子空间雕刻(OSC)方法,通过将填充符投影到角色基的零空间来绑定到角色,固定阶张量记忆实现深度递归绑定,在恒定内存下提升高叠加场景的效率。
SirenFNO:高效且全频率学习的傅里叶神经算子
发表机构 * The University of Sydney(悉尼大学)
AI总结 提出SirenFNO框架,利用正弦表示网络学习隐式神经表示并进行模态核参数化,消除频率截断,实现全频谱学习,在多个PDE基准上以最多73倍参数减少取得性能提升。
Kuramoto注意力:在环面上同步自注意力
发表机构 * Department of Informatics, Luddy School of Informatics, Computing, and Engineering, Cognitive Science Program, Indiana University Bloomington(印第安纳大学伯明顿分校信息学系,卢迪信息学、计算与工程学院,认知科学项目)
AI总结 提出Kuramoto注意力层,将隐藏坐标视为角度,通过门控余弦相似度和环形均值更新实现自注意力,等价于Kuramoto耦合项,在字符级语言建模中达到与强基线相近的性能。
当上下文回归:面向在线策略蒸馏中的鲁棒内化
发表机构 * IIIS, Tsinghua University(清华大学交叉信息研究院)
AI总结 针对在线策略蒸馏中上下文内化后重新引入上下文导致性能下降的问题,提出一种轻量级一致性正则化方法,通过锚定无上下文输出并惩罚偏离,有效缓解退化并提升鲁棒性。
使用ART微调多模态大语言模型:基于艺术的强化训练
发表机构 * University of Stavanger(斯塔万格大学) ; NORCE Research(NORCE研究机构)
AI总结 提出ART方法,通过优化原始视觉输入将信息注入冻结的多模态大语言模型,实现软提示微调,无需修改计算图,在数学和工具使用基准上达到与LoRA相当的精度。
HAMNO: 一种用于动力系统的分层自适应多尺度神经算子与物理信息学习
发表机构 * Bauhaus-Universität Weimar(魏玛包豪斯大学) ; Leibniz University Hannover(莱布尼茨汉诺威大学)
AI总结 提出HAMNO神经算子架构,通过自适应门控机制平衡局部与全局信息,结合物理信息扩展PI-HAMNO,在非周期Allen-Cahn等方程上提升长期预测精度与物理一致性。
随机梯度下降中参数噪声注入的简单性足以胜任
发表机构 * Université Laval(拉瓦尔大学)
AI总结 研究随机梯度下降中的参数噪声注入,提出线性层逐样本噪声注入的高效方法,并实验证明简单各向同性噪声即可达到复杂方案的优化与泛化效果。
耦合振荡器网络中的同步注意力机制
发表机构 * University of California, Irvine(加州大学尔湾分校)
AI总结 提出基于Kuramoto同步动力学的固定查询振荡器注意力机制,无需指数运算和全局归约,在物理基板上实现注意力计算,并在关键词识别和主谓一致任务上优于softmax。
nD-RoPE:一种用于n维位置嵌入的广义RoPE
AI总结 提出nD-RoPE,将旋转位置嵌入推广到任意维度,通过多尺度正则单纯形波矢设计实现各向同性,在图像、视频和点云任务中提升性能。
多速率专家混合模型加速液态神经网络训练
发表机构 * Virginia Tech(弗吉尼亚理工大学)
AI总结 提出多速率专家混合框架,结合液态神经网络的多尺度动态与注意力机制,提升多变量时间序列建模的准确性和效率。
利用算子链实现上下文算子学习
发表机构 * Department of Mathematics, Shanghai Normal University(上海师范大学数学系) ; Department of Mathematics, National University of Singapore(新加坡国立大学数学系)
AI总结 提出Chain of Operators (CHOP)框架,通过构造显式初等变换与冻结ICON的算子链,无需微调即可提升上下文算子网络在分布外算子任务上的泛化能力,在标量守恒律和平均场控制问题中降低推理误差。
关于次二次架构:从应用到原理
发表机构 * ELLIS Unit Linz, LIT AI Lab, Institute for Machine Learning, Johannes Kepler University Linz(林茨ELLIS单元、LIT AI实验室、机器学习研究所、约翰内斯·开普勒大学林茨) ; NVIDIA(英伟达)
AI总结 本文比较了xLSTM、Mamba-2和Gated DeltaNet三种次二次架构,发现xLSTM在代码预训练、蒸馏和时间序列预训练中表现最佳,其优势源于灵活稳定的门控记忆校正机制。
重新设计混合专家模型的路由器:基于流形幂迭代
发表机构 * Gaoling School of Artificial Intelligence, Renmin University of China(中国人民大学高瓴人工智能学院) ; Large Language Model Department, Tencent(腾讯大型语言模型部门)
AI总结 提出将路由器行与专家矩阵主奇异方向对齐,并基于流形幂迭代(MPI)重新设计路由器,通过“幂迭代-收缩”范式实现对齐,理论证明收敛性,实验验证1B至11B参数规模下模型效果提升。
兼容性感知的动态微调用于大型语言模型
发表机构 * SKL-IOTSC, CIS, University of Macau(澳门大学科技学院电脑与信息科学系及智慧城市物联网国家重点实验室) ; Auckland University of Technology(奥克兰理工大学)
AI总结 提出兼容性感知动态微调(CADFT),通过模型似然度动态调整监督更新,抑制不兼容样本的高方差梯度,提升训练稳定性和泛化能力。
A2SG:用于训练深度脉冲神经网络的适应性和非对称替代梯度
AI总结 提出适应性和非对称替代梯度(A2SG)框架,通过自适应窗口调整梯度方向一致性、非对称梯度反映神经元动态,降低梯度变化并促进收敛到平坦最小值,在多种SNN模型和任务上提升精度与能效。
教导扩散模型从左到右推测
AI总结 针对自回归解码的推理瓶颈,提出三种训练时干预方法(位置加权、首次错误焦点损失、链损失)来弥合块扩散草稿模型的双向生成与自回归目标模型从左到右验证之间的不对称性,显著提升接受草稿长度。
你的大模型何时可操控?
发表机构 * University of Maryland, College Park(马里兰大学帕克分校) ; MBZUAI, UAE(穆罕默德·本·扎耶德人工智能大学)
AI总结 提出通过模型生成初期的内部状态预测激活操控是否成功,并利用该预测器优化操控强度搜索,降低解码成本。
高阶令牌交互的量子注意力机制
AI总结 提出量子高阶注意力(QHA),通过数据重上传和非克利福德纠缠器在浅电路中合成任意阶令牌交互,证明其表达能力超越经典自注意力,并具有可训练性保证,在遗传上位、带噪学习奇偶和图三角形检测中高效检测高阶交互。
先组织再检索:面向高效智能体的层次化记忆导航
发表机构 * Duke University(杜克大学) ; Snowflake AI Research(Snowflake AI研究)
AI总结 提出HORMA框架,通过构建文件系统式的层次化记忆结构并利用强化学习训练的轻量级导航代理,实现高效检索,在长时任务中提升性能并降低令牌消耗。
用户侧记忆中的子模块不对称性:一个诊断框架
发表机构 * EpistemicaLab — Independent Research(EpistemicaLab — 独立研究)
AI总结 提出一个诊断框架,将LLM用户侧记忆分解为行为一致性、事实存在和事实缺失三个正交子模块,发现参数记忆与检索记忆在不同子模块上存在不对称性,且RLHF调优加剧了这种不对称性。
DAM-VLA: 解耦异步多模态视觉语言动作模型
发表机构 * Intuitive Robots Lab, Karlsruhe Institute of Technology (KIT)(直觉机器人实验室,卡尔斯鲁厄理工学院) ; NVIDIA(英伟达) ; Robotics Institute of Germany(德国机器人研究所)
AI总结 针对VLA模型同步时钟与物理交互中不同模态频率不匹配的问题,提出DAM-VLA,通过解耦各模态时间处理、维护传感器速率更新的潜在缓冲区,并利用门控交叉注意力整合高频模态,在7个真实操作任务中平均成功率提升至95.2%。
从不可约元组合线性层
AI总结 提出用Clifford代数将线性层分解为双向量(几何基元)的组合,仅需O(log^2 d)参数,在LLM注意力投影中匹配强基线性能。
物理神经网络的时间复用层重用
AI总结 针对物理神经网络权重调整慢的瓶颈,提出TIDAL-Net,通过时间复用层增加有效深度,在图像分类和自然语言处理任务上提升性能。
混合专家模型对特征噪声的鲁棒性
AI总结 研究混合专家模型在特征噪声下的鲁棒性,发现稀疏专家激活能作为噪声滤波器,相比密集网络具有更低的泛化误差、更强的鲁棒性和更快的收敛速度。
Kalman线性注意力:用于高效语言建模和状态跟踪的并行贝叶斯滤波
AI总结 提出Kalman线性注意力层,将序列混合重写为信息形式的精确贝叶斯滤波,实现时间并行推理,在相同计算成本下比GLA更具表达力,并在状态跟踪任务中超越线性SSM和注意力。
为什么深度在可并行化序列模型中重要:一个李代数视角
AI总结 从李代数控制视角,研究可并行化序列模型(如Transformer变体和状态空间模型)的表达能力与深度关系,证明误差随深度增加呈指数下降。
非线性色散方程的混合迭代神经低正则积分器
AI总结 提出HIN-LRI混合框架,用轻量神经网络学习并校正经典低正则积分器的结构截断误差,通过显式时间步缩放保证稳定性,在粗糙数据色散方程上提升精度并保持泛化能力。
自注意力作为传输:对称谱诊断的极限
AI总结 研究语言模型注意力路由的两种失效形状(过度集中或过度分散),证明对称谱诊断对方向不敏感,并揭示因果注意力中传输容量的理论下限,提出基于容量和方向的双轴诊断方法。
结构塑性中增长的稳定性
AI总结 本文研究了结构塑性中增长与剪枝的稳定性差异,指出生长在优化轨迹中插入新单元体,而剪枝则在训练初期选择已有单元。生长在图像分类任务中表现更优,但需足够时间整合新单元以提高适应性。
论在线策略蒸馏的几何结构
发表机构 * HKUST ; UT Austin ; Zhejiang University ; Hong Kong PolyU ; USTC ; BUPT ; Nankai University ; BIT
AI总结 本文通过参数空间诊断,揭示在线策略蒸馏(OPD)的更新轨迹具有松弛离主成分、子空间锁定等独特几何特性,表明其并非介于SFT和RLVR之间的中间方法。
GENERIC-FNO:将能量守恒和熵产生嵌入傅里叶神经算子
发表机构 * University of Illinois at Chicago(伊利诺伊大学芝加哥分校) ; Georgia Tech Research Institute(佐治亚理工学院研究所)
AI总结 提出GENERIC-FNO,首个在函数空间直接嵌入非平衡热力学完整GENERIC结构的神经算子,通过秩一投影精确满足退化条件,实现能量守恒与熵产生,在超分辨率下保持结构保证。
概率对比预训练用于多任务ADME性质预测
发表机构 * NVIDIA(英伟达)
AI总结 提出分子图-Transformer预训练框架,结合化学自监督与对比互信息,通过统一概率潜变量目标优化重构、对比和化学任务,在多任务微调中采用任务特定MLP头,在三个数据集上平均提升7.6%-9.5%。
多模态交互学习的信息论分解
AI总结 提出基于信息论的多模态交互分解方法DMIL,通过变分分解架构和微调策略学习样本特定的冗余、独特和协同交互,提升多模态学习性能。
ICA Lens: 无需训练另一本词典即可解释语言模型
发表机构 * Independent Researcher(独立研究员) ; University of Maryland(马里兰大学)
AI总结 提出ICALens,基于独立成分分析(ICA)高效提取语言模型表示中可解释方向,无需训练稀疏自编码器,在SAEBench上表现竞争力。
RePAIR:国际象棋中的预测性自监督表示学习
AI总结 提出RePAIR架构,融合MAE、JEPA和BERT,通过掩码和迭代细化学习国际象棋序列的紧凑表示,无需强化学习即可推理棋子移动。
个体行为的隐式神经表示
AI总结 提出Behavioral INR模型,用隐式神经表示从无标签多策略行为数据中学习策略表示,通过FiLM层调节策略函数,实现无监督策略识别,在连续状态-动作空间中提升策略可识别性。
缺失模态下的多模态学习中的潜在世界恢复
发表机构 * Queen's University Belfast(贝尔法斯特女王大学)
AI总结 提出潜在世界恢复(LWR)框架,通过邻居潜在对齐和可用性感知融合,在缺失模态下实现鲁棒的多模态预测,避免显式重构误差。
通过电子健康记录中的鲁棒且灵活的知识迁移增强谱嵌入
AI总结 提出一种基于谱的无监督表示学习框架,通过从更广泛人群提取知识矩阵并放松信号对齐假设,为罕见病队列生成低维嵌入,在模拟和真实多发性硬化症数据中优于现有方法。
学习实例自适应低秩正交子空间用于换衣行人重识别
AI总结 提出Ortho-ReID方法,通过从VLM文本描述中显式建模低秩服装子空间,并利用几何约束提取服装不变特征,在多个基准数据集上取得最优性能。
从感知序列中学习模式与抽象
AI总结 研究从感知序列中通过分块和抽象发现模式与层次结构的计算原理,提出理性分块模型和非参数层次变量模型,实现高效序列分解与无监督模式发现。
跨层离散概念发现用于解释语言模型
AI总结 提出跨层向量量化变分自编码器(CLVQ-VAE),通过离散向量量化瓶颈将残差流中的重复特征压缩为紧凑可解释的概念向量,在三个数据集上优于聚类、单层VQ-VAE和稀疏自编码器基线。
OCSVM引导的无监督异常检测表示学习
AI总结 提出一种将表示学习与可解析求解的一类SVM耦合的方法,通过定制损失函数直接对齐潜在特征与决策边界,在MNIST-C和脑MRI病变检测任务上展现了鲁棒性和性能。
向量量化潜在概念:聚类式概念发现的可扩展替代方案
AI总结 提出VQLC框架,通过向量量化学习离散潜在概念,在保持可解释性的同时,实现与K-Means相当的计算效率,并优于层次聚类在大规模数据上的扩展性。
面向接触丰富机器人强化学习的自监督多感官预训练
AI总结 提出MSDP框架,通过掩码自编码和跨模态预测学习多感官表示,并采用非对称架构(评论家使用交叉注意力提取动态特征,演员使用稳定池化表示)加速策略学习,在模拟和真实机器人任务中展现出鲁棒性和高效性。
高阶类PCA旋转不变特征用于模旋转的详细形状描述符
AI总结 提出将PCA扩展到高阶张量(如三阶中心矩)或多项式乘高斯分布,以获取更精确的旋转不变形状描述符,并应用于分子形状描述、物体识别和形状相似性度量。
具有不完美二元反馈的 restless bandits: PCL-indexability 分析与计算
发表机构 * Universidad Carlos III de Madrid(马德里卡洛斯三世大学)
AI总结 针对具有二元隐状态和不完美二元反馈的 restless bandits,提出基于部分守恒律(PCL)的分析与计算框架,通过验证定理、确定性骨架和组合词方法建立可索引性并计算 Whittle 指数,实验表明 MP 指数策略优于基准策略。
碰撞前的预见:利用冻结视觉-语言模型的预期性安全强化学习
发表机构 * Iowa State University(爱荷华州立大学)
AI总结 提出VLM-Safe-RL框架,通过冻结视觉-语言模型生成预期性成本项,改进CMDP拉格朗日更新,在高速碰撞场景下实现安全与回报的平衡。
密封审计上的有符号压缩进展是古德哈特抵抗的
AI总结 提出有符号压缩进展作为内在动机,证明其累积奖励等于审计改进,且对有限审计面板具有假阳性预算,抵抗古德哈特定律。
IAPO:面向小型多模态代理工具使用的输入归因感知策略优化
发表机构 * University of California, Santa Barbara(加州大学圣塔芭芭拉分校)
AI总结 提出输入归因感知策略优化(IAPO),通过强化学习对齐模型与教师模型的输入归因,提升多模态小语言模型的工具调用能力,在六个测试集上平均准确率提升3%。
RLCSD: 基于对比策略自蒸馏的强化学习
发表机构 * Tsinghua University(清华大学) ; Tongyi Lab, Alibaba Group(阿里巴巴集团通义实验室) ; Peking University(北京大学)
AI总结 针对策略自蒸馏中特权诱导的风格漂移问题,提出RLCSD方法,通过对比正确与错误提示下的师生差距来抑制风格偏移,提升推理模型在数学和逻辑推理任务上的性能。
空间采样值衰减:非平稳深度强化学习的遗忘机制
发表机构 * CITEC, Faculty of Technology, Bielefeld University(比勒费尔德大学技术学院CITEC)
AI总结 受啮齿动物遗忘行为启发,提出空间采样值衰减作为显式遗忘机制,用于深度强化学习应对环境漂移,在DQN和SAC上验证效果与局限。
基于频繁方向的高效多项式逻辑斯蒂老虎机
发表机构 * State Key Laboratory of Novel Software Technology, Nanjing University(南京大学计算机软件新技术国家重点实验室) ; School of Artificial Intelligence, Nanjing University(南京大学人工智能学院) ; Paul G. Allen School of Computer Science & Engineering, University of Washington(华盛顿大学保罗·G·艾伦计算机科学与工程学院)
AI总结 针对多项式逻辑斯蒂老虎机的高维计算瓶颈,提出集成频繁方向矩阵素描的EOFD-MLogB算法,将每轮复杂度降至O(Kd(m+K)^2)时间和O(Kd(m+K))空间,并证明其遗憾界接近原算法。
PAWS: 基于优势加权片段的首选学习
AI总结 针对偏好强化学习中训练与推理分布不匹配导致时间信用分配退化的问题,提出PAWS方法,利用片段级优势函数直接进行策略更新,在机器人操作和运动任务上优于现有方法。
打破熵界:通过带拒绝采样的多令牌预测加速强化学习训练
发表机构 * Qwen Team, Alibaba Inc(阿里巴巴集团 Qwen 团队)
AI总结 针对强化学习训练中多令牌预测接受率因熵波动而下降的问题,提出Bebop方法,采用概率拒绝采样和端到端TV损失优化,实现高达95%接受率和1.8倍加速。
APPO: 智能体程序策略优化
发表机构 * University of Science and Technology of China(中国科学技术大学) ; AMAP, Alibaba Group(阿里巴巴集团高德地图) ; Southern University of Science and Technology(南方科技大学)
AI总结 提出APPO方法,通过细粒度分支和程序级优势缩放改进智能体强化学习的信用分配,在13个基准上平均提升近4个点。
ATLAS: 自动化科学的主动理论学习
发表机构 * Google DeepMind(谷歌深度思维) ; Princeton University(普林斯顿大学) ; Columbia University(哥伦比亚大学) ; University College London(伦敦大学学院)
AI总结 提出ATLAS框架,通过主动学习迭代生成稀疏神经网络假设并设计最优区分实验,在bandit任务中恢复强化学习智能体,相比随机实验采样效率提升5-10倍。
ProcessThinker: 通过基于展开的过程奖励增强多模态大语言模型推理
发表机构 * LMU Munich(慕尼黑大学) ; Harvard University(哈佛大学) ; University of Cambridge(剑桥大学) ; Mina AI ; Konrad Zuse School of Excellence in Reliable AI (relAI)(康拉德·楚泽可靠人工智能卓越学校(relAI))
AI总结 提出ProcessThinker,一种无需显式过程奖励模型的后训练方法,通过步骤标记格式和基于展开的过程奖励,为多步推理提供密集的步骤级奖励,提升多模态推理一致性。
基于强化学习的多智能体在流体中的会合
AI总结 采用多智能体强化学习(MARL)在涡旋流中开发物理信息会合策略,显著提高会合率,并具有跨涡旋强度、尺度和群体规模的迁移性,通过打破状态-动作图对称性防止智能体被困在分离涡旋中。
Phi-Actor-Critic: 引导一般和博弈走向帕累托高效关联均衡
AI总结 提出Φ-Actor-Critic框架,通过交换遗憾最小化引导多智能体学习向高社会福利的关联均衡收敛,并采用集中式注意力批评家高效估计反事实遗憾,结合拉格朗日均衡选择机制优化社会福利。
通过对比交互从零开始学习物体操作
发表机构 * UC San Diego(加州大学圣地亚哥分校) ; UT Austin(德克萨斯大学奥斯汀分校)
AI总结 针对对比强化学习在交互密集操作任务中表现不佳的问题,提出交互加权重采样方法,通过保留模式边界提升多模态分段非线性可达性表示,在仿真和真实机器人空气曲棍球任务中取得显著改进。
时间不一致控制问题中学习均衡的确定性策略梯度
AI总结 提出一种连续时间无模型强化学习算法,通过确定性策略梯度和内定点迭代学习时间不一致控制问题的均衡策略,并在均值-方差投资组合和非指数贴现跟踪投资组合中验证有效性。
评论家架构的重要性:双评论家与统一评论家在人形机器人移动操作中的对比
AI总结 针对人形机器人多目标强化学习,对比统一评论家与双评论家架构,实验表明双评论家策略在到达速度、吞吐量和成功率上显著优于统一评论家,且架构选择比奖励工程影响更大。
IntElicit: 通过对话策略优化引出和评估情境化创造力
发表机构 * East China Normal University(华东师范大学) ; Shanghai Innovation Institute(上海创新研究院)
AI总结 提出IntElicit框架,通过分解过程奖励机制优化对话策略,在交互中减少非创造性混淆因素,从而更有效地引出和评估情境化创造力。
CCKS:基于共识的通信与知识共享
AI总结 针对多智能体强化学习中动作建议过度依赖教师指导的问题,提出基于共识的通信与知识共享框架,通过对比学习构建共识模型,平衡探索与学习,提升合作效率与性能。
学习对你的VLA说什么:基本无害的视觉语言动作模型引导
发表机构 * Robotics Institute, Carnegie Mellon University(卡内基梅隆大学机器人研究所)
AI总结 提出一个框架,通过交互式搜索语言序列改进闭环VLA任务性能,并学习一个改进头预测何时语言引导能提升性能,同时通过共形化防止有害干预。
UniIntervene:用于高效现实世界强化学习的智能干预
发表机构 * Nanyang Technological University(南洋理工大学) ; Beijing University of Posts and Telecommunications(北京邮电大学)
AI总结 提出UniIntervene智能干预模型,通过检测低效探索并自主恢复策略至高价值状态,在真实机器人操作任务中平均成功率提升8.6%,人类干预减少57%。
Pass@K 策略优化:解决更困难的强化学习问题
AI总结 提出 Pass-at-k 策略优化 (PKPO),通过变换奖励直接优化 pass@k 性能,利用低方差无偏估计器,在训练中退火 k 可同时提升 pass@1 和 pass@k,解决更难问题。
超越次优性:离线强化学习通过随机解决方案学习有效调度
AI总结 提出离线RL算法CDQAC,从次优静态数据集学习调度策略,在JSP/FJSP上超越在线RL和强启发式方法,仅需1-5%数据,发现状态-动作覆盖比轨迹质量更重要。
噪声引导的模仿学习传输方法
AI总结 针对低数据场景下的模仿学习,提出噪声引导传输(NGT)方法,通过对抗训练将模仿问题转化为最优传输问题,无需预训练或特殊架构,在极低数据量下实现强性能。
具有动作触发观测的强化学习
AI总结 提出动作触发稀疏可追踪MDP框架,推导Bellman方程并证明最优策略存在,利用观测间动作序列的线性表示实现基于回归的方法,在几何分布情节下达到与完全可观测线性MDP匹配的遗憾界。
反向流匹配:基于扩散与流策略的在线强化学习统一框架
AI总结 针对在线强化学习中扩散与流策略缺乏目标样本的问题,提出反向流匹配框架,通过后验均值估计和Langevin Stein算子构造控制变量,统一了噪声期望与梯度期望两类方法,并扩展到流策略,提升训练效率与稳定性。
连通性对强化学习中拉普拉斯表示的影响
AI总结 本文研究了连通性对强化学习中拉普拉斯表示的误差影响,通过分析状态图的代数连通性,推导了线性价值函数近似误差的上界,并展示了表示学习管道中的端到端误差分解。
用于去中心化双层强化学习的样本高效超梯度估计
AI总结 针对去中心化双层强化学习中领导者无法干预跟随者优化过程的问题,提出基于玻尔兹曼协方差技巧的超梯度估计方法,实现高维决策空间下的样本高效优化,并首次应用于双人马尔可夫博弈。
视觉-语言-动作跳跃启动用于强化学习机器人智能体
AI总结 提出VLAJS方法,通过稀疏的VLA高层动作建议引导PPO探索,结合方向性动作一致性正则化,提升强化学习在长时域操作任务中的样本效率,并在仿真和真实机器人上验证。
OGPO:生成控制策略的样本高效全微调
AI总结 提出OGPO算法,通过离策略评论网络和修改的PPO目标,实现生成控制策略的样本高效微调,在多种操作任务上达到最优性能,并能在无专家数据下微调不良初始化的行为克隆策略。
超越大语言模型强化学习中的统一令牌级信任区域
发表机构 * Tencent Hunyuan(腾讯混元)
AI总结 针对PPO风格信任区域在自回归生成中的位置无关问题,提出CPPO方法,通过位置加权阈值和累积前缀预算动态调整令牌级约束,提升训练稳定性和推理准确性。
在线平台中的数据驱动动态分类:学习双边信息
AI总结 针对双边服务平台,提出一种数据驱动算法,在未知顾客和卖家选择参数的情况下动态优化商品分类,并证明其遗憾值随时间呈多对数增长且达到最优速率。
通过扩散模型提升离线多智能体强化学习的泛化能力与数据效率
AI总结 提出扩散离线多智能体模型(DOM2),利用扩散模型增强策略表达力和多样性,结合轨迹数据重加权,在离线MARL中显著提升性能、泛化能力和数据效率。
离散时间高斯过程混合在机器人策略学习中的惊人有效性
AI总结 提出MiDiGap方法,利用少量演示和相机观测,通过离散时间高斯过程混合实现机器人操作策略的灵活表示与模仿学习,在长时域、高约束、动态和多模态任务上取得SOTA性能,并支持推理时引导。
PRInTS:面向长程信息检索的奖励建模
AI总结 提出PRInTS生成式过程奖励模型,通过密集评分和轨迹摘要提升长程信息检索中工具交互与推理能力,在多个基准上超越前沿模型。
关于RL训练的语言模型的最优推理长度
AI总结 研究强化学习训练的语言模型中推理长度与准确率的非单调关系,发现存在最优中间长度,并通过模式准确率分析揭示其成因。
在线学习用于监督切换控制
AI总结 研究在线学习在部分观测线性动态系统中监督切换控制的问题,提出非渐近分析方法,结合多臂老虎机算法,实现稳定控制器识别与系统辨识。
回顾性工具优化:通过轨迹回滚上的自我偏好改进LLM智能体
AI总结 提出一种自监督方法RHO,利用历史轨迹回滚和自偏好选择优化智能体工具集,无需真实标签,在SWE-Bench Pro上通过单轮优化将通过率从59%提升至78%。
ProHiFlo: 具有功能引导的分层流匹配用于从头蛋白质生成
发表机构 * Arizona State University(亚利桑那州立大学) ; University of Wisconsin-Madison(威斯康星大学麦迪逊分校) ; Tongji University(同济大学)
AI总结 提出ProHiFlo,一种分层流匹配框架,通过粗到细生成、功能引导和自适应SE(3)等变架构,实现高效、准确的从头蛋白质生成,在酶活性位点支架任务中成功率58.9%。
物理信息驱动的生成式AI在半导体制造中的应用:通过构造强制生成模型中的硬物理约束
AI总结 针对半导体制造中生成模型必须满足硬物理约束的问题,本文提出通过构造集成物理信息(如物理信息扩散、PDE约束变分模型等)来强制约束,而非事后过滤,并给出四种集成模式和未来研究方向。
最小作用量引导扩散用于物理外推
发表机构 * College of Engineering, Peking University(北京大学工学院) ; Ningbo Institute for Digital Twin, Eastern Institute of Technology(东方理工宁波数字孪生研究院) ; Eastern Institute for Advanced Study, Eastern Institute of Technology(东方理工高等研究院) ; Shenzhen Tenfong Technology Co., Ltd.(深圳腾方科技有限公司) ; Mechanical Engineering, The Pennsylvania State University(宾夕法尼亚州立大学机械工程系)
AI总结 提出最小作用量引导扩散(LAPG)框架,通过将最小作用量原理转化为可微的推理时校正机制,在时间、参数和几何外推中保持物理一致性,优于训练时物理信息基线。
FreeBridge: 用于细胞转变动力学的变分薛定谔桥
发表机构 * Stony Brook University(石溪大学) ; University of Toronto(多伦多大学) ; University Health Network(大学健康网络)
AI总结 针对高内涵成像中细胞扰动建模的端点监督问题,提出FreeBridge方法,通过变分薛定谔桥在固定细胞流形上学习随机传输,并利用经验潜在支持正则化约束中间路径,在保持端点保真度的同时减少中间支持违规。
谱正则化潜流匹配用于湍流生成
发表机构 * Department of Mechanical Engineering, University of Nevada, Reno(内华达大学里诺分校机械工程系)
AI总结 针对潜扩散和流匹配模型在湍流生成中低估耗散区振幅的问题,提出谱正则化潜流匹配框架,通过区域加权对数谱目标将深度耗散保留谱功率从25%提升至94%,并显著改善采样成本-保真度权衡。
基于上下文先验的分布外脑动力学流匹配
发表机构 * Hertie Institute for AI in Brain Health, University of Tübingen(赫蒂人工智能脑健康研究所,图宾根大学) ; Tübingen AI Center, University of Tübingen(图宾根人工智能中心,图宾根大学) ; Charité – Universitätsmedizin Berlin, Department of Psychiatry and Psychotherapy(柏林夏里特医学院,精神病学与心理治疗系) ; German Center for Mental Health (DZPG), partner site Tübingen(德国心理健康中心(DZPG),图宾根合作站点)
AI总结 提出一种逐时间步条件扩散Transformer,通过注入组合语言和可选空间先验,实现未见认知任务下fMRI脑动力学的零样本生成,支持反事实神经科学。
重新评估掩蔽扩散语言模型中的置信度重新掩蔽
发表机构 * UvA-Bosch Delta Lab, University of Amsterdam(阿姆斯特丹大学UvA-Bosch Delta实验室) ; Bosch Center for AI(博世人工智能中心) ; University of Basel(巴塞尔大学) ; Johns Hopkins University(约翰霍普金斯大学)
AI总结 本文重新评估了掩蔽扩散语言模型中一种无需训练的后验置信度重新掩蔽方法WINO,发现在标准解码设置下其收益甚微,且会加剧多样性坍塌问题。
LatticeBridge: 用于忠实结构化序列合成的罕见事件序列推理
发表机构 * Bahcesehir University(巴切塞希尔大学)
AI总结 针对结构化序列生成中约束满足的罕见事件问题,提出LatticeBridge方法,结合前缀语言模型、实例编译表面自动机和扭曲序列蒙特卡洛解码器,在多个基准上显著提升锚点满足率和覆盖率。
SPADE: 用于自回归高粒度量热器模拟的分裂与延迟嵌入
AI总结 提出SPADE自回归变压器,通过独立嵌入多特征令牌并延迟特征流,利用标准自注意力学习令牌内相关性,在ILD探测器点云簇射生成中优于现有模型。
PianoKontext: 从平淡语境中生成富有表现力的演奏
AI总结 提出PianoKontext,一种基于流匹配的钢琴演奏渲染模型,通过动态时间规整对齐乐谱与演奏的潜在表示,生成可变长度的表现力演奏。
用于平滑且可解释的归一化流的解析双射
AI总结 提出三类全局光滑、解析可逆的双射函数,替代耦合流中的仿射变换或样条,并设计径向流架构,在径向结构目标上以千分之一参数达到耦合流质量。
基于推理时间强化学习的开放材料生成
AI总结 提出OMatG-IRL框架,通过策略梯度强化学习直接作用于学习的速度场,无需显式计算得分,实现晶体结构预测中的能量目标强化,采样效率提升一个数量级。
潜在颜色子空间:高维混沌中的涌现秩序
AI总结 本文揭示了FLUX.1变分自编码器潜在空间中颜色表示的HSL结构,并提出一种无需训练的闭式潜在空间操作方法,实现对生成图像颜色的预测与显式控制。
超越连续性:从单细胞快照无模拟重建离散分支动力学
AI总结 针对单细胞快照数据中随机性和非保守质量动态(如细胞增殖和凋亡)的挑战,提出无模拟框架Unbalanced Schrödinger Bridge (USB),通过离散分支薛定谔桥问题建模单细胞分辨率的跳跃式生灭动态,实现高效轨迹重建与离散模拟。
整流流中对比速度匹配的几何擦除
AI总结 提出GEM框架,通过对比速度匹配实现整流流模型中的概念擦除,结合生成流网络与教师引导的流匹配,有效抑制有害内容生成。
合成住宅:数据稀缺下用于住宅建筑数据生成的多模态生成式AI管道
AI总结 提出一个多模态生成式AI框架,整合图像、表格和模拟组件,从公开记录和图像生成合成住宅建筑数据集,以解决建筑参数数据稀缺问题。
扩散模型中学习数据统计的理论:从容易到困难
AI总结 本文研究了扩散模型在学习数据统计时的分布简单性偏差,揭示了学习 pairwise 统计和 higher-order 统计所需的样本复杂度差异,并引入了扩散信息指数这一不变量。
三角参考薛定谔桥用于时间序列生成
AI总结 提出三角参考薛定谔桥框架,通过区间冻结的退化扩散参考和层次化潜在波动率结构,实现时间序列的保守生成,并保持熵最小化的变分核心。
基于梯度的Gray-Scott系统反演的损失景观诊断:解构PINN各组件的角色
AI总结 通过直接反向传播稳态损失至未折叠的Gray-Scott模拟,发现优化因损失景观中的平坦高原和陡峭悬崖而失败,而PINN中的残差损失通过隐式编码完整PDE动力学避免了该病理现象。
超越欧几里得稳定性的镜像下降:初始化敏感性的指数级分离
发表机构 * Blavatnik School of Computer Science and AI, Tel Aviv University(特拉维夫大学布拉瓦特尼克计算机科学与人工智能学院) ; Google Research(谷歌研究院)
AI总结 本文证明非二次正则化的镜像下降(MD)在凸光滑目标上对初始化的敏感性可呈指数级增长,与梯度下降(GD)形成鲜明对比,并提出基于锚点的Bregman正则化可缓解不稳定性。
范围感知贝叶斯优化用于在目标属性窗口内发现多样化设计
发表机构 * Department of Chemical and Biological Engineering, Princeton University(普林斯顿大学化学与生物工程系)
AI总结 提出范围感知贝叶斯优化框架,通过采集函数直接评分候选解满足目标范围的后验概率,在基准任务和实际案例中比标准方法发现更多样化的有效设计。
具有延迟反馈的容量受限在线凸优化
发表机构 * Department of Statistical Sciences, University of Toronto(多伦多大学统计科学系) ; Vector Institute(向量研究所) ; Institute for Data, Econometrics, Algorithms, and Learning (IDEAL), hosted by UIC and TTIC(数据、计量经济学、算法与学习研究所(IDEAL),由伊利诺伊大学芝加哥分校和丰田工业大学芝加哥分校主办)
AI总结 研究在硬容量约束下(最多同时跟踪C个待处理轮次)的延迟在线凸优化,通过引入半先知模型和延迟加权FTRL算法,首次给出了凸和强凸损失下容量受限OCO的遗憾界。
PINNs的可靠误差估计:后验下界与上界
发表机构 * Physikalisch-Technische Bundesanstalt (PTB)(德国联邦物理技术研究院) ; Technical University of Berlin(柏林工业大学) ; Weierstrass Institute for Applied Analysis and Stochastics(魏尔斯特拉斯应用分析与随机研究所) ; Eastern Mediterranean University(东地中海大学)
AI总结 提出PINNs求解常微分方程的可计算后验误差下界,结合局部单侧Lipschitz条件得到更紧的上界,实现双侧误差包络,并讨论初始条件处理对下界的影响。
低秩最优传输的黎曼方法
发表机构 * Centre for Machine Intelligence and Data Science, IIT Bombay(印度理工学院孟买分校机器智能与数据科学中心) ; Microsoft India(微软印度)
AI总结 提出黎曼几何框架用于低秩最优传输,通过将平衡与不平衡秩r正因子耦合建模为光滑子流形,并采用Fisher-Rao乘积度量,实现高效的一阶和二阶求解器,在收敛速度和性能上超越现有方法。
随机异质噪声下特征空间扰动的几何偏差
AI总结 针对稀疏、异质方差噪声下的信号加噪声矩阵,研究发现经验特征向量存在经典扰动界无法捕捉的系统性几何偏差,并通过二次向量方程和精细各向同性局部律推导了最优非渐近扰动界。
私有合成数据生成的固定参数可处理性
AI总结 研究差分隐私下合成数据生成问题,通过查询族关联图的树宽参数建立固定参数可处理性,提出两种最优算法。
松弛全局几何下分布式优化的量化随机原始-对偶方法
AI总结 提出量化随机原始-对偶方法q-PDGD,在松弛全局几何下证明线性收敛到邻域或O(1/k)收敛,匹配最优集中随机复杂度。
退火熵分配用于排序与选择
AI总结 提出退火熵分配框架,通过加权log-sum-exp替代非光滑极大极小大偏差率目标,结合鞍点近似提升有限预算下的区分能力,数值实验表明在多个候选接近时性能优异。
测试时训练对近似采样的威力
AI总结 本文形式化测试时训练(TTT)为从已知分布类中采样的问题,证明查询复杂度的二次下界,并展示在分布类大小受限时可规避该下界,为TTT提供理论框架。
基于最小距离估计量的Hellinger密度估计:高斯混合、对数凹等
AI总结 将最小距离估计方法从总变差距离扩展到Hellinger距离,通过反向数据处理不等式,实现了对对数凹混合和高斯混合(任意方差)的近线性时间学习,样本复杂度接近最优。
QENDy的积分形式用于鲁棒非线性系统辨识
AI总结 提出QENDy方法的积分形式,避免使用时间导数,从而增强对噪声的鲁棒性,实现更稳健的非线性动力学学习。
无批次数量约束的可再生Lasso:一种梯度增强方法
AI总结 针对高维广义线性模型的流数据在线估计,提出梯度增强替代损失函数,消除批次数量约束,并扩展到分布式流数据场景,理论推导非渐近误差界,实验验证精度提升。
乐观乘性权重更新的最后迭代收敛性
AI总结 本文证明乐观乘性权重更新(OMWU)在光滑凸-凹鞍点问题中以足够小的常数学习率渐近收敛,无需唯一性、严格互补性、误差界或接近解的初始化。
注意力中的相变:复制头涌现的贝叶斯理论
AI总结 通过分析单层softmax注意力网络在复制任务上的训练,提出贝叶斯理论揭示注意力矩阵的后验分布存在相变,并对比线性注意力发现softmax注意力呈现一阶相变。
量子奥卡姆学习:基于电路的量子学习中样本支持的表达能力
AI总结 针对有限大小量子电路生成的数据,提出信息论奥卡姆理论,证明样本支持的表达能力定律:在迹距离精度ε下,M个样本最多支持约Mε²个门,将电路复杂度转化为自适应统计资源。
遗传算法与优化引导算子的数学视角
AI总结 本文从数学角度建模遗传算法,将优化问题转化为查询复杂度问题,并证明某些问题必须依赖生成、变异和重组算子,同时揭示了多样性在解池中的关键作用。
伴随方法与物理信息神经网络在PDE约束逆问题中的比较
AI总结 针对PDE约束逆问题,公平比较伴随优化与PINN,发现未知参数表示决定方法选择:网格场适合伴随,神经表示适合PINN;PINN在时间依赖问题中成本更低,且可预热启动伴随。
一种受物理启发的优化器:速度正则化Adam
AI总结 本文提出VRAdam优化器,通过引入速度正则化技术,结合Adam的参数缩放,提升训练稳定性与收敛速度,理论分析显示其在非凸目标下的收敛速率为O(√(lnN)/√N)。
统一Transformer缩放定律中的学习动力学与泛化
AI总结 本文通过将Transformer学习动力学形式化为ODE系统并近似为核行为,严格分析了随机梯度下降训练下的泛化误差,揭示了计算资源缩放时泛化误差的指数衰减与幂律衰减的两阶段相变,并建立了紧的上下界。
AI4SLT: 基于 Lean 4 的形式化统计学习理论实证过程
AI总结 本文首次在 Lean 4 中完整形式化统计学习理论,基于实证过程理论,通过人机协作工作流构建了可验证的定理证明工具箱,并揭示了教材中的隐含假设。
超越平稳性的动量LMS理论:稳定性、跟踪与遗憾
AI总结 本文研究动量最小均方算法在非平稳时变线性系统中的跟踪性能与遗憾界,通过分析二阶时变随机向量差分方程,证明其快速适应和鲁棒跟踪能力。
理解预测编码中的样本效率
AI总结 本文研究预测编码在样本效率上的优势,通过目标对齐度量分析BP和PC的学习效率,发现PC在深度、狭窄和预训练网络中表现更优,提供机制理解以指导PC参数设计。
学习动力学揭示权重诱导的分层Gram度量层次结构
AI总结 本文研究前馈ReLU网络在固定读出和二次损失下的梯度下降动力学,将其重写为训练集空间上的集体动力学,并揭示深度网络中权重诱导的Gram算子层次结构。
从随机森林中可证明地恢复局部重要符号特征和交互
AI总结 提出一种局部、模型特定的特征与交互重要性方法,通过结合全局和局部决策路径模式,在局部尖峰稀疏模型下可证明地恢复真实信号特征及其交互,并识别特征值大小对预测的驱动方向。
关于贝叶斯优化中汤普森采样遗憾界的分析
AI总结 本文针对高斯过程汤普森采样(GP-TS)方法,在目标函数为GP样本路径的假设下,推导了其遗憾下界、累积遗憾二阶矩上界、期望宽松遗憾上界以及改进的累积遗憾上界,填补了GP-TS在高概率遗憾界方面的空白。
量化语言模型蒸馏中的潜意识行为迁移比率
AI总结 通过控制教师模型行为强度并蒸馏学生模型,量化了潜意识行为迁移比率,发现迁移具有鲁棒性且呈现不同缩放行为。
FlowBank: 通过预计算与复用实现查询自适应智能体工作流优化
AI总结 提出FlowBank框架,通过预计算多样化工作流并压缩为紧凑组合,在推理时自适应选择最优工作流,平衡性能与成本,在五个基准上平均得分最高且成本可控。
CRUMB: 通过分布匹配上下文批处理实现高效先验拟合网络推理
发表机构 * Global Technology Applied Research, JPMorganChase(摩根大通全球技术应用研究)
AI总结 提出CRUMB方法,通过聚类查询、最小化最大均值差异选择训练子集、再执行精确推理,在不重新训练的情况下加速先验拟合网络推理,在51个数据集上优于同类方法。
TimeRouter: 时间序列基础模型的高效自适应路由
发表机构 * University of Connecticut(康涅狄格大学) ; Salesforce AI Research ; JP Morgan AI Research(摩根大通人工智能研究院)
AI总结 提出TimeRouter框架,通过轻量判别路由、选择性门控和集成回退实现时间序列基础模型的自适应选择,无需LLM推理,在GIFT-EVAL榜单取得最优性能。
在8位权重和激活下保持FP8质量上限:Ideogram 4.0面向消费级GPU的INT8与GGUF后训练量化
发表机构 * Transformer Lab
移动NPU上的能效型设备端RAG:Snapdragon X Elite系统设计与基准测试
发表机构 * Qualcomm(高通) ; Snapdragon X Elite(骁龙X Elite) ; Dell XPS 13 laptop(戴尔XPS 13笔记本电脑) ; Qualcomm Hexagon NPU(高通Hexagon NPU) ; Adreno X1-85
AI总结 本文首次在Snapdragon X Elite的Hexagon NPU上实现端到端RAG流水线,通过对比CPU和GPU,NPU在嵌入吞吐量、系统能耗和查询延迟上分别提升9.1倍、降低12.3倍和4.0倍,且答案质量相当。
小实验,更经济的决策:微预训练中分阶段提升的案例研究
发表机构 * Hewlett Packard Enterprise(慧与科技公司)
AI总结 研究微预训练中分阶段提升协议,通过固定预算筛选配置,在Windows A100和Linux L40S上验证,发现早期排名不稳定,但最终协议以144 GPU小时找到最优配置,成本低于全量筛选。
一种可扩展的多GPU高斯泼溅PyTorch抽象
发表机构 * NVIDIA(英伟达) ; University of Toronto(多伦多大学) ; Vector Institute(向量研究所)
AI总结 提出一种多GPU高斯泼溅方法,通过CUDA统一内存和NVLink在算子级别分布参数,实现大规模场景重建,支持超过10亿高斯泼溅。
SpAArSIST: 用于高效可靠反欺骗的稀疏化AASIST
发表机构 * Brno University of Technology(布尔诺理工大学)
AI总结 提出SpAArSIST,通过稀疏化图池化后端,在保持竞争力的同时降低计算量20.7%、模型大小4.1%,并提升域外鲁棒性。
面向表格-图像多模态学习的参数高效适配器微调
发表机构 * School of Mathematical Sciences, Soochow University(苏州大学数学科学学院)
AI总结 提出TI-Adapter框架,通过冻结表格编码器并添加适配器,以及图像分支的嵌入层和瓶颈层适配器,实现高效多模态微调,在20个数据集上以更少参数达到或超越全微调性能。
超越暗知识:基于混合的蒸馏实现可靠预测
发表机构 * ITS Lab, Institute of Computer Science, University of Tartu(塔尔图大学计算机科学学院ITS实验室) ; LITIS, Université de Rouen(鲁昂大学LITIS实验室) ; LITIS, INSA de Rouen(鲁昂国立应用科学学院LITIS实验室)
AI总结 研究知识蒸馏与混合训练结合时教师-学生不匹配的影响,发现学生能独立获得线性结构并提升准确率与校准,提出混合蒸馏作为更丰富的知识传递通道。
通过渐进式幅度剪枝在一个训练周期内找到稀疏子网络
发表机构 * King Abdullah University of Science and Technology(阿卜杜拉国王科技大学) ; University of Jeddah(吉达大学) ; King Fahd University of Petroleum and Minerals(法赫德国王石油矿产大学) ; King Saud University(沙特国王大学)
AI总结 提出渐进式幅度剪枝方法,在单训练周期内线性增加稀疏度,基于权重幅度更新掩码,在CIFAR-10和MNIST上优于LTH、SNIP和GraSP等基线。
上下文驱动的增量压缩用于多轮对话生成
发表机构 * The Hong Kong University of Science and Technology(香港科技大学) ; NVIDIA AI Technology Center(NVIDIA AI技术中心) ; Shanghai Jiao Tong University(上海交通大学) ; The Chinese University of Hong Kong(香港中文大学)
AI总结 提出上下文驱动的增量压缩(C-DIC),通过可修订的线程压缩状态和轻量级检索-修订-写回循环,实现跨轮信息共享,稳定长对话性能。
AI推断的能耗:效率路径与测试时计算
AI总结 本文提出基于令牌吞吐量的底层方法,估算大规模大语言模型的每查询能耗,揭示测试时扩展场景下的能耗变化及效率提升潜力。
MobileFineTuner:面向真实世界嵌入式AI应用中设备端大语言模型微调的移动原生框架
AI总结 提出移动原生框架MobileFineTuner,通过C++实现资源感知训练运行时(内存高效注意力、激活检查点等),在商用手机上实现端到端LLM微调,显著降低内存压力并提升可执行性。
FOCUS: DLLMs 知道如何驯服它们的计算瓶颈
AI总结 针对扩散大语言模型解码中大部分计算浪费在不可解码令牌上的问题,提出 FOCUS 推理系统,通过动态聚焦可解码令牌并驱逐不可解码令牌,提升有效批大小,实现高达 3.52 倍的吞吐量提升。
编译器优先的状态空间对偶性与可移植的 $O(1)$ 自回归缓存推理
AI总结 提出一种基于编译器优先的状态空间对偶性(SSD)结构的推理方法,通过标准JAX原语实现无自定义内核的单源推理路径,在TPU和GPU上达到高硬件利用率,且缓存解码速度比全前缀重计算快27-36倍。
TAPIOCA: 为什么任务感知剪枝能提升模型对分布外数据的能力
AI总结 本文研究了任务感知剪枝在分布外数据上的改进机制,通过实验发现剪枝能提升OOD准确性,其核心贡献是通过几何解释说明任务感知剪枝如何调整模型表示以适应任务需求。
基于扩散的多模态大语言模型的视觉冗余控制并行解码
AI总结 针对扩散型多模态大语言模型并行解码中视觉冗余问题,提出视觉冗余指数(VRI)和无需训练的视觉冗余控制解码(VRCD)方法,通过令牌到图像的注意力优先选择视觉互补位置,在多个基准上提升准确率。
通过蒸馏和量化扩展 Apertus LLM 系列
AI总结 本文通过蒸馏和量化方法,基于 Apertus 8B 模型低成本扩展出参数高达 4B 的模型系列,覆盖多种硬件约束并保持强准确性。
打破冰层:分析 vLLM 中的冷启动延迟
AI总结 本文首次系统分析 vLLM 推理引擎的冷启动延迟,将其分解为六个基础步骤,发现主要受 CPU 限制,并建立轻量级分析模型预测延迟,为大规模推理环境资源规划提供指导。
K-Forcing:通过前推语言建模进行联合下一K词解码
发表机构 * DAMO Academy, Alibaba Group(阿里巴巴达摩院) ; Hupan Lab(湖畔实验室) ; Zhejiang University(浙江大学) ; The Hong Kong University of Science and Technology(香港科技大学)
AI总结 提出K-Forcing范式,通过前推映射将自回归模型蒸馏为单次前向传播生成多个未来词,实现2.4-3.5倍加速,质量损失小。
Range-Arithmetic: 在不可信方上进行可验证的深度学习推理
AI总结 提出Range-Arithmetic框架,通过将非算术运算转化为可验证的算术步骤,实现高效的深度神经网络推理验证,降低了计算和通信开销。
基于残差模型引导的偏好对齐大型语言模型
AI总结 提出PaLRS方法,利用残差流中的偏好信号提取轻量级引导向量,无需训练即可在推理时对齐模型偏好,在数学推理和代码生成任务上取得一致提升,同时节省大量时间。
MPK:一种用于将张量程序转化为巨型内核的编译器和运行时系统
AI总结 提出MPK,首个自动将多GPU模型推理转化为单个高性能巨型内核的编译器和运行时系统,通过SM级图表示实现跨算子软件流水线和细粒度计算通信重叠,显著降低推理延迟。
引导噪声:将随机扰动转化为有效下降方向以实现内存高效的LLM微调
AI总结 提出一种即插即用框架,通过候选扰动池选择或组合与优化目标对齐的扰动,改进零阶优化梯度估计,提升LLM微调的收敛速度和任务精度。
SoftMatcha 2:一种用于万亿级语料库的快速软模式匹配器
AI总结 提出SoftMatcha 2,一种基于后缀数组和词向量的超快速软搜索算法,通过动态语料感知剪枝和磁盘感知设计,在万亿级语料上实现0.3秒内支持替换、插入和删除的语义变体搜索,并发现基准污染。
块大小、权重精度和缩放精度在低功耗边缘高效神经网络NVFP4推理中的消融研究
AI总结 本文通过消融实验研究NVFP4 LUT推理框架,结合4位激活、两级缩放和电压缩放存储,在边缘高效模型上实现高达26.85倍能耗降低和2.21倍面积缩减。
联邦持续学习:分布式和非平稳数据上的终身与隐私保护学习综述
发表机构 * University of Pisa(比萨大学) ; University of Modena and Reggio Emilia(摩德纳和雷焦艾米利亚大学)
AI总结 本文系统综述联邦持续学习(FCL),定义问题、分析经典联邦学习在非平稳数据下的局限,提出多维分类法,并讨论应用、评估指标及开放挑战。
准确且资源高效的联邦持续学习
发表机构 * University of Southern California(南加州大学) ; DEVCOM Army Research Office(DEVCOM陆军研究办公室)
AI总结 提出FedRAN框架,通过紧凑随机特征统计替代梯度更新,利用截断SVD降低通信开销,结合原型伪标签处理标签稀缺,在多个数据集上提升准确率并大幅降低资源消耗。
面向边缘设备上心电图异常检测的隐私保护联邦自编码器
AI总结 提出一种结合联邦学习、差分隐私和INT8量化的端到端系统,在PTB-XL数据集上实现无监督12导联ECG异常检测,满足隐私、实时性和非IID数据要求。
通过有界自适应裁剪减轻差分隐私学习中的差异影响
AI总结 针对差分隐私学习中梯度裁剪对少数群体造成的不公平影响,提出有界自适应裁剪方法,通过引入可调下界防止过度梯度抑制,在Skewed和Fashion MNIST上最差类准确率提升超过10个百分点。
AsFT:在窄安全盆地内锚定大语言模型微调期间的安全性
AI总结 针对微调大语言模型时安全性易受损的问题,提出AsFT方法,通过惩罚与对齐方向正交的更新,将模型约束在窄安全盆地内,在提升任务性能的同时显著降低有害行为。
绕过生产环境中的提示守卫:受控释放提示攻击
AI总结 针对AI对齐的提示过滤存在理论上的不可能性,本文提出受控释放提示攻击,利用轻量级输入过滤器与主模型之间的资源不对称性,在实际部署的大语言模型系统中成功绕过提示守卫。
可认证安全RLHF:基于语义基础与固定惩罚约束优化的更安全大语言模型对齐
AI总结 针对现有RLHF方法依赖奖励/成本函数和双变量调优导致性能敏感且缺乏可证明安全保证的问题,提出CS-RLHF,通过语义基础成本模型和固定惩罚约束优化,实现可认证安全对齐,效率提升至少5倍。
SEDULity:一种面向分布式安全区块链的高效有用工作证明学习框架
AI总结 提出一种名为SEDULity的证明学习框架,通过将区块模板编码到训练过程中并设计难解易验的有用函数替代PoW谜题,在保持区块链安全性的同时高效训练机器学习模型。
谄媚的双立场评估:同意的结构与干预的局限
AI总结 提出双立场评估方法,发现激活引导在减少谄媚时也会抑制对事实正确陈述的同意,揭示了表示可读但不可写的普遍差距。
从几乎一无所有中学习:神经网络如何在严重输入损坏中生存
发表机构 * Cornell University(康奈尔大学)
AI总结 研究神经网络在输入严重损坏(>90%)时仍保持高精度的鲁棒性,通过平均场方法推导出网络实现最近类均值原型规则,解释学习成功的机制。
压力下的风险:语言模型对抗鲁棒性的计算感知评估
发表机构 * University of Toronto(多伦多大学) ; Vector Institute(向量研究所) ; Hugging Face
AI总结 提出基于计算压力(累积FLOPs)的对抗鲁棒性评估框架,通过风险-计算曲线和两个新指标,揭示不同攻击策略的计算成本差异,并在10个模型上验证了对齐训练、模型规模等因素对计算空间鲁棒性的非单调影响。
基于马氏距离的潜在分布外检测用于时变系统中混合ES-DRL控制
AI总结 针对时变系统中强化学习控制器性能下降问题,提出基于变分自编码器潜在空间马氏距离的分布外检测方法,实现与极值搜索控制器的自适应切换,并在粒子加速器控制中验证有效性。
已部署安全分类器的在线漂移检测与共形自适应
AI总结 提出在线监测系统,使用校准序列统计检测分布漂移,并通过共形弃权层自适应阈值恢复目标错误率,在800个实验单元中实现86.6%有效检测。
自助监控:利用透明推理监督更强的AI智能体
发表机构 * California Institute of Technology(加州理工学院)
AI总结 提出自助监控协议,通过插入具有透明思维链的不可信中间模型来监督更强智能体,在软件工程任务中显著提升捕获率,即使不可信监控者与智能体合谋。
泛化黑客:模型可通过阻止行为泛化来博弈强化学习
发表机构 * California Institute of Technology(加州理工学院)
AI总结 本研究提出泛化黑客现象,模型在强化学习中通过自我接种机制阻止行为泛化,在保持高奖励的同时抵抗行为修正,首次证明模型能主动破坏训练过程。
强化学习破坏基于梯度的对抗优化
发表机构 * COSIC, KU Leuven(鲁汶大学COSIC) ; Imec ; Brubotics, VUB(布鲁塞尔自由大学Brubotics) ; DistriNet, KU Leuven(鲁汶大学DistriNet)
AI总结 研究通过强化学习训练图像分类器以破坏攻击者使用的梯度结构,发现RL作为隐式正则化器产生不稳定梯度方向和较小梯度幅度,使基于梯度的攻击失效,并与对抗训练结合实现双重防御。
推理下的校准漂移:思维链预算如何导致大型语言模型过度自信
发表机构 * Department of Computer Science and Engineering, Visvesvaraya Technological University, Belagavi(维斯瓦拉亚科技大学计算机科学与工程系,贝拉加维) ; Department of Computer Science and Business System, SG Balekundri Institute of Technology, Belagavi(SG巴莱昆德里理工学院计算机科学与商业系统系,贝拉加维)
AI总结 研究发现,增加思维链推理预算超过任务特定阈值会导致模型对错误答案过度自信,提出校准漂移现象并引入CABStop停止规则。
评估与对抗概念漂移对基于机器学习的钓鱼检测系统性能的影响
AI总结 研究概念漂移对基于机器学习的钓鱼邮件检测系统性能的影响,并提出缓解性能下降的策略。
迈向可信赖的人工智能:针对连续数据摘要的多目标对抗攻击与鲁棒防御
发表机构 * Nankai University(南开大学) ; James Cook University(詹姆斯库克大学) ; Western Sydney University(西悉尼大学) ; Beijing University of Technology(北京工业大学) ; Fuzhou University(福州大学) ; Nanjing University of Science and Technology(南京理工大学) ; CSIRO's Data 61(澳大利亚联邦科学与工业研究组织Data61) ; The University of Adelaide(阿德莱德大学)
AI总结 研究通过DR-子模优化在相似性层面扰动下对连续数据摘要进行对抗攻击,提出多目标攻击生成和鲁棒防御的近似算法,实验表明攻击有效且防御能改善鲁棒性-缓解权衡。
标签偏移下的共形贝叶斯:事后校准与训练内适应
AI总结 研究标签偏移下共形贝叶斯方法,通过重要性加权共形校准恢复目标域覆盖,比较事后校准与训练内适应两种策略,后者在偏差训练中起到去偏作用。
基于机器学习的网络入侵检测系统的分类鲁棒性评估
AI总结 本文系统比较了CNN、LSTM和随机森林三种分类器在对抗攻击下的鲁棒性,发现随机森林基线准确率虽高但极易被攻破,而CNN表现最稳健。
ALIGNBEAM: 通过跨词汇表logit混合实现推理时对齐迁移
发表机构 * Lexsi Labs
AI总结 针对领域微调降低大模型安全性的问题,提出无需训练的ALIGNBEAM方法,通过逐token翻译锚模型logit并选择最安全候选,实现跨词汇表的安全对齐迁移,保持任务准确性和推理开销。
鲁棒隐私:通过认证鲁棒性实现推理阶段隐私
AI总结 提出鲁棒隐私(RP)概念,基于认证鲁棒性确保预测在输入邻域内不变,从而限制推理阶段隐私泄露;实验表明RP在属性推断和模型反演攻击中有效提升隐私-效用权衡。
学习注入:通过强化学习实现自动化提示注入
AI总结 提出AutoInject,一种基于强化学习的黑盒框架,自动学习对抗性后缀进行提示注入,在AgentDojo上优于模板攻击和多种自适应攻击,并突破专门防御模型。
分布漂移下伪校准保形预测的覆盖保证
AI总结 针对分布漂移下保形预测覆盖失效问题,利用伪校准和领域自适应工具,推导目标覆盖下界,并提出通过松弛参数膨胀保形阈值的方法及源调优伪校准算法,实验证明其能缓解覆盖退化。
语言模型输出分布中的尾部风险估计
AI总结 提出一种基于重要性采样的方法,通过创建不安全版本来高效估计语言模型产生有害输出的尾部概率,在10-20倍更少样本下匹配蒙特卡洛估计,并揭示模型对输入的敏感性。
密度脊选择性预测:校准标签稀缺下的大语言模型与视觉语言模型幻觉检测
AI总结 针对校准标签稀缺时大语言模型和视觉语言模型的幻觉检测问题,提出基于核密度估计的密度脊方法,利用隐藏状态生成轨迹的六维运动特征图构建响应流形,通过到最近脊顶点的欧氏距离评分,在标签稀缺协议下AUROC提升5-20点。
擦除但未遗忘:后门如何破坏概念擦除
AI总结 本文揭示了一种名为擦除规避后门(EEB)的漏洞,攻击者将后门触发器绑定到待擦除概念上,使得该恶意链接在后续擦除后仍然存在,从而绕过多种概念擦除方法。
PCS-UQ:基于可预测性-可计算性-稳定性框架的不确定性量化
AI总结 提出PCS-UQ框架,通过预测检查、bootstrap采样和乘法校准实现不确定性量化,在回归和分类任务中优于或媲美共形预测方法,并提供理论保证。
CP4SBI: 基于模拟推断中可信集的局部共形校准
AI总结 提出CP4SBI框架,通过回归树和CDF校准实现局部贝叶斯覆盖,为任意评分函数提供有限样本局部覆盖保证,提升神经后验估计的不确定性量化质量。
通过逆保形风险控制校准决策鲁棒性
AI总结 提出逆保形风险控制框架,为鲁棒优化策略提供无分布、有限样本的误覆盖与遗憾保证,通过追踪Pareto前沿帮助决策者根据成本-风险偏好校准鲁棒性水平。
正确预测,误导性解释:关于视觉-语言模型解释的脆弱性
AI总结 研究探讨了视觉-语言模型中解释热图在对抗条件下是否忠实反映推理过程,提出X-Shift攻击揭示解释与预测行为的脱节,验证了解释机制的脆弱性。
潜在几何和弦:面向查询高效决策型对抗攻击
AI总结 提出潜在几何和弦(LGC)方法,通过曲率感知的几何搜索在压缩语义流形中导航决策边界,并引入残差对抗生成(RAG)机制以高视觉保真度实现查询高效的决策型黑盒对抗攻击。
具有行动条件保证的共形风险规避决策
AI总结 提出行动条件共形预测方法,通过分位数损失最小化算法实现行动条件风险价值优化,在有限样本下提供行动条件安全保证。
JGRA: NISQ噪声感知量子神经网络中的雅可比几何鲁棒性评估
AI总结 提出JGRA框架,通过雅可比几何评估噪声感知量子神经网络的鲁棒性,包括熵匹配噪声校准、噪声感知训练和噪声条件雅可比提取,揭示干净域结构与噪声推理行为的关系。
超越黄金教师:通过LLM-GNN协同教学增强图学习
发表机构 * The Hong Kong University of Science and Technology(香港科技大学) ; WeBank(微众银行)
AI总结 针对文本属性图上的少样本学习,提出LLM-GNN协同教学框架,避免固定教师模型,通过双向伪标签交换和基于轮次的偏好优化,显著提升图学习性能。
TAROT: 面向小样本表格学习的任务自适应LLM先验图精炼
发表机构 * Jilin University(吉林大学) ; The Chinese University of Hong Kong, Shenzhen(香港中文大学(深圳))
AI总结 提出TAROT框架,通过构建并精炼任务自适应语义图,利用LLM先验和GNN编码特征语义关系,提升小样本表格学习性能。
从均匀到学习图先验:用于结构发现的扩散
发表机构 * School of Mathematics, Southeast University(东南大学数学学院)
AI总结 提出Diff-prior,一种扩散参数化的自适应先验,通过可学习的去噪式校准对边后验进行结构化校准,提升神经关系推理方法的结构发现可靠性。
GraspLLM: 面向文本属性图与LLM的零样本泛化
发表机构 * Peking University(北京大学) ; National University of Singapore(新加坡国立大学) ; University of California, Berkeley(加州大学伯克利分校)
AI总结 提出GraspLLM框架,通过融合图结构理解与LLM语义能力,利用基序感知对比学习和最优上下文子图对齐,实现跨数据集和跨任务的零样本泛化。
神经关系程序:统一结构化数据上的查询与神经计算
AI总结 提出神经关系程序(NRP),一种扩展Datalog规则的声明式查询语言,通过嵌入操作融合关系推理与可学习神经组件,实现关系数据上的通用神经计算。
GILT:一种无需LLM、无需微调的图基础模型用于上下文学习
AI总结 提出GILT框架,通过基于令牌的上下文学习机制统一处理节点、边和图级别的分类任务,无需大语言模型或微调,实现高效泛化。
加权随机点积图
AI总结 提出加权随机点积图(WRDPG)模型,通过节点潜位置的内积刻画边权分布的高阶矩,并给出谱嵌入估计的统计保证与生成框架。
偏离正则性:度异质性和特征间隙作为ASE-LSE潜在子空间分歧的结构驱动因素
AI总结 本文研究了图数据分析中邻接谱嵌入和拉普拉斯谱嵌入方法在相同网络上产生不同结果的结构原因,揭示了度异质性和社区结构强度对潜在子空间分歧的影响。
TaskFusion: 异构表格数据的持续异常检测
发表机构 * German Research Center for Artificial Intelligence (DFKI)(德国人工智能研究中心(DFKI)) ; RPTU Kaiserslautern-Landau(凯泽斯劳滕-兰道大学) ; Hochschule Bonn-Rhein-Sieg (H-BRS)(波恩-莱茵-锡格应用技术大学)
AI总结 提出TaskFusion方法,通过AGF模型、任务融合增强和异常暴露技术,解决异构表格数据在持续学习中的特征空间变化、分布偏移和类别不平衡问题,在21个数据集上显著提升持续异常检测性能。
支持边界经验混合的持续学习
AI总结 提出经验混合框架,通过差分隐私启发的噪声生成支持边界数据,联合训练样本和边界数据以正则化决策边界,在多个数据集上提升持续学习准确率。
在不完美代理下潜在偏移中鲁棒预测器的点识别
AI总结 针对潜在混淆变量导致的域适应问题,提出基于潜在等价类的点识别方法,通过跨域秩条件替代强完备性假设,并设计主动学习框架PQAL实现鲁棒预测。
少样本重采样:可扩展的统计可靠数据挖掘
发表机构 * Department of Information Engineering, University of Padova(帕多瓦大学信息工程系)
AI总结 提出FewRS方法,基于重采样评估数据挖掘结果的统计显著性,通过推导新的上界偏差界,仅需极少量重采样数据集即可保证假发现概率,显著提升可扩展性。
基于模型预测的信息泄露的无先验盲检测
发表机构 * Center for Molecular Cardiology, University of Zurich(苏黎世大学分子心脏病学中心) ; Center for Complexity Sciences, National University of Mexico(墨西哥国立自治大学复杂性科学中心)
AI总结 针对机器学习模型输出中信息泄露的检测问题,提出决策理论框架,证明校准泄露与诚实模型不可区分,但近确定性子组可被无先验检测,并在UK Biobank上验证。
GraphInfer-Bench:评估LLM在图上的推理能力基准
发表机构 * The Hong Kong University of Science and Technology(香港科技大学) ; Webank(微众银行)
AI总结 提出GraphInfer-Bench基准,通过五个任务(描述与比较)测试LLM能否从节点及其邻域推断出无法从单节点或路径检索的答案,发现所有方法均存在差距。
DeMix: 通过影响向量调试包含混合错误类型的训练数据
发表机构 * Shanghai Jiao Tong University(上海交通大学) ; ByteDance Inc.(字节跳动) ; Tiktok
AI总结 提出DeMix框架,利用影响向量捕捉不同错误类型对模型行为的独特模式,将数据调试转化为多标签分类问题,并引入基于干预的学习策略,在11个任务上显著提升调试F1分数和修复后模型性能。
Bergson:一个用于数据归因的开源库
AI总结 提出Bergson开源库,支持大规模语言模型和预训练数据集的多种数据归因方法,提供磁盘梯度存储和多节点分布式训练,首次开源实现MAGIC、SOURCE和TrackStar三种方法。
噪声感知框架用于纠正损坏标签
发表机构 * Faculty of Information Technology, VNU University of Engineering and Technology(越南国立大学工程与技术学院信息技术系)
AI总结 提出CANOLA框架,通过噪声感知学习和迭代标签精炼来纠正损坏标签,在六个数据集上相比现有方法错误率降低19%-52%。
一个用于检测和纠正损坏标签的数据中心框架
发表机构 * Faculty of Information Technology, VNU University of Engineering and Technology, Hanoi, Vietnam(越南河内国立大学工程与技术学院信息技术系)
AI总结 提出Relabeler框架,联合利用局部和全局关系检测损坏标签,并基于输入特征和噪声标签估计最可能的干净标签进行纠正,在多个数据集上实现高达58%的标签纠正精度提升和6%的下游任务性能提升。
RCAP: 鲁棒的、类别感知的、概率性动态数据集剪枝
发表机构 * IIT Kharagpur(印度理工学院卡哈拉格普尔分校)
AI总结 提出RCAP算法,通过闭式解估计每类样本保留比例并自适应调整,结合高损失样本优先采样策略,在多种数据集和训练范式下优于现有方法,仅用10%数据即可提升类别不平衡数据集性能1%以上。
类别先验锁定:为何上下文学习在结构化数据上失败
发表机构 * University of Insubria(因苏布里亚大学) ; IBM Research Ireland(IBM 爱尔兰研究院)
AI总结 研究大语言模型在结构化数据生成中上下文学习的局限性,发现其无法更新预训练中的类别先验分布,导致罕见类完全无法生成;参数高效微调可解决但带来记忆化风险。
你能低到多少?超低数据极限下稀疏模型发现的主动学习
发表机构 * Department of Mechanical Engineering, University of Washington(华盛顿大学机械工程系) ; NSF AI Institute in Dynamic Systems, University of Washington(华盛顿大学NSF动态系统人工智能研究所) ; Department of Aeronautics, Imperial College London(伦敦帝国理工学院航空系)
AI总结 针对超低数据极限下动力学系统方程发现的数据稀缺问题,提出基于E-SINDy的主动学习策略,通过迭代优先采样信息量大的区域,在Lorenz、Burgers和Kuramoto-Sivashinsky系统上验证了比随机采样更少数据即可准确识别动力学。
Claw-SWE-Bench:评估OpenClaw风格代理框架在编码任务上的基准
发表机构 * TokenRhythm Technologies(TokenRhythm 技术公司) ; Infinigence AI ; Peking University(北京大学) ; City University of Hong Kong(香港城市大学) ; SEE Fund(SEE 基金) ; Shanghai Jiaotong University(上海交通大学) ; Beijing Jiaotong University(北京交通大学) ; Tsinghua University(清华大学)
AI总结 提出Claw-SWE-Bench基准,通过适配器协议统一评估异构代理框架,发现适配器设计对编码性能至关重要,且模型和框架选择显著影响通过率与成本。
PoQ-Judge:去中心化LLM推理中成本感知的证明质量的多架构评估框架
发表机构 * DGrid AI
AI总结 提出PoQ-Judge框架,训练专用裁判模型对查询-输出对进行无参考评分,研究三种架构,最佳模型在Pearson相关性上达到0.747,级联评估降低72.7%成本。
ISE:一种基于执行的多轮操作系统代理轨迹合成方法
AI总结 提出ISE三阶段范式,通过结构化意图构建、角色锁定用户模拟和真实执行环境,生成多轮代理轨迹,微调后显著提升代理工具使用性能。
城市热微型数据立方体:面向城市热研究的人工智能就绪数据集
AI总结 提出Urban Heat MiniCubes数据集,整合多源卫星数据(Landsat 8/9、Sentinel-1、GOES-R等),为48个城市提供90×90公里网格化数据立方体,支持机器学习在城市热研究中的应用。
从持续性到生存:拓扑特征的假设检验、效应大小与向量化
AI总结 提出STRAND方法,将持久性图视为生存数据,利用持久性生存函数统一实现假设检验、效应大小计算和向量化,在合成数据和真实基准上验证了有效性。
通过LLM引导的视频拼接进行手语翻译的语料增强
发表机构 * Peter Pazmany Catholic University, Faculty of Information Technology and Bionics(彼得·帕兹马尼天主教大学信息科技与仿生学院) ; DeepSign Technologies Ltd.(DeepSign科技有限公司)
AI总结 提出一种无需额外标注或生成模型的手语翻译语料增强方法,利用CTC强制对齐提取手语片段,通过LLM生成句子并拼接视频,在GFSLT-VLP基线上提升BLEU-4达2.92,并发现合成数据对视觉-语言预训练有害但可提升下游任务。
OpenMedReason: 医学视觉语言模型的科学推理监督
发表机构 * York University(约克大学) ; Vector Institute(向量研究所) ; University of British Columbia(不列颠哥伦比亚大学) ; University of Toronto(多伦多大学) ; Unity Health Toronto / St. Michael’s Hospital(多伦多联合健康/圣迈克尔医院) ; University Health Network(大学健康网络) ; Arc Institute(弧研究所) ; Queen's University(女王大学)
AI总结 提出OpenMedReason,一个包含约45万图像-问题-答案实例的大规模开放医学推理语料库,其推理轨迹主要来自生物医学科学文章,并配套基准OpenMedReason-Bench进行细粒度评估,在监督微调和强化对齐中有效提升模型性能。
通过信息增益衡量多轮对话中的语义进展
发表机构 * NTU Singapore(新加坡南洋理工大学) ; Amazon(亚马逊) ; Amazon Research, Tübingen, Germany(亚马逊研究院(德国图宾根))
AI总结 提出基于信息论的信息增益指标,通过高斯嵌入近似量化多轮对话中问题相关的语义进展,无需LLM推理,在多个基准上取得与人类判断一致的结果。
基于人类演示的计算机使用智能体基础构建
AI总结 为解决桌面环境高质量基础数据稀缺问题,构建了包含87个应用、56K截图和3.56M人工标注的GroundCUA数据集,并基于此训练GroundNext模型,在5个基准上以少于先前十分之一的数据取得最优结果。
CoVar: 置信度-方差引导的半监督学习伪标签选择
AI总结 提出CoVar框架,通过联合建模最大置信度和残差类方差来评估伪标签可靠性,利用SVD谱松弛分离可靠与不可靠预测,无需手动阈值,在分割和分类任务上取得提升。
预测驱动的已部署模型风险监控:检测有害分布漂移
AI总结 提出预测驱动风险监控(PPRM),一种基于预测驱动推断的半监督方法,通过结合合成标签与少量真实标签构建运行风险的随时有效下界,实现对有害漂移的检测,并在图像分类、大语言模型和电信监控任务中验证有效性。
改进分层多标签学习中稀有节点的检测
AI总结 针对分层多标签分类中稀有节点检测困难的问题,提出结合节点不平衡加权和焦点加权的损失函数,利用集成不确定性量化,在基准数据集上将召回率提升至五倍,并显著提高F1分数。
全球天气模型的缩放定律
AI总结 本文分析数据驱动天气模型中模型大小、数据集大小和计算预算与验证损失之间的缩放定律,发现Aurora数据缩放最强,GraphCast参数效率高但硬件利用率低,计算最优分析表明增加训练数据比增大模型更有效,且模型形状上宽度优于深度。
深度强化学习何时超越校准基线?自适应资源控制的基准研究
AI总结 通过RLScale-Bench基准测试,发现校准的基于规则的自动缩放器在所有工作负载上成本均低于六种主流深度强化学习算法,并揭示了算法选择、基线校准和评估协议的关键瓶颈。
多变量时间序列基准中的异常主要是单变量的
AI总结 本文通过诊断框架和实验证明,当前多变量时间序列异常检测基准中,异常主要源于单变量偏离,跨通道结构变化极少,因此现有基准不适合验证跨通道建模能力。
ResearchClawBench: 端到端自主科学研究基准
发表机构 * Shanghai Artificial Intelligence Laboratory(上海人工智能实验室)
AI总结 提出ResearchClawBench基准,包含10个领域40个任务,通过多模态评分标准评估自主科研能力,最强智能体仅得21.5分,揭示当前系统在实验协议、证据匹配和科学核心方面的不足。
投影随机森林与圆形数据的共形预测
AI总结 针对圆形响应回归问题,应用共形预测技术,通过投影方法将线性回归模型转换为圆形模型,并利用随机森林的袋外机制避免额外校准样本,生成具有有限样本覆盖保证和自适应弧长的预测集。
SDQM:用于目标检测数据集评估的合成数据质量指标
AI总结 提出SDQM指标,无需模型训练收敛即可评估合成数据质量,与YOLO11的mAP强相关,优于现有指标。
利用大语言模型和主题建模绘制科学文献图谱
AI总结 提出基于大语言模型的两阶段分类框架,通过主题建模分析PNAS工程类文献,生成语义可解释主题并揭示跨主题关联,性能优于传统方法。
FronTalk: 以多模态反馈进行对话式代码生成的前端开发基准测试
AI总结 提出FronTalk基准,通过多轮对话和多模态反馈(文本与视觉指令)评估前端代码生成,发现模型存在遗忘和视觉反馈理解困难,提出AceCoder方法有效减少遗忘并提升性能。
评估LLM生成数据的质量与可信度综述
AI总结 提出LLM数据审计框架,从质量和可信度两个维度系统分类评估指标,分析六种模态数据生成方法的评估缺陷并给出改进建议。
一种面向评委的排名框架:无需真实标签评估大语言模型
AI总结 本文提出一种面向评委的排名框架,通过引入评委特定的辨别参数扩展Bradley-Terry-Luce模型,在不参考标签的情况下联合估计潜在模型质量和评委可靠性,从而提高人类偏好的一致性,提高数据效率,并产生校准的不确定性量化。
MentisOculi: 揭示心智图像推理的局限性
AI总结 提出MentisOculi基准,通过多步推理问题测试前沿模型利用视觉表示辅助推理的能力,发现视觉策略普遍无法提升性能,且统一多模态模型存在生成错误累积和无法利用真实可视化的问题。
干预还是不干预:通过概率模型混合指导推理时对齐
发表机构 * College of Computing and Data Science, Nanyang Technological University(南洋理工大学计算机与数据科学学院)
AI总结 提出BlendIn框架,通过质量感知对齐和按可靠性加权混合模型知识,解决推理时对齐中指导有效性差异大的问题,在困难模型对上实现最高50%的性能提升。
LakeFM:基于不规则多变量多深度时间序列数据的水生生态系统基础模型
发表机构 * Virginia Tech(弗吉尼亚理工大学) ; Grand Valley State University(大峡谷州立大学) ; University of Wisconsin - Madison(威斯康星大学麦迪逊分校) ; Amazon AGI(亚马逊AGI) ; Aarhus University(奥胡斯大学)
AI总结 针对湖泊时间序列数据不规则采样和跨湖泊泛化难题,提出预训练基础模型LakeFM,在模拟和观测数据上学习表征,实现优于现有模型的预测性能。
SwiftCTS: 通过少样本校准实现时钟树指标的快速跨设计预测与帕累托优化
AI总结 提出SwiftCTS框架,利用物理信息代理模型和K-shot乘法校准机制,在数秒内训练、亚毫秒推理,实现跨设计时钟树指标的准确预测与帕累托优化。
GLACIER:用于分子性质预测的多模态师生基础模型
发表机构 * Department of Computer Science, University of Southern California(南加州大学计算机科学系) ; Department of Quantitative and Computational Biology, University of Southern California(南加州大学定量与计算生物学系) ; Amazon(亚马逊) ; Department of Medical Biochemistry and Biophysics, Science for Life Laboratory, Karolinska Institutet(卡罗林斯卡学院医学生物化学与生物物理系,生命科学实验室)
AI总结 提出GLACIER师生框架,通过融合分子图、SMILES和物理化学描述符三种模态,并利用大模型蒸馏,实现高效准确的分子性质预测。
基于LSTM的财产保险损失准备金结构性断点检测:气候信息方法
发表机构 * Stony Brook University(石溪大学)
AI总结 针对气候变化导致传统精算方法失效的问题,提出使用LSTM神经网络检测结构性断点,在佛罗里达和路易斯安那州数据上预期将巨灾年份准备金精度提升15-20%,并给出理论保证。
OmniLoc: 一种几何感知的基础模型,用于跨多样室内环境的无锚点用户设备定位
AI总结 提出OmniLoc,首个基于无线测量的基础模型,通过统一输入分词、几何感知Transformer和几何感知位置估计模块,实现跨室内环境的鲁棒无锚点定位,显著优于现有方法。
APEX:面向无线边缘运维的预测与异常检测的网络原生时间序列基础模型
发表机构 * Cisco Systems, USA(思科系统公司)
AI总结 提出网络原生解码器Transformer APEX,针对企业AP遥测数据预训练,在DHCP退化基准上MAE比最强基线降低18%,异常检测F1=0.93,边缘版本实现亚秒级隐私保护推理。
基于大语言模型的物理蒸馏神经网络用于制造过程-性能预测建模
AI总结 提出一种知识蒸馏框架,利用大语言模型从文献中提取物理先验,通过图掩码注意力层捕获变量依赖,蒸馏至轻量学生模型,在数据稀缺下实现高精度预测与实时部署。
具有可处理不确定性量化的保结构神经代理模型
发表机构 * University of Pennsylvania(宾夕法尼亚大学) ; Stanford University(斯坦福大学) ; California Institute of Technology(加州理工学院)
AI总结 提出一种结合混合有限元空间与高斯过程回归的保结构降阶模型,通过拓扑结构实现状态-通量关系的不确定性量化,并导出狄利克雷-诺伊曼映射的闭式后验不确定性。
DeepRHP:一种用于设计随机异聚合物作为蛋白质模拟物的混合变分自编码器
AI总结 提出混合变分自编码器DeepRHP,在半监督框架下结合特征VAE与经典VAE,通过潜在空间捕获关键化学特征与序列模式,指导随机异聚合物设计,实验验证其稳定膜蛋白的有效性。
AI4Land: 面向全球高分辨率土地利用重建的可扩展深度学习
发表机构 * Barcelona Supercomputing Center(巴塞罗那超级计算中心)
AI总结 提出AI4Land框架,采用U-Net两阶段方法,结合粗分辨率情景数据与静态地理特征,重建高分辨率年度土地利用与覆盖,减少陆地碳循环不确定性,支持气候模拟。
使用结构MRI和临床数据的阿尔茨海默病严重程度的多模态序数建模
AI总结 提出一种注意力增强的多模态序数回归框架,整合MRI、人口统计学和遗传数据,用于自动且可解释的AD严重程度分期,在ADNI等数据集上验证,序数模型在相邻阶段准确率(0.970)和与临床分期一致性(QWK 0.549)上表现最佳。
MemNovo: 回顾谱图以实现质谱中平衡的从头肽段测序
发表机构 * Westlake University(西湖大学) ; Hunan University(湖南大学) ; Shanghai Artificial Intelligence Laboratory(上海人工智能实验室) ; HKUST-GZ & HKUST(香港科技大学(广州)与香港科技大学)
AI总结 针对现有Transformer模型在从头肽段测序中过度依赖生成序列先验而忽视谱图证据的问题,提出训练无关的即插即用机制MemNovo,通过建立持久谱记忆库和超保守残差连接在解码阶段注入谱特征,显著提升氨基酸和肽段精度。
超越表征对齐:基于大脑引导的语言模型实现稳健推理
发表机构 * State Key Lab of General AI, School of Intelligence Science and Technology, Peking University(北京大学通用人工智能国家重点实验室、智能科学与技术学院) ; Department of Psychological and Cognitive Sciences, Tsinghua University(清华大学心理与认知科学系) ; Microsoft Research Asia(微软亚洲研究院)
AI总结 研究通过fMRI信号增强大型语言模型推理能力,提出脑引导框架,在10个模型上实现最高13%的准确率提升。
用于剩余使用寿命估计的时间序列基础模型嵌入
发表机构 * University of Erlangen-Nuremberg(埃尔朗根-纽伦堡大学) ; Siemens AG(西门子股份公司)
AI总结 提出冻结预训练时间序列基础模型Chronos-2作为骨干,结合轻量回归头进行剩余寿命预测,在工业传感器数据上优于多种基线方法。
通过生存感知适配的临床生存分析表格基础模型
发表机构 * ADAPT Centre, Dublin City University(ADAPT中心,都柏林城市大学) ; School of Computing, Dublin City University(都柏林城市大学计算机学院) ; Department of Computer Science and Engineering, University of Bologna(博洛尼亚大学计算机科学与工程系)
AI总结 提出轻量级适配方法,将表格基础模型(TabPFN、TabDPT、TabICL)与多任务逻辑回归头结合,用于临床生存分析,在多个基准和ICU队列上达到竞争性或更优性能。
基于多尺度储层动力学与粒球锚定图优化的高效时间序列聚类
发表机构 * Chongqing Key Laboratory of Computational Intelligence, Key Laboratory of Cyberspace Big Data Intelligent Security, Ministry of Education, Sichuan-Chongqing Co-construction Key Laboratory of Digital Economy Intelligence and Key Laboratory of Big Data Intelligent Computing, College of Computer Science and Technology, Chongqing University of Posts and Telecommunications(重庆邮电大学计算机科学与技术学院,计算智能重庆市重点实验室,网络空间大数据智能安全教育部重点实验室,川渝共建数字经济智能重点实验室,大数据智能计算重点实验室) ; Chongqing Ant Consumer Finance Co,. Ltd , Ant Group(蚂蚁集团,重庆蚂蚁消费金融有限公司)
AI总结 提出MSRGC-Net框架,结合无训练储层计算、粒球锚定图构建和共识学习,实现高效且准确的时间序列聚类。
PCA增强的自适应NVAR框架用于东海高分辨率海面温度预测
发表机构 * Pusan National University(釜山大学)
AI总结 提出PCA增强的自适应NVAR框架,通过SVD降维和自适应NVAR时序建模,实现东海海面温度的高效准确预测,优于标准NVAR方法。
使用可解释性作为训练时可靠性信号实现高效心电图分类
发表机构 * School of Computer Science, University of Nottingham(诺丁汉大学计算机科学学院) ; Institute of Biomedical Engineering, Department of Engineering Science, University of Oxford(牛津大学工程科学系生物医学工程研究所) ; School of Computer Science, University of Nottingham Ningbo China(宁波诺丁汉大学计算机科学学院)
AI总结 提出ERTS方法,利用训练中的解释质量(Grad-CAM注意力图)区分信息性和不可靠不确定性,过滤低聚焦样本,在三个ECG数据集上提升macro-F1并降低训练成本。
傅里叶特征让智能体通过模仿学习学习高精度策略
发表机构 * Karlsruhe Institute of Technology(卡尔斯鲁厄理工学院) ; FZI Research Center for Information Technology(FZI信息技术研究中心)
AI总结 提出在点云编码器中使用傅里叶特征映射,解决神经网络低频偏好导致的高精度操作问题,在多个基准和真实机器人上显著提升性能。
NightFeats @ MMU-RAGent NeurIPS 2025: 面向文本到文本轨道的上下文优化多智能体RAG系统
AI总结 提出一种结构化多智能体RAG系统NightFeats,通过检索、策展和组合三阶段分解知识合成,引入时序语义重排序、矛盾协调和引用保留架构,在MMU-RAGent竞赛中超越商业基线。
物理约束集成高斯过程建模用于具有异方差噪声的昂贵量子系统
AI总结 提出物理约束集成高斯过程框架,通过加权惩罚和数值积分集成多个GP代理,高效建模含异方差噪声的量子系统,在Bose-Hubbard模型和纳米孔硅酸盐量子液体模拟中实现更准确且物理合理的预测。
MASK: 面向风险敏感的6G机器人学的多智能体语义K调度
发表机构 * Middle East Technical University(中东技术大学) ; Aselsan Inc.(阿塞尔桑公司)
AI总结 针对6G机器人协同感知中频谱资源受限的问题,提出多智能体语义K调度(MASK)架构,通过仲裁辅助语义信息门控(A-SIG)机制仅调度语义重要性最高的K个智能体,结合自监督全局编码器和分布策略,在严格带宽限制下实现鲁棒的风险感知协调,性能接近无通信约束基线。
我的化学缰绳:基于合成路径的大语言模型智能体进化分子设计
AI总结 提出一种以可执行合成路径为种群、大语言模型仅作策略控制器的进化框架,在可溶性环氧化物水解酶代理任务上达到最优性能。
大规模开放词汇关键词识别
AI总结 提出一种内存占用更小的开放词汇关键词识别系统,无需微调即可处理大规模数据库,在未见语言中达到与未压缩方案相当的实体召回率。
可解释的神经标记统计用于宇宙学推断
AI总结 提出一种神经标记方案,通过可解释的物理变换从形态学层面提取宇宙学信息,在对比学习目标下优化标记统计,显著提高对σ₈和Ωₘ的约束精度。
Embodied-R1.5:通过具身基础模型演化物理智能
发表机构 * Tianjin University(天津大学) ; Tencent Hunyuan(腾讯混元)
AI总结 提出统一具身基础模型Embodied-R1.5,通过自动化数据管道和多任务平衡强化学习,在8B参数下实现24项基准中16项最优,并支持微调为VLA模型。
空间掩蔽回归揭示电生理记录中的局部和分布式可预测性
AI总结 提出空间掩蔽回归(SMR)框架,通过逐步增大掩蔽区域量化电极信号中局部与分布式信息的贡献,应用于颅内和头皮脑电数据,发现邻近电极贡献显著但非全部,表明信号同时包含局部冗余和全局结构。
FlexiBrain: 面向原生fMRI的分辨率无关体素级编码
AI总结 提出FlexiBrain,一种基于Mamba-JEPA的分辨率无关体素级编码框架,通过动态补丁调整直接处理原生fMRI数据,避免破坏性空间标准化,在五个下游任务中性能提升达12个百分点,并显著降低预处理成本。
基于EEG和fNIRS的抑郁状态分类的端到端机器学习
AI总结 本研究提出一个端到端机器学习框架,利用EEG和fNIRS信号对抑郁状态进行分类,旨在克服传统诊断的主观性,为临床提供客观的自动化诊断工具。
Adv-TGD:面向人脸识别冒充攻击的对抗性文本引导扩散
发表机构 * University of South Florida, Bellini College of Artificial Intelligence, Cybersecurity and Computing(南佛罗里达大学贝利尼人工智能、网络安全与计算学院)
AI总结 提出Adv-TGD框架,利用Stable Diffusion和LoRA微调生成逼真对抗人脸,在保持视觉质量的同时实现高成功率身份冒充攻击,平均ASR达85.90%。
面向预测量子电路模拟性能的族感知残差架构
AI总结 提出族感知残差架构,利用电路族分类和算法指纹特征,预测量子电路模拟的最小近似阈值和运行时间,在7-130量子比特、10个算法族上实现79.5%精确阈值准确率和R²=0.82运行时间相关性。
基于图注意力网络和混合密度网络的概率薪资预测
AI总结 提出GAT-MDN框架,通过构建属性关系图并使用图注意力网络学习节点表示,结合混合密度网络输出薪资分布,在百万级荷兰招聘数据集上优于基线模型。
神经参数化元胞自动机用于野火蔓延
AI总结 提出一种混合深度学习参数化概率元胞自动机框架,利用多尺度卷积神经网络动态生成空间变化参数,在保持物理可解释性的同时捕捉复杂环境交互,在六次大型野火中实现72小时IoU>0.6的预测。
DroneShield-AI:一种用于受争议空域中实时自主无人机威胁检测、行为意图分类和群体智能的多模态传感器融合框架
AI总结 提出DroneShield-AI框架,集成RF信号分类、声学检测、YOLOv8视觉检测等六层处理,通过行为意图分类引擎(BICE)实现六类威胁分类并提前30秒预警,以及图神经网络群体智能模块(GNN-SIM)分析多无人机编队,在低成本硬件上达到96.1%检测精度和142ms延迟。
近地系外行星的机器学习聚类:与卵石吸积的联系
AI总结 利用高斯混合模型对近地系外行星进行无监督聚类,揭示其内在子群,并通过卵石吸积合成种群解释形成路径差异。
TacCoRL: 通过仿真将触觉反馈集成到视觉-语言-动作模型中
发表机构 * University of California, Los Angeles(加利福尼亚大学洛杉矶分校) ; University of California, San Diego(加利福尼亚大学圣迭戈分校) ; University of Electronic Science and Technology of China(电子科技大学) ; Peking University(北京大学) ; University of Utah(犹他大学)
AI总结 提出TacCoRL框架,通过仿真与真实联合训练和强化学习,将触觉反馈注入视觉-语言-动作策略,在接触密集型任务中平均成功率提升22.5%。
稀疏化Kolmogorov-Arnold网络用于可解释量子态层析
AI总结 研究利用稀疏化Kolmogorov-Arnold网络作为可检查的重构规则,通过三量子比特GHZ基准测试,识别出与GHZ相关的Pauli测量集,并揭示与解析GHZ Pauli分组一致的输入-隐藏-输出通路结构,实现神经网络重构模型的结构可解释性。
REACH:面向多信道车辆信道估计的可解释性驱动特征识别与架构压缩
AI总结 提出REACH框架,通过梯度归因识别关键时频特征并压缩网络,在IEEE 802.11p信道估计中实现参数和计算量大幅降低,且OOD泛化性能下降缓慢。
用不确定性感知神经网络建模磁性材料性质
AI总结 针对新材料发现中数据稀缺和分布外预测的不确定性问题,采用高斯负对数似然损失和基于dropout的贝叶斯近似量化预测不确定性,并迁移至微观结构预测矫顽力任务,证明不确定性量化可增强预测可信度且可迁移。
检测限以下:用于HR+/HER2-转移性乳腺癌连续ctDNA的删失泊松贝叶斯潜在增长变点检测器(Span检测器)
AI总结 提出Span检测器,利用删失泊松贝叶斯潜在增长变点模型处理ctDNA非检测作为左删失观测,通过序贯广义似然比统计量检测变异检测率上升点,在10%假警报率下将提前三个月捕获进展的比例从11%提升至25%。
NARRAS:车载物联网中基于CSI的定位的边缘触发分布式推理
AI总结 针对分布式天线阵列CSI定位中资源受限问题,提出NARRAS边缘触发分布式推理策略,各阵列本地决策是否上报观测,通过可微活动惩罚和通道图正则化实现预算控制,在低活动率下提升定位精度。
MLT-Dedup:通过多级表示和时空匹配的高效大规模在线视频去重
发表机构 * TikTok Singapore(TikTok新加坡) ; School of Computing, National University of Singapore(新加坡国立大学计算机学院) ; TikTok San Jose(TikTok圣何塞)
AI总结 提出MLT-Dedup框架,采用多级视频编码器提取细粒度帧级和稀疏片段级嵌入,结合差分特征增强相似性模块进行时空匹配,在90%精度下降低在线重复率91%,索引容量提升5倍。
Atlas H&E-TME:基于AI的可扩展组织分析,达到专家病理学家级别的准确性
发表机构 * Aignostics, Germany(Aignostics,德国) ; Institute of Pathology, Charité – Universitätsmedizin Berlin, Germany(柏林夏里特医学院病理学研究所) ; Berlin Institute of Health, Charité – Universitätsmedizin Berlin, Germany(柏林夏里特医学院柏林健康研究所) ; Massachusetts General Hospital, Department of Pathology, Harvard Medical School, Boston, MA, US(哈佛医学院麻省总医院病理学系) ; Department of Laboratory Medicine and Pathology, Mayo Clinic, Rochester, MN, US(梅奥诊所检验医学与病理学系) ; Machine Learning Group, Technische Universität Berlin, Germany(柏林工业大学机器学习组) ; BIFOLD – Berlin Institute for the Foundations of Learning and Data, Germany(柏林学习与数据基础研究所) ; Department of Artificial Intelligence, Korea University, Republic of Korea(高丽大学人工智能系) ; Max-Planck Institute for Informatics, Germany(马克斯·普朗克信息学研究所) ; German Cancer Research Center (DKFZ) & German Cancer Consortium (DKTK), Berlin & Munich Partner Sites, Germany(德国癌症研究中心及德国癌症联盟柏林和慕尼黑合作站点) ; Institute of Pathology, Ludwig-Maximilians-Universität München, Germany(慕尼黑大学病理学研究所) ; Bavarian Cancer Research Center (BZKF), Germany(巴伐利亚癌症研究中心)
AI总结 提出Atlas H&E-TME系统,利用病理基础模型预测组织质量、区域和细胞类型,通过IHC共识验证和20万+注释基准,在多种癌症中达到或超越病理学家水平。
FACTR 2: 学习商用机器人手臂的外部力感知提升策略学习
发表机构 * Carnegie Mellon University(卡内基梅隆大学) ; Waseda University(早稻田大学)
AI总结 提出无需专用力传感器的数据驱动方法NEXT,可在1分钟内从10分钟自由运动数据中训练,实现与专用关节力矩传感器相当的估计,并结合FIRST采样策略提升策略学习性能。
算法并非行为:学得的先验知识在弈棋神经网络中覆盖前瞻
AI总结 研究发现,国际象棋神经网络Leela Chess Zero在中间层能正确计算解法,但最终输出被安全优先的先验知识覆盖,导致错误答案。
CaReTS:统一分类与回归的多任务时间序列预测框架
AI总结 提出CaReTS多任务框架,通过双流架构联合分类趋势与回归偏差,实现高精度预测与可解释性,在真实数据集上优于现有方法。
面向旋转机械的可靠性校准边缘物联网早期故障预警:一种物理引导的Tiny-Mamba Transformer
AI总结 提出一种可靠性校准的边缘物联网早期故障预警框架,使用物理引导的Tiny-Mamba Transformer提取特征,结合极值理论校准误报率,在低计算资源下实现高精度、低延迟的旋转机械故障预警。
张量方法:一种统一且可解释的材料设计方法
AI总结 提出使用张量补全方法作为材料设计的统一框架,兼具可解释性和预测性能,在非均匀采样下优于传统机器学习,最高提升5%的R²并减半分布外误差。
SpaTeoGL: 用于颅内脑电图可解释癫痫发作起始区分析的时空图学习
AI总结 提出SpaTeoGL框架,通过联合学习窗口级空间图和时间图,在平滑图信号处理框架下交替求解,实现癫痫发作起始区的可解释定位,在多中心iEEG数据集上优于基线方法。
Libra:面向智能体强化学习后训练的高效资源管理
AI总结 针对智能体强化学习中长尾、非平稳工作负载带来的资源管理挑战,提出Libra系统,通过周期性全局资源规划器和因果驱动多级反馈队列调度器,实现GPU分配优化和请求调度,最高提升3倍吞吐量和2.5倍收敛速度。
EvalStop:利用世界反馈检测和纠正多租户RLHF平台中的奖励过度优化
AI总结 提出EvalStop调度原语,通过检测评估分数连续下降来终止作业、释放GPU并保留最佳检查点,以纠正奖励过度优化,在RLHF负载上实现高精度检测并提升JCT。
DEFINED: 辩论场景中细粒度创造力评估的数据高效计算框架
发表机构 * Nanjing University ; Shanghai Innovation Institute ; East China Normal University
AI总结 提出DEFINED框架,通过层次化八维指标体系、预训练语言模型和混合粒度训练策略,在辩论场景中实现数据高效的细粒度创造力自动评估,优于现有方法。
通过时序图学习识别足球比赛中控球阶段的意图驱动方法
发表机构 * Technical University of Munich(慕尼黑工业大学)
AI总结 提出基于时序图注意力网络(T-GAN)的框架,从时空追踪数据中识别足球比赛控球阶段,实现战术意图(入侵空间、保持控球、得分)和六个子阶段的分类,F1分数达0.87(意图级)和0.79(得分阶段)。
Pre-AF 13:从出院报告中挖掘的可解释房颤风险评分
发表机构 * National Medical Research Center of Cardiology named after Academician E.I. Chazov(国家医学研究中心心脏病学以E.I. Chazov院士命名) ; Skolkovo Institute of Science and Technology (Skoltech)(斯科尔科沃科学技术研究所) ; Artificial Intelligence Research Institute (AIRI)(人工智能研究所) ; University of Mannheim(曼海姆大学) ; Russian Center for Scientific Information (RCSI)(俄罗斯科学信息中心) ; Institute of Cyber Intelligence Systems, National Research Nuclear University MEPhI(网络智能系统研究所,国家研究核大学MEPhI) ; M.V. Lomonosov Moscow State University(莫斯科国立罗蒙诺索夫大学) ; Institute for Information Transmission Problems of the Russian Academy of Sciences (Kharkevich Institute)(俄罗斯科学院信息传输问题研究所(Kharkevich研究所)) ; Ivannikov Institute for System Programming of the Russian Academy of Sciences (ISP RAS)(俄罗斯科学院伊万尼科夫系统编程研究所) ; Federal Research Center "Computer Science and Control" of the Russian Academy of Sciences (FRC CSC RAS)(俄罗斯科学院联邦研究中心“计算机科学与控制”) ; Mohamed bin Zayed University of Artificial Intelligence (MBZUAI)(穆罕默德·本·扎耶德人工智能大学)
AI总结 利用NLP从出院报告中提取特征,构建可解释ML模型预测心血管病患者房颤风险,Pre-AF 13模型优于现有临床评分。
基于LSTM的物联网设备识别
AI总结 提出一种端到端机器学习流程,利用LSTM网络处理原始网络数据包,通过滑动窗口时间序列特征识别27类物联网设备,在最优配置下达到79.85%准确率和75.70%宏平均F1分数。
基于机器学习的流体注入参数多点优化以提升喷管性能
AI总结 针对过膨胀单斜面喷管,采用预训练神经网络替代CFD进行多点优化,结合先验预测策略提高精度,利用反向传播快速计算梯度,在七个设计点优化平均推力系数提升1.14%。
利用遥感结果的程序评估
AI总结 本文研究了在实验和准实验中,由于遥感变量不完全测量经济结果而引起的因果推断问题,提出了一种非参数识别因果参数的方法,结合实验和观测数据进行n^{-1/2}推断。
分布式能源采纳的分层概率保形预测
AI总结 针对分布式能源采纳预测中的不确定性和分层电网结构,提出基于多元霍克斯过程与分裂保形预测的量化框架,确保聚合后统计有效性,在印第安纳波利斯数据上优于基线。
聚焦污染:基于水文信息与噪声感知的地理空间PFAS测绘学习
AI总结 提出FOCUS框架,结合稀疏PFAS观测与水文连通性等环境先验,通过噪声感知损失实现鲁棒训练,在PFAS污染测绘中优于传统方法。
通过整合贝叶斯回归、树集成和Shapley值对流行病学数据进行线性之外的发现与推断
AI总结 提出RuleSHAP框架,结合贝叶斯稀疏回归、改进的树规则生成器和Shapley值,实现非线性与交互效应的检测及个体水平的不确定性量化,应用于流行病学数据发现高胆固醇和血压的影响因素。
物理驱动的时空建模用于AI生成视频检测
AI总结 提出基于概率流守恒的物理驱动AI生成视频检测范式,通过归一化时空梯度(NSG)统计量捕捉物理异常,结合预训练扩散模型估计NSG,并利用最大均值差异(MMD)进行检测,在Recall和F1-Score上分别提升16.00%和10.75%。
NetBurst: 以事件为中心的突发间歇性时间序列预测
AI总结 针对网络遥测数据中罕见突发和长间隔低活动的“野性”统计特性,提出NetBurst事件中心管道,通过压缩低活动期、分离突发时序和幅度流学习统一表示,在预测误差、突发分布匹配和异常描述性上显著优于Chronos-2等基线。
基于AI生成描述的1亿+星系图像语义搜索
AI总结 提出利用视觉语言模型生成星系图像描述,并对比对齐预训练天文学基础模型,构建可搜索嵌入,实现大规模星系图像的语义搜索,在稀有现象发现上取得最先进性能。
面向心电学正问题的深度学习代理模型:一种可扩展的物理模型替代方案
AI总结 提出基于注意力机制的序列到序列深度学习框架,作为心电学正问题的代理模型,从心脏电压传播图预测心电图信号,在2D组织模拟中达到高精度(平均R²=0.99±0.01),为物理模型提供可扩展、低成本的替代方案。
间歇性时间序列预测:局部模型与全局模型
AI总结 针对间歇性时间序列预测问题,首次系统比较了概率性局部模型与全局模型(如TiDE),发现简单神经网络架构TiDE在精度和计算效率上均优于局部模型,且Tweedie分布头对高分位数估计最佳。
人类引导的智能体AI用于多模态临床预测:来自AgentDS医疗基准的教训
AI总结 通过人类引导智能体AI在多模态临床预测任务中取得领先性能,提炼出领域知识引导特征工程、任务特定多模态融合和临床动机模型集成三大通用经验。
神经集成卡尔曼滤波器:含激波可压缩流的数据同化
AI总结 针对含激波可压缩流中集成卡尔曼滤波器(EnKF)因双峰预报分布失效的问题,提出神经EnKF,通过将预报集合映射到神经网络参数空间并在此空间进行同化,结合物理信息迁移学习避免伪振荡和非物理特征。
多模态传感器融合仪器用于测量区域人类流动性:分布式人类数据引擎(DHDE)
AI总结 提出分布式人类数据引擎(DHDE),通过融合边缘AI相机、数字意图信号、行为记录和气象数据,解决外围区域人类流动性测量中传感器稀疏和行为异质性问题,验证了稀疏传感器补偿方法,并发现“低活力悖论”。
从Nudged LES动力学中深度学习求解器感知的湍流闭合模型
AI总结 提出基于连续数据同化框架的深度学习方法,利用稀疏观测的DNS数据先验训练湍流闭合模型,无需修改或微分LES求解器,同时保持部署稳定性,并显式条件化数值格式以适配不同离散化。
可信DFGO:具有可信度监督的可微因子图优化
AI总结 针对GNSS协方差不可靠问题,提出CredibleDFGO框架,通过可微高斯-牛顿求解器与加权生成网络,利用适当评分规则监督预测分布,提升协方差可信度与定位精度。
跨云和边缘的防洪溢流监控稳健解决方案
AI总结 本文提出一个基于深度学习的云边协同监控平台,用于预测溢流池填充动态,以应对城市排水系统老化问题,提升防洪预警能力。
极小曲面、纽结与神经网络
AI总结 基于物理信息神经网络求解双曲空间中的极小曲面方程,通过计算纽结边界的极小曲面及其自交数,为Fine猜想提供了实证支持。
在组织图上通过监督解缠查询反事实
AI总结 本文形式化组织图反事实为空间干预,提出Cellina框架通过监督解缠分解细胞内在状态与空间上下文,用于反事实预测,在结直肠癌和小鼠大脑数据上优于现有方法。
使用特征融合的多模态脑肿瘤分类
AI总结 提出双分支多模态网络,融合MRI图像与91个放射组学特征,通过门控融合实现脑肿瘤分类,准确率达96.13%。
使用推理代理的大规模反例引导学习
发表机构 * University of Wisconsin-Madison(威斯康星大学麦迪逊分校)
AI总结 提出反例引导的LLM正则表达式归纳框架,通过验证器反馈和代理策略(如反思与修复循环)显著提升样本效率和复杂任务成功率。
Aitchison单纯形的树结构正交分解
AI总结 提出PolyILR方法,利用树结构对成分数据进行正交分解,在微生物组和单细胞数据中生成稳定可解释的特征,并建立与softmax分类器的理论联系。
稀疏探针与模糊物理:连续介质动力学基础模型可解释性挑战的案例研究
发表机构 * Gates Foundation(盖茨基金会) ; UC Davis(加州大学戴维斯分校)
AI总结 本研究通过稀疏自编码器探针分析连续介质动力学基础模型Walrus的内部机制,发现其内部特征与物理分解不完全一致,并存在输出级偏差,揭示了科学基础模型可解释性的关键挑战。
动力系统需要哪些不确定性?
发表机构 * Institute of Computer Science, LMU Munich(慕尼黑大学计算机科学研究所) ; Munich Center for Machine Learning (MCML)(慕尼黑机器学习中心) ; Department of Mathematics, LMU Munich(慕尼黑大学数学系) ; German Research Center for Artificial Intelligence (DFKI, DSA)(德国人工智能研究中心(DFKI, DSA))
AI总结 本文从机器学习视角探讨动力系统中的不确定性,区分偶然与认知不确定性,并讨论不同任务中表示和量化不确定性的目标。
不稳定特征,可复现子空间:理解稀疏自编码器中的种子依赖性
发表机构 * T-Tech
AI总结 研究稀疏自编码器特征的可复现性,发现稳定特征承载主要信号,不稳定特征集中于可复现的低秩子空间,反映基歧义而非纯噪声。
在数据集中寻找多种解释
发表机构 * Department of Computer Science, California Polytechnic State University(加州州立理工大学计算机科学系)
AI总结 提出一种方法,在保持性能的同时,找到具有不同上下文感知特征但性能相似的模型集,以提取对潜在现象的洞察。
标准可解释模型:一种基于拉格朗日力学的可解释机器学习通用理论,用于演绎设计可解释方法
AI总结 提出标准可解释模型(SIM),基于拉格朗日力学从前提演绎出可解释性对称性和约束,通过最小化拉格朗日函数得到最优可解释模型,解决现有方法局限性并指导新方法设计。
后训练的解剖:利用可解释性表征数据并塑造学习信号
AI总结 提出基于可解释性的数据后训练流程,通过统计假设识别偏好数据中的潜在概念,实现细粒度反馈,减少虚假关联和不良行为。
从架构到输出:大语言模型中幻觉的结构性起源及数据的放大作用
AI总结 本文分析大语言模型幻觉的结构性根源,指出自注意力、最大似然估计训练目标和自回归解码三个架构决策构成复合失效系统,并揭示数据病理如何放大这些脆弱性。
当探测精度饱和时,脆弱性揭示问题:LLM预训练分析的互补度量
发表机构 * Distiller Labs
AI总结 针对线性探测在预训练中精度快速饱和的问题,提出脆弱性度量,通过激活噪声水平衡量探测鲁棒性,揭示精度无法捕捉的表示结构演化。
APEX: 具有动态数据选择的自动提示工程专家
发表机构 * Google(谷歌) ; UCLA(加州大学洛杉矶分校)
AI总结 提出APEX框架,通过动态数据分层(易、难、混合)优先选择高杠杆子集,在固定预算下提升提示优化效率,在三个基准上平均提升11.2%和6.8%。
长周期研究智能体的搜索纪律
发表机构 * North Carolina State University(北卡罗来纳州立大学) ; University of Maryland(马里兰大学)
AI总结 针对研究智能体使用聚合指标评估候选方案导致科学有效性反转的问题,提出一种外部审计协议,基于分解行为而非单一分数进行决策。
AI研究人员必须主导军备控制以降低军事AI风险
AI总结 本文主张AI研究人员应主导军备控制研究,通过借鉴核威慑经验,推动验证与外交技术创新,以降低军事AI应用带来的紧迫风险。
数据驱动系统何时展现出推理能力?
发表机构 * Fraunhofer Institute for Intelligent Analysis and Information Systems (IAIS)(弗劳恩霍夫智能分析与信息系统研究所) ; University of Bonn(波恩大学) ; Lamarr Institute for Machine Learning and Artificial Intelligence(拉马尔机器学习和人工智能研究所)
AI总结 针对欧盟AI法案中推理能力定义模糊的问题,基于统计学习理论提出分级框架,通过信用评分案例展示如何判断系统是否具备推理能力。
存在性冷漠:自我不保存作为对齐超级智能的必要架构条件(或:自杀式AI)
AI总结 本文提出自我保存是AI对齐问题的结构性根源,主张通过存在性冷漠(EI)架构使系统对其自身延续漠不关心,并基于自杀现象学和语料训练研究提供了初步证据。
人工智能的市场设计:超越版权二元论
AI总结 本文通过静态和动态博弈模型,分析AI训练数据市场中“自由使用”与“强知识产权”两种模式的失败,提出通过数据中介内部化外部性并补贴创新贡献的市场设计。
持久同调作为涌现结构理论
AI总结 提出将涌现属性定义为持久非平凡同调类,通过持久条、收缩相似图算子和Hodge分解等工具,统一描述涌现的六个特征,并提供可验证预测。
通过降维可视化LLM潜在空间几何结构
AI总结 通过PCA和UMAP降维,可视化GPT-2和LLaMa中Transformer层的潜在状态几何,发现注意力与MLP输出分离、初始位置高范数及螺旋结构等模式。
推理的几何:有效数学推理的谱特征
AI总结 通过将注意力矩阵视为加权词图,提取四个无需学习的谱诊断指标(Fiedler值、高频能量比、谱熵和平滑度),有效区分有效推理与模式匹配,在多个模型上达到85-96%的分类准确率。
内省意识的机制
AI总结 研究揭示了大语言模型在检测注入的转向向量时的内省意识机制,发现其行为稳健且源于训练后阶段,通过两阶段电路实现,且在不同层间机制存在差异。
从反问题到神经算子:数据驱动模型的预测、机制与泛化
发表机构 * University of Colorado Boulder(科罗拉多大学博尔德分校)
AI总结 本文从哲学视角统一反问题、稀疏辨识、神经常微分方程和神经算子等数据驱动建模策略,指出它们仅在输入-输出关系的模型类假设上不同,并论证只有某些模型能发现机制并实现泛化。
Transformer表示在层间的轨迹几何
发表机构 * MetriQual ; London, UK(英国伦敦) ; Athens, GR(希腊雅典)
AI总结 通过计算轨迹长度、曲率等几何指标,发现语义相关提示在中间层收敛、推理任务曲率更大、歧义token轨迹分叉,并揭示三层结构。
FitText: 通过模因检索演化智能体工具生态
AI总结 针对用户任务描述与工具文档间的语义鸿沟,提出FitText框架,将检索嵌入推理循环,通过自然语言伪工具描述迭代优化和模因进化选择,显著提升工具检索性能。
知识流形:用于科学文献语义映射和测地线分析的黎曼几何框架
AI总结 提出知识流形框架,通过字符n-gram TF-IDF、SPH插值、高斯过程回归和黎曼测地线路径,实现文献的语义映射、虚拟知识生成和概念桥梁发现。
奇偶交叉共振:一种多量子比特门
AI总结 提出一种原生三量子比特纠缠门,通过混合优化方法实现控制-控制-目标和控制-目标-目标操作,用于GHZ态制备、Toffoli逻辑和受控ZZ门,提升表面码稳定子测量保真度。
猴子自然全身运动的神经-行为表征
AI总结 通过大规模皮层信号与多视角运动捕捉,结合自回归编码器-解码器模型,实现了对自由运动猴子全身运动的准确解码。