Noise-Driven Exploration and Transient Freezing Select Flat Minima in Stochastic Gradient Descent
噪声驱动的探索与瞬态冻结在随机梯度下降中选择平坦极小值
AI总结 通过分析SGD学习动力学,发现非平衡机制驱动解选择:瞬态探索阶段逃离尖锐谷,噪声重塑势能稳定平坦解,冻结延迟增强泛化。
Comments 12 pages, 4 figures
噪声驱动的探索与瞬态冻结在随机梯度下降中选择平坦极小值
AI总结 通过分析SGD学习动力学,发现非平衡机制驱动解选择:瞬态探索阶段逃离尖锐谷,噪声重塑势能稳定平坦解,冻结延迟增强泛化。
Comments 12 pages, 4 figures
DPDFNet: 通过双路径RNN提升DeepFilterNet2
AI总结 提出DPDFNet,在DeepFilterNet2编码器中引入双路径块增强长时跨带建模,结合过衰减抑制损失和微调策略,在多个基准上超越现有因果模型,并部署于边缘NPU实现实时性能。
Comments Accepted manuscript version. Accepted for publication in Speech Communication
Atlas: 编排异构模型与工具实现多领域复杂推理
AI总结 提出ATLAS双路径框架,通过无监督聚类路由和强化学习多步路由动态选择最优模型-工具组合,在15个基准上超越GPT-4o,分布内外任务分别提升10.1%和13.1%。
Comments Accepted by ACL 2026
EngTrace:工程推理可验证过程监督的符号基准
AI总结 提出EngTrace符号基准,包含1350个参数化测试用例,通过两阶段可验证评估框架(分层协议+AI仲裁)检验中间推理轨迹与最终答案,揭示数值精度与轨迹保真度的权衡。
Comments 33 pages, includes figures and tables; introduces the EngTrace benchmark
DiFlow-TTS: 基于离散流匹配的紧凑低延迟零样本文本转语音
AI总结 提出DiFlow-TTS框架,通过离散流匹配和分解离散流去噪器,在零样本TTS中实现高质量与低延迟的平衡。
Comments Accepted at Interspeech 2026 (Long Paper track)
BusterX++: 迈向基于MLLM的统一跨模态AI生成内容检测与解释
AI总结 提出统一多模态大模型BusterX++,通过纯强化学习策略实现图像与视频伪造检测的跨模态能力迁移,性能超越现有方法。
通过奖励设计解耦多模态大语言模型中的感知与推理
AI总结 研究多模态大模型中感知与推理的瓶颈,发现感知是主要约束,并通过奖励设计提升视觉基础推理,平均提升5.56分。
Comments 24 pages, 15 Figures, 10 Tables
数据处理不等式是否反映实践?论低级任务的有用性
AI总结 本文研究低级处理(如去噪、编码)如何提升分类性能,证明在有限样本下存在预处理可提高准确率,并通过实验验证理论趋势。
Comments ICLR 2026 (camera-ready). Code is available at: https://github.com/serveroy/process-before-you-classify
长视频全模态推理基准
AI总结 提出LongShOTBench基准,用于评估长视频中视觉、语音和环境音频的全模态推理,并引入无训练的全模态证据搜索代理LongShOTAgent,在105个模型上取得最优性能。
从逾渗视角看待Dropout神经网络训练
AI总结 本文研究使用dropout训练深度神经网络时的逾渗现象,建立新逾渗模型刻画网络拓扑与路径问题的关系,揭示dropout中的逾渗效应及其可能导致训练崩溃的机制。
Comments 21 pages, 14 figures
TextMesh4D: 零样本文本到4D网格生成
AI总结 提出TextMesh4D框架,通过雅可比变形场和局部-全局语义正则化,实现零样本文本到动态网格生成,解决扩散引导与网格拓扑约束的冲突,达到高时间一致性和几何保真度。
K-VARK: 用于协作机器人无传感器力估计的核化方差感知残差卡尔曼滤波器
AI总结 提出K-VARK方法,通过核化运动基元学习残差力矩的预测均值和异方差方差,并自适应调整卡尔曼滤波噪声协方差,在6自由度协作机械臂上实现无传感器力估计,RMSE降低20%以上。
大提示词机制下的Softmax作为线性注意力:基于测度的视角
AI总结 提出基于测度的框架,证明在无限提示词极限下softmax注意力收敛到线性算子,并给出有限提示词下的非渐近浓度界,从而将线性注意力的优化分析迁移到大提示词下的softmax注意力。
高保真物体重建的有效高斯管理
AI总结 提出一种高斯管理框架,通过选择性激活属性、自适应表示和任务解耦剪枝,结合正则化表面重建模块,在减少参数的同时实现高保真外观与几何重建。
MiniFool——深度神经网络中基于物理约束感知的最小化器对抗攻击
AI总结 提出MiniFool算法,通过最小化结合χ²检验统计量与目标分数偏差的代价函数,生成物理感知的对抗样本,用于测试粒子与天体物理中的神经网络分类器,并量化网络决策的鲁棒性。
Comments Submitted to Computing and Software for Big Science
AnomalyMatch: 通过半监督和主动学习发现罕见感兴趣对象
AI总结 提出AnomalyMatch框架,结合半监督FixMatch算法和主动学习,将异常检测视为二分类问题,利用少量标注和大量未标注图像训练,在严重类别不平衡下实现高AUROC和AUPRC。
Comments Accepted for publication in RASTI; 17 pages; 12 figures
一种基于几何和深度学习的可复现流水线,用于利用原位摄像头监测城市河流中的漂浮人为碎片
AI总结 提出结合几何模型与深度学习的框架,利用固定摄像头连续量化监测城市河流漂浮碎片,并评估不同模型在复杂环境下的精度与速度,通过投影几何实现碎片尺寸估计。
基于梯度的因果发现框架及其在复杂工业过程中的应用
AI总结 提出GRNGC方法,通过对模型输入输出梯度施加L1正则化推断Granger因果,仅需一个预测模型,降低计算开销,在多个基准和真实数据集上优于现有方法。
Comments 9 pages,3 figures, conference
Branch-and-Browse:具有树状推理与动作记忆的高效可控网页探索
AI总结 提出Branch-and-Browse框架,通过树状结构化推理、网页状态重放和页面动作记忆,实现LLM网页代理的高效可控多分支探索,在WebArena上成功率35.8%,执行时间降低40.4%。
超越采样令牌:在RLVR中保留候选支持
AI总结 本文从候选分布角度分析RLVR中的探索崩溃,提出CaSP方法,通过保留前N个候选的概率质量,在不牺牲pass@1的情况下提升pass@K,在多个基准测试中验证了有效性。
Comments Technical report (23 pages, 16 figures, project page: https://spherelab.ai/simko/)
对抗攻击利用特征叠加中的干扰
AI总结 本文揭示神经网络中特征叠加导致的干扰是对抗脆弱性的根源,通过理论推导和实验验证了干扰模式决定攻击成功与迁移性。
Comments Forty-third International Conference on Machine Learning
论神经网络的满射性:你能从模型中诱导出任何行为吗?
AI总结 本文证明现代神经网络架构(如预层归一化和线性注意力模块)几乎总是满射,意味着任何输出(包括有害内容)原则上都可生成,揭示了模型在对抗攻击下的固有脆弱性。
Comments Blog: https://astro-eric.github.io/blogs/surjective/
OmniRetarget:面向人形全身运动操控与场景交互的交互保持数据生成
AI总结 提出OmniRetarget引擎,通过交互网格显式建模并保持智能体、地形和物体间的空间与接触关系,将人类运动重定向为机器人运动,生成高质量轨迹以训练强化学习策略,实现长时间跑酷和操控技能。
Comments Project website: https://omniretarget.github.io
高斯差分隐私:机器学习中报告差分隐私保证的方法
AI总结 针对当前机器学习中差分隐私报告不完整的问题,提出使用非渐近高斯差分隐私(GDP)作为主要报告方式,通过数值会计和决策理论度量,证明GDP能无误差地捕获DP-SGD等算法的完整隐私特征。
Comments IEEE SatML 2026 (position paper track)
代码的回归语言模型
AI总结 提出回归语言模型(RLM),利用冻结的大语言模型编码器直接从文本预测代码执行结果(如内存占用、延迟、神经网络精度等),在多个任务上达到高相关度。
Comments Published in International Conference on Machine Learning (ICML) 2026
Moving Out: 基于物理的人机协作
AI总结 提出Moving Out基准测试,模拟物理约束下的协作场景,并开发BASS方法增强智能体多样性及动作理解,实验证明其与未见过的AI和人类均能有效协作。
Comments Accepted at ICML 2026
显式上下文驱动的神经声学建模用于高保真RIR生成
AI总结 提出MiNAF模型,通过查询房间网格并提取距离分布作为显式局部几何特征,引导神经隐式模型生成更准确的房间脉冲响应(RIR),在多项指标上达到竞争性能。
OpenTie: 开放词汇的连续钢筋绑扎系统
AI总结 提出OpenTie,一种无需训练的3D钢筋绑扎框架,通过RGB到点云生成和开放词汇检测实现高精度连续绑扎,优于基于YOLO的方法。
Comments This article is accepted by The 2026 IEEE 22nd International Conference on Automation Science and Engineering (CASE 2026)
Top-Theta注意力:通过补偿阈值稀疏化Transformer
AI总结 提出Top-Theta注意力,一种无需训练的推理时稀疏化方法,通过静态每头阈值保留每行固定数量的重要元素,结合补偿技术实现高稀疏度下的精度保持,在NLP任务中实现3-10倍V-cache减少和高达10倍注意力元素减少,精度下降不超过1%。
Comments Extended version of a paper accepted at ICANN 2026
HeteRo-Select: 信息量作为异构联邦学习中的参与驱动因素
AI总结 提出HeteRo-Select框架,用客户端信息量分数替代带宽驱动压缩,联合决定客户端选择、压缩比和聚合权重,降低异构性并减少流量,在CIFAR-10上实现1.78倍加速和18.2%流量减少。