A Theory on Flow Matching with Neural Networks
基于神经网络的流匹配理论
AI总结 本文为神经网络参数化的条件速度场流匹配建立了理论基础,证明了过参数化两层ReLU网络中梯度下降的收敛性,推导了条件速度场匹配目标的泛化界,并提供了生成样本的Wasserstein距离保证。
基于神经网络的流匹配理论
AI总结 本文为神经网络参数化的条件速度场流匹配建立了理论基础,证明了过参数化两层ReLU网络中梯度下降的收敛性,推导了条件速度场匹配目标的泛化界,并提供了生成样本的Wasserstein距离保证。
可解释的时序面部区域运动分析用于野外帕金森病视频分类
AI总结 提出基于面部区域关键点的时序运动描述符,在YouTubePD基准上实现轻量级且可解释的PD视频分类,平衡准确率达0.826。
Comments 22 pages, 6 figures. Submitted to Biomedical Signal Processing and Control
CodeAlchemy:大规模合成代码重写
AI总结 提出CodeAlchemy框架,通过5种策略生成超过500B token的合成代码数据,引入DevEval和TraceEval基准,3B模型在多项任务上超越10倍大小的前沿模型。
AI辅助优化下的探索响应性与适应性刚性
AI总结 本文提出AI辅助优化下的探索适应理论,通过动态框架分析预测辅助如何影响系统探索响应性,揭示收敛预测机制导致适应性降低、刚性增强,而探索增强机制则促进适应性。
CTF-4-Science Lorenz基准的分治建模策略
AI总结 提出分治建模策略,针对CTF-4-Science Lorenz基准的五个场景族分别设计模型,通过平滑去噪、NG-RC/NVAR预测、Lorenz过渡校正和参数前缀混合,以79.63分证明场景特定更新优于通用模型。
VFUSE: 基于稀疏自编码器的毒力特征理解
AI总结 提出VFUSE方法,通过训练稀疏自编码器(SAE)分析扩散-Transformer模型激活,识别蛋白质设计中的危险特征,实现可解释性提升而不牺牲性能。
时序层神经网络与动态正交传输
AI总结 提出时序层神经网络(TSNN),通过动态正交帧和局部坐标系间显式传输实现时序链接预测,在多种基准上超越现有方法,尤其适用于节点角色异质性强的图。
高维超参数优化的重要性感知调度
AI总结 提出GIF方法,通过小样本预热估计超参数重要性,按重要性分组并比例分配试验,保留全空间回退,在高维基准上优于TPE等方法,提升采样效率。
Comments 8 pages, 5 figures. Accepted to IJCNN 2026
公共医学视觉语言基准中预训练污染的受控审计
AI总结 审计发现公共医学VLM基准存在图像源重叠和文本规范顺序交换性信号,但确认的像素级重复罕见,且现有成员推理检测器在小规模医学VLM队列中不可靠。
Comments 30 pages, 7 figures, 9 tables. Preprint
Bittensor 智能体竞技场作为轨迹基元:从 ShoppingBench 子网轨迹中蒸馏购物智能体
AI总结 针对小模型后训练缺乏多轮轨迹数据的问题,利用 Bittensor 子网 SN15 的竞技机制生成激励对齐的轨迹,通过结构质量过滤提取智能体轨迹,后训练 Qwen3-4B 模型在 ShoppingBench 上达到 42.7% ASR,接近合成数据基线。
Comments 10 pages, 4 figures, Data and Models available at: https://huggingface.co/collections/oro-ai/shoppingbench-sn15-trajectory-primitive
基础模型智能体中的部署时记忆
AI总结 研究基础模型智能体在部署时记忆的设计选择如何影响个性化效用、提取风险和删除保真度,提出遗忘残差分数并揭示压缩与删除的权衡。
Comments 4 pages, ICML MemFM 2026 Workshop
BenSyc: 孟加拉语上下文中大语言模型对话谄媚与人类对齐的基准测试
AI总结 提出BenSyc基准,基于孟加拉语社交数据构建五级标注集,评估15+模型在对话对齐分类与生成任务上的表现,发现前沿模型在区分共情与强化性认可上仍存在困难。
商业世界模型
AI总结 提出商业世界模型(BWM)架构,将世界模型思想应用于商业环境,通过编码状态、动态、约束和目标,支持自主决策与规划。
使用悬挂托盘的机器人非抓取式物体运输
AI总结 针对机器人服务员问题,提出使用绳索悬挂托盘实现三维摆运动,仅需3自由度移动基座即可减少滑动和泼洒,实验验证了有效性并集成到交互演示中。
Comments 8 pages, 11 figures. IEEE/ASME International Conference on Advanced Intelligent Mechatronics, 2026
用稀疏自编码器解释和引导文本转语音语言模型
AI总结 本文在CosyVoice3语言模型骨干上训练BatchTopK稀疏自编码器,发现特征可解释且因果可控,能操纵笑声、性别和语速。
GHOST: 用于泛化机器人操作的层次化子目标策略
AI总结 提出GHOST框架,通过将控制分解为高层子目标预测和低层目标条件控制器,实现视觉运动操作策略的泛化,并利用人类演示适应新物体和任务变化。
Comments Accepted at RSS 2026
SpineReport: MRI上腰椎退变的自动化3D量化与报告
AI总结 提出SpineReport开源框架,利用鲁棒解剖分割从腰椎MRI中提取3D形态和信号特征,生成个体化报告,在中央管狭窄评估中AUC达0.95。
Comments Submitted to Medical Image Analysis
广义CVO:基于二阶黎曼优化的快速无对应局部点云配准
AI总结 提出一种基于几何表面结构和再生核希尔伯特空间嵌入的无对应局部点云配准方法,采用二阶流形优化实现高达10倍加速,在LiDAR和RGB-D跟踪及物体配准中显著降低漂移并提升鲁棒性。
Comments 16 pages, 12 figures
ABot-Earth 0.5:生成式3D地球模型
AI总结 提出ABot-Earth 0.5框架,利用3D高斯泼溅从卫星图像生成大规模无缝3D环境,每平方公里合成时间低于10分钟,支持实时交互可视化,降低3D重建成本。
Comments From Amap-cvlab, Alibaba. Official page: https://abot-earth.amap.com/
RespiraMFM:一种用于呼吸道疾病识别的对比音频-语言对齐多模态基础模型
AI总结 提出RespiraMFM多模态基础模型,通过对比音频-文本对齐策略整合呼吸音与临床信息,在监督和零样本任务中分别提升AUROC 9.15%和20.98%。
Comments ACL 2026 Main Conference
FSQ 令牌在分类数据连续扩散中的最优性及其在文本到语音中的应用
AI总结 本文研究连续扩散模型中离散令牌的潜在空间结构,通过理论分析和实验证明 FSQ 令牌化方案在分类数据连续扩散中最优,并在文本到语音任务中验证其优于基于 LLM 的方法。
3SPO: 面向LLM智能体的状态分数监督策略优化
AI总结 提出3SPO算法,通过动态状态分数监督实现逐步骤策略优化,解决多轮智能体任务中奖励稀疏和信用分配问题,在ALFWorld和WebShop上分别比GRPO提升22.6%和15.6个百分点。
HydraCIL: 通过原型引导的多头分类器实现解耦的类增量学习
AI总结 提出HydraCIL模型,通过冻结主干网络、解耦特征提取与学习,并利用原型相似性选择任务特定分类头,在资源受限环境中实现高效类增量学习,匹配或超越现有方法同时大幅降低训练时间和碳排放。
Comments Accepted for publication at the International Joint Conference on Neural Networks (IJCNN 2026)
面向高强度降雨的季节感知降水临近预报的时间上下文条件化
AI总结 提出TA-SmaAt-UNet模型,通过时间条件层(昼夜和季节循环编码)增强雷达降水临近预报,显著提升高强度降雨事件的预测性能。
Comments 9 pages, 6 figures
混合交通环境下自动驾驶的不确定性感知运动规划
AI总结 提出不确定性感知运动规划(UAMP),通过量化人类意图不确定性并引入不确定性校准值学习,提升自动驾驶在混合交通中的安全性和舒适性。
归一化选择对因果大规模时间序列模型重要吗?
AI总结 研究因果大规模时间序列模型中不同归一化策略对训练收敛和预测性能的影响,发现归一化选择显著影响模型效果。
注意力的哈斯图:设计Transformer掩码的偏序框架
AI总结 本文提出一个理论框架,证明多层Transformer的信息流收敛到哈斯图,并将并行训练任务设计转化为求哈斯图最小公共超图问题,由此导出两种新注意力掩码。
Comments 21 pages, 9 figures. Theoretical framework for attention mask design; no experiments included
学习何处模拟:在线PDE代理训练的生成式主动采样
AI总结 提出在线生成式主动采样(OGAS),通过扩散模型学习配置参数与代理性能的关系,主动采样高难度区域,显著降低尾部分布误差,提升代理最坏情况可靠性。
交叉编码器特征间的交互:一个紧凑证明的视角
AI总结 本文从紧凑证明角度形式化交叉编码器特征交互,提出交互度量并应用于计算稀疏性、语义聚类和检测休眠代理。
Comments Accepted at the NeurIPS 2025 Workshop on Mechanistic Interpretability
RKSC:面向多步LLM推理的感知推理的KV缓存共享与自信提前退出
AI总结 提出RKSC框架,通过注意力相似性KV共享、置信门控提前退出和推理选择性块缓存管理,消除多分支LLM推理中的结构冗余,实现平均3.008倍加速,错误率仅0.37%。
Comments Accepted to the ICML 2026 Workshop on Statistical Frameworks for Uncertainty in Agentic Systems