G-STAR: End-to-End Global Speaker-Tracking Attributed Recognition
G-STAR: 端到端全局说话人跟踪属性识别
AI总结 提出G-STAR框架,通过缓存条件说话人跟踪模块与Speech-LLM转录骨干耦合,实现长时重叠多说话人语音的端到端说话人属性识别,支持组件优化和联合训练,在局部和全局评估中均表现优异。
Comments submitted to Emnlp 2026
G-STAR: 端到端全局说话人跟踪属性识别
AI总结 提出G-STAR框架,通过缓存条件说话人跟踪模块与Speech-LLM转录骨干耦合,实现长时重叠多说话人语音的端到端说话人属性识别,支持组件优化和联合训练,在局部和全局评估中均表现优异。
Comments submitted to Emnlp 2026
KernelCraft: 面向新兴硬件的近底层内核生成的智能体基准测试
AI总结 提出KernelCraft基准,通过函数调用和反馈驱动的工作流评估LLM智能体为新兴加速器生成和优化底层内核的能力,在多个任务上验证其能快速生成正确且高效的内核。
基于整流流的胶质瘤患者放疗前先验信息治疗后脑MRI预测
AI总结 提出一种基于整流流的条件图像生成模型,利用放疗前MRI和剂量图预测治疗后任意时间点的脑MRI,实现快速推理并保持语义和视觉保真度。
Comments 10 pages, 6 figures, 1 supplementary table, added GitHub url, corrected figure captions
NGDBench:迈向神经图数据管理
AI总结 针对现有数据管理系统在噪声、不完整和动态更新下缺乏隐式结构发现和推理能力的问题,提出NGDBench基准,通过统一结构化与非结构化来源的图视图,评估神经查询方法在噪声和动态状态跟踪中的表现。
环境AI监管的全球格局:从推理成本到绿色AI权利
AI总结 本文通过实证证据、全球监管地图和政策建议,揭示了生成式AI日益增长的环境成本,并提出模型级透明度、用户选择权和国际协调的三管齐下应对方案。
Comments 23 pages, 1 table, preprint
重新审视 Bertrand 悖论:通过无遗憾学习者的均衡分析
AI总结 本文通过无遗憾学习者的重复博弈模型,分析 Bertrand 定价博弈中高价格均衡出现的条件,并比较外部遗憾与交换遗憾对竞争行为的影响。
Comments 36 pages, 34 figures
HistCAD:一种约束感知的基于参数化历史CAD表示、数据集和具有工业复杂性的基准
AI总结 提出HistCAD表示标准、数据集和基准,通过显式约束记录草图、特征和操作,实现可编辑的参数化CAD序列生成与评估。
量化扩散模型中的误差传播与模型崩溃
AI总结 本文理论分析了基于分数的扩散模型中递归训练导致模型崩溃的误差传播机制,给出了生成分布与目标分布之间累积散度的上下界,并刻画了不同漂移区域。
Comments Accepted at ICML 2026
DTBench:文档到表格提取的合成基准
AI总结 提出DTBench合成基准,通过反向Table2Doc范式和多智能体合成流程生成文档,系统评估LLM在文档到表格提取中的多种能力。
Comments KDD26
通过风险厌恶实现可证明收敛的MARL演员-评论家算法
AI总结 针对无限时域一般和马尔可夫博弈,提出基于风险厌恶分位数响应均衡(RQE)的单时间尺度演员-评论家算法,利用RQE的正则性证明全局收敛并给出有限样本保证。
记忆是有益还是有害?先验信息设定阈值
AI总结 在过参数化线性模型和贝叶斯框架下,研究先验分布如何决定训练误差与泛化误差的关系,给出记忆必要或过拟合有害的条件。
Comments 33 pages, 3 figures. Accepted to the Conference on Learning Theory (COLT) 2026
你能长多远?表征材料科学中图生成模型的外推前沿
AI总结 提出RADII基准,通过半径分辨的纳米粒子结构评估晶体生成模型的外推能力,发现模型在训练半径外误差增加,且外推前沿可预测。
多智能体团队阻碍专家发挥
AI总结 研究自组织多智能体LLM团队在无约束协调下无法匹配专家性能,发现整合妥协行为是主要瓶颈,导致性能损失高达41.1%。
Comments Accepted at the International Conference on Machine Learning (ICML 2026)
拉取请求作为仓库级代码编辑的训练信号
AI总结 提出Clean-PR方法,利用真实GitHub拉取请求作为训练信号,通过重建和验证转换为搜索/替换编辑块,结合无代理对齐的监督微调,在SWE-bench上显著提升仓库级代码编辑性能。
Comments Accepted at ICML 2026
泊松梯度估计的旅行者指南
AI总结 本文系统比较了指数到达时间模拟和Gumbel-SoftMax松弛两种方法,提出改进的EAT方法以降低偏差,并在泊松潜变量模型上验证其优越性能。
Comments Published at ICML2026 --- code: https://github.com/hadivafaii/PoissonGradientEstimation
面向视觉的语义通信综述:分类、框架、使能技术与应用
AI总结 本文系统综述了面向视觉数据语义通信(SemCom-Vision)的方法,基于语义量化方案将现有方法分为语义保持、语义扩展和语义精炼三类,并总结了基于机器学习的编解码模型、训练算法及知识利用策略。
误差放大限制了连续控制中的ANN到SNN转换
AI总结 针对连续控制中ANN到SNN转换性能差的问题,提出跨步残差电位初始化(CRPI)机制,通过抑制时间相关误差恢复性能。
Comments Accepted by ICML2026
自适应步长的约束优化随机可行性方法
AI总结 提出一种结合Polyak步长和随机约束采样的自适应步长随机可行性算法,用于解决强凸或一般凸目标函数下的约束优化问题,并证明线性收敛或O(1/√T)最坏情况速率。
从局部高斯到全局平面波:眨眼间的周期电荷密度
AI总结 提出ELECTRAFI模型,利用实空间各向异性高斯的解析傅里叶变换和泊松求和公式,通过单次逆FFT快速重建周期电荷密度,在保持高精度的同时速度提升高达633倍。
Comments ICML 2026, 29 pages including appendix, 11 Figures, 7 tables
不完全信息博弈中的一致对手建模
AI总结 针对不完全信息博弈中现有对手建模方法无法保证收敛到对手真实策略的问题,提出一种基于序列形式博弈表示和投影梯度下降的凸优化算法,实现高效且一致的对手建模。
MatchFixAgent: 语言无关的自主仓库级代码翻译验证与修复
AI总结 提出基于大语言模型的多智能体框架MatchFixAgent,实现语言无关的仓库级代码翻译等价性验证与修复,在验证覆盖率和修复成功率上显著优于现有方法。
Comments Published in ICML 2026
条件覆盖诊断用于共形预测
AI总结 提出将条件覆盖估计转化为分类问题,通过超额风险度量(ERT)来诊断共形预测的条件覆盖偏差,实验表明使用现代分类器比传统指标具有更高的统计功效。
面向工具变量回归的结果感知谱特征学习
AI总结 针对存在隐藏混杂因素的非参数工具变量回归问题,提出一种通过最小化基于增广算子的对比损失来学习结果感知谱特征的方法,以缓解谱错位导致的因果函数表示不足问题。
Comments ICML 2026
迈向人性化的社交媒体生态系统:面向安全、自主与福祉的AI增强人机交互设计模式
AI总结 提出Human-Layer AI(HL-AI)框架,通过浏览器端用户拥有的可解释中介,在不依赖平台合作的情况下赋予用户实时控制权,实现内容重写、完整性检测、信息流定制、行为中断和恢复模式等五种设计模式,以提升社交媒体安全性与用户福祉。
Comments 6 pages, 5 tables, 7 figures, and 2 algorithm tables. Accepted at International Conference on Signal Processing, Information, Communication and Systems (SPICSCON 2025)
超越听觉:通过生理学启发的标记化从耳机学习任务无关的ExG表示
AI总结 提出一种基于耳机的生理学启发的多频带标记化方法(PiMT),通过无干扰的日常ExG数据采集和重建任务学习鲁棒表示,实现跨多种任务(包括五种人类感官)的通用ExG监测。
Comments Accepted to ICLR 2026
LLMs 依赖先验而非编程语言语义
AI总结 通过 PLSemanticsBench 基准测试,发现前沿大语言模型在程序执行任务中依赖预训练统计规律而非形式语义规则,语义变异和结构复杂度导致准确率大幅下降。
Comments Accepted at ICML 2026
GEM-Bench:生成引擎营销中广告注入响应生成的基准测试
AI总结 针对生成引擎营销中广告注入响应生成缺乏专门基准的问题,提出首个综合基准GEM-Bench,包含多场景数据集、多维度指标和基线方案,实验表明简单提示方法虽能提升点击率但降低用户满意度,而基于预生成无广告响应的插入方法可缓解此问题但增加开销。
Comments Technical Report
流形上的动态局部Fréchet曲线回归
AI总结 本文在可分离希尔伯特空间中推导了响应和回归变量的最小二乘局部线性Fréchet曲线预测器,并提出了基于加权Fréchet均值的流形内蕴局部线性Fréchet曲线预测器,证明了其渐近最优性。
Comments This paper is currently under journal second revision
多通道重放语音检测的声学仿真框架
AI总结 提出一个利用公开资源模拟多通道重放语音配置的声学仿真框架,训练M-ALRAD检测器并扩展其利用通道间相位差特征,在无真实训练数据下于ReMASC语料库上评估泛化能力。
Comments Submitted to IEEE MMSP 2026
用于线性统计模型的快速随机草图化序贯最小二乘估计器
AI总结 提出一种融合草图-求解与迭代草图方法的序贯最小二乘估计框架,通过逐步增大草图尺寸迭代求解子问题,高效获得高精度参数估计。