Graph-Dictionary Signal Model for Sparse Representations of Multivariate Data
图词典信号模型用于多变量数据的稀疏表示
发表机构 * LTS4, EPFL, Lausanne, Switzerland(瑞士洛桑联邦理工学院LTS4实验室)
AI总结 本文提出图词典信号模型,通过图结构描述多变量数据中的关系,利用稀疏组合的图原子进行信号重构,优于现有基线方法。
图词典信号模型用于多变量数据的稀疏表示
发表机构 * LTS4, EPFL, Lausanne, Switzerland(瑞士洛桑联邦理工学院LTS4实验室)
AI总结 本文提出图词典信号模型,通过图结构描述多变量数据中的关系,利用稀疏组合的图原子进行信号重构,优于现有基线方法。
SINDy-RL:可解释且高效的基于模型的强化学习
发表机构 * Department of Mechanical Engineering, University of Washington, Seattle, WA 98195, USA(华盛顿大学机械工程系) ; Data Science and Artificial Intelligence Department, The Aerospace Corporation, El Segundo, CA 90245(航空航天公司数据科学与人工智能部) ; Department of Aeronautics, Imperial College, London SW7 2AZ, United Kingdom(帝国理工学院航空系) ; Department of Applied Mathematics, University of Washington, Seattle, WA 98195(华盛顿大学应用数学系) ; Department of Electrical and Computer Engineering, University of Washington, Seattle, WA 98195(华盛顿大学电气与计算机工程系)
AI总结 本文提出SINDy-RL框架,结合SINDy和DRL,实现低数据下高效、可解释的动力学模型和控制策略,通过基准环境和流体控制实验验证其有效性。
Comments For code, see https://github.com/nzolman/sindy-rl. v2 Update: Included Pinball and 3D Airfoil examples. Christian Lagemann added as an author for contributions with the 3D Airfoil code. To appear in Nature Communications
Journal ref Nat. Commun. 16, 10714 (2025)
Mcity数据引擎:通过开放词汇数据选择实现迭代模型改进
发表机构 * University of Michigan Transportation Research Institute(密歇根大学交通研究所) ; Karlsruhe Institute of Technology(卡尔斯鲁厄理工学院) ; Texas A&M University(德克萨斯A&M大学)
AI总结 本文提出Mcity数据引擎,通过开放词汇数据选择解决大规模未标记数据中长尾类检测难题,提供从数据采集到模型部署的完整数据开发流程。
Comments Accepted for publication at ITSC 2025
不是什么别的吗?利用大语言模型对德国开放式调查回答进行编码:调查动机
发表机构 * Social Data Science & AI Lab, LMU Munich(社会科学与人工智能实验室,慕尼黑大学) ; Munich Center for Machine Learning(慕尼黑机器学习中心) ; University of Maryland, College Park(马里兰大学学院公园分校) ; GESIS – Leibniz Institute for the Social Sciences(莱比锡社会科学研究机构)
AI总结 本文探讨了使用大语言模型对开放式调查回答进行编码的有效性,通过德国调查参与原因的数据,比较了不同LLM和提示方法的性能,发现仅微调的LLM能获得满意预测效果,且分类性能差异影响类别分布。
Comments to appear in Survey Research Methods
Journal ref Survey Research Methods (2025)
一种统一的框架用于在机器学习中强制、发现和促进对称性
发表机构 * AI Institute in Dynamic Systems University of Washington(动态系统人工智能研究所华盛顿大学) ; Sibley School of Mechanical and Aerospace Engineering, Cornell University(机械与航空航天工程学院,康奈尔大学)
AI总结 本文提出统一框架,通过强制已知对称性、发现未知对称性和促进对称性三种方式,将对称性纳入机器学习模型中,基于李导数的数学框架统一了现有结果。
Journal ref J. Mach. Learn. Res. 26(248):1-83 (2025)
面向机器人任务规划的3D grounded视觉-语言框架:自动化提示合成与监督推理
发表机构 * Tsinghua University(清华大学)
AI总结 本文提出融合2D提示合成模块和小语言模型的框架,提升机器人3D场景理解与任务执行能力,实验显示任务成功率高达96.0%。
Journal ref Engineering Applications of Artificial Intelligence, vol. 164, p. 113268, 2026
无需训练的超小模型用于压缩感知中的通用稀疏重建
发表机构 * School of Artificial Intelligence and Automation, Huazhong University of Science and Technology, Wuhan, China(华中科技大学人工智能与自动化学院) ; China Belt and Road Joint Lab on Measurement and Control Technology, Wuhan, China(中国一带一路测量与控制技术联合实验室) ; School of Electric and Electrical Engineering, Chongqing University of Technology, Chongqing, China(重庆理工大学电气工程学院) ; Optics Valley Laboratory, Wuhan, China(光谷实验室) ; School of Water Conservancy and Transportation, Zhengzhou University, Zhengzhou, China(郑州大学水利与交通学院) ; School of Software Engineering, Huazhong University of Science and Technology, Wuhan, China(华中科技大学软件工程学院)
AI总结 本文提出无需训练的超小神经模型CL,实现快速稀疏重建,继承传统迭代方法的通用性和可解释性,提升效率和精度。
基于可微代理的布局前信号完整性设计空间探索的摊销神经优化
发表机构 * Information Processing Lab, Faculty for Electrical Engineering and Information Technology, TU Dortmund(信息处理实验室,电气工程与信息科技学院,图腾大学) ; Pyramide2525, Paderborn, Germany(Pyramide2525,帕德博恩,德国) ; EMC Technology Center Paderborn, Zuken GmbH, Paderborn, Germany(EMC技术中心帕德博恩,Zuken GmbH,帕德博恩,德国)
AI总结 提出摊销神经优化(ANO)框架,利用可微神经网络代理模型替代迭代黑盒优化,实现单次前向传播获取近最优设计参数,在DDR5 DFE、SerDes均衡等场景中加速三到四个数量级。
Comments 16 pages, 20 figures, 8 tables
合成病灶MR图像在低数据场景下自动局灶性皮质发育不良检测中的影响
发表机构 * Computational Radiology Laboratory(计算放射学实验室) ; Boston Children’s Hospital(波士顿儿童医院) ; Harvard Medical School(哈佛医学院)
AI总结 本研究通过条件生成网络合成FCD病灶MRI数据,评估其真实性及对自动检测的影响,发现合成数据可减少约20%标注需求,但真实数据仍更有效。
超越后向散射:来自检测SAR图像的InSAR相干性
发表机构 * Department of Aerospace Engineering, University of the Bundeswehr Munich(联邦国防军 Munich航空航天工程系) ; Microwaves and Radar Institute, German Aerospace Center (DLR)(德国航空航天中心 (DLR) 微波与雷达研究所)
AI总结 提出一种深度学习框架,直接从检测SAR图像回归相干性,无需精确配准,使用Residual U-Net学习后向散射幅度与相干性的关系,在多种数据集上验证了高分辨率相干性回归的准确性提升和泛化能力。
Comments 27 pages, 20 figures
评估音视频语音识别器的真正泛化能力
发表机构 * Trinity College Dublin(都柏林三一学院) ; Imperial College London(伦敦帝国理工学院)
AI总结 通过构建与LRS3测试集严格匹配的评估集,发现当前最先进的音视频语音识别模型在未见数据上性能全面崩溃,揭示了其泛化能力不足,并分析了退化原因、词汇偏差和错误模式。
Comments Accepted to Interspeech 2026 Long paper track. 9 pages, 4 figures
超越普遍性:GCC-FER数据集及面向动态面部表情识别的文化感知适应
发表机构 * Department of Electrical Engineering, Indian Institute of Technology Delhi, India(印度理工学院德里分校电子工程系) ; Department of Computer Science and Engineering, Indian Institute of Technology Indore, India(印度理工学院印尔德分校计算机科学与工程系) ; Department of Psychology, COEP Technological University, India(COEP技术大学心理学系)
AI总结 针对动态面部表情识别中文化差异被忽视的问题,提出首个大规模全球跨文化数据集GCC-FER,并设计文化感知适应系统CA-FER,通过自适应校准面部表示减轻文化偏差,实验证明其有效性。
DaX: 跨尺度的通用病理学表示学习
发表机构 * DAMO Academy, Alibaba Group(达摩院,阿里巴巴集团) ; Institute of Automation, Chinese Academy of Sciences(中国科学院自动化研究所) ; Hupan Lab(虎斑实验室)
AI总结 提出病理视觉基础模型DaX,通过改进DINOv3自监督学习,结合连续放大训练、跨尺度组织视图等设计,在44个公开数据集的161项临床任务上取得最佳平均性能。
SpectCount: 通过合成信号进行频谱时间计数改进大型音频语言模型
发表机构 * Department of Electrical and Computer Engineering and INMC, Seoul National University, Seoul, South Korea(电气与计算机工程系和INMC,首尔国立大学,首尔,韩国)
AI总结 针对大型音频语言模型在频谱时间感知上的弱点,提出SpectCount方法,利用动态生成的完全合成音频信号进行数据高效微调,无需真实音频或标注,显著提升多种听觉基准性能。
Comments 5 pages, 5 figures
SAR图像中飞机目标的物理驱动语义散射结构理解
发表机构 * School of Information and Electronics, Beijing Institute of Technology(信息与电子学院,北京理工大学) ; National Key Laboratory of Science and Technology on Space-Born Intelligent Information Processing(空间智能信息处理国家级重点实验室) ; Beijing Institute of Remote Sensing Information(遥感信息北京市研究院)
AI总结 针对SAR图像中飞机目标散射中心表示不稳定、弱散射部件缺失的问题,提出物理驱动框架S3U-SAR,通过定义语义散射关键点并利用多维物理先验约束,实现完整拓扑结构重建,在基准数据集上取得最优性能。
SEAM:面向面试防护栏的脚本化与自发语音的快捷方式感知实时检测
发表机构 * Symbal AI ; Princeton University(普林斯顿大学)
AI总结 提出SEAM框架,通过统一预处理、接缝感知采样、非语音增强和紧凑DistilHuBERT骨干,在8秒窗口下实现0.971 ROC-AUC,并揭示快捷方式学习问题。
Comments Accepted to Interspeech 2026
BiEAR: 一种受人类听觉启发的自适应双耳前端,用于多说话人定位和距离估计
发表机构 * The University of New South Wales(新南威尔士大学) ; Tongyi Speech Lab, Alibaba Group(通义语音实验室,阿里巴巴集团) ; School of Artificial Intelligence, The Chinese University of Hong Kong, Shenzhen(人工智能学院,香港中文大学(深圳))
AI总结 提出受人类听觉启发的自适应双耳前端BiEAR,通过神经控制器动态调整滤波器组频率选择性,提升多说话人定位和距离估计的准确性与鲁棒性。
Comments Accepted to INTERSPEECH 2026
基于神经缩放定律的超声心动图心肌分割与灌注量化的计算最优网络设计
发表机构 * Department of Bioengineering, Imperial College London(生物工程系,帝国理工学院伦敦分校) ; National Heart and Lung Institute, Imperial College London(国家心脏和肺 institute,帝国理工学院伦敦分校) ; Guy’s and St. Thomas’ NHS Foundation Trust(圣泰莫斯国家健康服务信托基金)
AI总结 应用神经缩放定律预测心肌分割性能,在CAMUS和CEUS数据集上确定最优网络大小,实现参数减少240倍且性能达最优,自动分割在心肌灌注量化中与资深心脏病专家等效。
Comments 15 pages, 4 figures, 5 tables, journal
ErA:用于单图像散焦去模糊的误差感知深度展开网络
发表机构 * KC Machine Learning Lab(KC机器学习实验室)
AI总结 提出ErA网络,通过联合学习紧凑核基和逐像素权重,并利用增广拉格朗日展开中的误差感知项交替更新和ResUNet去噪器校正核估计误差,在多个数据集上达到最优性能。
基于视觉基础模型的注意力一致纵向医学视觉问答
发表机构 * University of California, San Diego(加州大学圣地亚哥分校) ; Yale Biomedical Imaging Institute(耶鲁大学生物医学成像研究所)
AI总结 提出一种注意力引导的编码器-解码器框架,通过轻量级配准和自适应掩码生成,结合辅助损失函数,实现胸部X光片的纵向医学视觉问答,在Medical-Diff-VQA基准上取得优异性能。
Comments Accepted to CVPR 2026 Workshop PHAROS-AIF-MIH
Journal ref Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) Workshops, 2026, pp. 6448-6458
基于物理引导深度学习的先进洪水预测:结合UNet、FNO与SAR/光学影像
发表机构 * National Center for Atmospheric Research (NCAR)(国家大气研究中心)
AI总结 提出物理引导深度学习框架,融合多模态遥感与浅水方程约束,通过UNet-FNO混合架构实现高精度洪水预测,IoU达0.82,F1达0.90。
Comments This paper has been accepted for publication in the Proceedings of the IEEE Radar Conference (RadarConf 2026). The final authenticated version will be available through IEEE Xplore
在有限标签下哪些解剖结构重要?用于心脏病理预测的数据高效解剖感知基准
发表机构 * Himanshu Singh(希曼斯·辛格)
AI总结 针对有限标签和计算资源下的医学影像问题,提出解剖感知基准,通过比较不同解剖结构表示和分类器,发现表示质量比模型复杂度更重要。
Comments ACCEPTED at ICML 2026 Workshop GlobalSouthML (Seoul, South Korea; PMLR 306, 2026)
通用干预下的自动、去偏和不变反事实生成
发表机构 * Cornell Tech(康奈尔科技) ; Cornell University(康奈尔大学) ; Department of Biostatistics, Department of Population Health(生物统计学系、人口健康系) ; New York University Grossman School of Medicine(纽约大学格罗斯曼医学院)
AI总结 提出ADIGen框架,结合Riesz回归、因果不变性和正交统计学习,实现通用干预下反事实生成的自动、去偏和不变性,并提供过剩风险界。
信号交叉口弱势道路使用者安全的集成路边感知与通信框架
发表机构 * Department of Civil, Environmental and Construction Engineering, University of Central Florida(中央佛罗里达大学土木、环境与建设工程系)
AI总结 提出集成多模态感知、边缘计算、V2X/P2X通信和自适应信号控制的框架,基于公开数据集R-LiViT分析53,319个标注,发现VRU占49%、昼夜密度差异大、近距离事件变化10倍、83%行人边界框小,支持多模态感知和自适应部署。
Comments 17 pages, 5 figures, 2 tables. Preprint
深度单指标弗雷歇回归
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 提出DeSI框架,通过深度神经网络估计单指标方向,在度量空间中进行弗雷歇回归,缓解维数灾难并保持可解释性,理论保证收敛率,在分布、网络等数据上表现优异。
超越有界差分的稳定性:有限 $L_p$ 矩下的尖锐泛化界
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 针对重尾或无界损失,提出仅需有限 $L_p$ 矩条件的稳定性框架,导出尖锐高概率泛化界,覆盖经验风险最小化、转导回归和元学习。
训练任务多样性对上下文学习的影响:基于低维子空间的视角
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; University of Washington(华盛顿大学) ; University of California, Los Angeles(加州大学洛杉矶分校) ; Stanford University(斯坦福大学) ; University of Toronto(多伦多大学)
AI总结 本文通过低秩高斯混合模型分析训练任务多样性(由子空间非重叠列数定义)如何提升线性注意力上下文学习的泛化与优化,解释训练多样性缩短学习平台期及实现分布外泛化的现象,并扩展至非线性场景。
经验转移算子与含噪扩张区间映射的有限样本变化检测
发表机构 * Department of Mathematics and Statistics, Concordia University(数学与统计学系,康科迪亚大学)
AI总结 针对一维含噪动力系统,提出基于分区经验转移矩阵的有限样本变化检测方法,通过比较滑动窗口与基线段的平稳分布L1距离来检测不变密度变化,并给出有限样本界和误报保证。
Comments 27 pages, 2 tables, 1 figure
深度神经网络的泛化:梯度方法的极小化最优速率
发表机构 * Mathematical Institute for Machine Learning and Data Science, Catholic University of Eichstätt-Ingolstadt(机器学习与数据科学数学研究所,埃施特哈特-因戈尔施塔特天主教大学) ; Department of Computer Science, RPTU Kaiserslautern-Landau(计算机科学系,凯斯莱特恩-兰道大学) ; Department of Mathematics, The University of Hong Kong(数学系,香港大学) ; School of Mathematics and Statistics, The University of Sydney(数学与统计学学院,悉尼大学)
AI总结 本文建立了过参数化深度神经网络与核方法学习动力学的联系,证明了梯度下降和随机梯度下降在足够宽度下能达到极小化最优泛化误差。
Comments 37 pages
深度神经网络梯度下降方法的泛化最优速率
发表机构 * Mathematical Institute for Machine Learning and Data Science, KU Eichstätt-Ingolstadt(机器学习与数据科学数学研究所,埃施特哈特-英戈尔施塔特大学) ; Department of Computer Science, RPTU Kaiserslautern-Landau(计算机科学系,凯撒斯劳滕-兰道大学) ; Department of Mathematics, University of Hong Kong(数学系,香港大学) ; School of Mathematics and Statistics, University of Sydney(数学与统计学学院,悉尼大学)
AI总结 本文针对深度ReLU网络,在神经正切核(NTK)机制下,首次建立了梯度下降(GD)和随机梯度下降(SGD)的极小化最优泛化误差速率,证明宽度足够时可达核方法的最优速率。
Comments 39 pages, 1 table