Mercer Large-Scale Kernel Machines from Ridge Function Perspective
从岭函数视角出发的Mercer大规模核机
AI总结 本文从岭函数视角出发,研究大规模核机的Mercer性质,探讨了通过余弦函数的乘积之和近似核函数的可行性,并分析了该方法的障碍,应用于图像处理中的'一对一'方法。
Comments 17 pages, 3 figures
从岭函数视角出发的Mercer大规模核机
AI总结 本文从岭函数视角出发,研究大规模核机的Mercer性质,探讨了通过余弦函数的乘积之和近似核函数的可行性,并分析了该方法的障碍,应用于图像处理中的'一对一'方法。
Comments 17 pages, 3 figures
隐式生成建模的分数差流
AI总结 本文提出分数差流作为隐式生成建模的一种新方法,通过最优减少两个分布之间的KL散度,展示了其与去噪扩散模型的等价性,并揭示了生成对抗网络训练中隐含的数据优化子问题与分数差流之间的联系。
Comments 25 pages, 5 figures, 4 tables. Updated final version of a paper originally published in Transactions on Machine Learning Research (TMLR), including minor typographical corrections and post-publication commentary connecting the SD flow to drifting models
深度学习应用于计算力学:综述、现状和经典方法
AI总结 本文综述了深度学习在计算力学中的应用,包括固体力学、流体力学和有限元技术,并讨论了混合和纯机器学习方法在解决非线性偏微分方程中的作用,同时介绍了LSTM、注意力机制和核方法等技术。
Comments 275 pages, 158 figures. Appeared online on 2023.03.01 at CMES-Computer Modeling in Engineering & Sciences
PREF: 用于紧凑神经表示的相位嵌入场
AI总结 本文提出了一种高效的基于频率的神经表示PREF,通过引入覆盖显著边谱的相位体积,结合快速傅里叶变换和局部插值加速傅里叶映射,从而减少频率表示中的成本MLP,提升效率和可解释性。
通过卷积神经网络和数据增强进行新冠肺炎咳嗽声诊断
AI总结 本文提出利用卷积神经网络和数据增强技术,对DiCOVA 2021挑战赛Track 1中的咳嗽声数据集进行分析,以实现新冠肺炎的诊断,通过改进模型在盲测集上的AUC分数达到87.07,并超越了挑战赛的基线模型。
Comments DiCOVA, top 1st, This work has been submitted to the IEEE for possible publication
基于AI的独立施工安全结果的属性预测
AI总结 本文改进并验证了先前研究中通过机器学习从属性中预测安全结果的方法,使用NLP提取属性并训练模型预测伤害严重性、类型、受影响身体部位和事件类型,通过独立人工标注消除潜在的人工相关性,结果表明属性仍具有高度预测性,同时引入了更大的数据集、新模型、模型堆叠和更合适的评估指标,最终成功预测伤害严重性,这是重大进展。
Comments Added author contributions and journal reference, updated corresponding author, fixed a few typos
从文本自动学习事故前兆
AI总结 本文研究了如何利用建设行业数字记录的安全报告,通过比较几种深度学习方法自动学习事故前兆,以提高对安全事故的理解和学习能力。
Comments Added author contributions and journal reference, updated corresponding author
OpenSeisML: 开放式大规模真实地震和井历数据集用于生成式AI
AI总结 本文提出OpenSeisML,一个开放的大型真实地震和井历数据集,用于支持生成式AI在地震反演中的应用,通过自动化数据整理流程提供可重复的地震数据准备,以训练生成模型捕捉地下属性的统计分布,从而生成多个统计上一致的现实实现用于不确定性量化。
Comments 5 pages, 8 figures
连续分割下的联合非平稳性
AI总结 本文研究了在联合非平稳性条件下连续语义分割的问题,提出了一种基于梯度适应稳定机制和半监督学习的方法,以应对数据分布漂移带来的不稳定性和过拟合问题,并在多种场景下验证了方法的有效性。
Biomedical NER和实体链接基准测试测量什么?一种以语料库为中心的诊断框架
AI总结 本文提出一种以语料库为中心的诊断框架,用于分析生物医学NER和实体链接基准测试的相关属性,揭示语料库特性对评估信号、泛化需求和基准测试结论范围的影响。
Comments Accepted to the ACL 25th Workshop on Biomedical Language Processing
HADS-Net:一种融合注意力增强的双流网络,用于乳腺超声图像分类
AI总结 本文提出HADS-Net,一种融合注意力增强的双流网络,通过两个并行路径利用全局纹理和局部边界线索,结合物理信息增强,以提高乳腺超声图像分类的准确性。
Comments 7 pages, 4 figures
通过子空间追求轴心化神经网络
AI总结 本文提出一个基于几何公理的框架,用于解释神经网络的行为,通过子空间追求假设,统一了表示、计算和泛化在浅层和深层架构中的视角。
Comments 43 pages, 25 figures. Code and additional materials will be released
Ada2MS: 一种基于元素级和全局二阶矩估计指数混合的混合优化算法
AI总结 本文提出Ada2MS算法,通过连续指数插值元素级和全局二阶矩估计,平衡AdamW和动量SGD的优缺点,在视觉任务中取得竞争性结果。
词组关联性:人类和神经网络中主谓一致学习的一种假设
AI总结 本文探讨了语言输入中的统计信号如何帮助语法习得,提出词组关联性假设,通过词组共现规律提供句法依赖线索,并验证该机制在英语主谓一致习得中的有效性。
Comments Accepted to CoNLL
NeuroQA: 一种大规模的3D脑部MRI理解图像 grounded 评估基准
AI总结 本文提出NeuroQA,一个大规模的3D脑部MRI视觉问答基准,包含来自12977名受试者的56953个问答对,涵盖5-104岁及五个临床领域,通过3D体积评估11种临床推理技能,并提供可复现的生成脚本和在线排行榜。
Comments 30 pages, dataset and benchmark release
机器学习增强的非侵入性测试用于MASLD纤维化:浅层-深层神经网络与FIB-4、表格基础模型和大语言模型的比较
AI总结 本文研究了机器学习增强的非侵入性测试在MASLD纤维化检测中的应用,比较了浅层-深层神经网络、FIB-4、表格基础模型和大语言模型在不同队列中的性能,发现浅层-深层神经网络在保持FIB-4变量空间的同时提供了更平衡的外部操作性能。
Comments 26 pages, 4 figures, 3 tables. Preprint
基于二次近似的指数机制用于具有隐私保障的机器学习模型微调
AI总结 本文提出一种基于指数机制的随机算法,用于在保证差分隐私的前提下微调预训练模型,通过结合局部二次近似和新数据集信息构建效用函数,并引入随机投影策略提升高维模型的可扩展性。
面向前沿AI能力的开放世界评估
AI总结 本文提出开放世界评估作为一种补充方法,通过小样本定性分析来评估长期、复杂、现实世界任务,以更准确地衡量AI能力,并介绍了CRUX项目作为定期进行此类评估的尝试。
在线腐蚀反馈下的符合预测
AI总结 本文研究了在存在腐蚀反馈的情况下在线符合预测的鲁棒性问题,提出两种鲁棒方案并通过实验验证了其在腐蚀反馈下的改进性能。
ShadeBench: 一个用于可持续社会建筑阴影模拟的基准数据集
AI总结 本文提出ShadeBench,一个用于城市阴影理解的综合数据集和基准,通过多模态数据支持阴影生成、分割和3D建筑重建,并提供标准化评估协议和基线方法,为数据驱动的城市气候研究和热适应城市规划提供基础。
Comments 12 pages, 13 figures, 2 tables. Accepted by KDD 2026 AI for Sciences Track
通过言语反馈强化人类行为模拟
AI总结 本文提出DITTO模型,通过将言语反馈作为强化学习中的首要信号来提升LLM模拟人类行为的能力,并引入SOUL基准测试平台,展示了在多个任务中显著提升性能的成果。
基于表示空间扩散模型的Tippett最小融合多编码器异常检测
AI总结 本文提出了一种多编码器融合的表示空间扩散模型,通过统计分析每个编码器对特定分布偏移类型的敏感性,引入EncMin2L门控机制,无需使用OOD标签即可在较低参数成本下提升异常检测性能,同时在四种分布偏移类型上均达到0.94以上的AUROC。
Comments 14 pages
一种用于显微镜视觉-语言模型中高效提示选择的人机协作框架
AI总结 本文提出了一种人机协作框架,通过目标驱动的主动学习方法解决显微镜视觉-语言模型中提示集构建的问题,减少专家验证图像的数量,提高分类性能。
Comments Accepted to CVPR workshops, 2026
具有风依赖性路径转换的10,000年全球随机热带气旋目录(WHITS)
AI总结 本文提出WHITS方法,通过非参数半马尔可夫路径生成器生成全球10,000年合成气旋目录,以提高保险损失评估的可靠性。
ZEBRA: 零样本预算化资源分配用于LLM编排
AI总结 该研究提出ZEBRA框架,通过将多阶段预算分配转化为连续非线性背包问题,有效解决多智能体流水线中预算分配问题,实验显示其在多个任务上均优于传统方法。
通过利用腿部里程计增强基于图的SLAM在GNSS受限环境中的性能
AI总结 本文提出了一种基于因子图的架构,通过结合本体感觉腿部里程计和激光雷达-惯性里程计,有效减少了GNSS受限环境中视觉漂移,提高了SLAM的鲁棒性。
Comments 4 pages, 3 figures, 2 tables, for ICRA workshop on Robot Meets GNSS and Ranging for Seamless Autonomy
二次特性用于神经网络可达性分析
AI总结 本文提出了一种构建二维实平面上标量关系的验证二次特性的框架,通过局部生成候选二次不等式并全局验证,以提高神经网络可达性分析的精度和效率。
用于基于模型的图像去噪中超参数预测的Oracle监督转移
AI总结 该研究提出HyperDn,一种单配置条件预测器,通过聚合源配置的Oracle监督,预测新的去噪器-噪声配置的异质超参数,展示了在跨范式实验中,从相对便宜的TV/TGV变分源转移到更昂贵的扩散模型DiffPIR时,通过少量或无目标Oracle标签实现接近Oracle性能的成果。
Stage-Audit: 用于跨维基表的可审计源前沿发现
AI总结 本文研究了LLM整理的表格可能存在的源不一致问题,提出Stage-Audit方法通过分离curator和auditor的写权限、行级源引用门禁以及12项审计分类学,提高了源前沿的精度和F1值,同时保持了每行的源可追溯性。
Comments 9 pages, 2 figures, 3 tables. Accepted at the ACM CAIS 2026 Workshop on AI Agents for Discovery in the Wild
训练语言代理以从经验中学习
AI总结 本文提出了一种名为In-context Training(ICT)的任务框架,用于评估语言代理在跨任务中的自我改进能力,并通过基于强化学习的训练管道直接从经验中学习反思,从而在多个基准任务中优于基线模型,展示了从经验中学习的能力本身可以被学习。