Beyond Means: Topological Causal Effects under Persistent-Homology Ignorability
超越均值:基于持久同调的因果效应
发表机构 * Université du Québec à Trois-Rivières(魁北克三河大学)
AI总结 本文提出基于持久同调的因果框架,以解决均值基于因果估计在处理结局分布形状变化时的局限性,通过定义拓扑学的CATE和ATE,并证明其在近似拓扑可忽略性下的可识别性。
超越均值:基于持久同调的因果效应
发表机构 * Université du Québec à Trois-Rivières(魁北克三河大学)
AI总结 本文提出基于持久同调的因果框架,以解决均值基于因果估计在处理结局分布形状变化时的局限性,通过定义拓扑学的CATE和ATE,并证明其在近似拓扑可忽略性下的可识别性。
如果她不再有同样的感觉呢?当我们将AI用于关系建议时会发生什么
发表机构 * Department of Psychology, University of Kansas(堪萨斯大学心理学系) ; Independent Researcher(独立研究者)
AI总结 研究探讨了用户对LLM生成的浪漫关系建议的评价,发现用户对建议的满意度高,并且这种满意度与对模型可靠性和有用性的感知正相关,同时用户对LLM的态度也显著改善。
Journal ref First Workshop on LLM Persona Modeling, NeurIPS 2025
CUCo:一种用于计算与通信协同设计的代理框架
发表机构 * UT Austin(德克萨斯大学奥斯汀分校)
AI总结 本文提出CUCo框架,通过结合结构化设计空间形式化和正确性优先的快速路径代理以及进化驱动的慢速路径代理,实现了CUDA内核的计算与通信协同设计,从而在四个多GPU工作负载中实现了1.57倍的加速,并在LLM推理成本低于10美元的情况下发现了一种双流重叠策略。
通用合成数据驱动推断
发表机构 * Department of Electrical and Computer Engineering, Technion IIT, Israel(电气与计算机工程系,技术离子研究所,以色列) ; Department of Statistics and Data Science, The Wharton School, University of Pennsylvania, USA(统计学与数据科学系,沃顿商学院,宾夕法尼亚大学,美国) ; Department of Computer Science, Technion IIT, Israel(计算机科学系,技术离子研究所,以色列)
AI总结 本文提出了一种通用合成数据驱动推断框架,通过结合高质量合成数据和真实数据来提高样本效率,同时在合成数据质量低时自动回退到传统方法,无需分布假设即可保持误差率在用户指定范围内。
模型比较与交叉验证的相对不稳定性
发表机构 * Department of Statistics, Harvard University, Cambridge, MA, USA(哈佛大学统计系) ; Microsoft Research New England, Cambridge, MA, USA(微软研究院新英格兰分部)
AI总结 研究指出即使个体稳定的模型在比较时也可能产生相对不稳定的结果,挑战了交叉验证推断的有效性,特别指出Lasso和软阈值化在最有利的学习条件下仍会导致无效的交叉验证推断。
HypRAG: 超几何密集检索用于检索增强生成
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 本文提出超几何密集检索方法,通过在双曲空间中构建HyTE-FH和HyTE-H两种模型变体,解决传统欧几里得空间在检索增强生成中的局限性,提升文档相关性和回答相关性。
最小最大最优差分隐私合成数据用于平滑查询
发表机构 * Department of Mathematics, University of Southern California(南加州大学数学系) ; Department of Mathematics, University of California San Diego(加州圣地亚哥大学数学系)
AI总结 本文研究了如何生成具有(ε,δ)差分隐私的合成数据,以在保证个体隐私的同时,为有意义的下游分析提供强效用保证。提出了一种多项式时间算法,实现了最小最大误差率O_{k,d}(n^{-min{1, k/d}}),并建立了针对k-平滑查询的首个最小最大下界。
Comments COLT 2026 arXiv version. 34 pages
grounded but Misleading: Evaluating Semantic Alignment in AI-Generated Security Explanations
发表机构 * Virginia Tech(弗吉尼亚理工学院)
AI总结 本文研究了AI生成的安全解释中语义对齐的问题,通过VEXA测试平台验证了词汇基础与语义风险对齐之间的差距,发现即使解释在词汇上显得合理,其语义解释可能削弱检测器的意图风险评估。
A2RAG:面向成本感知和可靠推理的自适应代理图检索
发表机构 * University of New South Wales(新南威尔士大学) ; Euler AI ; Sigma Trading Management(Sigma 交易管理) ; Eigenflow AI ; Macquarie University(麦考瑞大学)
AI总结 本文提出A2RAG框架,通过自适应控制器和代理检索器解决图检索中成本和可靠性问题,提升多跳问答的准确率并减少计算开销。
利用无透镜全息和深度学习进行自动HER2评分及不确定性量化
发表机构 * Electrical and Computer Engineering Department, University of California, Los Angeles, CA, 90095, USA(加州大学洛杉矶分校电气与计算机工程系) ; Bioengineering Department, University of California, Los Angeles, CA, 90095, USA(加州大学洛杉矶分校生物工程系) ; California NanoSystems Institute (CNSI), University of California, Los Angeles, CA, 90095, USA(加州大学洛杉矶分校加州纳米系统研究所) ; Department of Computer Science, University of California, Los Angeles, CA, 90095, USA(加州大学洛杉矶分校计算机科学系)
AI总结 本文提出了一种基于无透镜全息和深度学习的紧凑型、低成本系统,用于自动免疫组化染色乳腺组织切片的HER2评分,通过贝叶斯蒙特卡洛Dropout策略提高诊断可靠性,实现了高准确率的HER2分类和评分。
Comments 23 Pages, 6 Figures, 1 Table
Journal ref BME Frontiers, AAAS (2026)
消除基于大语言模型的推荐系统中的域外推荐:一种统一视角
发表机构 * College of Computer Science and Software Engineering, Shenzhen University(深圳大学计算机科学与软件工程学院) ; Microsoft Research Asia(微软亚洲研究院)
AI总结 本文提出RecLM框架,通过统一架构整合三种 grounding 方法,系统比较了基于嵌入检索、约束生成和离散项生成的推荐方法,有效消除域外推荐并提升了推荐准确性。
Comments 20 pages
利用街景图像和视觉大语言模型预测遗产价值以支持治理:风险、伦理与政策影响
发表机构 * RISE Research Institutes of Sweden AB(瑞典RISE研究机构) ; Malmö University(马尔默大学) ; Forschungszentrum Jülich GmbH(朱利奇研究中心) ; Uppsala University(乌普萨拉大学)
AI总结 本研究利用街景图像和视觉大语言模型评估瑞典建筑遗产价值,以支持建筑翻新计划的制定,探讨了方法中的问题、潜在改进以及使用LLM数据的伦理风险。
大气机器学习模型对均匀海表温度变暖的平衡响应
发表机构 * University of Washington(华盛顿大学)
AI总结 本文评估了几种先进的机器学习模型对均匀海表温度变暖的气候响应,探讨了这些模型在气候预测中的潜力与局限性。
自主不确定性量化用于计算床旁传感器
发表机构 * Electrical & Computer Engineering Department(电气与计算机工程系) ; Bioengineering Department(生物工程系) ; California NanoSystems Institute (CNSI)(加州纳米系统研究所) ; Department of Surgery(外科医学系) ; University of California, Los Angeles(加州大学洛杉矶分校)
AI总结 本文提出了一种自主不确定性量化技术,用于改进床旁诊断中的神经网络驱动计算传感器系统,通过蒙特卡洛dropout方法提高诊断的准确性和可靠性。
Comments 18 Pages, 5 Figures
Journal ref ACS Nano (2026)
面向工业互联网-of-things意图网络的高效异步联邦评估与策略相似性意识
发表机构 * Guangxi University Key Laboratory of Intelligent Networking and Scenario System (School of Information and Communication, Guilin University of Electronic Technology)(广西智能网络与场景系统重点实验室(信息与通信学院,桂林电子科技大学)) ; National Engineering Laboratory for Comprehensive Transportation Big Data Application Technology (Guangxi)(综合交通运输大数据应用技术国家工程实验室(广西)) ; School of Automation, Guangdong University of Technology(自动化学院,广东工业大学) ; School of Architecture and Transportation Engineering, GUET(建筑与交通工程学院,桂林电子科技大学)
AI总结 本文提出了一种基于联邦学习的增强意图网络框架FEIBN,利用大语言模型将用户意图转化为结构化策略元组,并通过策略相似性意识联邦学习机制提升训练效率和通信效率,从而在工业互联网-of-things环境中实现更高效的策略评估。
Comments 12 pages with 7 figures and 4 tables
HEIST:一种用于空间转录组学和蛋白质组学数据的图基础模型
发表机构 * Yale University, USA(耶鲁大学)
AI总结 本文提出HEIST模型,通过图结构建模空间转录组学和蛋白质组学数据,利用层次化图Transformer实现对细胞空间位置和基因表达的联合建模,从而提升对细胞异质性和微环境响应的理解。
超越代码对:基于对话的数据生成用于LLM代码翻译
发表机构 * Argonne National Laboratory(阿贡国家实验室) ; University of Minnesota(明尼苏达大学) ; Iowa State University(爱荷华州立大学) ; Lawrence Livermore National Laboratory(劳伦斯利弗莫尔国家实验室)
AI总结 本文提出了一种基于对话的数据生成方法,通过双LLM架构生成验证的翻译和多轮对话,以提升LLM在低资源编程领域中的代码翻译能力。
旋转参数化图分数阶傅里叶变换:定义、性质和最优滤波
发表机构 * School of Mathematics and Statistics, Nanjing University of Information Science and Technology(南京信息工程大学数学与统计学院) ; School of Communication and Artificial Intelligence, Nanjing Institute of Technology(南京理工大学通信与人工智能学院) ; School of Integrated Circuits, Nanjing Institute of Technology(南京理工大学集成电路学院) ; Jiangsu Province Engineering Research Center of IntelliSense Technology and System(江苏省智能感知技术与系统工程研究中心) ; Hubei Key Laboratory of Applied Mathematics, Hubei University(湖北省应用数学重点实验室) ; Key Laboratory of System Control and Information Processing, Ministry of Education, Shanghai Jiao Tong University(教育部系统控制与信息处理重点实验室,上海交通大学)
AI总结 本文提出旋转参数化图分数阶傅里叶变换(RP-GFRFT),通过统一分数阶和旋转参数化的谱分析,解决现有方法在旋转基控制和零角度退化方面的不足,提升图信号处理的去噪、重建和特征保留性能。
对抗代理:基于强化学习的黑盒逃逸攻击
发表机构 * University of Wisconsin-Madison(威斯康星大学麦迪逊分校) ; Virginia Tech(弗吉尼亚理工大学)
AI总结 本文提出了一种基于强化学习的对抗攻击方法,通过学习生成对抗样本的新算法,提高了攻击效率和成功率,同时在图像分类基准上展示了其优越的性能。
Comments Accepted to the Findings of CVPR 2026
关于深度等变网络的通用性
发表机构 * University of Trento(特伦托大学) ; Fondazione Bruno Kessler(布鲁诺·凯瑟勒基金会) ; PUC Chile(智利天主教大学) ; Northeastern University(东北大学)
AI总结 本文研究了等变神经网络的通用性问题,提出在分离约束下,通过全连接读出层可实现连续函数的近似,并引入了更严格的逐元素分离性准则,证明了足够深度或适当读出层可使等变网络在逐元素分离性范围内实现通用性。
Comments Published as a conference paper at ICLR 2026
Journal ref International Conference on Learning Representations (ICLR), 2026
CTIConnect:一种用于异构网络威胁情报的检索增强大语言模型基准
发表机构 * Virginia Tech Department of Computer Science(弗吉尼亚理工大学计算机科学系) ; University of California, Berkeley Department of Computer Science(加州大学伯克利分校计算机科学系)
AI总结 本文提出CTIConnect基准,用于评估检索增强型大语言模型在网络威胁情报任务中的表现,通过整合五个异构数据源构建了1860个专家验证的问答对,揭示了不同任务类别中跨源语义差距的差异以及检索策略和性能瓶颈的变化,展示了领域特定策略在提升性能上的优势。
Comments Accepted to KDD 2026
纠正大语言模型基准测试中的提示依赖:一种具有嵌入空间聚类的贝叶斯分层模型
发表机构 * University of Cambridge(剑桥大学)
AI总结 本文提出了一种贝叶斯分层模型,通过嵌入空间聚类来纠正大语言模型基准测试中的提示依赖问题,在数据有限的情况下提供更稳健的性能指标,并在对抗鲁棒性基准测试中实现了性能指标的显著提升。
Comments Accepted to the 1st Workshop on Combining Theory and Benchmarks, CTB@ICML 2026, Seoul, South Korea
多补丁等几何神经求解器用于计算机辅助设计域上的偏微分方程
发表机构 * Institute for Accelerator Science and Electromagnetic Fields, Technische Universität Darmstadt(加速器科学与电磁场研究所,德累斯顿技术大学) ; Terra Quantum AG(Terra Quantum公司) ; Scientific Computing, Centrum Wiskunde & Informatica(科学计算,数学与信息学中心)
AI总结 本文提出了一种结合物理感知神经网络与多补丁等几何分析的计算框架,用于解决复杂计算机辅助设计几何上的偏微分方程。该方法利用补丁局部神经网络在等几何分析的参考域上操作,并通过定制的输出层强加狄利克雷边界条件。通过专用的界面神经网络确保非均匀有理B样条补丁之间界面的解一致性。通过变分框架最小化偏微分方程弱形式导出的能量函数进行训练。在两个高度非平凡且实际相关的应用案例中验证了该方法的有效性,即四极磁铁的2D磁静力学模型和机械夹具的3D非线性固体力学与接触力学模型。结果与高保真有限元求解器获得的参考解高度一致,展示了该神经求解器在处理复杂工程问题方面的潜力。
Comments 33 pages, 15 figures
开源人工智能中开放协作的图谱:映射14个开源大语言模型项目的实践、动机与治理
发表机构 * RISE Research Institutes of Sweden AB(瑞典RISE研究机构) ; University of Oxford(牛津大学)
AI总结 本文通过分析14个开源大语言模型项目的开发与再利用生命周期中的开放协作实践,揭示了协作方法、动机和治理结构的多样性,以及开放源代码AI并非单一属性,而是协作组织方式在互联艺术领域、生命周期阶段和制度背景下的涌现结果。
Comments In submission
RAG安全与隐私:形式化威胁模型和攻击面
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 本文研究了RAG系统中的安全与隐私问题,提出首个形式化的威胁模型,定义了攻击向量如文档级成员推断和数据中毒,以提升对RAG系统隐私和安全性的理解。
Comments Published at the 5th ICDM Workshop in November 2025
Journal ref 2025 IEEE International Conference on Data Mining Workshops (ICDMW), pp. 1387-1394, 2025
多尺度科学数据的自适应生成流
发表机构 * Department of Mathematics, University of California, Los Angeles(加州大学洛杉矶分校数学系) ; Machine Learning Lab, Capital Fund Management(资本基金管理有限公司机器学习实验室) ; Courant Institute, New York University(纽约大学柯朗研究所)
AI总结 本文提出了一种多尺度科学数据生成模型,通过设计噪声分布和插值计划,解决多尺度傅里叶谱数据中的数值挑战,提高了生成样本的质量和效率。
利用大型语言模型生成研究主题本体:多学科研究
发表机构 * Knowledge Media Institute, The Open University(开放大学知识媒体学院) ; The Open University(开放大学) ; University of Milano Bicocca(米兰比克卡大学) ; Department of Business and Law, University of Milano Bicocca(米兰比克卡大学商学院与法学院)
AI总结 本文研究了大型语言模型在生物医学、物理和工程学三个学科中识别研究主题语义关系的能力,通过零样本提示、链式思维提示和在现有本体上微调三种条件评估模型性能,并引入PEM-Rel-8K数据集验证跨学科迁移能力。
注意力真的全部我们需要吗?对预训练RNN稀疏和全局注意力模型在资产定价中的实证研究
发表机构 * Department of Economics and Related Studies, Univiersity of York(经济与相关研究系,约克大学)
AI总结 本文研究了预训练RNN注意力模型在资产定价中的应用,探讨了注意力机制在捕捉时间依赖性和长期记忆方面的改进,以及在不同市场条件下的稳定性。
Comments 72 pages including appendix
一种基于神经隐式对比源表示的全数据和相位less数据反演可微框架
发表机构 * Department of Electronic Engineering, Beijing National Research Center for Information Science and Technology (BNRist), and State Key laboratory of Space Network and Communications(电子工程系,北京信息科学与技术国家研究中心(BNRist),空间网络与通信国家重点实验室)
AI总结 本文提出了一种基于神经隐式对比源表示的可微框架,用于全数据和相位less数据反演,通过引入轻量级残差多层感知机作为连续神经场,提升了反演精度和鲁棒性,同时通过总变分正则化将状态方程和数据方程结合,形成可微目标函数,实现了端到端的可微优化。
学习优化并保证收敛性:线性收敛算法的完整表征
发表机构 * School of Electrical Engineering and Computer Science, and Digital Futures, KTH Royal Institute of Technology, Sweden(电气工程与计算机科学学院及数字未来学院,瑞典皇家理工学院) ; Australian Centre for Robotics and School of Aerospace, Mechanical and Mechatronic Engineering, The University of Sydney, Australia(澳大利亚机器人中心及航空航天、机械与机电工程学院,澳大利亚悉尼大学) ; Department of Engineering Sciences, University of Oxford, United Kingdom(工程科学系,英国牛津大学)
AI总结 本文研究了如何通过改进算法在特定问题分布下的平均性能,提出了一种线性收敛算法的完整表征方法,展示了如何通过基线算法和可训练的指数衰减修改来实现线性收敛,并在非凸、梯度主导函数、强凸函数和多面体可行集优化中验证了其有效性。