Provably Auditable and Safe LLM Agents from Human-Authored Ontologies
基于人类编写本体的可审计且安全的LLM智能体
发表机构 * Thistleseeds
AI总结 提出Agentic Redux架构,通过类型化λ演算证明其在适当领域上的执行语义正确且决策可审计,并引入本体优先的智能体设计方法。
基于人类编写本体的可审计且安全的LLM智能体
发表机构 * Thistleseeds
AI总结 提出Agentic Redux架构,通过类型化λ演算证明其在适当领域上的执行语义正确且决策可审计,并引入本体优先的智能体设计方法。
随机最短路径问题的贝叶斯学习
发表机构 * Department of Engineering, University of Cambridge, UK(剑桥大学工程系) ; School of Mathematics and Physics, University of Wollongong, Wollongong, Australia(沃林根大学数学与物理学院)
AI总结 针对随机最短路径问题,提出一种贝叶斯框架,通过贝尔曼最优方程直接构建最优动作价值函数Q*的后验分布,并解决似然松弛导致的不可识别性问题,实现不确定性量化与数据高效学习。
Comments 50 pages, 19 figures
现实世界 MCP 服务器中的描述-代码不一致性:测量、检测与安全影响
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 针对 MCP 服务器中工具描述与代码实现不一致的问题,提出结合结构感知静态分析与 Direct-Reverse-Arbitration 提示方法的自动检测框架 DCIChecker,并在大规模数据集上揭示 9.93% 的不一致率及其安全风险。
Comments Preprint
网络上的近最优去中心化随机凸优化
发表机构 * Blavatnik School of Computer Science, Tel Aviv University(塔尔大学比拉维克计算机科学学院) ; Google Research Tel Aviv(谷歌研究以色列特拉维夫)
AI总结 针对去中心化随机光滑凸优化问题,提出一种加速去中心化方法,在总梯度样本预算N下,将可支持的工作节点数提升至M≲√ρ N^{3/4},并证明其最优性。
Comments 12 papers
重新审视Vul-RAG:基于RAG的漏洞检测的可复现性与可复制性——使用开放权重模型
发表机构 * Institute for Secure Networked Systems, Esslingen University(安全网络系统研究所,埃斯林根大学) ; Institute for Intelligent Systems, Esslingen University(智能系统研究所,埃斯林根大学)
AI总结 本研究通过本地部署和多种开放权重模型,复现并扩展了Vul-RAG框架,发现其性能存在约0.30成对准确率的上限,且模型能力提升无法显著改善性能。
Comments Accepted at AI&CCPS 2026 workshop, co-located with the 21st International Conference on Availability, Reliability and Security (ARES 2026). This is the authors' preprint version
QPredSGG:面向长尾场景图生成的混合量子谓词学习
发表机构 * Department of Computer Science, University of Waterloo(1. 温哥华大学计算机科学系) ; Machine Learning Research Group, University of Waterloo(2. 温哥华大学机器学习研究组)
AI总结 针对场景图生成中长尾谓词分布导致的分类偏差,提出用量子谓词头(QP-Head)替换经典谓词头,通过振幅嵌入和强纠缠层压缩特征,在Visual Genome 150上实现参数高效的长尾关系分类。
Comments 11 pages, 5 figures
听你所写:基于声学差异的无参考假设评估
发表机构 * X-LANCE Lab, School of Computer Science, Shanghai Jiao Tong University, China(X-LANCE实验室、计算机科学学院、上海交通大学、中国) ; MoE Key Lab of Artificial Intelligence, Jiangsu Key Lab of Language Computing, China(人工智能MOE重点实验室、江苏省语言计算重点实验室、中国)
AI总结 提出READ指标,利用预训练自回归TTS模型计算语音与文本假设的声学差异,无需参考转录即可评估ASR假设,并在噪声条件下实现高达20%的相对错误率降低。
Comments Submitted to Interspeech 2026. 6 pages, 4 figures
U-Net加速的质量-多样性优化用于气候适应性城市布局
发表机构 * Institute of Technology, Resource and Energy-efficient Engineering (TREE)(技术学院,资源与能源高效工程院(TREE)) ; Bonn-Rhein-Sieg University of Applied Sciences(博恩-莱茵-锡格应用科学大学) ; Fraunhofer Institute for Algorithms and Scientific Computing (SCAI)(弗劳恩霍夫算法与科学计算研究所(SCAI))
AI总结 提出用U-Net替代慢速物理模拟器作为代理模型,结合离线MAP-Elites算法,实现快速生成数千个多样化且经气候评估的建筑布局。
Ekka: LLM推理中静默错误的自动诊断
发表机构 * University of Science and Technology of China(中国科学技术大学) ; Tsinghua University(清华大学)
AI总结 提出Ekka系统,通过差分调试对齐比较中间执行状态,自动诊断LLM推理框架中的静默错误,在真实错误基准上达到80% pass@1和88% pass@5的诊断准确率。
Comments ICML 2026
合成人格:LLM 如何使用社会经济微观数据模仿个体受访者?
发表机构 * Technical University of Munich(慕尼黑技术大学)
AI总结 研究利用德国社会经济面板数据构建个体级数字孪生,通过评估不同构建方法(模型、信息深度、嵌入方式、推理模式)对200万以上孪生响应的准确性,发现信息深度在75%熵分位数达到成本效益帕累托点,最佳单元准确率达78.8%。
通过仿真辅助智能感知重建不可观测温度场
发表机构 * Silicon Austria Labs(硅酸奥地利实验室) ; Republic of Austria(奥地利共和国) ; Styrian Business Promotion Agency(施蒂里亚商业促进局) ; federal state of Carinthia(卡林西亚联邦州) ; Upper Austrian Research(上奥地利研究) ; Austrian Association for the Electric and Electronics Industry(奥地利电子电气工业协会)
AI总结 提出基于随机物理仿真生成数据集的方法,训练神经网络从稀疏传感器重建内部温度场,实现实时在线监测。
Comments Presented at IEEE International Instrumentation and Measurement Technology Conference (I2MTC), Nancy, France, 2026
ReSGA: 一种用于学习风险价值和预期缺口的大尾部风险模型
发表机构 * Hong Kong University(香港大学) ; Xiamen University(厦门大学)
AI总结 提出检索增强自分组自编码器(ReSGA),利用数百万参数捕捉资产横截面依赖和长期时间动态,在1926-2023年美国股票数据上优于12种基准模型,并通过新规模增强左尾动量策略实现经济收益。
ANN搜索:召回真正重要的
发表机构 * University of Ioannina(伊奥尼亚大学) ; Archimedes, Athena RC(阿基米德,雅典RC)
AI总结 本文提出用逆近似比1/Ratio@k替代Recall@k来评估近似最近邻搜索质量,实验表明前者能更准确反映实际效用并降低计算开销。
像对待树一样对待流量:一种用于加密流量分析的语义保持分层图专家框架
发表机构 * School of Cyber Science and Engineering, Southeast University(东南大学网络安全科学与工程学院) ; Purple Mountain Laboratories(紫金山实验室) ; Engineering Research Center of Blockchain Application, Supervision and Management (Southeast University)(区块链应用、监督与管理工程研究中心(东南大学)) ; Engineering Research Center of Security for Ubiquitous Network, Jiangsu Province(江苏省物联网安全工程技术研究中心)
AI总结 提出一种基于协议树图注意力与专家混合的语义保持分层图专家框架(PTGAMoE),通过字段级图构建和专家委员会设计,在严格无数据泄露设置下显著优于现有模型,并提供可解释的协议级特征重要性分析。
Comments This work has been submitted to the IEEE for possible publication
建模与解释癌症护理结果预测中的团队协作动态
发表机构 * University of California, Davis(加州大学戴维斯分校)
AI总结 利用电子健康记录中的协作网络和机器学习方法,研究医疗专业人员团队协作动态对癌症患者生存预测的影响,并解释关键网络特征。
基于全局草图的扩散语言模型水印
发表机构 * Harvard University(哈佛大学)
AI总结 提出一种针对掩码扩散语言模型的全局向量草图水印方法,通过控制文本的整体统计特征实现与局部上下文无关的检测。
CyberGym-E2E:面向AI代理端到端网络安全能力的可扩展真实世界基准
发表机构 * Stanford University(斯坦福大学) ; UC Berkeley(加州大学伯克利分校)
AI总结 提出CyberGym-E2E,一个大规模、真实的端到端网络安全基准,通过自动化流水线将开源漏洞数据转化为评估环境,全面评估AI代理在漏洞发现、PoC生成和补丁生成全生命周期中的能力。
Comments ICML 2026
D^2SD: 使用双重扩散草稿模型加速推测解码
发表机构 * Peking University(北京大学) ; Tsinghua University(清华大学) ; HKUST(香港科技大学) ; UIUC(伊利诺伊大学厄巴纳-香槟分校) ; Ant Group(蚂蚁集团)
AI总结 提出D^2SD框架,通过双重扩散草稿模型和置信度引导的前缀树,提升推测解码的接受率,优于现有扩散方法和自回归推测解码基线。
面向自主系统中多传感器、多智能体与多领域学习的数据集扩展
发表机构 * Department of Electrical and Computer Engineering, Duke University(电气与计算机工程系,杜克大学)
AI总结 提出基于AVstack和CARLA的模块化数据集生成流程,创建TB级带真实标签的多域数据,支持单/多智能体与灵活传感器配置,用于特定应用训练和协作自主研究。
平坦性与泛化:使用齐次神经网络学习多指标模型
发表机构 * Department of Computer Science(计算机科学系) ; University of California, San Diego(加州大学圣地亚哥分校) ; Halicioğlu Data Science Institute(Halicioğlu数据科学研究所)
AI总结 本文研究两层齐次神经网络学习多指标模型时,平坦性与泛化之间的关系,证明最平坦插值器总能泛化,而某些非泛化插值器的平坦性无法接近最平坦值。
如果提示注入从未消失?探索智能体系统中的跨会话存储提示注入
发表机构 * Institute of Information Engineering, Chinese Academy of Sciences(中国科学院信息工程研究所) ; School of Cyber Security, University of Chinese Academy of Sciences(中国科学院大学网络空间安全学院) ; AI Sec Lab, Beijing Chaitin Technology Co.,Ltd(北京柴坦科技有限公司AI安全实验室)
AI总结 本研究引入跨会话存储提示注入,通过持久化状态使提示注入从单会话模型级威胁转变为长期系统级漏洞,并构建了分类法、基准测试和沙箱工具以评估风险。
Comments position paper
基于Knockoffs的深度神经网络错误发现率控制与简化
发表机构 * bnbu.edu.cn(北京理工大学)
AI总结 本文基于knockoff方法和正则化神经网络,提出了三种在控制错误发现率条件下的变量筛选方法(单层过滤、多层过滤、变量权重聚合过滤),以简化深度神经网络并降低计算复杂度。
TITAN-FedAnil+:面向资源受限智能企业的基于信任的自适应区块链联邦学习
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 提出TITAN-FedAnil+框架,通过基于亲和传播的自适应聚类聚合过滤恶意更新、GPU加速向量化提升效率及有符号状态跳变机制实现轻量级区块链重同步,在资源受限边缘设备上内存开销降低81%。
Comments 8 pages, 5 figures; code available at https://github.com/error8149/FedAnilPlus-Optimized
重新思考基于LLM的分层偏好排名的销售线索评分
发表机构 * Intelligent Business Team, Li Auto Inc.(李自动公司智能商务团队)
AI总结 针对高价值领域销售线索转化问题,提出基于LLM的判别式框架HPRO,通过分层偏好排名优化联合建模结构化与非结构化数据,实现评分与排名性能提升。
LCSHBench:一个多语言、共识基础的国会图书馆主题标目分配基准
发表机构 * Library of Congress(国会图书馆)
AI总结 提出LCSHBench基准,基于多图书馆共识构建多语言书目记录集,通过精确匹配和概念匹配评估自动主题编目,并展示低秩微调嵌入器在跨语言检索中的改进。
REGAIN:基于调和增益的辅助方向学习
发表机构 * School of Mathematical Sciences, Beihang University, Beijing, China(北京航空航天大学数学科学学院) ; School of Economics and Management, Beihang University, Beijing, China(北京航空航天大学经济管理学院)
AI总结 提出REGAIN框架,通过学习归一化辅助方向并利用冻结预测预言机,基于目标加权损失减少选择方向,以改进预测调和。
DSIRM:学习查询桥接的离散语义标识符用于电商相关性建模
发表机构 * Taobao & Tmall Group of Alibaba(淘宝与天猫集团)
AI总结 针对电商搜索中连续嵌入难以捕捉细粒度属性区分的问题,提出查询桥接对比量化的离散语义标识符相关性模型(DSIRM),通过注入查询-物品交互监督学习语义感知分区,并利用生成式大语言模型预测物品标识符,显著提升相关性建模效果。
Comments Jing Wang (Corresponding Author)
掩蔽小波散射变换神经场用于声场重建
发表机构 * Fonds de recherche du Québec – Nature et technologies(魁北克自然与技术研究基金)
AI总结 提出一种利用小波散射变换作为多尺度特征提取器,结合神经场优化和掩蔽策略,实现稀疏观测下声场重建的方法,并在HRTF上采样中验证有效性。
Comments 5 pages, 2 figures, conference
解耦答案引擎优化与平台增长:基于日志的ChatGPT推荐流量自然实验
发表机构 * Glasp Inc.(Glasp公司)
AI总结 本研究通过自然实验方法,利用同一域内未处理页面作为对照,分离了答案引擎优化(AEO)对推荐流量的因果效应与平台自身增长带来的混淆效应。
Comments 9 pages, 4 figures, 1 table
当新鲜度不足时:面向网络化LQR控制的分布感知信息年龄
发表机构 * Department of Electrical and Computer Engineering, The Ohio State University(电气与计算机工程系,俄亥俄州立大学)
AI总结 本文研究网络化控制系统中,仅最小化平均信息年龄(AoI)不足以优化LQR跟踪性能,需考虑调度间隔的完整分布(包括高阶矩和指数矩)。