A Technical Taxonomy of LLM Agent Communication Protocols
LLM智能体通信协议的技术分类法
发表机构 * Technische Universität München(慕尼黑技术大学)
专题命中 多智能体 :分类LLM智能体通信协议,核心是Agent通信
AI总结 针对大语言模型智能体通信协议碎片化问题,提出包含五个维度的技术分类法,分析九种开源协议,揭示架构模式并预测协议演进趋势。
AI 大模型
智能体、工具调用、规划、工作流、多智能体和自主任务执行。
LLM智能体通信协议的技术分类法
发表机构 * Technische Universität München(慕尼黑技术大学)
专题命中 多智能体 :分类LLM智能体通信协议,核心是Agent通信
AI总结 针对大语言模型智能体通信协议碎片化问题,提出包含五个维度的技术分类法,分析九种开源协议,揭示架构模式并预测协议演进趋势。
面向网络安全互联微电网的拜占庭弹性联邦多智能体优化框架
专题命中 多智能体 :联邦多智能体优化,拜占庭弹性。
AI总结 提出BR-FedMAPPO框架,结合三重表面移动目标防御与自适应隔离策略,通过两阶段拜占庭弹性聚合规则抵御隐蔽虚假数据注入攻击,保护分布式学习通道并维持经济调度性能。
GateMem:多主体共享内存代理中的内存治理基准
发表机构 * School of Artificial Intelligence, Jilin University(吉林大学人工智能学院) ; Shanghai Jiao Tong University(上海交通大学) ; King Abdullah University of Science and Technology (KAUST)(卡尔斯鲁厄大学) ; Tsinghua University(清华大学) ; National University of Singapore(新加坡国立大学)
专题命中 多智能体 :多主体共享内存代理的记忆治理基准
AI总结 提出GateMem基准,评估多主体共享内存代理在效用、访问控制和遗忘三方面的治理能力,发现现有方法无法同时满足三者。
Comments 24 pages, 8 figures. Code and dataset are available at https://github.com/rzhub/GateMem and https://huggingface.co/datasets/Ray368/GateMem
表征网络化大语言模型的意见演化
专题命中 多智能体 :研究网络化LLM多智能体系统中的意见演化动力学。
AI总结 研究经典意见动力学模型能否描述多智能体系统中大语言模型(LLM)的意见传播,发现引入偏置项可显著提升建模精度,将平均意见误差降低高达88%。
Comments 19 pages, 2 figures
AdsMind: 一种基于物理的多智能体系统,用于异质催化剂表面吸附构型的自校正发现
发表机构 * Department of Computer Science ; Engineering, Hong Kong University of Science ; Department of Chemistry, Hong Kong University of Science ; Laboratory of Artificial Chemical Intelligence (LIAC), EPFL, Lausanne, Switzerland ; Platform Laboratory for Science \& Technology, Asahi Kasei Corporation, Tokyo, Japan ; IAS Center for AI for Scientific Discoveries, Hong Kong University of Science
专题命中 多智能体 :提出闭环多智能体框架,自主纠错搜索。
AI总结 提出AdsMind闭环多智能体框架,利用机器学习力场弛豫反馈实现吸附构型搜索的自主纠错,在基准测试中成功率高达100%和98.8%,且仅需少量弛豫步骤,显著优于启发式枚举和单次方法。
Comments 37 pages, 5 figures
通过先前协作的片段记忆改善城市搜索与救援中的人机团队合作
发表机构 * HumemAI, The Netherlands(荷兰HumemAI) ; Vrije Universiteit Amsterdam, The Netherlands(荷兰阿姆斯特丹自由大学) ; TNO, The Netherlands(荷兰TNO)
专题命中 多智能体 :人机团队,记忆复用。
AI总结 提出利用知识图谱片段记忆存储历史协作模式,通过图表示学习选择代表性记忆初始化机器人,在MATRX USAR环境中将救援成功率从25.7%提升至41.3%,任务时间减少283秒。
迈向智能体优先的Web:为AI智能体重新设计Web
发表机构 * Old Dominion University(老 Dominion 大学) ; AI Motion Labs(AI Motion 实验室) ; Florida International University(佛罗里达国际大学) ; Accenture Technology Labs(Accenture 技术实验室) ; Nanyang Technological University(南洋理工大学) ; University of Colombo(科伦坡大学) ; Center for Wireless Communications, University of Oulu(无线通信中心,奥卢大学) ; McDonald Army Health Center(麦克唐纳陆军健康中心)
专题命中 其他Agent :为AI智能体重新设计Web,核心是Agent访问
AI总结 本文提出三层重新设计原则,包括访问层(代理继承人类权限)、经济层(基于意图的代币订阅模型)和内容层(ATML标记语言与加密溯源链),以解决AI智能体作为中间人时Web的访问、经济与内容问题。
PYPILINE:通过可疑API知识和Agent工作流检测恶意PyPI包
专题命中 其他Agent :Agent工作流检测恶意PyPI包。
AI总结 提出PYPILINE方法,结合可疑API知识库与Agent工作流,通过静态分析构建知识库并自动检测恶意PyPI包,在精度、召回率和F1分数上显著优于现有工具。
通过智能体轨迹剖析模型行为
发表机构 * AWS AI Labs(AWS人工智能实验室)
专题命中 其他Agent :分析AI代理轨迹以改进模型行为
AI总结 本文提出“意图-执行差距”概念,并设计Simple Strands Agent(SSA)框架,通过分析138k条轨迹揭示模型在自主问题解决中的行为差异。
Comments 106 pages, 50 Figures, 16 Tables
超越单语言深度研究:用跨语言 BrowseComp-Plus 评估智能体和检索器
发表机构 * Waseda University(早稻田大学) ; Northwestern University(西北大学) ; RIKEN AIP(理化学研究所革新智能研究中心) ; Snowflake Inc.(Snowflake公司) ; University of Utah(犹他大学) ; Duke-NUS Medical School(杜克-新加坡国立大学医学院) ; The University of Tokyo(东京大学)
专题命中 其他Agent :评估深度研究智能体的跨语言能力
AI总结 提出跨语言基准 XBCP,评估深度研究智能体在证据语言与查询不同时的表现,发现检索和智能体端均存在显著性能下降。
Comments Preprint
ARIADNE: 推理时适配器动态选择的不可知路由
发表机构 * University of Turin(都灵大学) ; Samsung AI Center(三星人工智能中心)
专题命中 其他Agent :推理时适配器动态选择,路由框架。
AI总结 提出无训练、与适配器无关的路由框架ARIADNE,通过训练集嵌入质心表示适配器,在推理时基于潜在空间距离选择适配器,无需适配器内部信息或额外训练,在44个任务上达到89.7%的选择准确率。
无感关怀:情感动态作为人-AI智能体协作的控制层
发表机构 * East China Normal University(华东师范大学) ; National University of Singapore(新加坡国立大学)
专题命中 其他Agent :综述情感动态在人-AI智能体协作中的控制作用。
AI总结 本文综述情感动态在人-AI智能体协作中的作用,提出将情感视为协调层而非AI内部属性,用于校准信任、委托和治理。
CoreMem: 对话代理中长期记忆的黎曼检索与Fisher引导蒸馏
发表机构 * Shenzhen International Graduate School, Tsinghua University(清华大学深圳国际研究生院) ; Peng Cheng Laboratory(鹏城实验室) ; Shandong Analysis and Test Center, Qilu University of Technology(齐鲁工业大学山东省分析测试中心) ; State Key Laboratory for Quality Ensurance and Sustainable Use of Dao-di Herbs(道地药材品质保障与可持续利用国家重点实验室)
专题命中 其他Agent :对话代理长期记忆架构
AI总结 提出CoreMem架构,用黎曼检索替代余弦相似度解决高维检索枢纽问题,通过Fisher引导离散令牌蒸馏实现原则性压缩,在8GB显存边缘设备上实现长期记忆对话代理。
Comments 15 pages, 5 figures
通过研究框架将AI科学家的研究综合与验证外部化
发表机构 * X-LANCE Lab, School of Computer Science, Shanghai Jiao Tong University, Shanghai, China(上海交通大学计算机学院X-LANCE实验室) ; Jiangsu Key Lab of Language Computing, Suzhou, China(江苏省语言计算重点实验室) ; Suzhou Laboratory, Suzhou, China(苏州实验室)
专题命中 工作流自动化 :自动化科学研究工作流,外部化综合与验证。
AI总结 提出Xcientist框架,将研究综合与实验验证外部化为可检查的合同驱动过程,解决自动研究中的声明漂移问题,并在多个领域验证其有效性。
Comments 65 pages, 14 figures, 19 tables
OmniDroneX: 一种LLM辅助的全方位无人机即服务生态系统
专题命中 工作流自动化 :LLM辅助无人机服务组合与任务定义
AI总结 提出OmniDroneX统一无人机即服务生态系统,通过libUAV接口和PT-SOA抽象模型连接底层物理与高层任务,利用大语言模型辅助功能识别、服务组合和自然语言任务定义,支持多种组合技术以实现可扩展、自演进的无人机系统。
Comments This manuscript is a full version of a paper accepted in shortened form by IEEE International Conference on Joint Cloud Computing
WorldLines: 对长时域有状态具身智能体进行基准测试与建模
发表机构 * HKUST(GZ)(香港科技大学(广州)) ; HKUST(香港科技大学) ; Knowin
专题命中 规划决策 :具身智能体长时记忆与任务规划。
AI总结 提出WorldLines基准,通过构建带时间跨度的家庭轨迹(含对话、动作、状态变化等)评估具身智能体的长时记忆与任务规划能力,并设计ObsMem记忆框架提升状态感知决策。
Comments 27 pages, 18 figures
通用型智能体必须记住什么?
发表机构 * Carnegie Mellon University(卡内基梅隆大学) ; Georgia Institute of Technology(佐治亚理工学院)
专题命中 规划决策 :通用智能体记忆需求的形式化分析。
AI总结 本文形式化论证了通用型智能体为在多个环境和目标下近似最优行动,必须存储领域相关信息以区分观察瓶颈处的不兼容最优动作,并证明记忆可用于重构局部转移动态。
OmniPlan:一种用于及时且近乎最优的网络规划优化的自适应框架
发表机构 * Zhejiang University(浙江大学) ; Fuzhou University(福州市大学) ; Yangzhou University(扬州大学) ; The State Key Laboratory of Blockchain and Data Security(区块链与数据安全国家重点实验室) ; College of Computer Science and Technology(计算机科学与技术学院)
专题命中 规划决策 :自适应框架动态选择求解器进行规划
AI总结 提出OmniPlan自适应框架,利用大语言模型解析用户意图,通过混合专家架构动态选择MIP求解器、启发式算法或深度强化学习模型,实现网络规划优化的及时性与近乎最优性,在分布式机器学习推理卸载任务中延迟降低97.8%,资源消耗降低11.5%。
Comments Accepted by ACM KDD 2026
MapSatisfyBench: 通过行为隐含决策因素基准测试满意度感知的地图智能体
发表机构 * University of Chinese Academy of Sciences(中国科学院大学) ; Institute of Automation, Chinese Academy of Sciences(中国科学院自动化研究所)
专题命中 规划决策 :评估地图智能体的隐含需求满足能力
AI总结 提出MapSatisfyBench基准,通过恢复用户行为链中的隐含决策因素来评估地图智能体的满意度感知能力,实验表明现有智能体在显式任务完成上表现良好,但在满足隐含需求方面仍有局限。
MeEvo: 元认知进化与自然进化相结合用于自动启发式设计
发表机构 * School of Computer Science, University of Nottingham Ningbo China(诺丁汉大学宁波分校计算机科学学院) ; School of Computer Science, University of Nottingham(诺丁汉大学计算机科学学院)
专题命中 规划决策 :自动启发式设计框架,结合进化与元认知
AI总结 提出MeEvo框架,通过循环耦合自然进化(探索启发式代码)和元认知进化(反思历史生成改进启发式),解决现有方法知识继承弱、探索不足的问题,在五个优化问题上表现更优。
部分可观测环境下导航的生成模型预测规划
发表机构 * University of Manchester(曼彻斯特大学) ; Aalto University(阿尔托大学)
专题命中 规划决策 :生成模型预测规划用于导航
AI总结 提出BeliefDiffusion框架,结合扩散模型和模型预测控制,显式建模多模态信念分布并进行前瞻规划,在合成地图环境中显著优于无模型强化学习和生成方法。
测试集中式和多中心计算规划
专题命中 规划决策 :比较计算规划者与基于代理的市场,涉及规划决策
AI总结 本文提出一个可复现的合成基准,在模拟经济中比较计算规划者、基于代理的市场和混合元市场,发现规划者福利损失更低,但结果受设计选择影响,主要贡献是方法论而非意识形态。
无环境奖励的固定通道感知事件流在线奖惩学习
发表机构 * Zirong Li(李 Cirong)
专题命中 规划决策 :提出无环境奖励的在线奖惩学习框架。
AI总结 提出OHIRL框架,在无标量奖励下通过固定通道感知流进行在线奖惩学习,利用内部轨迹评估器推断感知维度的效价,在XOR任务和CartPole等控制任务中达到高准确率。
Comments 9 pages, 5 figures, 6 tables; 13-page technical supplement
LLMZero: 通过LLM智能体发现RL后训练的自适应训练策略
发表机构 * Amazon(亚马逊)
专题命中 规划决策 :利用LLM智能体进行树搜索发现训练策略
AI总结 提出LLMZero系统,利用LLM智能体通过树搜索发现多阶段RL后训练的自适应策略,揭示容量参数单调累积、正则化参数振荡的规律,在4个GRPO任务上相对基线提升9%-140%。
带奖励机的帕累托Q学习
发表机构 * Linköping University, Sweden(瑞典_linköping大学) ; Univ. Lille, CNRS, Centrale Lille, UMR 9189 CRIStAL, F-59000 Lille, France(法国里尔大学、CNRS、中央里尔学院、UMR 9189 CRIStAL、法国里尔) ; Univ. Toulouse, INRAE-MIAT, Toulouse, France(法国图卢兹大学、INRAE-MIAT、图卢兹)
专题命中 规划决策 :多目标强化学习算法,用于智能体决策
AI总结 提出PQLRM算法,结合帕累托Q学习和奖励机,在多目标强化学习中高效逼近帕累托前沿,并处理非马尔可夫奖励。
Comments Accepted at the ICAPS 2026 Workshop on Bridging the Gap Between AI Planning and (Reinforcement) Learning (PRL)
ProfiLLM: 面向工业网约车调度的效用对齐智能用户画像
发表机构 * Didichuxing Co. Ltd(滴滴出行科技有限公司)
专题命中 工具调用 :LLM智能体用于网约车调度用户画像
AI总结 提出ProfiLLM,一种通过工具增强全局知识挖掘和效用对齐画像探索的智能LLM数据管道,解决工业网约车调度中大规模行为日志的用户画像问题,在滴滴生产系统中实现AUC提升6.14%、GMV提升4.35%。
门仅与其合约一样诚实:面向风险感知因果门控合约层的ContractGuard
专题命中 工具调用 :保护工具增强型LLM代理
AI总结 针对工具增强型LLM代理的间接提示注入,提出ContractGuard,通过验证合约完整性(而非风险标签)来防御攻击,在基准测试中实现零注入成功率。
用于LEGEND-1000 LoFi回旋管连续材料监测的视觉AI智能体
专题命中 软件智能体 :LangChain智能体流水线,自动材料监测
AI总结 提出基于LangChain和Claude Haiku 4.5的视觉AI智能体流水线,通过SAM2分割和混合OCR验证从静水压测试视频中自动提取OFHC铜圆柱的直径和应变,计算屈服强度并与模拟对比。
Comments 27 pages, 8 figures, 5 tables, submitted to PRX Intelligence
AGENTS.md 文件中的配置异味:配置编码代理的常见错误
专题命中 软件智能体 :编码代理配置问题,属于AI Agent
AI总结 本文首次系统化编码代理配置文件(AGENTS.md/CLAUDE.md)的异味,通过灰文献综述和仓库挖掘识别出六种异味,并在100个开源仓库中验证其普遍性,其中Lint Leakage最常见(62%)。
Code-Augur:通过规约推断的智能体漏洞检测
发表机构 * National University of Singapore(新加坡国立大学)
专题命中 软件智能体 :自主LLM智能体进行漏洞审计
AI总结 提出安全规约优先范式,通过显式化智能体假设并运行时反证,结合引导式模糊测试提升漏洞检测能力,在真实项目中比现有智能体检测更多漏洞。