AI 大模型
AI Agent
智能体、工具调用、规划、工作流、多智能体和自主任务执行。
1. 多智能体 4 篇
FundaPod: A Multi-Persona Agent Pod Platform with Knowledge Graph Memory for AI-Assisted Fundamental Investment Research
FundaPod: 一个具有知识图谱记忆的多角色智能体平台,用于AI辅助的基础投资研究
专题命中 多智能体 :多角色智能体平台,支持独立研究和知识图谱记忆
AI总结 提出FundaPod平台,通过多角色独立研究、知识图谱记忆和事后裁决机制,支持人类投资经理进行透明、可验证的基础投资决策。
Comments 32 pages; 12 figures
Simulation of Language Evolution under Regulated Social Media Platforms: A Synergistic Approach of Large Language Models and Genetic Algorithms
受监管社交媒体平台下的语言演化模拟:大语言模型与遗传算法的协同方法
专题命中 多智能体 :多智能体框架模拟用户语言策略演化
AI总结 提出基于大语言模型的多智能体框架,结合遗传算法模拟用户语言策略在监管下的迭代演化,实验表明对话轮次增加可提升信息传递准确性和对话持续性。
Comments The manuscript has been accepted to IEEE Transactions on Computational Social Systems
2. 工具调用 1 篇
VitalAgent: A Tool-Augmented Agent for Reactive and Proactive Physiological Monitoring over Wearable Health Data
VitalAgent: 一种工具增强型代理,用于对可穿戴健康数据进行反应性和主动式生理监测
专题命中 工具调用 :工具增强推理和主动监测的智能体框架
AI总结 提出VitalAgent框架,通过工具增强推理和纵向生理记忆,实现对ECG/PPG信号的反应性问答与主动监测,在VitalBench基准上相比基线提升超30%。
Comments Minor revisions; results unchanged
3. 工作流自动化 3 篇
TSAssistant: A Human-in-the-Loop Agentic Framework for Automated Target Safety Assessment
TSAssistant: 一种人在回路中的自动化靶点安全性评估智能体框架
专题命中 工作流自动化 :多智能体框架自动化靶点安全性评估报告生成
AI总结 提出TSAssistant多智能体框架,通过分层指令架构和交互式优化循环,将靶点安全性评估报告生成分解为专业子任务,实现高可重复性和证据溯源。
Comments Updated with quantitative and expert evaluations
4. 其他Agent 4 篇
CogniFold: Always-On Proactive Memory via Cognitive Folding
CogniFold: 通过认知折叠实现始终在线的主动记忆
专题命中 其他Agent :主动记忆系统,持续认知结构涌现
AI总结 提出CogniFold,一种受大脑启发的主动记忆系统,通过将互补学习系统扩展为三层(海马体、新皮层、前额叶意图层)并利用图拓扑自组织,实现事件流的持续认知结构涌现,在认知评估和常规记忆基准上均表现优异。
Comments Code is available at https://github.com/OpenNorve/CogniFold
5. 软件智能体 2 篇
ShoppingBench: A Real-World Intent-Grounded Shopping Benchmark for LLM-based Agents
ShoppingBench:面向LLM智能体的真实世界意图导向购物基准
专题命中 软件智能体 :提出购物基准测试LLM智能体,属于软件智能体
AI总结 提出ShoppingBench基准,包含多层级真实购物意图任务,通过模拟环境和250万商品评估LLM智能体,发现GPT-4.1成功率低于50%,并提出轨迹蒸馏策略提升小模型性能。
Comments Accepted for oral presentation at AAAI 2026