AI Agent - arXivDaily 专题

2606.20373 2026-06-19 cs.SE cs.AI 新提交专题 90

AutoPass: Evidence-Guided LLM Agents for Compiler Performance Tuning

AutoPass：基于证据的LLM智能体用于编译器性能调优

Zepeng Li, Jie Ren, Zhanyong Tang, Jie Zheng, Zheng Wang

专题命中工作流自动化：多智能体框架自动优化编译器性能

AI总结提出AutoPass多智能体框架，通过查询编译器内部状态和中间表示，利用运行时反馈迭代优化编译选项，无需训练即可提升性能，在x86-64和ARM64上分别实现1.043倍和1.117倍加速。

URL PDF HTML

2606.20318 2026-06-19 cs.DB 新提交专题 90

AgenticDB: Agentic Performance Reconfiguration for Database Workloads

AgenticDB: 面向数据库工作负载的代理式性能重配置

Xinyue Yang, Chaozheng Wang, Chen Zheng, Heng Zhang, Yanjun Wu

专题命中工作流自动化：智能体框架自动重配置数据库性能

AI总结提出AgenticDB框架，通过运行时交互实现数据库系统级和操作系统级重配置，诊断瓶颈并积累经验，在MySQL和PostgreSQL上平均性能提升118.1%。

URL PDF HTML

2606.19790 2026-06-19 cs.CE 新提交专题 90

The Orchestration Gap: Why Process Automation Stalls in Operationally Complex Industries

编排鸿沟：为何流程自动化在操作复杂行业中停滞不前

Jiechao Gao, Yuandong Pan. Yuangang Li, Jie Wang, Kincho Law, Michael Lepech

专题命中工作流自动化：分析多智能体系统在复杂行业自动化中的编排鸿沟。

AI总结本文提出“编排鸿沟”概念，分析为何多智能体系统在物流、医疗等复杂行业自动化中失败，并给出基于约束执行和可解释性的分阶段自动化路径。

URL PDF HTML

2606.19382 2026-06-19 cs.SE cs.AI 新提交专题 90

DynAMO:Dynamic Asset Management Orchestration via Topological Multi-Agent Scheduling

DynAMO：基于拓扑多智能体调度的动态资产管理编排

Kanishk Kushwaha, Vikrant Vinod Bansode, Harsh Vardhan, Dhaval C. Patel

专题命中工作流自动化：提出多智能体编排引擎，生成工作流图。

AI总结提出DynAMO引擎，采用先规划后执行架构生成可验证工作流图，支持顺序与并行执行，通过动态识别独立任务提升效率，在工业基准上实现1.6倍延迟降低，并保持正确性与安全性。

Comments 11 pages, 2 figures, 7 tables, 4 algorithms. Evaluated on the AssetOpsBench industrial benchmark. Code: https://github.com/kushwaha001/DynAMO

URL PDF HTML

2604.23938 2026-06-19 cs.CL 版本更新专题 90

TSAssistant: A Human-in-the-Loop Agentic Framework for Automated Target Safety Assessment

TSAssistant: 一种人在回路中的自动化靶点安全性评估智能体框架

Xiaochen Zheng, Zhiwen Jiang, David Tokar, Yexiang Cheng, Alvaro Serra, Melanie Guerard, Klas Hatje, Tatyana Doktorova

专题命中工作流自动化：多智能体框架自动化靶点安全性评估报告生成

AI总结提出TSAssistant多智能体框架，通过分层指令架构和交互式优化循环，将靶点安全性评估报告生成分解为专业子任务，实现高可重复性和证据溯源。

Comments Updated with quantitative and expert evaluations

URL PDF HTML

2606.20002 2026-06-19 cs.LG cs.AI cs.CL 新提交专题 85

Connect the Dots: Training LLMs for Long-Lifecycle Agents with Cross-Domain Generalization Via Reinforcement Learning

Connect the Dots：通过强化学习训练具备跨域泛化能力的长期生命周期智能体

Yanxi Chen, Weijie Shi, Yuexiang Xie, Boyi Hu, Yaliang Li, Bolin Ding, Jingren Zhou

专题命中工作流自动化：训练LLM作为长期生命周期智能体。

AI总结提出Connect the Dots框架，通过端到端强化学习训练LLM在长期任务中自我更新上下文并泛化到新领域，实验验证了跨域泛化能力。

Comments Work in progress; we will continuously update the codebase and arXiv version

URL PDF HTML

2606.19795 2026-06-19 cs.SE cs.AI 新提交专题 85

Agentic Electronic Design Automation: A Handoff Perspective

代理式电子设计自动化：一种交接视角

Jiawei Liu, Peiyi Han, Yuntao Lu, Su Zheng, Fengyu Yan, Bei Yu

专题命中工作流自动化：讨论基于LLM的代理在EDA中的交接与自动化。

AI总结本文从交接有效性角度出发，将EDA流程中的代理系统分为三类，并提出五层代理通信协议，以解决多阶段、多工具间的状态传递和验证问题。

URL PDF HTML

2606.19390 2026-06-19 cs.SE cs.AI 新提交专题 85

Execution-bound advisory automation for agentic AI: a reproducible AIBOM-driven CSAF-VEX framework

面向执行约束的自主AI自动化：一种可复现的AIBOM驱动的CSAF-VEX框架

Petar Radanliev, Omar Santos, Carsten Maple, Kay Atefi

专题命中工作流自动化：提出协议驱动框架，用于自主AI工作负载的自动化。

AI总结提出一种协议驱动框架，通过绑定SBOM和AIBOM工件与确定性环境捕获及结构化运行时遥测，结合静态与运行时证据生成CSAF VEX公告，经密码签名和确定性重放验证，在合成自主AI工作负载上评估。

Journal ref Execution-bound advisory automation for agentic AI: a reproducible AIBOM-driven CSAF-VEX framework. Front Artif Intell 9, (May 2026), 1826384

URL PDF HTML

2606.20394 2026-06-19 cs.RO math.OC 新提交专题 85

Agentic AutoResearch forSpace Autonomy: An Auditable, LLM-Driven Research Agent for Aerospace Control Problems

面向空间自主性的智能体自动研究：用于航空航天控制问题的可审计、LLM驱动的研究代理

Amit Jain, Richard Linares

专题命中工作流自动化：LLM驱动的研究代理自动开发航天控制策略

AI总结提出AutoResearch框架，利用大语言模型作为离线研究代理，自动迭代开发航天控制策略，并通过内置可信层审计结果，消除种子噪声影响，在交会和对接问题上验证了有效性。

URL PDF HTML

2606.18191 2026-06-19 cs.AI cs.MA 新提交专题 85

DRFLOW: A Deep Research Benchmark for Personalized Workflow Prediction

DRFLOW：用于个性化工作流预测的深度研究基准

Md Tawkat Islam Khondaker, Raymond Li, Muhammad Abdul-Mageed, Laks V. S. Lakshmanan, Issam H. Laradji

专题命中工作流自动化：评估AI代理预测个性化工作流的能力

AI总结提出DRFLOW基准，评估AI代理从异构源预测个性化工作流的能力，包含5领域100任务，并设计7个诊断指标，实验显示现有代理性能有限。

URL PDF HTML

2604.08552 2026-06-19 cs.DB cs.AI 版本更新专题 85

Automated Standardization of Legacy Biomedical Metadata Using an Ontology-Constrained LLM Agent

使用本体约束的LLM代理自动化标准化遗留生物医学元数据

Josef Hardi, Martin J. O'Connor, Marcos Martinez-Romero, Jean G. Rosario, Stephen A. Fisher, Mark A. Musen

专题命中工作流自动化：LLM代理自动化标准化生物医学元数据

AI总结提出基于LLM的元数据标准化系统，通过实时查询标准指南和本体服务，在839条HuBMAP记录上验证，相比纯LLM方法显著提升预测准确性。

URL PDF HTML

2606.19821 2026-06-19 cs.AI cs.LG 新提交专题 80

TelcoAgent: A Scalable 5G Multi-KPM Forecasting With 3GPP-Grounded Explainability

TelcoAgent: 一种可扩展的5G多KPM预测与3GPP基础可解释性

Geon Kim, Dara Ron, Sukhdeep Singh, Suyog Moogi, Pranshav Gajjar, V V N K Someswara Rao Koduri, Een Kee Hong, Vijay K. Shah

专题命中工作流自动化：多智能体管道用于5G KPM预测和可解释性。

AI总结提出TelcoAgent框架，利用基础模型实现多KPM的零样本预测，通过3GPP知识图谱和可解释性管道提供可操作诊断。

Comments 6 pages, 6 figures. Submitted to IEEE GLOBECOM 2026

URL PDF HTML

2606.19605 2026-06-19 cs.SE cs.AI 新提交专题 80

FAPO: Fully Autonomous Prompt Optimization of Multi-Step LLM Pipelines

FAPO：多步骤LLM流水线的全自动提示优化

Paul Kassianik, Baturay Saglam, Huaibo Zhao, Blaine Nelson, Supriti Vijay, Aman Priyanshu, Amin Karbasi

专题命中工作流自动化：框架自动诊断和优化流水线瓶颈，属于工作流自动化

AI总结提出FAPO框架，通过自动诊断流水线瓶颈并迭代优化提示或链结构，在18个模型-基准比较中15次优于基线GEPA，平均提升14.1个百分点。

URL PDF HTML

2606.19501 2026-06-19 cs.AI cs.CL cs.LG q-fin.RM 新提交专题 80

DeXposure-Claw: An Agentic System for DeFi Risk Supervision

DeXposure-Claw: 一个用于DeFi风险监管的智能体系统

Aijie Shu, Bowei Chen, Wenbin Wu, Cathy Yi-Hsuan Chen, Fengxiang He

专题命中工作流自动化：基于图时间序列的DeFi风险监管智能体

AI总结针对DeFi监管中LLM智能体易误报的问题，提出DeXposure-Claw系统，通过图时间序列基础模型预测风险网络，结合确定性监控和置信度门控生成可审计监管票据，并构建六轴评估基准DeXposure-Bench，实验验证有效性。

URL PDF HTML

2602.15707 2026-06-19 cs.MM cs.CL cs.LG 版本更新专题 80

Proactive Conversational Assistant for a Procedural Manual Task based on Audio and IMU

基于音频和IMU的主动式程序性任务对话助手

Rehana Mahfuz, Yinyi Guo, Erik Visser, Phanidhar Chinchili

专题命中工作流自动化：实时对话助手提供程序性任务指导，主动交互

AI总结提出首个仅使用音频和IMU模态的实时对话助手，通过微调语言模型减少不必要对话并提升问答准确性，在边缘设备上实现无云依赖。

Comments 5 figures. 5 more in appendix

URL PDF HTML

2606.19812 2026-06-19 cs.AI cs.LG 新提交专题 75

Human-on-the-Loop Orchestration for AI-Assisted Legal Discovery

AI辅助法律发现中的人机协同编排

Anushree Sinha, Srivaths Ranganathan, Abhishek Dharmaratnakar, Debanshu Das

专题命中工作流自动化：人机协同编排用于AI辅助法律发现，减少错误。

AI总结针对AI代理在电子取证中因多步推理错误导致的法律风险，提出一种四层验证架构，通过人机协同阈值减少特权豁免风险达61%。

URL PDF HTML

2606.19602 2026-06-19 cs.AI 新提交专题 75

Configurable Clinical Information Extraction with Agentic RAG: What Works, What Breaks, and Why

可配置的临床信息提取与智能体RAG：什么有效、什么失效及原因

Osman Alperen Çinar-Koraş, Marie Bauer, Sameh Khattab, Merlin Engelke, Moon Kim, Stephan Settelmeier, Shigeyasu Sugawara, Fabian Freisleben, Felix Nensa, Jens Kleesiek

专题命中工作流自动化：智能体RAG流水线自动推理和验证临床信息

AI总结针对临床文档元数据缺失问题，提出基于智能体RAG的ACIE系统，在埃森大学医学中心部署，通过完整患者上下文推理和源引用验证，在7326次临床判断中实现96.5%的提取接受率。

URL PDF HTML

2606.19852 2026-06-19 cs.CL cs.LG 新提交专题 70

Prompt, Plan, Extract: Zero-Shot Agentic LLMs Workflows for Lung Pathology Extraction from Clinical Narratives

提示、规划、提取：用于从临床叙述中提取肺部病理学的零样本智能体LLM工作流

Aman Pathak, Cheng Peng, Mengxian Lyu, Ziyi Chen, Reema Solan, Sankalp Talankar, Yasir Khan, Hiren Mehta, Aokun Chen, Yi Guo, Yonghui Wu

专题命中工作流自动化：智能体工作流用于临床信息提取。

AI总结提出零样本智能体工作流，利用开源大语言模型从肺切除病理报告中提取13个CAP字段，在无训练下达到0.893 Micro-F1，接近监督方法。

Comments 7 pages, 2 figures, 3 tables. Affiliations: (1) Department of Health Outcomes and Biomedical Informatics, College of Medicine, University of Florida, Gainesville, FL, USA; (2) Division of Pulmonary, Critical Care and Sleep Medicine, Department of Medicine, College of Medicine, University of Florida, Gainesville, FL, USA; (3) College of Nursing, Florida State University, Tallahassee, FL, USA

URL PDF HTML

2606.20360 2026-06-19 astro-ph.IM 新提交专题 60

Lightstack: A Python Package for Creating Photometric Data Cubes

Lightstack: 用于创建测光数据立方体的Python包

Andressa Wille, Rafael S. de Souza, Ana L. Chies-Santos, Thallis Pessi, Emille E. O. Ishida, Alberto Krone-Martins

专题命中工作流自动化：Python包自动化测光数据立方体创建

AI总结提出Lightstack Python包，通过裁剪、堆叠和PSF匹配三步将独立图像组合成测光数据立方体，支持多波段测光研究。

Comments 4 pages, 1 figure, published in RNAAS

Journal ref Research Notes of the AAS, Volume 10, Number 6, 2026

URL PDF HTML