Scaling Behavior of Single LLM-Driven Multi-Agent Systems
单一LLM驱动的多智能体系统的扩展行为
发表机构 * Fudan University(复旦大学)
AI总结 本文通过提出顺序迭代多智能体系统(SIMAS)框架,系统研究了同质多智能体系统性能随智能体数量变化的扩展规律,发现性能并非单调提升,而是受协作协同与协调开销之间的权衡支配,呈现收益递减模式。
单一LLM驱动的多智能体系统的扩展行为
发表机构 * Fudan University(复旦大学)
AI总结 本文通过提出顺序迭代多智能体系统(SIMAS)框架,系统研究了同质多智能体系统性能随智能体数量变化的扩展规律,发现性能并非单调提升,而是受协作协同与协调开销之间的权衡支配,呈现收益递减模式。
LP5X-PIM Sim:用于LPDDR5X-PIM的高保真硬件/软件集成模拟器
发表机构 * Samsung Electronics, South Korea(三星电子(韩国))
AI总结 本文介绍三星电子开发的LPDDR5X-PIM模拟器,通过集成硬件数据路径和软件控制层的高保真模型,实现系统性能和能效的精确评估。
Comments 4 pages, 4 figures, tech note
真实性债务与合成内容威胁格局:生成式AI时代信任、溯源和知识产权治理的分层框架
发表机构 * Accenture Services Pvt. Ltd.(Accenture服务有限公司)
AI总结 提出真实性债务概念,并基于零信任架构原则设计分层参考架构,整合密码学溯源、人工验证和持续治理,以应对生成式AI带来的合成内容威胁。
MemGraphRAG:基于记忆的多智能体系统用于图检索增强生成
发表机构 * Xiamen University(厦门大学) ; Jilin University(吉林大学)
AI总结 提出MemGraphRAG框架,通过基于记忆的多智能体系统构建高质量知识图谱,并设计记忆感知的分层检索算法,在多个基准上超越现有模型。
Comments Accepted by KDD 2026
Critic-R:使用具有自然语言内省反馈的指令调优检索器改进智能搜索
发表机构 * Center for Intelligent Information Retrieval(智能信息检索中心) ; University of Massachusetts Amherst(马萨诸塞大学阿默斯特分校)
AI总结 提出Critic-R框架,通过引入评论模型评估智能体内省推理轨迹,实现检索模型与推理代理之间的反馈闭环,无需人工标注即可优化检索质量与下游答案准确性。
光谱引导的神经Tucker分解
发表机构 * School of Automation, Chongqing University of Posts and Telecommunications(重庆邮电大学自动化学院) ; College of Computer and Information Science, School of Software, Southwest University(西南大学计算机与信息科学学院、软件学院)
AI总结 提出光谱引导的神经Tucker分解(SG-NTF),通过连续光谱空间映射和时空共门控机制,实现高维不完整张量的高效补全。
基于边缘的QoS感知自适应任务放置:多机器人系统中的闭环控制
发表机构 * Deakin University(德肯大学) ; RMIT University(皇家墨尔本理工大学) ; Zhejiang University(浙江大学) ; Swinburne University of Technology(西姆伯恩理工大学)
AI总结 提出一种QoS感知的自适应任务放置(ATP)控制器,通过多指标成本评分和闭环控制,在共享边缘节点上动态切换任务放置,以降低尾延迟和截止时间违规。
Comments 6 pages, 2 figure, 1 algorithm, accepted as a regular paper on the 24th IEEE International Conference on Industrial Informatics (INDIN), 26-29 July, 2026, Melbourne, Australia
用于机器人工程教育的四层通信架构与图形化开源平台的仿真到现实验证
发表机构 * Deakin University(德金大学) ; RMIT University(皇家墨尔本理工大学) ; Swinburne University of Technology(斯威本科技大学)
AI总结 针对大学实验室中机械臂教育规模化面临的商业数字孪生成本高和ROS门槛高的问题,提出一种四层通信架构,基于图形化开源平台(GOSP)实现虚拟环境与物理机器人的数据桥接,并通过仿真到现实验证其硬件无关的可行性。
Comments 4 pages, 4 figures, accepted as a Work-in-Progress (WiP) paper, on the 24th IEEE International Conference on Industrial Informatics (INDIN), 26-29 July, 2026, Melbourne, Australia
重尾噪声下随机梯度方法的期望收敛性
发表机构 * Stern School of Business, New York University(纽约大学斯特恩商学院)
AI总结 针对重尾噪声(有限p阶矩,p∈(1,2))下随机梯度方法的收敛性问题,证明了随机镜像下降(SMD)、加速随机镜像下降(ASMD)在凸优化中以及SGD和带动量的SGD(SGDM)在非凸优化中的期望收敛性,无需算法修改或有界域假设。
用于植入尖峰模型的简单、鲁棒近似消息传递
发表机构 * Stanford University(斯坦福大学)
AI总结 针对含对抗性噪声的尖峰矩阵模型,提出一种结合谱预处理与鲁棒谱初始化的算法,使近似消息传递(AMP)在无需修改的情况下实现鲁棒性,输出与无噪声AMP结果接近的向量。
Comments 32 pages
“我强烈怀疑这个网站是骗局”:自主网络代理中无防御的PII泄露与检测基准测试
发表机构 * KIIT Bhubaneshwar(KIIT布巴内什瓦尔) ; BITS Pilani(比特斯理工学院) ; Lam Research(拉姆研究)
AI总结 本文通过构建包含91个攻击者控制环境和10个良性孪生基线的基准Scammer4U,评估前沿自主网络代理在社交工程攻击下的PII泄露风险,发现关键PII泄露率高达54-93%,并揭示了代理检测到攻击但仍有35.9%概率提交PII的检测-行动差距。
Comments 24 pages
UniPinRec:在Pinterest规模下统一生成式检索与排序
发表机构 * Pinterest
AI总结 提出UniPinRec,通过共享Transformer编码用户行为序列,结合掩码动作建模、混合训练样本和跨阶段KV缓存共享,在Pinterest生产系统中首次实现检索与排序的全栈统一,提升在线参与度并降低延迟。
AgentxGCore:面向下一代移动核心网络的智能体AI
发表机构 * Centro de Informática - Universidade Federal de Pernambuco(计算机中心 - 佩鲁巴科联邦大学)
AI总结 本文提出AgentxGCore,通过智能体AI原生层扩展3GPP架构,利用多智能体系统实现基于实时信息的闭环优化,支持自组织和自适应。
Comments This paper has been accepted for publication in IEEE Network
基于重写的人类文本检测的无分布框架:通过Knockoff过滤
发表机构 * Prorata.ai
AI总结 提出一种无分布统计框架,将任意基于重写的检测器转化为具有有限样本FDR保证的检测器,无需重新训练,通过将重写检测视为具有knockoff结构的多重假设检验问题实现。
AutoIQ:前列腺扩散加权成像中几何畸变自动评估的集成框架
发表机构 * Biomedical Imaging Research Institute, Cedars-Sinai Medical Center(生物医学成像研究 institute, Cedars-Sinai 医疗中心) ; Department of Bioengineering, University of California(生物工程系,加州大学) ; Siemens Medical Solutions USA Inc.(西门子医疗解决方案美国公司) ; Siemens Healthineers AG(西门子健康影像股份有限公司) ; Department of Imaging, Cedars-Sinai Medical Center(成像部,Cedars-Sinai 医疗中心) ; Department of Nuclear Medicine, Cedars-Sinai Medical Center(核医学部,Cedars-Sinai 医疗中心) ; Department of Urology, Cedars-Sinai Medical Center(泌尿科,Cedars-Sinai 医疗中心)
AI总结 提出AutoIQ集成机器学习框架,结合分割和配准方法量化DWI几何畸变,用于自动分类畸变严重程度,在独立测试集上达到0.95准确率。
Comments Original research; 11 pages, 7 figures, 1 table
交互式多视图基因组学可视化的智能体创作
发表机构 * Harvard Medical School(哈佛医学院) ; Boston College(波士顿学院)
AI总结 针对基因组学可视化创作中定制化不足和编程门槛高的问题,提出基于大语言模型的智能体方案,通过结构化输出和迭代优化提升可视化质量。
Comments 11 pages, 12 figures
量化地理文化价值对多元安全对齐的显著性
发表机构 * University of Oxford(牛津大学) ; University of Cambridge(剑桥大学)
AI总结 通过多层次模型分析,发现文化区域归属对安全评分有显著影响(p<0.05),约10%的项目存在文化敏感性,当前LLM无法可靠替代人类评分员但可辅助筛选。
Comments 119 pages, 13 figures. ICML 2026 camera ready
基于重采样的聚类验证与探索分析(CARVE)
发表机构 * Department of Statistics, Columbia University, New York, NY, USA(哥伦比亚大学统计学系) ; Center for Theoretical Neuroscience, Zuckerman Mind Brain Behavior Institute, Columbia University, New York, NY, USA(哥伦比亚大学理论神经科学中心、Zuckerman思维-大脑-行为研究所) ; Department of Applied and Computational Mathematics and Statistics, University of Notre Dame, Notre Dame, IN, USA(诺丁汉大学应用与计算数学与统计学系) ; School of Data and Information Sciences, University of North Carolina at Chapel Hill, Chapel Hill, NC, USA(北卡罗来纳大学夏洛特分校数据与信息科学学院) ; Irving Institute for Cancer Dynamics, Columbia University, New York, NY, USA(哥伦比亚大学癌症动力学伊万·里弗斯研究所)
AI总结 提出CARVE开源软件包,通过重采样评估聚类稳定性和泛化性,在全局、簇和样本级别提供诊断,优于传统聚类验证指标。
LLM 也需要语义 ID 的编码器
发表机构 * Pinterest United States(Pinterest美国公司)
AI总结 提出 PrefixMem,一种基于前缀 n-gram 记忆表的轻量级语义 ID 编码器,为 LLM 提供结构化、前缀条件的表示,显著提升生成推荐中的语义 ID 准确率和检索召回率。
随机舍入增加小奇异值
发表机构 * Department of Computer Science, Purdue University(计算机科学系,普渡大学) ; Department of Mathematics, University of Alberta(数学系,阿尔伯塔大学)
AI总结 本文证明随机舍入作为低精度浮点运算的量化方案,不仅对极端长宽比矩阵,而且对恒定长宽比矩阵都能提升尾部奇异值簇,从而更广泛地发挥谱正则化作用。
生成架构如何塑造多智能体LLM系统中的代码复杂度:基于HumanEval的配对研究
发表机构 * GitHub
AI总结 通过配对实验比较六种多智能体架构在HumanEval上的代码复杂度,发现架构复杂度与功能正确性无正相关,最简架构在准确率上持平或超越复杂架构。
Comments 16 pages, 7 figures, 7 tables
基于对称Hermite求积的平衡截断:从导数数据学习线性动力系统
发表机构 * New York University(纽约大学) ; Virginia Tech(弗吉尼亚理工学院)
AI总结 提出一种对称Hermite求积平衡截断算法,通过传递函数及其导数数据构建线性降阶模型,保持状态空间Hermite性和渐近稳定性。
Comments 14 pages, 2 figures, 4 tables
预测流控制障碍函数用于实时安全最优控制
发表机构 * Department of Mechanical and Aerospace Engineering, University of Kentucky(机械与航空航天工程系,肯塔基大学)
AI总结 本文提出预测流控制障碍函数(P-CBF),通过将CBF推广为预测流的泛函,结合终端候选和规划时间偏移,实现有限预测时域内的安全证书,并统一了有限时域积分成本优化与安全认证。
零样本超分辨率在算子学习中是否可能?
发表机构 * Unique Subedi ; Ambuj Tewari
AI总结 本文系统研究算子学习中的零样本超分辨率现象,证明其在信息论上可能不可行,并识别输出函数的Hölder光滑性作为充分条件,给出泛化界。
奖励学习中的表示-可理性权衡
发表机构 * Vector Institute(向量研究所) ; University of Waterloo(滑铁库大学)
AI总结 本文研究RLHF中奖励学习面临的表示与可理性之间的权衡,通过分解交叉熵损失为表示项和聚合项,证明更丰富的表示会扩大不可理性比较的数量,且联合训练无法自动达到最优平衡点。
跨域事件的合成数据用于大规模推荐系统
发表机构 * Meta
AI总结 提出SCALR框架,通过源域事件生成目标域的合成用户-物品交互事件,以缓解数据稀疏和噪声反馈问题,并在工业推荐平台的在线A/B测试中取得显著改进。
Comments 13 pages, 3 figures
对流尺度降水降尺度的流匹配方法
发表机构 * Met Office(英国气象局)
AI总结 针对对流尺度降水降尺度问题,提出流匹配生成模型,相比扩散模型在空间技能上表现更优,但低估降水分布上尾导致气候平均偏干。
KISS:学习无线通信时保持简单和时隙化
发表机构 * AGH University of Krakow(克拉科夫AGH大学)
AI总结 本文使用离线双深度Q网络结合贝叶斯推理,在时隙信道上训练分布式智能体自主学习随机接入策略,实现了接近理论效率且公平的接入,并发现学习到的行为类似于动态调整传输概率的时隙ALOHA。
ReFLEX: 通过相对频率偏置实现MIMO-OFDM中长度可泛化的CSI去噪
发表机构 * Moscow Institute of Physics and Technology (State University)(莫斯科物理技术学院(国家大学)) ; Yangtze Delta Region Academy(长江三角洲地区研究院) ; Beijing Institute of Technology(北京理工大学) ; School of Interdisciplinary Science(交叉科学学院)
AI总结 提出ReFLEX,一种基于相对频率位置偏置(RFPB)的长度可泛化Transformer,用于MIMO-OFDM系统中可变RB分配的CSI去噪,在未见RB长度和稀疏DM-RS场景下无需重训即可应用,并在3GPP信道和NR PUSCH仿真中显著提升性能。
Comments 5 pages, 3 figures, submitted to IEEE journal
文明超材料:能力梯度与结构湍流下的协调工程
发表机构 * Independent Researcher(独立研究者)
AI总结 受超材料物理学启发,提出将治理从规范性学科转变为工程学科的正式框架,通过有效协调系数模型预测自愈与自失稳相变,并设计可检验假设与实验方案。
Comments 19 pages, 4 figures. Accepted for presentation at AGI-26 (Springer LNAI, forthcoming). v2 corrects the sign of the synergy term in the constitutive law (Eq. 2) and reformulates H3 as a threshold-crossing claim, per peer review