Is Agent Memory a Database? Rethinking Data Foundations for Long-Term AI Agent Memory
智能体记忆是数据库吗?重新思考长期AI智能体记忆的数据基础
AI总结 本文提出将长期AI智能体记忆视为一种新的数据管理工作负载,通过形式化治理演化记忆(GEM)框架,用四个状态级操作替代记录级操作,并论证记录级系统无法满足其正确性条件,最后通过原型MemState验证可行性并指出未来研究方向。
智能体记忆是数据库吗?重新思考长期AI智能体记忆的数据基础
AI总结 本文提出将长期AI智能体记忆视为一种新的数据管理工作负载,通过形式化治理演化记忆(GEM)框架,用四个状态级操作替代记录级操作,并论证记录级系统无法满足其正确性条件,最后通过原型MemState验证可行性并指出未来研究方向。
统一神经缩放定律
AI总结 提出一种统一神经缩放定律(UNSL)函数形式,能够准确建模和预测深度神经网络在多个维度(模型参数、训练数据量、训练步数、推理步数、计算量及超参数)同时变化时的缩放行为,适用于多种架构和任务,并在大规模视觉、语言、数学和强化学习任务中实现更精确的缩放行为外推。
LLM蒸馏中的桥园困境:为什么混合硬标签和软标签有效
AI总结 针对大语言模型知识蒸馏中硬标签与软标签的混合使用,提出桥园分解理论解释其降低暴露偏差的机制,并开发自适应混合监督方法,在多个模型上实现性能提升和9.7倍训练成本降低。
Comments Accepted at ICML 2026
LongAV-Compass:面向分钟级音视频生成在T2AV、I2AV和V2AV上的统一评估
AI总结 针对现有评估协议局限于短片段的问题,提出LongAV-Compass基准,通过284个测试用例和统一评估框架,系统评估分钟级音视频生成在文本、图像、视频条件下的质量、一致性和对齐。
可证明通信高效且隐私保护的联邦图神经网络
AI总结 提出CE-FedGNN框架,通过稀疏交换聚合节点表示和移动平均估计器处理跨客户端依赖,结合度量差分隐私实现通信高效与隐私保护,并证明收敛速率和隐私保证。
LLM 能否内省?一个现实检验
AI总结 本文基于人类元认知研究的教训,质疑大型语言模型能否真正内省,并通过重新审视两个评估范式发现,当前证据不足以证明LLM具有元认知监控能力。
RoMo:用于人体运动生成的大规模、丰富组织的数据集和语义分类体系
AI总结 提出RoMo数据集,通过分类感知过滤流水线确保质量,并采用三级语义分类体系组织数据,使训练模型在保真度和多样性上达到最优,同时提升对复杂文本提示的理解。
Comments Accepted to CVPR'26
Sentinel:具身协同空间推理与规划
AI总结 提出Sentinel挑战和CoSaR框架,通过自然语言通信与空间导航算法结合,解决多智能体在城市规模户外环境中的协同空间推理与规划问题。
Comments The first two authors contributed equally
并非所有模态都平等:面向多模态视频的指令感知门控
AI总结 提出UniMVU框架,通过内模态和模态级指令感知动态门控实现多模态视频理解,在六个基准上优于静态融合方法。
Comments 19 pages, 8 figures, 7 tables, preprint
几何感知表示去噪用于鲁棒的多视角3D重建
AI总结 提出几何感知表示去噪(GARD)框架,在前馈3D重建模型的特征空间中执行扩散式多视角恢复,同时恢复场景几何与高质量RGB图像,在DA3基准上验证有效性。
从隐私到泛化:DP-SGD的线性最大信息界
AI总结 本文证明了DP-SGD的近似最大信息量具有与数据集大小成线性关系的有限样本界,并基于此推导出PAC-Bayes泛化界和DP-SGD训练模型的显式泛化界。
Comments 22 pages
结构蛋白质组学引导的共折叠模型
AI总结 提出AIMS-Fold框架,通过整合XL-MS和HDX-MS实验数据与扩散模型,在推理时引导蛋白质复合物构象生成,提升诱导接近靶标的预测准确性。
从流式时间序列建模时滞系统的动态混合
AI总结 提出在线框架DelayMix,将流式时间序列视为时滞系统的动态混合,通过固定长度表示总结过去状态,利用马尔可夫参数张量捕捉动态和延迟,实现快速适应环境变化并降低内存使用。
Comments Accepted by IJCAI 2026
HRVConformer:基于心率信号的新生儿缺氧缺血性脑病分类
AI总结 提出HRVConformer,一种混合卷积-Transformer深度学习架构,直接从原始心率信号端到端分类新生儿缺氧缺血性脑病,在测试集上达到83.23% AUC和74.56%准确率,优于Transformer、ResNet50等基线。
Comments Paper submitted to Journal of Engineering Applications of Artifical Intelligence
GAC: 面向混合SFT-RL后训练的噪声感知自适应混合
AI总结 提出噪声感知控制器GAC,通过在线估计梯度方差和两个训练信号之间的不一致性,自适应调整混合权重,以改进混合后训练性能。
Comments 15 pages, 3 figures, 22 tables
BrickAnything: 基于几何条件的可构建砖块生成与结构感知标记化
AI总结 提出BrickAnything,一个基于几何条件的自回归框架,通过结构感知树标记化生成满足装配约束和结构稳定性的砖块结构。
PitchBench: 测量音频-语言模型中的音高听觉能力
AI总结 提出PitchBench评估套件,通过28个实验系统测量音频-语言模型在绝对和相对音高感知上的表现,发现当前模型在不同声源、音长和格式下音高感知不可靠。
Comments Preprint
InfoQuant:为低比特LLM量化塑造激活分布
AI总结 针对低比特激活量化中分布与量化器不匹配的问题,提出基于信息论的分析和无需训练的峰值抑制正交变换(PSOT)方法,显著提升量化精度。
ARBITER:测试时采样中的推理轨迹盆地与多数投票失败
AI总结 本文发现语言模型测试时采样的推理轨迹会聚集成少数“推理盆地”,导致多数投票选择最稳定而非最准确的盆地,并提出ARBITER方法通过保守加性证据修正共识,从样本池中恢复部分正确性。
Comments Preprint. 34 pages, 2 figures
当规则违反罕见时:用于逻辑异常检测的嵌合体训练
AI总结 针对规则违反样本稀少的逻辑异常检测,提出嵌合体训练方法,通过特征级操作数反事实构造生成监督信号,提升规则级异常检测性能。
Comments 9+30 pages, 4+4 figures, under review
通过监督投影流形学习进行李群嵌入的神经动力学规划
AI总结 提出李群嵌入动力神经网络(LieEDNN),通过梯度下降和流形上的度量投影实现可学习且稳定的动力学,解决李群与神经网络加法不兼容及非线性表示空间中的演化问题,并在SE(3)伸缩机械臂上验证。
Comments Preprint. Under review
基于推送的异步联邦学习:一种偏差校正聚合方法
AI总结 提出PushCen-ADFL框架,通过中心表示空间中的平均保持推-求和混合与轻量级中心正则化,解决异步去中心化联邦学习中的通信开销、聚合偏差和模型漂移问题。
Comments Accepted at the 32nd ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD 2026). This is the extended version with full appendix
TSFMAudit: 时间序列基础模型中的数据污染审计
AI总结 针对时间序列基础模型(TSFMs)预训练数据污染问题,提出基于探针适应动力学的审计方法TSFMAudit,通过检测微调后损失下降更快且骨干网络移动更小的异常现象来识别污染数据集。
Comments 22 pages, 7 figures, 9 tables
自适应引导何时有帮助?部分可观测条件下自动驾驶的信念感知特权蒸馏
AI总结 本文提出信念感知GSAC(BA-GSAC),通过集成分歧动态调节蒸馏系数,系统研究自适应引导在部分可观测自动驾驶中的有效性,发现严重遮挡下系数过早崩溃,并揭示可观测性盲区问题。
Comments 9 pages, 3 figures, 7 tables. Accepted at CVPR 2026 Workshop on Autonomous Driving (WAD)
神经贝叶斯序列路由
AI总结 提出神经贝叶斯序列路由(NBSR)框架,将神经推理建模为有向无环图上的主动证据累积,通过狄利克雷-分类共轭框架实现不确定性量化、早期退出和资源理性推理。
Comments 71 pages
侵蚀对真实语音的信任:人类音频深度伪造感知的大规模研究
AI总结 通过大规模听辨实验(1768名参与者,35532次判断),发现音频深度伪造导致人类对真实语音的信任下降(准确率从72.7%降至64.1%),而非检测伪造能力下降。
SilIF:基于轮廓增强的隔离森林用于无监督交易欺诈检测
AI总结 提出SilIF方法,通过添加基于轮廓得分的层次增强隔离森林,在IEEE-CIS欺诈检测基准上平均AUC-PR提升0.0080,并在五个种子中均优于原始隔离森林。
Comments 5 pages, 1 figure, 5 tables. Code: https://github.com/venkat15vk/silif-anomaly-detection
大型语言模型中的预训练数据暴露:成员推断、数据污染及安全影响综述
AI总结 本文首次统一综述了大型语言模型中的预训练数据暴露问题,涵盖成员推断和数据污染,形式化定义了暴露级别,回顾了攻击与防御方法,并总结了实证发现及未来研究方向。
Comments accepted by NLDB 2025
自验证蒸馏:你的语言模型秘密地就是它自己的合成数据管道
AI总结 提出自验证蒸馏算法,让大语言模型仅用无标注种子问题,通过自生成、自验证和自训练提升推理能力,在数学、科学和编程任务上取得显著提升。
AirCast-SR: 基于潜在一致性扩散的千米级大气超分辨率基础模型
AI总结 提出AirCast-SR基础模型,利用潜在一致性扩散框架将全球AI天气预报从0.25度降尺度至1公里分辨率,实现零偏差和跨区域零样本迁移。
Comments Somnath Luitel and Manmeet Singh are equal-contribution co-first authors, with Manmeet Singh (manmeet.singh@wku.edu) as corresponding author