AdMem: Advanced Memory for Task-solving Agents
AdMem: 面向任务求解智能体的高级记忆
发表机构 * Princeton University(普林斯顿大学) ; Amazon(亚马逊) ; Arm
AI总结 提出一种统一自动记忆框架,集成语义、情节和程序记忆,通过双层级设计和多智能体架构实现自动生成、奖励标注与自适应检索,提升长程多轮任务的鲁棒性和成功率。
AdMem: 面向任务求解智能体的高级记忆
发表机构 * Princeton University(普林斯顿大学) ; Amazon(亚马逊) ; Arm
AI总结 提出一种统一自动记忆框架,集成语义、情节和程序记忆,通过双层级设计和多智能体架构实现自动生成、奖励标注与自适应检索,提升长程多轮任务的鲁棒性和成功率。
当更好的代码手册还不够:LLM政治事件编码中的预测性能与行为可靠性
发表机构 * Independent Researcher(独立研究者) ; Illinois Institute of Technology(伊利诺伊理工学院) ; The University of Texas at Dallas(德克萨斯大学达拉斯分校)
AI总结 本研究探讨在政治事件编码任务中,将专家代码手册优化为LLM友好形式能显著提升分类性能,但预测增益并未完全转化为行为可靠性,模型在代码手册变化下仍可能失效。
一个用于流失预测和行为驱动因素识别的滚动窗口框架
发表机构 * Information and Computer Science Department, King Fahd University of Petroleum and Minerals(国王法赫德石油和矿物大学信息与计算机科学系) ; Interdisciplinary Research Center for Smart Mobility and Logistics (IRC-SML), King Fahd University of Petroleum and Minerals(智能交通与物流交叉研究中心(IRC-SML),国王法赫德石油和矿物大学) ; SDAIA–KFUPM Joint Research Center for Artificial Intelligence, King Fahd University of Petroleum and Minerals(SDAIA-KFUPM人工智能联合研究中心,国王法赫德石油和矿物大学)
AI总结 提出基于滚动行为窗口的流失预测框架,在非契约服务环境中实现连续风险评估,特征模型准确率87.6%、ROC-AUC 0.94,序列模型召回率96.1%。
基于真实仓库中闭路电视摄像机网络的多机器人规划与控制
发表机构 * Oxford Robotics Institute, University of Oxford, UK(牛津大学机器人研究所,牛津大学,英国) ; Robot Systems Group, Technical University of Munich, Germany(机器人系统组,慕尼黑技术大学,德国)
AI总结 提出仅利用分布式CCTV网络和边缘计算实现多机器人协调规划与控制的方法,在真实仓库中验证了四台机器人和30个摄像头的系统,首次实现仅依赖外部摄像头网络的现场多机器人协调。
AxisGuide: 在RGB观测中接地机器人动作坐标系以实现鲁棒的视觉运动操控
发表机构 * Korea University(韩国大学) ; University of Michigan(密歇根大学) ; KT R&D Center(KT研发中心) ; Kakao Mobility(Kakao移动)
AI总结 针对视觉运动策略在分布偏移下动作执行失败的问题,提出AxisGuide方法,通过渲染机器人基座坐标系轴并叠加提示通道,增强动作坐标理解,显著提升泛化性能。
PromptPrint: 通过自然语言提示在LLMs中的行为生物特征
发表机构 * Johns Hopkins University(约翰霍普金斯大学)
AI总结 提出PromptPrint,研究用户与LLM交互的简短提示是否包含可识别的行为生物特征,通过词汇、句法和话语模式分析,发现词汇稳定性假设成立,但存在唯一性-一致性悖论,且身份信号对语义改写脆弱。
深度强化学习中的性能变化
发表机构 * Department of Computing Science University of Alberta(计算科学系阿尔伯塔大学) ; Alberta Machine Intelligence Institute (Amii)(阿尔伯塔人工智能研究所(Amii)) ; CIFAR AI Chair(CIFAR人工智能主席)
AI总结 针对深度强化学习算法运行间鲁棒性低的问题,提出基于百分位的统计量(min-max IPR)和可视化方法(逐运行百分位高亮),用于评估性能变化,并通过三个案例验证其有效性。
何时深度思考:用于LLM推理的抑制性深思
发表机构 * University of Birmingham, United Kingdom(英国伯明翰大学)
AI总结 提出IDPR框架,通过抑制控制器根据快速答案决定是否启动慢速推理,在数学推理测试集上仅调用8.20%的慢速推理,准确率从47.90%提升至48.92%。
HybridCodec: 快速双流、语义增强的神经音频编解码器
发表机构 * Indian Institute of Technology, Madras(印度理工学院马德拉斯分校)
AI总结 提出HybridCodec,一种结合语义蒸馏与双流架构的统一神经音频编解码器,实现强解耦、跨语言鲁棒性及3倍速度提升。
OpenSkill: 面向LLM智能体的开放世界自我进化
发表机构 * Lehigh University(莱维大学) ; University of Illinois Chicago(伊利诺伊大学芝加哥分校) ; University of British Columbia(不列颠哥伦比亚大学) ; Vector Institute(向量研究所) ; Salesforce AI Research(Salesforce人工智能研究) ; Massachusetts General Hospital and Harvard Medical School(麻省总医院和哈佛医学院)
AI总结 提出OpenSkill框架,使智能体在无目标任务监督下,利用开放世界资源自举构建技能和验证信号,实现自我进化,在多个基准上取得最佳自动通过率。
多语言多说话人单元声码器:离散语音表示的系统分析
发表机构 * National Institute of Technology, Trichy(印度Trichy国家理工学院) ; Indian Institute of Technology, Madras(印度Madras理工学院)
AI总结 分析基于BigVGAN的单元声码器在多语言多说话人语音生成中的表现,发现聚类大小控制可懂度,显式说话人条件防止身份崩溃,语言监督在低聚类大小时有益。
使用预训练语言模型的模块化单语适应
发表机构 * Charles University, Faculty of Mathematics and Physics Institute of Formal and Applied Linguistics(查尔斯大学数学与物理系形式与应用语言学研究所)
AI总结 提出一种模块化方法,通过替换标记、冻结对应嵌入并调整模型其余部分,在低资源语言上提升NLU任务性能,优于全模型微调。
IDDMBSE:集成数据驱动和基于模型的系统工程用于可信自主网络物理系统
发表机构 * Institute for Systems Research, University of Maryland, College Park(系统研究所,马里兰大学,College Park)
AI总结 提出IDDMBSE方法,将MBSE V流程与数据驱动循环结合,通过开源工具链PERFECT、TRADES-X和VERITAS实现,在自主地面机器人全生命周期验证其有效性。
Synthics: 用于机器学习的类物理合成数据集
发表机构 * Aalto University(阿尔托大学)
AI总结 提出基于贝叶斯概率上下文无关文法从方程语料库生成结构相似的合成回归数据集,通过非侵入式探测确定物理有效域,统计验证表明合成数据在结构保真度上优于纯概率方法,且在下游超参数调优中性能接近真实数据。
SCOUT: 基于不确定性引导遍历的语义场景覆盖
发表机构 * Nokia Bell Labs, France(诺基亚贝尔实验室,法国) ; Nokia Bell Labs, Murray Hill, NJ, USA(诺基亚贝尔实验室,美国,新泽西州 Murray Hill) ; Imperial College London(帝国理工学院伦敦分校) ; Locus Robotics(Locus机器人技术公司)
AI总结 提出SCOUT框架,通过不确定性引导的遍历规划与概率场景图构建的闭环,使机器人主动探索并逐步理解环境,实现语义场景完整性作为操作目标。
MSAIC-Net:用于基于心电图的心肌基质异常检测的多尺度注意力和不平衡感知对比网络
发表机构 * University of Virginia(弗吉尼亚大学)
AI总结 提出多尺度注意力增强卷积网络MSAIC-Net,通过并行空洞卷积提取多尺度特征、通道注意力重加权、不平衡感知对比学习及导联置换重要性分析,在低数据量UVA队列和大规模PTB-XL数据集上实现心肌瘢痕和心肌梗死检测的准确性和可解释性提升。
ShallowBench: 浅口袋靶标上的生成式药物设计模型基准测试
发表机构 * University of Illinois - Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校)
AI总结 提出ShallowBench基准,包含5780个浅口袋靶标,用于评估生成式药物设计模型在低凹度界面上的性能,揭示现有模型预测结合亲和力较弱的问题。
主题情感是否导致感知意识形态?比较政治新闻文章中人类与LLM的标注
发表机构 * Columbia University(哥伦比亚大学)
AI总结 研究主题情感对感知政治意识形态的因果效应,通过比较人类与LLM标注,发现微调GPT-4o-mini产生显著因果效应,归因于捷径学习。
锚定而非分级:视觉-语言模型在纹理倾斜感知中失败
发表机构 * Brown University(布朗大学) ; Harvard University(哈佛大学)
AI总结 研究视觉-语言模型(VLM)在纹理倾斜感知任务中的表现,发现零样本和上下文提示均产生锚定失败,仅预测少数离散角度,监督微调部分缓解但残留锚定,表明问题在于表示到输出的语言接口无法分级表达。
使用7自由度机械臂进行非抓取式抛球的最优控制方法
发表机构 * Technical University of Munich(慕尼黑技术大学) ; Mohamed Bin Zayed University of Artificial Intelligence(穆罕默德·本·扎耶德人工智能大学) ; German Aerospace Center (DLR), Institute of Robotics and Mechatronics(德国航空航天中心(DLR)机器人与机电机构研究所)
AI总结 提出一种基于模型的两阶段最优控制框架,用于7自由度机械臂使用工具进行非抓取式抛球,生成周期性抛球轨迹并通过离线计算实现实时误差校正。
MMBU: 大规模多模态生物医学理解基准,用于探测视觉语言模型的感知能力
发表机构 * Stanford University(斯坦福大学) ; University of Wisconsin–Madison(威斯康星大学麦迪逊分校) ; Instituto Tecnológico de Monterrey(蒙特雷技术学院) ; Monash University(墨尔本大学) ; University of Cambridge(剑桥大学) ; Shanghai Jiao Tong University(上海交通大学) ; Shandong University(山东大学)
AI总结 提出MMBU基准,涵盖35个子模态,通过分类、定位和检测任务系统评估VLM在生物医学领域的视觉感知和泛化能力,发现高准确率可能掩盖感知缺陷。
S23DR 2026 获胜方案
发表机构 * Visual Recognition Group(视觉识别组) ; Czech Technical University in Prague(布拉格捷克技术大学)
AI总结 提出一种基于条件集和流匹配DiT的3D线框重建方法,通过全局粗预测、局部细化及多采样一致性步骤,在S23DR 2026挑战中取得HSS=0.654的领先成绩。
RPC-GS:基于原生RPC渲染的卫星图像高斯泼溅
发表机构 * Fraunhofer Institute of Optronics, System Technologies and Image Exploitation(弗劳恩霍夫光学研究所、系统技术与图像 exploitation 研究所)
AI总结 提出首个原生使用RPC模型的高斯泼溅框架RPC-GS,通过直接投影高斯均值和协方差避免近似误差,在卫星基准数据集上重建误差最低。
面向异构优化器的无服务器半去中心化联邦学习
发表机构 * Department of Electrical and Computer Engineering, Princeton University(普林斯顿大学电子工程与计算机科学系) ; Department of Electrical and Computer Engineering, Purdue University(帕克森大学电子工程与计算机科学系)
AI总结 提出无服务器半去中心化联邦学习(SSD-FL),通过轻量级D2D初始化实现聚类,利用有效损失函数和Cheeger不等式优化聚类,提升收敛速度和通信效率。
关于树上最优运动的难度
发表机构 * Rutgers University(罗切斯特大学)
AI总结 本文证明,在树上,带标签和2色变体的多智能体路径寻找(MAPF)问题在距离、makespan和flowtime三个目标下均为NP难,解决了长期未决的经典Pebble Motion问题。
RigPAPR:基于固定视角视频的静态神经点云绑定动画
发表机构 * APEX Lab(APEX实验室) ; School of Computing Science(计算科学学院) ; Simon Fraser University(西蒙弗雷泽大学)
AI总结 提出RigPAPR方法,通过直接线性混合蒙皮驱动静态神经点云,无需网格代理或姿态依赖校正,在合成和真实数据上减少关节边界伪影,新视角PSNR提升3+dB。
面向空间分离评估的高光谱分类自适应波段选择
发表机构 * International University of Rabat, Rabat, Morocco(拉巴特国际大学) ; Thales Alenia Space, Spain(西班牙泰勒斯阿莱尼亚空间公司)
AI总结 提出SGBR-HC方法,通过监督光谱排序初始化可训练稀疏门,自适应确定波段数,在空间分离评估下以约20个波段取得最高平均总体精度和Kappa系数。
HKJudge:用于解释法院认定事实、推理过程和裁决结果的法律话语标注语料库
发表机构 * City University of Hong Kong(香港城市大学) ; University of Chinese Academy of Sciences(中国科学院大学)
AI总结 提出首个句子级专家标注的法律话语数据集HKJudge,包含香港各级法院刑事判决,设计双层话语模式(26种修辞角色和3种判刑要素),并基于BERT和LLM进行基准评估。
人们真正希望从AI中得到什么?偏好多元性映射
发表机构 * Oxford Internet Institute, University of Oxford(牛津大学互联网研究所) ; Meedan
AI总结 通过分析75个国家1500份开放式回答,发现不同人对AI的期望各异,多数价值观仅被少数人要求,且同一词语(如“真实性”)含义分歧,某些能力存在争议,揭示当前RLHF偏好聚合方法的根本缺陷。
不确定性感知的LLM引导策略塑形用于稀疏奖励强化学习
发表机构 * USD AI Research Lab(USD人工智能研究实验室)
AI总结 提出ULPS框架,结合校准的大语言模型与不确定性估计,通过A*轨迹微调BERT模型提供动作建议,并用熵机制平衡LLM引导与PPO策略,在MiniGridUnlockPickup基准上显著提升成功率、奖励效率和样本复杂度。