What Must Generalist Agents Remember?
通用型智能体必须记住什么?
发表机构 * Carnegie Mellon University(卡内基梅隆大学) ; Georgia Institute of Technology(佐治亚理工学院)
AI总结 本文形式化论证了通用型智能体为在多个环境和目标下近似最优行动,必须存储领域相关信息以区分观察瓶颈处的不兼容最优动作,并证明记忆可用于重构局部转移动态。
通用型智能体必须记住什么?
发表机构 * Carnegie Mellon University(卡内基梅隆大学) ; Georgia Institute of Technology(佐治亚理工学院)
AI总结 本文形式化论证了通用型智能体为在多个环境和目标下近似最优行动,必须存储领域相关信息以区分观察瓶颈处的不兼容最优动作,并证明记忆可用于重构局部转移动态。
GRIDEX:基于网格的深度伪造频谱图取证解释
发表机构 * CSIRO(澳大利亚联邦科学与工业研究组织)
AI总结 提出GRIDEX框架,通过两阶段学习(SFT+GRPO)定位频谱图异常区域并生成结构化取证解释,提升伪造检测的可解释性。
低成本神经形态跌倒检测:使用合成事件数据和混合SNN
发表机构 * School of Electrical Engineering Pontificia Universidad Católica de Valparaíso, Chile(瓦尔帕莱索天主教大学电气工程学院)
AI总结 提出混合SNN-CNN模型,从智能手机视频合成事件相机数据,实现高效准确的跌倒检测。
Comments 4 pages, 6 figures, presented at ICONS 2025 during the Poster Session, but not published
LegalWorld: 法律智能体的生命周期交互环境
发表机构 * Fudan University(复旦大学) ; Shanghai Innovation Institute(上海创新研究院) ; Northwest University of Political and Law(西北政法大学)
AI总结 提出LegalWorld,一个将中国民事诉讼建模为五阶段因果链的生命周期交互环境,基于75309对判决书构建,并评估多智能体在连续诉讼中的能力差异。
基于图锚定交叉注意力Transformer神经网络的预测过程监控中结构约束完整事件序列生成
发表机构 * Department of Computer Science, University of Milan(米兰大学计算机科学系)
AI总结 提出图锚定交叉注意力Transformer(GGATN),通过全局过程图作为结构化记忆、Transformer自注意力编码序列位置、图锚定交叉注意力注入过程拓扑,结合维特比式图约束解码,一次性生成完整事件序列,在六个基准日志上优于LLM基线。
Comments 40 pages
临床对齐的几何约束用于鲁棒的IVUS血管边界分割
发表机构 * AIM For Health Lab, Monash University(莫纳什大学AIM健康实验室) ; Department of Data Science and Artificial Intelligence, Faculty of IT, Monash University(莫纳什大学信息技术学院数据科学与人工智能系) ; Monash University Victorian Heart Institute(莫纳什大学维多利亚心脏研究所) ; School of Computing Technologies, RMIT University(皇家墨尔本理工大学计算技术学院) ; National Cerebral and Cardiovascular Center(国立循环器病研究中心) ; Department of Cardiology, Chonnam National University Hospital and Medical School(全南大学医院和医学院心脏病学系)
AI总结 提出GeoCat网络,通过双编码器与可微几何一致性损失,在IVUS分割中降低边界漂移和拓扑错误,提升临床几何测量精度。
Comments MICCAI2026 Accepted
重新思考表格结构识别中的指针损失:面向空间局部性的几何感知指针损失
发表机构 * Teamreboott Inc.(Teamreboott公司)
AI总结 针对指针网络在表格结构识别中相邻单元格错误占79.6%的问题,提出几何感知指针损失,通过反距离加权重写交叉熵目标,聚焦邻近单元格梯度,在不增加推理成本下提升性能。
Morpheus: 一种面向土耳其语的形态感知神经分词器和词嵌入器
发表机构 * Independent Researcher(独立研究者)
AI总结 针对土耳其语粘着特性,提出Morpheus神经词素边界模型,实现无损可逆分词与结构化词嵌入,在可逆分词器中达到最低比特每字符(1.425),词素对齐F1提升至0.61,GPU内存节省约19%。
LLMs难以衡量区分不同水平学生的题目:阅读理解评估中题目区分度研究
发表机构 * MBZUAI(穆罕默德·本·扎耶德人工智能大学) ; University of Maryland(马里兰大学) ; Virginia Tech(弗吉尼亚理工大学)
AI总结 本研究评估42个LLM在零样本设置下预测题目区分度的能力,发现直接预测与人类校准的区分度相关性弱(最高Spearman 0.152),基于CTT的响应校准相关性有限(0.241),表明LLM尚不能可靠捕捉题目区分度。
PEFT-MedSAM:面向可解释皮肤病变分割的医学基础模型高效微调
发表机构 * Department of Computer Science, Quaid-e-Awam University of Engineering, Sciences & Technology(计算机科学系,卡迪尔-阿瓦姆工程、科学与技术大学) ; Department of Artificial Intelligence, Quaid-e-Awam University of Engineering, Sciences & Technology(人工智能系,卡迪尔-阿瓦姆工程、科学与技术大学) ; Department of Computer Science, Sindh Madressatul Islam University, City Campus, Karachi(计算机科学系, Sind 阿里斯坦伊斯兰大学,卡拉奇城校区) ; Department of Computer Science and Digital Technologies, School of Architecture, Computing and Engineering, University of East London(计算机科学与数字技术系,建筑、计算与工程学院,东伦敦大学)
AI总结 提出参数高效微调方法PEFT-MedSAM,冻结预训练编码器仅训练轻量解码器,在ISIC 2018上达到0.9411 Dice系数,并通过Grad-CAM可解释性增强临床可信度。
晶格结构中的选择性单元胞驱动用于软体机器人的分布式形态变化
发表机构 * Istituto Italiano di Tecnologia (IIT)(意大利技术研究院)
AI总结 提出嵌入式气动单元胞,将弯曲支柱晶格与双向波纹管致动器集成,通过空间驱动模式实现全局形态控制,实验验证了可扩展位移、力生成及弯曲、抓取和爬行运动。
Comments Accepted to IROS 2026, 8 pages, 5 figures
跨模态生物学语言模型的逻辑空间对比对齐
发表机构 * Biomedical Informatics and Data Science, Yale School of Medicine(耶鲁医学院生物医学信息学与数据科学)
AI总结 提出LOGICA框架,在输出逻辑空间进行对比学习,通过门控跨模态适配器保留预训练似然接口,实现跨不同词汇表模型的上下文条件预测,在蛋白质-配体结合、TCR-肽活性和药物耐药性预测任务上超越现有方法。
UniTemp: 通过双向蒸馏实现任意时间顺序的视频生成
发表机构 * University of Wisconsin Madison(威斯康星大学麦迪逊分校) ; Adobe Research(Adobe 研究院) ; University of California Los Angeles(加利福尼亚大学洛杉矶分校) ; University of California Davis(加利福尼亚大学戴维斯分校)
AI总结 提出UniTemp框架,通过双向蒸馏训练单个自回归模型,支持任意时间方向(前向、后向、中间插值)的视频生成,解决因果3D VAE在后向生成中的不连续性,提升可控性。
TW-LegalBench: 衡量台湾法律理解
发表机构 * University of Rochester(罗切斯特大学) ; National Taiwan University(国立台湾大学) ; NVIDIA(英伟达)
AI总结 提出TW-LegalBench基准,包含多项选择、开放式问答和法律判决预测任务,评估13个LLM在台湾法律上的表现,发现顶尖模型通过律师考试但未达到法官检察官标准,且法律条文引用困难。
Comments 10 pages, 2 figures, To appear in ICAIL 2026
通过数据投毒进行隐蔽的世界模型操纵
发表机构 * Department of Computer Science(计算机科学系)
AI总结 提出SWAAP框架,通过两阶段数据投毒(双层级优化寻找有害目标模型+梯度匹配隐蔽实现)操纵学习到的世界模型,导致规划性能显著下降,且能规避多种防御检测。
Comments 41 pages, 8 figures, 11 tables. Submitted to NeurIPS 2026
双通道接地世界建模 (DCGWM):通过异构外部接地与内向梯度流结构性防止目标干扰崩溃
发表机构 * Independent Researcher(独立研究者)
AI总结 提出双通道接地世界建模(DCGWM),通过分区潜空间和内向梯度流,结构性防止联合嵌入预测架构中多目标接地导致的目标干扰崩溃。
Comments Position paper. Experimental validation in progress
空间分层蒸馏用于异构雷达位置识别
发表机构 * CSIRO Robotics(澳大利亚联邦科学与工业研究组织机器人实验室) ; University of Queensland(昆士兰大学)
AI总结 针对4D汽车雷达与密集旋转雷达之间的异构位置识别,提出空间分层蒸馏(SSD)方法,通过基于雷达回波的物理空间非对称对齐,在重叠区域强制特征对齐,在稀疏区域降低蒸馏权重,在HeRCULES数据集上达到最先进性能。
Comments IEEE ICRA Workshop on Open Challenges for Rigorous Robot Perception 2026
ForecastBench-Sim:一个模拟世界预测基准
发表机构 * Forecasting Research Institute(预测研究所)
AI总结 提出基于Freeciv游戏模拟的预测基准ForecastBench-Sim,通过游戏回滚生成可控、即时可解的预测问题,用于评估AI系统的概率推理能力。
Comments 15 pages, 5 main figures, 6 appendix figures. Spotlight presentation at Forecasting as a New Frontier of Intelligence / Workshop on AI Forecasting, ICML 2026
使用先进深度学习模型的多类脑肿瘤分类:一项比较研究
发表机构 * Department of Computer Science, Quaid-e-Awam University of Engineering, Sciences & Technology(夸迪-艾瓦姆工程、科学与技术大学计算机科学系) ; Department of Artificial Intelligence, Quaid-e-Awam University of Engineering, Sciences & Technology(夸迪-艾瓦姆工程、科学与技术大学人工智能系) ; The Faculty of Artificial Intelligence and Cyber Security, Universiti Teknikal Malaysia Melaka(马来西亚梅拉卡技术大学人工智能与网络安全学院) ; Department of Data Science, Quaid-e-Awam University of Engineering, Sciences & Technology(夸迪-艾瓦姆工程、科学与技术大学数据科学系) ; Department of Computer Science and Digital Technologies, School of Architecture, Computing and Engineering, University of East London(东伦敦大学建筑、计算与工程学院计算机科学与数字技术系)
AI总结 本研究比较五种CNN架构(包括定制模型和四种预训练模型)在约10,000张MRI图像上的多类脑肿瘤分类性能,发现EfficientNetB0以95%准确率最优,尤其显著提高了脑膜瘤的召回率(89%)。
超越多样性:将视觉令牌剪枝视为子空间重建以实现高效视觉语言模型
发表机构 * Inha University(延世大学)
AI总结 提出SPARE方法,将令牌剪枝重构为子空间重建问题,通过迭代选择投影残差大的令牌进行剪枝,并引入反相关性机制保留上下文信息,在LLaVA上剪枝94%令牌仍保持95%性能。
Comments ECCV 2026 Under Review
高自由度轻量化仿生腿:提升小型机器人机动性
发表机构 * Shanghai Jiao Tong University(上海交通大学) ; Shanghai University of Electric Power(上海电力大学)
AI总结 针对微型机器人腿部自由度受限问题,提出一种四自由度并联腿机构,通过同心设计简化运动学,实现轻量化(18.9g)和大工作空间(>22255 mm³),显著提升运动灵活性。
表格基础模型在流学习中的有界上下文管理
发表机构 * Seoul National University(首尔大学) ; KAIST(韩国科学技术院)
AI总结 针对表格流学习中分布漂移问题,提出上下文管理策略CURE,通过不确定性门控准入和冗余感知驱逐管理上下文,在七个流上相对提升最高27.0%。
Comments Accepted as a spotlight oral (top 5%) at the 2nd ICML Workshop on Foundation Models for Structured Data (FMSD@ICML2026)
InTrain: 面向零成本神经架构搜索的内在可训练性
发表机构 * School of Computer and Data Science, Fuzhou University(福州大学计算机与数据科学学院) ; School of Computer and Data Science, Minjiang University(闽江学院计算机与数据科学学院) ; School of Artificial Intelligence, Nanchang University(南昌大学人工智能学院) ; Department of Computer Science, Hong Kong Baptist University(香港浸会大学计算机科学系) ; School of Interdisciplinary Medicine and Engineering, Harbin Medical University(哈尔滨医科大学跨学科医学与工程学院)
AI总结 提出统一理论代理InTrain,通过几何容量和优化韧性两个协同成分形式化架构的可训练性,在NAS基准上达到与集成方法相当的排序相关性。
BrainFusionNet:一种用于理解MRI图像局部、全局和序列特征以改进脑肿瘤检测的深度学习与XAI模型
发表机构 * School of Mathematics, Physics and Computing, University of Southern Queensland(南方昆士兰大学数学、物理与计算学院) ; School of Engineering, University of Southern Queensland(南方昆士兰大学工程学院)
AI总结 提出BrainFusionNet混合模型,结合CNN、ViT和GRU提取MRI空间、上下文和序列特征,并集成SHAP、LIME和GradCAM进行可解释性分析,在公开数据集上达到98%准确率,优于SOTA CNN。
scGTN:用于单细胞RNA测序聚类的深度孪生图变换网络
发表机构 * Sichuan University(四川大学) ; University of International Business and Economics(对外经济贸易大学) ; Great Bay University(大湾区大学) ; The Education University of Hong Kong(香港教育大学)
AI总结 提出scGTN框架,通过孪生图变换网络整合基因表达与细胞间结构信息,利用最优传输策略进行自监督聚类,在多个数据集上优于现有方法。
Comments Accepted by Proceedings of the Thirty-Fifth International Joint Conference on Artificial Intelligence (IJCAI 2026)
NeuralMUSIC: 一种用于机器人声源定位的混合神经-子空间框架
发表机构 * School of Electrical and Electronic Engineering, Nanyang Technological University(南洋理工大学电气与电子工程学院)
AI总结 提出NeuralMUSIC混合框架,结合神经网络估计空间协方差矩阵与经典MUSIC子空间方法,通过频率注意力融合和自监督学习提升机器人声源定位的鲁棒性和跨域泛化能力。
RegMix-D: 通过代理训练轨迹实现动态数据混合
发表机构 * The University of Tokyo(东京大学) ; National Institute of Informatics(国立信息学研究所)
AI总结 提出RegMix-D,通过代理训练轨迹预测多阶段最优混合比例,实现动态数据混合,在13个下游任务上优于RegMix和DoReMi,且代理计算预算仅为RegMix的25%。
Comments Work in progress
LandslideAgent与多模态LandslideBench:一种面向自主滑坡识别与分析的领域规则增强型智能体
发表机构 * Central South University(中南大学)
AI总结 提出指令驱动智能体框架,包含多模态数据集LandslideBench、滑坡专用视觉语言模型LandslideVLM及领域规则增强智能体LandslideAgent,实现自主滑坡识别与分析。
负责任的ASR:克服窄带和低资源场景下基础模型的挑战
发表机构 * Applied AI(应用人工智能)
AI总结 本文评估了开源和商业基础ASR模型在窄带对话中的表现,针对低资源语言印地语和低资源口音印度英语,发现零样本性能不佳,微调虽有改进但效果因语言和口音而异。
基于热核先验的流形变分学习
发表机构 * Yale School of Medicine(耶鲁大学医学院) ; University of Virginia(弗吉尼亚大学) ; Harvard Medical School(哈佛医学院)
AI总结 提出一种流形锚定变分框架,利用几何感知EM算法选择热核加权潜图上的图中心点作为原型,确保原型在流形上,并通过Dirichlet能量正则化保持潜空间几何平滑,在心脏瘢痕和脑MRI基准上取得最高精度和清晰原型。