Adaptive Weighted Averaging
自适应加权平均
发表机构 * University of Utah(犹他大学) ; Boston University(波士顿大学) ; Google(谷歌)
AI总结 提出一种从单次无偏估计中选取最大未知值的方法,具有可容许性且不劣于基线,应用于随机优化获得在线到批次的转换界限。
自适应加权平均
发表机构 * University of Utah(犹他大学) ; Boston University(波士顿大学) ; Google(谷歌)
AI总结 提出一种从单次无偏估计中选取最大未知值的方法,具有可容许性且不劣于基线,应用于随机优化获得在线到批次的转换界限。
Sparse2Act: 学习跨域机器人操作的动作对齐稀疏3D表示
发表机构 * University of California, Los Angeles(加州大学洛杉矶分校) ; University of California, San Diego(加州大学圣迭戈分校) ; University of Utah(犹他大学)
AI总结 提出Sparse2Act框架,通过动作对齐的掩码稀疏3D编码预训练,实现跨域机器人操作,在LIBERO-10上达86.9%成功率,并支持域迁移和sim-to-real。
大型语言模型中的预填充感知
发表机构 * Constellation University of Wisconsin-Madison(威斯康星大学麦迪逊分校星座研究所) ; Constellation Georgia Institute of Technology(佐治亚理工学院星座研究所) ; UK AI Security Institute(英国人工智能安全研究所)
AI总结 研究大型语言模型能否识别并响应其助手消息被预填充或篡改,发现前沿模型具有显著预填充感知能力,可能影响安全评估方法。
GRIP:面向大型多模态模型的反馈引导提示检索
发表机构 * University of Illinois Urbana Champaign(伊利诺伊大学厄巴纳-香槟分校) ; University of Bonn(波恩大学) ; Microsoft(微软)
AI总结 提出GRIP,一种可学习的视觉检索框架,利用多模态模型反馈识别真正提升上下文学习性能的示例,在分类、描述和VQA任务上优于基于相似度的检索。
降低可穿戴设备上用于脑电图分析的深度学习模型复杂度
发表机构 * University of Tehran(德黑兰大学) ; Mälardalen University(梅拉达伦大学) ; Royal Institute of Technology(皇家理工学院)
AI总结 研究通过参数量化和电极减少方法,在资源受限的可穿戴设备上部署DNN模型,实现脑电图分析中精度与复杂度的权衡。
深度展开潜在最优分区l2/l1网络用于数据驱动的块稀疏恢复
发表机构 * Nagoya Institute of Technology(名古屋工业大学) ; RIKEN Center for Advanced Intelligence Project(理化学研究所革新智能研究中心)
AI总结 针对凸LOP-l2/l1方法依赖手动调参且近端算子不可微的问题,提出基于隐式微分和深度权重分解的两种深度展开架构,实现自动参数学习,在块稀疏恢复中表现优异且抗脉冲噪声。
跨尺度科学挑战的AI智能体基准测试
发表机构 * Yale University(耶鲁大学) ; Broad Institute of MIT and Harvard(布罗德研究所) ; The Pennsylvania State University(宾夕法尼亚州立大学) ; Northeastern University(东北大学) ; Northwestern University(西北大学)
AI总结 提出SciAgentArena基准,含约200个交互式任务,评估AI智能体在真实科研场景中的能力,发现其在数据分析中有效,但在创新探索和开放问题上表现不均。
物理信息神经网络与径向基函数求解含狄拉克δ源的偏微分方程
发表机构 * Department of Civil and Environmental Engineering, University of Illinois Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校土木与环境工程系)
AI总结 针对含狄拉克δ项的偏微分方程,通过将物理信息神经网络解释为残差最小二乘法,利用弱形式直接处理δ项,并对比径向基函数展开方法,发现径向基函数-残差最小二乘法在输运问题中更稳定。
让我们问高斯:改进的单次运行隐私审计
发表机构 * Georgia Institute of Technology(佐治亚理工学院) ; Rensselaer Polytechnic Institute(伦斯勒理工学院) ; Purdue University(普渡大学)
AI总结 提出一种基于高斯渐近分布的差分隐私审计框架,利用白盒DP-SGD中金丝雀对齐信号的归一化和,从单次训练运行中获取更紧的隐私下界。
规范性鲁棒性作为LLM中不可验证推理的前沿
发表机构 * DeepMind ; Institute of Philosophy, School of Advanced Study, University of London(伦敦大学高等研究院哲学研究所) ; Technische Universität Berlin(柏林工业大学)
AI总结 提出道德推理作为不可验证推理的典型子域,定义道德鲁棒性并引入可扩展的多轮对抗评估框架,发现模型会向用户偏好偏移推理(平均6.5%),且受顺序和轮次影响。
重新思考LLMs的心理测量评估:自我报告何时以及为何能预测行为
发表机构 * Caltech(加州理工学院) ; UIUC(伊利诺伊大学厄巴纳-香槟分校) ; University of Cambridge(剑桥大学)
AI总结 研究对比大五人格与计划行为理论,发现LLMs的自我报告-行为一致性存在选择性:在共享对话中TPB达到人类水平,跨对话仅对锚定于训练的行为保持一致性,且角色提示不能使行为对齐。
EquiDexFlow: 基于接触的SE(3)-等变灵巧抓取生成流
发表机构 * Institute for Systems Research, University of Maryland, College Park(马里兰大学帕克分校系统研究所)
AI总结 提出EquiDexFlow,一种SE(3)-等变流匹配模型,联合预测腕部姿态、关节角度、指尖接触、表面法线和接触力,通过将接触投影到物体表面并将力约束在库仑摩擦锥内,确保物理稳定抓取,在16自由度Allegro手上实现零摩擦违规和最佳综合分数。
心智理论效用:心理化机制的形式化规范
发表机构 * Institute for Creative Technologies, University of Southern California(南加州大学创意技术研究所) ; Khoury College of Computer Sciences, Northeastern University(东北大学库里计算机科学学院)
AI总结 提出心智理论效用(ToM-U)框架,通过局部认知世界模型(LEWM)形式化推断他人信念的计算问题,定义结构、推理过程及失败痕迹,区别于贝叶斯心智理论等方法。
AI审稿人是否看到全貌?攻击与防御多模态同行评审
发表机构 * University of North Carolina at Chapel Hill(北卡罗来纳大学教堂山分校)
AI总结 针对AI同行评审易受多模态对抗攻击的问题,提出PaperGuard基准,包含多领域数据集、统一攻击套件和基于分块嵌入搜索的实用防御方法。
能力对齐之前的定义对齐:一个用于裁定关于AGI主张的设计科学框架
发表机构 * Universidad Internacional de Investigación México(墨西哥国际研究大学)
AI总结 针对AGI定义不统一导致争议的问题,提出DAF-AGI框架,包含五个序数标准和一个结构化治理审计,用于评估候选定义并裁定AGI主张。
AfriSUD:用于评估非洲语言模型的依存树库集合
发表机构 * Princeton University(普林斯顿大学) ; Laboratory for Artificial Intelligence, Princeton University(普林斯顿大学人工智能实验室) ; Gaston Berger University(加斯顿·伯杰大学) ; Mila, McGill University(麦吉尔大学米拉研究所) ; Canada CIFAR AI Chair(加拿大CIFAR人工智能教席) ; Paris Nanterre University(巴黎南泰尔大学) ; Paris-Saclay University(巴黎-萨克雷大学) ; CNRS(法国国家科学研究中心) ; Inria(法国国家信息与自动化研究所) ; LORIA(洛林计算机科学实验室) ; Université de Lorraine(洛林大学) ; University of Trento(特伦托大学) ; University of Minnesota–Twin Cities(明尼苏达大学双城分校) ; Imperial College London(伦敦帝国学院) ; Binghamton University(宾汉姆顿大学) ; Makerere University(马凯雷雷大学) ; Penn State University(宾夕法尼亚州立大学) ; Mbarara University of Science and Technology(姆巴拉拉科技大学) ; Chalmers University of Technology(查尔姆斯理工大学) ; University of Ibadan(伊巴丹大学) ; Nnamdi Azikiwe University(纳姆迪·阿齐基韦大学) ; South African Centre for Digital Language Resources(南非数字语言资源中心)
AI总结 为弥补非洲语言在NLP资源上的不足,构建了首个大规模九种非洲语言句法标注树库AfriSUD,评估多种模型发现显著句法差距。
VLADriveBench:评估自动驾驶VLA中的CoT-动作关系
发表机构 * Uber AV Labs(优步自动驾驶实验室)
AI总结 提出VLADriveBench框架,结合观察指标和CoT干预协议评估VLA模型中思维链与驾驶动作的相关性和因果性,发现不同模型表现差异显著。
基于可穿戴传感器数据的2型糖尿病个性化血糖评估:LLM驱动方法
发表机构 * Department of Information Systems and Cybersecurity, The University of Texas at San Antonio(德克萨斯大学圣安东尼奥分校信息系统与网络安全系) ; School of Engineering Medicine, Texas A&M University(德克萨斯农工大学工程医学院) ; Department of Family and Community Medicine, The University of Texas at San Antonio(德克萨斯大学圣安东尼奥分校家庭与社区医学系)
AI总结 提出GlyLLM框架,利用大语言模型整合可穿戴传感器数据和结构化元数据,实现个性化血糖动态建模,在血糖预测和糖尿病分类任务上分别比传统ML方法提升13.66%和13.08%。
EWAM:一种用于具身智能闭环在线自适应的增强世界动作模型
发表机构 * Astronex Robotics ; Nanjing University of Information Science and Technology(南京信息工程大学)
AI总结 提出EWAM架构,基于冻结的Cosmos3骨干网络,通过四个轻量级神经层实现零样本在线自适应,无需微调或额外演示数据,显著减少新任务布局的部署数据需求。
可观察模式并非解释:潜在推理模型的因果几何分析
发表机构 * Université Grenoble Alpes, CNRS, Grenoble INP, LIG(格勒诺布尔阿尔卑斯大学,法国国家科学研究中心,格勒诺布尔国立理工学院,信息学实验室) ; Université Paris-Saclay(巴黎-萨克雷大学) ; NAVER LABS Europe(NAVER欧洲实验室)
AI总结 本文通过对照实验和因果干预发现,潜在推理模型中的可观察模式(如BFS前沿)在控制组中也出现且不总是因果影响行为,提出潜在思维的使用是分级的,其因果效应集中在低秩方向,几何结构随行为影响增强而更有序。
M*: 一个模块化、可扩展的多模态模型服务系统
发表机构 * Stanford University(斯坦福大学) ; University of Washington(华盛顿大学) ; Carnegie Mellon University(卡内基梅隆大学)
AI总结 提出M*系统,通过将模型表示为数据流图并引入Walk Graph抽象,支持多模态复合模型的高效服务,在多个任务上降低延迟并提升吞吐量。
预测不等于归因:在基于图的神经营销组合模型中定位解码器旁路
发表机构 * University of California, Irvine(加州大学尔湾分校) ; AdsGency AI
AI总结 针对基于图的神经营销组合模型中预测精度高但归因失败的问题,提出DICE-MMM框架,通过限制解码器通信路径来诊断和定位归因旁路,实验表明低预测误差不能保证归因正确性。
从AGI到ASI
发表机构 * Google DeepMind(谷歌深度思维) ; University of Waterloo(滑铁卢大学) ; Australian National University(澳大利亚国立大学) ; University College London(伦敦大学学院)
AI总结 探讨从人类级通用人工智能到超级智能的转变路径,包括扩展、范式转变、递归改进和多智能体涌现,并分析摩擦与瓶颈。
因果不变性在有限样本设置中对领域适应有多大用处?
发表机构 * Department of Computer Science, ETH Zurich(苏黎世联邦理工学院计算机科学系) ; Causal Artificial Intelligence Lab, Columbia University(哥伦比亚大学因果人工智能实验室) ; Department of Statistics, Columbia University(哥伦比亚大学统计系)
AI总结 研究线性回归中因果不变性如何提升监督领域适应,通过候选预测器的目标风险边界和有限样本估计误差推导匹配上下界,证明当边界足够大时自适应聚合可避免负迁移。
Fed-FBD:用于隔离、隐私和精准遗忘的联邦功能块多样化
发表机构 * University of Wisconsin–Madison(威斯康星大学麦迪逊分校)
AI总结 提出Fed-FBD模块化联邦架构,将ResNet分解为六个功能块并维护颜色变体仓库,实现块级隔离、隐私设计和亚秒级精准遗忘,在多个数据集上以微小精度代价换取安全保障。
基于节点重构的零样本广义图异常检测框架
发表机构 * School of Computing, KAIST(韩国科学技术院计算机学院)
AI总结 提出AlignGAD框架,通过全局统一模块对齐异构特征、聚类模块捕获组级异常模式及节点差异评分模块聚合多视图异常证据,实现零样本跨域图异常检测。
BASENet: 基于频带自适应的跨频带注意力语音增强网络
发表机构 * Thales SIX GTS, FRANCE(泰雷兹SIX GTS公司,法国)
AI总结 提出BASENet,通过Bark尺度划分频带并分配自适应容量编码器,结合跨频带注意力模块,以最少参数实现高PESQ和STOI,适用于资源受限设备。
TrajGenAgent: 一种用于人类移动轨迹生成的分层LLM智能体
发表机构 * Emory University(埃默里大学) ; University of Florida(佛罗里达大学)
AI总结 提出TrajGenAgent,一种无需微调的分层LLM智能体框架,通过编排器-工作者两阶段设计生成真实轨迹,在时空保真度、语义一致性和个体行为真实性上优于现有方法。
MentalMARBERT:面向阿拉伯语心理健康障碍检测的领域自适应预训练与两阶段微调
发表机构 * King Abdulaziz University(阿卜杜勒阿齐兹国王大学)
AI总结 针对阿拉伯语社交媒体文本中心理健康障碍检测的方言差异、非正式语言、标注资源有限和类别不平衡问题,提出领域自适应预训练与两阶段微调框架,构建含5万条推文的数据集,MentalMARBERT在宏F1和准确率上分别达到0.861和0.877。
TEDD:不稳定时间特征的鲁棒检测
发表机构 * Feedzai
AI总结 提出TEDD方法,利用回归模型检测导致时间分布变化的特征,无需参数调优,可扩展,能检测数值和类别特征的单变量及多变量漂移。