eCNNTO: A Highly Generalizable ConvNet for Accelerating Topology Optimization
eCNNTO:一种高度泛化的加速拓扑优化的卷积网络
发表机构 * Global college, Shanghai Jiao Tong University(上海交通大学全球学院)
AI总结 提出基于元素的卷积神经网络eCNNTO,通过预测近最优密度跳过大量迭代,加速密度拓扑优化,并引入新训练策略提升效率与泛化能力。
eCNNTO:一种高度泛化的加速拓扑优化的卷积网络
发表机构 * Global college, Shanghai Jiao Tong University(上海交通大学全球学院)
AI总结 提出基于元素的卷积神经网络eCNNTO,通过预测近最优密度跳过大量迭代,加速密度拓扑优化,并引入新训练策略提升效率与泛化能力。
深度展开协调
发表机构 * Autonomous Control and Decision Systems Laboratory Georgia Institute of Technology United States(佐治亚理工学院自主控制与决策系统实验室)
AI总结 提出Deep Coordinator框架,通过深度展开ADMM-DDP迭代学习动态调整超参数,实现非凸优化器求解时自适应惩罚参数,在车队和四旋翼仿真中速度提升6.18-9.44倍且可扩展至8倍规模。
Comments The second and third authors contributed equally (equal second authorship). 35 pages (10 pages main text), 17 figures, 3 tables
ADaPT:面向高效大推理模型的令牌级解耦
发表机构 * School of Data Science, Fudan University(复旦大学数据科学学院) ; Shanghai Institute of Artificial Intelligence for Education, East China Normal University(华东师范大学上海智能教育研究院) ; College of Computer Science and Artificial Intelligence, Fudan University(复旦大学计算机科学与人工智能学院) ; Ant Group(蚂蚁集团)
AI总结 提出ADaPT,通过令牌级双过程框架解耦效率与正确性信号,引入模式选择令牌控制快慢推理,实现推理时效率-性能权衡的精确连续控制,在降低推理成本的同时保持强推理能力。
一种具有混合易失性和非易失性存储模式的新型FeFET差分位单元
AI总结 提出一种由交叉耦合FeFET和存取晶体管组成的4T差分位单元,通过调整写入条件可在易失/非易失模式间切换,无需显式备份恢复操作,面积小于传统6T SRAM。
SpatialSV: 通过任务导向的视觉监督在多模态大语言模型中内化可解释的3D空间感知
发表机构 * School of Intelligent Systems Engineering, Sun Yat-sen University(中山大学智能工程学院)
AI总结 提出SpatialSV框架,通过任务导向的视觉监督将MLLM的2D特征提升为显式3D表示(深度图、相机姿态、点云),实现可解释的3D空间感知内化,无需外部工具,并在半监督设置中展现强泛化能力。
Comments Accepted by IJCAI 2026
Co-policy: 响应式人机音乐共创框架
发表机构 * School of Computer Science, Wuhan University(武汉大学计算机学院) ; College of Computing and Data Science, Nanyang Technological University(南洋理工大学计算与数据科学学院) ; School of Automation, Wuhan University of Technology(武汉理工大学自动化学院) ; School of Geodesy and Geomatics, Wuhan University(武汉大学测绘学院) ; School of Robotics, Wuhan University(武汉大学机器人学院)
AI总结 提出Co-policy框架,通过语义锚定、约束变分和视觉运动策略实现人机音乐实时共创,在真实钟琴实验中优于扩散策略基线。
在CGLA架构上设计并评估节能的Whisper点积内核卸载
AI总结 在CGLA架构IMAX上卸载Whisper点积内核,通过内核映射、本地内存大小调整和突发调度优化,在Whisper tiny上实现比Jetson AGX Orin低2.35倍、比RTX 4090低10.48倍的功耗延迟积(PDP),为低功耗本地语音识别提供可编程架构方案。
Comments This paper is accepted at Concurrency and Computation: Practice and Experience (Wiley)
多智能体交互记忆
发表机构 * Carnegie Mellon University(卡内基梅隆大学) ; University of California, Berkeley(加州大学伯克利分校)
AI总结 提出MATM框架,通过共享存储和检索智能体轨迹,实现异构智能体群体间的知识复用,提升下游任务性能并减少交互步骤。
轻量级发音评估:基于离散语音标记的意外度
发表机构 * Qatar Computing Research Institute, Doha, Qatar(卡塔尔计算研究所,多哈,卡塔尔)
AI总结 提出仅使用母语语音资源训练的轻量级发音评估框架,通过离散化语音标记和语言模型计算意外度,结合文本引导对齐特征,在无监督或少量校准下达到接近监督方法的性能。
Comments Accepted to Interspeech 2026
用于内窥镜视频的高斯过程先验变分自编码器
发表机构 * Department of Electromechanics, InViLab, University of Antwerp(安特卫普大学机电工程系InViLab实验室) ; Department of Computer Science, University of Manchester(曼彻斯特大学计算机科学系) ; Department of Electrical Engineering, Eindhoven University of Technology(埃因霍温理工大学电气工程系)
AI总结 提出高斯过程先验变分自编码器(GPVAE),通过时间高斯过程先验替代因子化先验,结合两种可扩展GP近似和镜面反射掩码,实现内窥镜视频缺失帧的插值与修复,在C3VDv2数据集上平均降低RMSE 21.9%。
面向城市级危机响应模拟中时间真实性的LLM智能体方法
AI总结 针对LLM社会模拟缺乏时间真实性的问题,基于深圳疫情志愿活动数据,提出数据校准的自激与危机激活机制,实现爆发性时间模式,使智能体时间分布接近真实。
Comments 11pages,7 figures
基于语义调制的线性递归单元用于图像超分辨率
发表机构 * Korea University(高丽大学) ; DGIST(大邱庆北科学技术院)
AI总结 提出一种结合语义调制单元的线性递归网络,通过调制、空间分类和原型增强实现高效图像超分辨率,性能超越现有方法。
Comments Accepted to CVPR 2026 Findings
测量AI代理的生物能力与风险
发表机构 * PATRICIA PASKOV, JEFFREY LEE, KYLE BRADY, ALYSSA WORLAND(PATRICIA PASKOV、JEFFREY LEE、KYLE BRADY、ALYSSA WORLAND)
AI总结 针对AI科学家等自主执行多步科学任务的代理系统,本文提出生物代理评估作为解释性工具,并基于实践经验给出定义、设计、运行、评分和记录评估的考量,以帮助决策者谨慎解读结果并指导投资。
面向过滤近似最近邻搜索的查询感知路由
AI总结 提出查询感知路由框架,通过轻量级ML模型预测各候选方法的召回率,结合离线基准表选择最佳召回-QPS权衡,在五个未见数据集上达到SOTA性能。
Comments 12 pages
一对二执行:一种面向单臂智能体动作扩展至双臂的新框架
发表机构 * Chongqing University(重庆大学) ; Xi’an Jiaotong-Liverpool University(西交利物浦大学) ; Lumos Robotics
AI总结 提出ExS2D层次化动作扩展框架,利用单臂监督实现双臂操作,通过时间优先关系提取、子任务引导动作映射和碰撞避免协调规划,在仿真中减少54.4%执行步骤并保持成功率。
Comments 6 pages, 5 figures, 3 tables
任意低维结构上扩散模型的分数近似
发表机构 * Shanghai Institute for Mathematics and Interdisciplinary Sciences(上海数学与交叉科学研究院) ; Huawei Technologies Co., Ltd.(华为技术有限公司)
AI总结 针对任意紧支撑分布,提出一种基于离散混合的分数近似方法,证明ReLU网络复杂度仅随上Minkowski维数d指数增长,打破环境维数诅咒,解释扩散模型在非光滑数据上的有效性。
MetaResearcher: 通过对抗虚拟环境中的自我反思强化学习扩展深度研究
发表机构 * School of Digital Arts, Jiangxi Arts & Ceramics Technology Institute(江西陶瓷工艺美术职业技术学院数字艺术学院) ; Universiti Sains Malaysia(马来西亚理科大学)
AI总结 提出MetaResearcher框架,通过演化虚拟世界、发现导向任务、自我反思元奖励和异构多智能体架构,在对抗环境中扩展深度研究智能体的训练,提升基准性能和认知鲁棒性。
具有全局有界扰动的凸损失对抗性赌博机优化
发表机构 * Department of Informatics, Kyushu University(九州大学信息学系) ; RIKEN AIP(理化学研究所革新智能综合研究中心)
AI总结 研究损失函数可能非凸非光滑的对抗性赌博机优化,提出一种修改的赌博机优化算法,并分析扰动预算对遗憾的影响,将线性损失下的全局预算后行动扰动模型扩展到一般凸且β-光滑损失。
开放权重AI模型需要比例评估方法
AI总结 本文针对开放权重AI模型(OWMs)的独特风险因素,提出四种比例评估方法(PE1-PE4),并系统审查2025年至2026年4月发布的37个OWM系列,发现仅一个满足所有评估要求。
SurgVista:具有合理器械-组织动力学的长程手术世界建模
发表机构 * The Chinese University of Hong Kong(香港中文大学) ; EPFL(瑞士联邦理工学院洛桑) ; Imperial College London(伦敦帝国学院)
AI总结 提出SurgVista手术世界模型,通过变形一致性正则化和漂移适应训练,解决空间交互不连贯和时间保真度崩溃问题,在长程预测中显著优于现有方法。
SL-S4Wave:基于结构化状态空间模型的生理波形自监督学习
发表机构 * Massachusetts Institute of Technology(麻省理工学院) ; OpenEvidence, USA(OpenEvidence(美国)) ; New York University(纽约大学) ; Xi’an Jiaotong University(西安交通大学) ; University of Toronto(多伦多大学) ; Emory University(埃默里大学)
AI总结 提出SL-S4Wave框架,结合对比学习与基于结构化状态空间模型的编码器,通过多尺度子核全局卷积捕获多通道生理波形的局部和长程依赖,在心律失常检测等任务中优于现有方法。
FFinRED:面向金融大语言模型红队测试的专家引导基准生成与评估框架
发表机构 * DATUMO INC.(DATUMO公司) ; Korea Advanced Institute of Science and Technology (KAIST)(韩国先进科学研究院) ; Financial Security Institute (FSI)(金融安全研究所)
AI总结 提出FinRED框架,通过专家引导的两级分类法将全球金融标准映射为威胁,并利用真实金融文档生成上下文丰富的红队行为提示,结合专家验证的评估标准,有效降低关键假阴性。
匹配市场遇上累积前景理论:迈向最优和对抗鲁棒学习
发表机构 * Indian Institute of Technology Bombay(印度理工学院孟买分校)
AI总结 研究基于累积前景理论(CPT)的竞争性双边匹配市场多智能体多臂赌博机问题,提出最优遗憾界算法并扩展到对抗性市场。
Comments Accepted at ECML-PKDD 2026, Naples, Italy
多模态概念瓶颈模型
发表机构 * UC San Diego(加州大学圣地亚哥分校)
AI总结 提出多模态概念瓶颈模型(MM-CBM),利用双概念瓶颈层对齐图像和文本嵌入,实现可解释的零样本分类和图像检索,在四个基准上平均准确率提升高达51.26%。
Comments Present at NeurIPS 2025 Mechanistic Interpretability Workshop
REDACT:一个系统控制的个人信息检测多语言基准
发表机构 * ServiceNow
AI总结 提出REDACT基准,包含13,427条记录、51种实体类型、25种语言,通过强度-2覆盖阵列采样控制9个生成轴,并引入实体级元数据(披露状态、形式、GDPR敏感层级)以支持分层评估,揭示检测器在敏感数据上的架构依赖性失败模式。
Comments 14 pages, 5 figures
MMD-SLAM:结构增强的多元高斯分布引导视觉SLAM
发表机构 * HFIPS, Chinese Academy of Sciences(中国科学院合肥物质科学研究院) ; University of Science and Technology of China(中国科学技术大学) ; Aarhus University(奥胡斯大学) ; University of Tokyo(东京大学) ; Beijing University of Chemical Technology(北京化工大学) ; North China Electric Power University(华北电力大学)
AI总结 提出MMD-SLAM,利用亚特兰大世界假设引导多元高斯表示,通过点线融合、主导方向编码和高斯进化策略,提升视觉SLAM的跟踪精度与建图质量。
Comments ICRA 2026
现实中的EVM工作负载:多维Gas计量、状态增长、延迟执行和并行性的证据
AI总结 通过分析2025年以太坊L1和Base L2的区块追踪,发现资源组合不稳定、状态增长被低估、执行结果对历史状态敏感,为多维Gas计量和状态增长显式定价提供了实证基础。
大型语言模型黑盒不确定性估计方法的系统评估
发表机构 * State Key Laboratory of Multimodal Artificial Intelligence Systems, Institute of Automation, Chinese Academy of Sciences(中国科学院自动化研究所多模态人工智能系统国家重点实验室)
AI总结 系统评估了24种黑盒不确定性估计方法在4个模型和4个数据集上的表现,发现无单一方法普遍最优,但基于答案空间推理和比较的方法通常有效,混合方法在多数条件下表现良好。
PSCT-Net: 通过可微反投影和注意力引导细化实现几何感知的儿科颅骨CT重建
发表机构 * Interdisciplinary Program in Bioengineering, Seoul National University(首尔大学生物工程跨学科项目) ; Department of Transdisciplinary Medicine, Seoul National University Hospital(首尔大学医院跨学科医学系) ; Department of Artificial Intelligence, Yonsei University(延世大学人工智能系) ; Department of Medicine, Seoul National University College of Medicine(首尔大学医学院医学系) ; Healthcare AI Research Institute, Seoul National University Hospital(首尔大学医院医疗人工智能研究所)
AI总结 提出PSCT-Net,利用可微反投影建立空间先验,结合注意力引导投影和双向Mamba模块,从稀疏双平面X射线重建3D CT,缓解深度模糊并改善骨边界。
Comments 11pages, 5 figures
低成本多精度脉动阵列用于在AI ASIC上加速FHE NTT
AI总结 针对FHE在AI硬件上因精度不匹配导致的性能瓶颈,提出一种最小修改的多精度脉动阵列,在统一数据流下原生执行全精度输出重建,实现1.33倍加速。