Fast and Lightweight Novel View Synthesis with Differentiable Multiplane Image
基于可微多平面图像的快速轻量级新视角合成
发表机构 * Universiti Malaya(马来大学) ; Wuhan University(武汉大学)
AI总结 针对现有方法在速度、模型大小和稀疏视角下的不足,提出基于可微多平面图像(MPI)的快速轻量级新视角合成方法,利用点图进行几何初始化并引入一步扩散处理空洞和伪影。
基于可微多平面图像的快速轻量级新视角合成
发表机构 * Universiti Malaya(马来大学) ; Wuhan University(武汉大学)
AI总结 针对现有方法在速度、模型大小和稀疏视角下的不足,提出基于可微多平面图像(MPI)的快速轻量级新视角合成方法,利用点图进行几何初始化并引入一步扩散处理空洞和伪影。
消除原型:原型SAE的稳定性是初始化和度量设计的人为产物
发表机构 * Samsung AI Center(三星人工智能中心) ; University of Warsaw(华沙大学)
AI总结 本文通过实验证明,原型稀疏自编码器声称的稳定性源于多轮训练中相同的初始化设置,而非原型约束本身,并强调稳定性与稳定化的区别对可解释性研究至关重要。
TIDES:基于可变形重建的时间导数事件模拟
发表机构 * University of Surrey(萨里大学)
AI总结 提出TIDES,一种基于动态高斯泼溅的连续时间事件模拟器,通过显式3D场景表示推导逐像素强度动态,实现精确的阈值交叉预测,并利用遮挡引导自适应时间步长,达到最先进的事件流保真度。
eMoT: 通过符号锚定和记忆腐蚀演化的思维记忆
发表机构 * Center for Future Media, University of Electronic Science and Technology of China(未来媒体中心,电子科技大学)
AI总结 提出eMoT框架,通过记忆腐蚀、符号锚定和一致性精炼三个模块,将推理轨迹视为动态演化记忆,以稳定多步推理并提升准确率与一致性。
面向建筑最优能量管理的可解释数据驱动深度强化学习方法
发表机构 * Karlsruhe Institute of Technology(卡尔斯鲁厄理工学院)
AI总结 提出可解释深度强化学习框架,结合真实数据训练策略内与离策略算法,通过事后解释技术揭示电池管理决策过程,实现降本与透明化。
动态酪蛋白凝胶化显微图像拓扑纹理分析及其与流变学性质的关系
发表机构 * Department of Computer Science, University of Copenhagen, Denmark(哥本哈根大学计算机科学系) ; Department of Green Technology, University of Southern Denmark, Denmark(南丹麦大学绿色技术系) ; Department of Food Science, University of Copenhagen, Denmark(哥本哈根大学食品科学系)
AI总结 提出结合拓扑数据分析、差分盒计数、多重分形分割和局部二值模式的工具箱,分析STED显微图像中酪蛋白凝胶化的拓扑与纹理特征,揭示与流变学性质相关的微观结构转变。
通过正交LoRA库保持正态性的持续工业异常检测
发表机构 * Yisu University(Yorkshire University)
AI总结 提出基于历史冻结正交LoRA库和分层新颖性自适应库增长模块的框架,解决扩散模型在持续工业异常检测中的历史正态先验漂移和灾难性遗忘问题。
Comments 33 pages,6 figures,Submitted to Advanced Engineering Informatics
SentGuard:面向大型语言模型的句子级流式护栏
发表机构 * Fudan University(复旦大学) ; Shanghai AI Laboratory(上海人工智能实验室)
AI总结 提出SentGuard,一种与生成并行运行的句子级流式护栏,通过轻量级等待缓冲区将流式令牌分组为句子块并仅释放已验证块,以在低延迟下实现高精度不安全内容检测。
Comments 16 pages, 5 figures, submitted to ARR
RL-ACRGNet:基于强化学习的胸部放射学报告生成网络
发表机构 * Human-AI Interaction (HAIx) Lab, Indian Institute of Technology Gandhinagar(人类-人工智能交互实验室,印度理工学院冈丁加尔) ; Department of Computer Science and Engineering, Madhav Institute of Technology and Science Deemed University (MITS-DU)(计算机科学与工程系,马达夫技术与科学 deemed 大学(MITS-DU)) ; Multimedia and Information Security Research Group, Department of Computer Science and Engineering, ABV-Indian Institute of Information Technology and Management(多媒体与信息安全研究组,计算机科学与工程系,ABV-印度信息科技与管理学院)
AI总结 提出RL-ACRGNet,一种结合预训练DenseNet编码器与多级LSTM解码器的离策略强化学习框架,通过度量奖励机制优化视觉语义嵌入,在IU-Xray和MIMIC-CXR数据集上超越基线,生成高质量临床报告。
Comments This work has been submitted to the IEEE for possible publication
世界-任务分解用于机器人学习
发表机构 * Department of Computer Science and Technology, University of Cambridge, United Kingdom(计算机科学与技术系,剑桥大学,英国) ; Robotics and Biology Laboratory, Technische Universität Berlin(机器人与生物学实验室,柏林技术大学) ; Science of Intelligence (SCIoI), Cluster of Excellence, Berlin, Germany(智能科学(SCIoI),卓越中心,柏林,德国) ; Robotics Institute Germany(德国机器人研究所)
AI总结 提出将策略分解为世界因子和任务因子,通过可微图模型AICON与紧凑学习策略结合,实现零样本泛化到新配置并迁移到真实硬件。
排名 vs. 分配:多视角目标关联中的度量不匹配
发表机构 * Tevian Moscow(莫斯科Tevian) ; Lomonosov Moscow State University(莫斯科国立罗蒙诺索夫大学)
AI总结 本文揭示了多视角目标关联中常用的排名度量(如AP、FPR-95)与分配目标之间的根本性不匹配,并提出了基于Sinkhorn归一化的后处理方法以缓解该问题。
PerBite: 一种用于咬合感知食物体积估计的精选诊断工作流
发表机构 * University of Barcelona(巴塞罗那大学) ; LogMeal ; Universitat Pompeu Fabra(庞培法布拉大学)
AI总结 提出PerBite工作流,通过分割、三维重建、尺度校准和网格后处理等步骤,从餐前餐后状态估计食物体积,在MetaFood挑战中排名第一。
揭示思维链推理的熵动力学
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 本文通过熵动力学揭示思维链推理的两阶段结构(不确定性区域和置信区域),并提出基于CUSUM变化点检测的无训练框架实现早期退出和测试时缩放,以提升推理效率与可靠性。
Comments 21 pages, 10 figures, accepted in ICML2026
评估算法选择模型的现实世界泛化能力
发表机构 * Computer Systems Department, Jožef Stefan Institute(计算机系统部门,约泽夫·斯蒂芬研究所) ; Brno University of Technology(布拉格技术大学)
AI总结 通过跨基准测试系统评估算法选择模型在合成与现实优化问题上的泛化能力,分析其迁移性能并指出在特定领域应用中的挑战。
Comments 10 pages, 12 figures
推理模型中的极端低位推理:失败模式与针对性恢复
发表机构 * University of Washington(华盛顿大学)
AI总结 针对大型推理模型在2位量化推理中因生成不稳定导致总token数膨胀而无法实现端到端加速的问题,提出轻量级FP16规划和循环救援两种控制方法,显著恢复模型精度并保持实际速度。
PlanarBench: 通过平面图绘制评估LLM空间推理能力
发表机构 * tvori.info
AI总结 提出PlanarBench基准,通过让LLM根据边列表以ASCII艺术绘制平面图来评估其空间推理能力,发现边数是主要难度预测因子。
Comments 12 pages, 4 figures, https://github.com/wizzard0/planar-bench-as1073
自动作文评分与语言认证:评估法语中的泛化性、一致性和有效性
发表机构 * University of Exeter(埃克塞特大学) ; France Éducation international(法国教育国际) ; Cental, IL&C, UCLouvain ; Computer Science and Engineering Department, Universidad Carlos III de Madrid(马德里卡斯蒂利亚大学计算机科学与工程系)
AI总结 本文提出一个增强的论证有效性框架,通过公平性分析、语言特征相关性、预测误差评估和与人工评分的一致性比较,对8种模型架构在法语作文评分上进行多维评估,推进了法语自动作文评分的前沿。
面向盲图像质量评估的统计与视觉-语言特征的失真感知融合
发表机构 * Northwestern Polytechnical University(西北工业大学)
AI总结 提出一种失真感知融合框架,通过乘法门控机制动态加权NSS统计特征与VLM嵌入,在三个基准上取得最优或竞争性能,并揭示NSS对不同失真的贡献差异。
通过基于交互合成扩展智能体能力
发表机构 * Renmin University of China(中国人民大学) ; Peking University(北京大学) ; Tencent(腾讯)
AI总结 提出GAIS框架,通过两阶段接地机制(协议锚定环境和结构引导规划)自动生成多样化的环境和复杂任务,显著提升智能体在BFCL、τ²-Bench和ACEBench上的性能。
迈向3D感知视频扩散模型:基于网格标记化的无渲染人体运动控制
发表机构 * DAMO Academy, Alibaba Group(阿里巴巴集团大模型实验室) ; Hupan Lab(虎盘实验室) ; Zhejiang University(浙江大学) ; INSAIT
AI总结 提出一种无渲染框架,通过压缩的3D人体网格标记直接条件化视频生成,实现精确的人体运动控制,减少2D引导伪影并提升3D结构建模能力。
Comments Project page: https://jingyunliang.github.io/MeshToken/
为什么时间序列模型需要长上下文窗口?
发表机构 * Università della Svizzera Italiana(瑞士联邦理工学院) ; EPFL(瑞士联邦理工学院) ; Politecnico di Milano(米兰理工学院)
AI总结 本文从生成过程识别和条件预测两个目标出发,证明长上下文窗口通过降低生成过程的不确定性来提升预测性能,并表明即使对于记忆长度为P的过程,输入窗口必须严格大于P才能达到最小误差。
CARTE:法国语言模型知识映射基准
发表机构 * École Polytechnique, Institut Polytechnique de Paris(巴黎政治学院) ; National Technical University of Athens(雅典国家技术大学) ; Mohamed bin Zayed University of Artificial Intelligence(姆阿扎德人工智能大学)
AI总结 提出CARTE基准,通过2431道多选题评估大语言模型在法国13个大区14个主题领域的细粒度区域知识,并引入CARTE-LV子集聚焦语言变异,实验发现模型在区域和规模上存在性能差异。
MMG2Skill: 智能体能否从野外指南中提炼出自我进化的技能?
发表机构 * Nanjing University(南京大学) ; Kuaishou Technology(快手科技)
AI总结 提出MMG2Skill框架,将多模态异构的野外指南编译为可编辑技能,通过轨迹级根因反馈持续改进,在GUI控制、开放游戏和策略卡牌任务中显著提升VLM智能体性能。
Comments 35 pages, 12 figures, 13 tables. Code: https://github.com/NJU-LINK/MMG2Skill
文本引导异常检测的结构化基准:当语言停止条件化决策时
发表机构 * Politecnico di Milano, AIRLab(米兰理工学院,AIRLab) ; S&H – Software & Hardware(S&H – 软件与硬件)
AI总结 提出结构化基准TGAD,通过三个场景逐步增加语言功能角色,评估多模态异常检测系统的文本引导能力,发现当前系统仅表面受语言条件化,标准基准高估了其能力。
SafeMCP:基于环境接地前瞻推理的LLM智能体防御主动功率调节
发表机构 * Beijing Institute of Technology(北京理工大学) ; Beijing Academy of Artificial Intelligence(北京人工智能研究院) ; Institute for Artificial Intelligence, Peking University(北京大学人工智能研究院)
AI总结 针对LLM智能体因动作空间扩大而面临功率寻求风险,提出SafeMCP服务器端防御插件,通过内部世界模型进行前瞻推理,实现主动工具过滤和即时干预两级防御,在保持智能体效用的同时有效降低风险。
Comments Accepted to the 64th Annual Meeting of the Association for Computational Linguistics (ACL 2026), Main Conference
MT-EditFlow:基于流匹配的多轮图像编辑强化学习
发表机构 * Apple(苹果公司) ; University of California, Los Angeles(加州大学洛杉矶分校) ; University of Texas at Austin(德克萨斯大学奥斯汀分校) ; Lambda, Inc(Lambda公司)
AI总结 提出MT-EditFlow框架,通过流匹配强化学习优化多轮图像编辑的奖励信号,解决单轮编辑模型在多轮交互中的失败和误差传播问题,显著提升多轮编辑性能。
基于LLM的算法开发:以张量网络收缩顺序优化中LLM使用为例
发表机构 * German Aerospace Center (DLR), Institute of Software Technology, department High-Performance Computing(德国航空航天中心(DLR)软件技术研究所高性能计算部门)
AI总结 通过OpenEvolve对张量网络收缩顺序优化的案例研究,探讨了基于LLM的算法开发,重点分析了LLM选择、评估指标和测试实例等设计因素,强调了验证引导的进化编码代理的潜力以及人类科学家在评估、验证和解释方面的重要性与挑战。
Comments Submitted to the proceedings of the deRSE26 conference
开放集测试时自适应中分布内与分布外准确率的深入分析
发表机构 * University of British Columbia and Vector Institute(不列颠哥伦比亚大学和向量研究所)
AI总结 本文通过基准测试和提出新基线,揭示了当前开放集测试时自适应方法在平衡分布内准确率和分布外检测能力上的不足。
Comments TMLR 2026
基于市场重规划的搜救任务中安全关键无人机群
发表机构 * KTH Royal Institute of Technology(皇家理工学院) ; Swedish Defence Research Agency(瑞典国防研究机构) ; KTH Royal Institute technological Institute(皇家理工学院)
AI总结 提出一种分布式协调架构IRDS,通过反向拍卖市场机制和几何共识协议,在无人机故障下自主重分配任务,在25%退化下保持93%任务成功率。
Comments 6 pages, 4 figures, accepted at MIPRO 2026
训练提示至关重要:面向鲁棒微调的状态自适应优化
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 本文提出状态自适应提示优化(SAPO)策略,通过将任务公式从静态输入转变为动态状态自适应变量,有效缓解灾难性遗忘并提升泛化能力,在多个基准上取得显著性能提升。