Optimizing 3D Gaussian Splatting via Point Cloud Upsampling
通过点云上采样优化3D高斯泼溅
发表机构 * Vision and Image Processing Group, Systems Design Engineering, University of Waterloo(滑铁卢大学视觉与图像处理组,系统设计工程)
AI总结 提出多种点云上采样方法及深度引导点提升技术,改善3D高斯泼溅的初始化质量,实验表明不同场景适用不同策略。
通过点云上采样优化3D高斯泼溅
发表机构 * Vision and Image Processing Group, Systems Design Engineering, University of Waterloo(滑铁卢大学视觉与图像处理组,系统设计工程)
AI总结 提出多种点云上采样方法及深度引导点提升技术,改善3D高斯泼溅的初始化质量,实验表明不同场景适用不同策略。
ROG-Grasp:面向根部的几何方法用于机器人抓取与放置
发表机构 * Department of Electrical and Computer Engineering, Drexel University(德雷塞尔大学电气与计算机工程系) ; Virginia Seafood Agricultural Research and Extension Center, and Department of Biological Systems Engineering, Virginia Tech(弗吉尼亚理工学院生物系统工程系和弗吉尼亚海鲜农业研究与推广中心) ; Amazon Store Foundation AI (SFAI)(亚马逊商店基金会人工智能(SFAI))
AI总结 提出基于根部表面几何的ROG-Grasp框架,通过RGB-D感知估计农产品朝向,结合YOLO检测器和点云平面拟合生成稳定抓取姿态,在番茄和洋葱实验中实现高成功率与快速执行。
GeoSAM-3D: 用于从单目视频进行开放词汇3D场景分割的测地线提示传播
发表机构 * University of Minnesota, Twin Cities(明尼苏达大学,双城分校)
AI总结 提出GeoSAM-3D方法,利用冻结的视觉基础模型和单目3D高斯泼溅重建,通过可微分的图-测地线传播核在场景图上传播用户提示,实现从单目视频的开放词汇3D场景分割。
DarkVesselNet: 用于暗船检测的多模态遥感和轨迹推理
发表机构 * University of Minnesota, Twin Cities(明尼苏达大学,双城分校)
AI总结 提出DarkVesselNet,融合Sentinel-1 SAR、Sentinel-2光学影像、地理空间基础模型、AIS轨迹推理、TGARD间隙检测和Pi-DPM异常头,实现多模态遥感暗船检测。
基于动态网格-高斯重建的实时物理仿真
发表机构 * University of Waterloo(滑铁卢大学)
AI总结 针对动态重建与物理仿真拓扑不兼容的问题,提出固定拓扑网格与高斯泼溅的双表示框架,实现实时物理仿真,并揭示高质量重建与物理兼容拓扑存在本质冲突。
利用权重空间对称性近似曲率
发表机构 * DeepMind, London, UK(伦敦DeepMind)
AI总结 本文通过解析平均化保持损失不变的群作用,从单个梯度构建结构化的Hessian近似,从而利用权重空间对称性来近似损失函数的曲率。
SDR:用于放射学报告生成的集合距离奖励
发表机构 * Stanford University(斯坦福大学) ; Stanford University School of Medicine(斯坦福大学医学院) ; Ghent University(根特大学)
AI总结 针对胸部X光报告生成中标准奖励不兼容的问题,提出基于集合距离的连续置换不变奖励,通过GRPO后训练和测试时缩放显著提升性能。
基于物理可控世界模型的物理对象理解
发表机构 * Stanford University(斯坦福大学) ; OpenAI(开放人工智能公司) ; Noetik Inc.(Noetik公司) ; Google(谷歌)
AI总结 提出一类概率世界模型,通过自回归序列建模高效训练,从视频中推断对象及其物理交互,实现对象发现、3D操控和物理关系计算。
EST-PRM:在过程奖励模型成为关键依赖之前对其进行压力测试
发表机构 * Department of Computer Science, Iowa State University(艾奥瓦州立大学计算机科学系) ; Department of Computer Science, Kalinga Institute of Industrial Technology(卡林加工业技术学院计算机科学系) ; Department of Civil, Construction & Environmental Engineering, Iowa State University(艾奥瓦州立大学土木、建设与环境工程系)
AI总结 提出EST-PRM框架,通过步骤膨胀、依赖感知重排序和置信度标记三种变换对过程奖励模型进行压力测试,发现不同模型在奖励膨胀和正确性敏感性损失方面存在显著差异。
在跳跃前检测:视觉语言模型中的幻象检测
发表机构 * Indiana University Indianapolis(印第安纳大学印第安纳波利斯分校) ; Bangladesh University of Engineering and Technology(孟加拉工程与技术大学)
AI总结 针对视觉语言模型在缺乏视觉证据时产生自信但无根据回答的幻象问题,提出文本条件层内对齐方法,通过分析视觉编码器各层补丁令牌与问题嵌入的对齐轨迹,结合像素统计、零样本域路由和结构化自评估,实现高精度预响应幻象检测。
Grounded Decoding: 面向忠实RAG的检索锚定概率融合
发表机构 * Department of Computer Science, Iowa State University(爱荷华州立大学计算机科学系) ; Department of Computer Science, Kalinga Institute of Industrial Technology(卡林加工业技术学院计算机科学系) ; Department of Civil, Construction & Environmental Engineering, Iowa State University(爱荷华州立大学土木、建设与环境工程系)
AI总结 提出Grounded Decoding,一种无需训练的推理时解码框架,通过KL-重心目标融合全RAG分布和仅检索分布,并引入冲突感知自适应加权,以提升RAG的事实一致性。
低秩PEFT的更细参数步长:基于CP张量适配器的控制研究
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 本文通过固定组件的规范多路分解(CP)张量适配器实现更细的参数步长,研究其对低秩适配器精度-预算权衡的影响,发现CP适配器能填补LoRA秩之间的空白,但效果依赖于任务。
基于纠缠核的马尔可夫决策过程拓扑感知状态抽象
发表机构 * Department of Computer Science, Iowa State University(计算机科学系,爱荷华州立大学) ; Department of Civil, Construction & Environmental Engineering, Iowa State University(土木、建设与环境工程系,爱荷华州立大学)
AI总结 提出纠缠核抽象框架,利用经验转移图的图纠缠构建重叠状态抽象,在动作一致性条件下保证价值保持,并通过实验证明其在瓶颈领域优于现有方法。
规范化稳定列表回放:面向语言模型嵌入的私有联邦持续学习
发表机构 * Department of Computer Science, Iowa State University(爱荷华州立大学计算机科学系) ; Department of Computer Science & Engineering, BRAC University(BRAC大学计算机科学与工程系) ; Department of Civil, Construction & Environmental Engineering, Iowa State University(爱荷华州立大学土木、建设与环境工程系)
AI总结 针对联邦持续学习中差分隐私下回放列表无序的问题,提出规范化稳定列表回放(CSLR)方法,利用公共锚句的签名对齐客户端分布,在多个基准上提升性能。
弱批评者造就强学习者:用于可扩展监督的在策略批评蒸馏
发表机构 * University of Cambridge(剑桥大学) ; University of California, Berkeley(加州大学伯克利分校) ; UC Berkeley AI Lab(加州大学伯克利分校人工智能实验室)
AI总结 提出在策略批评蒸馏(OPCD)方法,利用弱模型作为批评者提供修订方向,通过自适应自教师信号蒸馏批评引导的行为,提升强模型在推理和对齐基准上的表现。
文学情感在运动中:用于触觉叙事的软体机器人装置
发表机构 * Department of Mechanical Engineering, University of Chile(智利大学机械工程系) ; Independent Researcher(独立研究员) ; Bolivian Catholic University(玻利维亚天主大学) ; Institute of Engineering Sciences, University of O’Higgins(奥希金斯大学工程科学研究所)
AI总结 提出一种将叙事文本语义情感分析映射到软体气动模块可变刚度的交互装置,通过用户研究评估刚度与LED强度多感官耦合对情感感知的影响。
4D雷达与激光雷达和相机的结合:恶劣天气下的协同感知
发表机构 * FZI Research Center for Information Technology(FZI信息技术研究所以) ; Karlsruhe Institute of Technology(卡尔斯鲁厄大学)
AI总结 针对恶劣天气下相机和激光雷达性能下降的问题,提出集成4D成像雷达作为鲁棒模态,并引入多普勒引导的空间注意力机制进行多智能体融合,显著提升雾雨环境下的协同感知鲁棒性。
审计近最优策略可能是指数级困难的:通过占用Rashomon容量的条件查询下界
发表机构 * Department of Computer Science, Iowa State University(计算机科学系,爱荷华州立大学) ; Department of Civil, Construction & Environmental Engineering, Iowa State University(土木、建设与环境工程系,爱荷华州立大学)
AI总结 本文通过引入占用Rashomon容量概念,证明了在存在多个近最优策略时,审计这些策略的行为差异需要指数级数量的查询,并给出了精确和噪声查询下的下界。
重新思考高分辨率地形高程数据的摊销神经表示
发表机构 * University of Maryland, College Park(马里兰大学学院公园分校)
AI总结 针对地形高程数据,提出HUVR+SIREN超网络方法,通过替换坐标解码器为平滑可微版本,在统一基准上实现最佳高度和导数保真度,且支持后训练量化压缩。
动态代理混合:将重放控制器从小模型迁移到大模型以进行持续指令微调
发表机构 * Department of Computer Science, Iowa State University(爱荷华州立大学计算机科学系) ; Department of Computer Science, Kalinga Institute of Industrial Technology(卡林加工业技术学院计算机科学系) ; Department of Civil, Construction & Environmental Engineering, Iowa State University(爱荷华州立大学土木、建筑与环境工程系)
AI总结 提出PROXY-MIX框架,通过在小代理模型上学习动态重放控制器并冻结迁移至大模型,以解决持续指令微调中固定重放比例导致的灾难性遗忘问题,在LLaMA-3-8B上平均准确率提升3.4%,遗忘降低3.5%,安全性提升5.8%。
多目标参考对齐机器遗忘
发表机构 * arXiv
AI总结 提出多目标框架RAUL,通过将遗忘样本的预测对齐到参考分布(均匀分布或保留集经验分布)来约束遗忘目标,并利用雅可比下降解决多目标优化,实现接近完整重训练的遗忘效果。
SoFiE: 用于智能抓取的软手指外骨骼
发表机构 * SDU Soft Robotics, SDU Biorobotics, The Maersk Mc-Kinney Moller Institute, University of Southern Denmark (SDU)(SDU柔性机器人实验室、SDU生物机器人实验室、马士基麦金尼莫勒研究所、南丹麦大学)
AI总结 本文提出一种模块化软手指外骨骼SoFiE,采用3D打印柔性材料、肌腱驱动和集成触觉传感,实现轻量化、低轮廓的抓取辅助与智能感知。
通过约束策略优化实现检测器规避的LLM释义
发表机构 * School of ECEE, Arizona State University(亚利桑那州立大学电子工程与计算机科学学院) ; Department of Computer Science, University of California, Santa Barbara(加州大学圣巴巴拉分校计算机科学系)
AI总结 提出DEPO算法,将检测器规避的LLM释义建模为约束马尔可夫决策过程,通过拉格朗日对偶强化学习在保持语义的同时实现高效规避。
Zamba2-VL 技术报告
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; University of Cambridge(剑桥大学) ; University of Washington(华盛顿大学) ; University of Toronto(多伦多大学)
AI总结 提出基于混合架构Zamba2的视觉语言模型Zamba2-VL,在图像理解等基准上媲美Transformer模型,且首次令牌延迟降低约一个数量级。
αDepth: 学习用于立体转换的单次软边界分解
发表机构 * ETH Zürich(苏黎世联邦理工学院) ; DisneyResearch|Studios(迪士尼研究|工作室)
AI总结 提出αDepth表示,通过圆形Alpha表示(CAR)将软边界分解为局部层次,实现高保真立体转换,无需用户干预。
CRMA:用于大语言模型模块化持续微调的谱约束骨干
发表机构 * ModelBrew AI
AI总结 提出CRMA残差适配器,通过Sinkhorn归一化确保混合矩阵双随机,从而在结构上约束谱范数,实现共享基座的持续训练与跨任务正向迁移,无需回放或蒸馏。
SUPREME: 一个用于可复现图像遗忘方法评估的多GPU框架
发表机构 * Department of Computer Science, School of Science, Loughborough University(计算机科学系,科学学院,洛斯伯勒大学) ; School of Mathematics, Statistics and Physics, Newcastle University(数学、统计与物理学院,新卡克大学)
AI总结 提出SUPREME框架,通过多GPU分布式架构加速图像分类遗忘方法的评估,支持新方法注册和多精度模式。
非学习低光立体视觉
发表机构 * arXiv.org
AI总结 提出一种非学习立体框架,利用Field of Junctions (FoJ)提取粗视觉特征,结合边界感知半全局匹配(SGM)从严重噪声图像中估计视差,在基准数据集上获得比近期立体算法更准确的稀疏视差图。
扩散模型中减少幻觉的分数控制
发表机构 * University at Buffalo(布法罗大学)
AI总结 针对扩散模型中的幻觉问题,提出基于方差引导的分数调制策略,通过控制分数雅可比矩阵减少幻觉,在保持高保真度和多样性的同时将幻觉降低约25%。
确定性视界:当扩展推理失败时工具委托变得必要
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 本文通过注意力瓶颈定理和确定性视界概念,证明解码器-only注意力在确定性状态追踪任务中存在信息论容量限制,导致扩展推理性能退化,并指出当视界超过19-31时工具委托成为必要。