Attitude-Aided Linear Calibration of Triaxial Accelerometers
三轴加速度计的姿态辅助线性校准
发表机构 * Tsinghua University(清华大学)
AI总结 提出一种利用姿态信息的三轴加速度计线性校准方法(ALAC),通过构建组合误差矩阵实现线性最小二乘估计,仅需五个任意方向测量即可完成校准,并在静态和准静态实验中验证了其精度和鲁棒性。
三轴加速度计的姿态辅助线性校准
发表机构 * Tsinghua University(清华大学)
AI总结 提出一种利用姿态信息的三轴加速度计线性校准方法(ALAC),通过构建组合误差矩阵实现线性最小二乘估计,仅需五个任意方向测量即可完成校准,并在静态和准静态实验中验证了其精度和鲁棒性。
分解语言模型中的事实性谄媚:规模与指令调优如何塑造鲁棒性
发表机构 * Centre for Computational Linguistics, Psycholinguistics and Sociolinguistics University of Antwerp(计算语言学、心理语言学与社会语言学研究中心 荷兰安特卫普大学)
AI总结 通过将事实性谄媚分解为真值边际和操纵敏感性两个通道,研究了模型规模和指令调优对56个开源语言模型(0.3B-32B参数)在13种操纵类型下鲁棒性的影响。
基于梯度信息逻辑校正的离散扩散模型即插即用引导
发表机构 * National University of Singapore(新加坡国立大学) ; University of Science and Technology of China(中国科学技术大学)
AI总结 提出GILC框架,通过将预训练去噪网络作为变分代理来估计引导信号,并引入无雅可比机制直接校正干净预测逻辑,实现无需额外训练的离散扩散模型可控生成,在DNA、蛋白质序列和分子生成任务上达到最优性能。
Tangram: 解锁非均匀KV缓存以实现高效的多轮LLM服务
发表机构 * Hanyang University(翰林大学) ; Rebellions Republic of Korea(Rebellions)
AI总结 针对多轮LLM服务中KV缓存线性增长导致的GPU内存和带宽压力,提出Tangram系统,通过确定性预算分配、头组页面和提前负载均衡三项技术实现非均匀KV缓存的高效管理,吞吐量提升达2.6倍。
Multi-ResNets:约束优化中子空间预条件的多残差网络
发表机构 * UCLA(加州大学洛杉矶分校) ; University of Oxford(牛津大学) ; Tapestry, Google(谷歌Tapestry) ; Alphabetical ordering, authors contributed equally to this work(作者等量贡献)
AI总结 提出一种分阶段残差神经网络架构MResOpt,通过优先级分解约束满足和阶段感知损失,在预测-补全-校正流水线中实现域知有序约束满足,并在理想无限宽条件下表现为序列高斯过程回归,显著降低高优先级约束违反。
反应通量匹配:稀有事件的机制发现与自适应采样
发表机构 * CMU-Pitt Program in Computational Biology(CMU-匹兹堡计算生物学项目) ; Dept. of Computational & Systems Biology University of Pittsburgh(计算与系统生物学系匹兹堡大学) ; Machine Learning Department Dept. of Mathematical Sciences Carnegie Mellon University(机器学习系数学科学系卡内基梅隆大学) ; Courant Institute, New York University(纽约大学Courant研究所) ; Machine Learning Lab Capital Fund Management(机器学习实验室资本基金管理)
AI总结 提出通量匹配框架,从反应轨迹数据中学习电流速度 u(z) 和标量势 h(z),用于识别反应路径和反应坐标,并实现自适应采样。
面向一对多时间定位
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 针对一对多时间定位(OMTG)任务,提出包含基准、数据集和奖励函数的系统解决方案,显著提升多段视频定位性能。
消息传递图神经网络的PAC-Bayesian对抗鲁棒泛化:敏感性分析
发表机构 * School of Information Science and Engineering, Southeast University(信息科学与工程学院,东南大学) ; Squirrel Ai Learning
AI总结 通过敏感性感知的PAC-Bayesian框架,利用输出雅可比矩阵的秩约束和异向高斯后验,为消息传递图神经网络导出更紧的对抗鲁棒泛化界。
合成数据生成与基于视觉的褶皱和关键点检测用于双手布料操作
发表机构 * Department of Engineering, University of Luxembourg(卢森堡大学工程系) ; School of Electrical and Electronic Engineering, Nanyang Technological University(南洋理工大学电子与电气工程学院) ; Université de Lorraine, Arts et Metiers Institute of Technology, LCFC(洛林大学,艺术与工艺技术学院,LCFC)
AI总结 针对布料操作中视觉感知难题,提出基于Blender的合成数据生成管道和结合CNN与YOLOv8-OpenCV的感知框架,实现褶皱抓取和关键点熨烫,关键点模型平均位置误差1.7615像素。
LLMs 可能泄露训练数据,但它们愿意吗?一种基于倾向性的 LLM 记忆评估
发表机构 * University of Southern Denmark(南部丹麦大学)
AI总结 提出 PropMe 框架,通过对比前缀攻击与非对抗评估,揭示 LLM 在非对抗设置下很少泄露训练数据,并引入 SimpleTrace 流水线进行归因和度量。
TRACE: 面向多模态时间序列基础模型的时间条件估计
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 提出TRACE条件估计范式,通过利用可用辅助模态推断缺失目标模态,解决多模态时间序列中的时间错位和部分模态缺失问题,在医疗和情感分析基准上优于现有融合方法。
ToolChoiceConfusion: 因果最小工具过滤实现可靠LLM智能体
发表机构 * Independent Researcher(独立研究者) ; United States of America(美国)
AI总结 提出因果最小工具过滤(CMTF)方法,通过因果充分性选择工具,减少错误工具调用和令牌成本,在102个任务、100个工具、4个LLM后端的基准测试中,将可见工具从100个减少到每步1个,令牌使用降低约90%。
多分辨率触觉模仿学习用于接触丰富的机器人操作
发表机构 * Interactive Robot Perception & Learning, TU Darmstadt(互动机器人感知与学习,图腾达姆施塔特大学) ; Intelligent Autonomous Systems, TU Darmstadt(智能自主系统,图腾达姆施塔特大学) ; Hessian AI(黑森人工智能) ; Robotics Institute Germany(德国机器人研究所)
AI总结 提出多分辨率触觉表示框架MiTaS,融合不同时间分辨率的触觉传感器(GelSight Mini和Evetac)与RGB相机,通过模态特定卷积茎和基于Transformer的融合实现复杂接触丰富操作任务的模仿学习,平均成功率80%。
黎曼退化流形上的测地流匹配用于盲图像恢复
发表机构 * Samsung Research Institute(三星研究院)
AI总结 提出在低维黎曼流形上显式建模退化,通过联合图像-流形空间上的测地流匹配目标学习内在传输动力学,实现盲图像恢复。
你的GFlowNet秘密学习了一个最优传输方案
发表机构 * GitHub ; arXiv
AI总结 本文建立了非无环生成流网络与最优传输之间的理论联系,证明最小流GFlowNet学习到的策略编码了从源分布到目标分布的最优传输方案。
FOXGLOVE: 理解专家与LLM在议论文中的目标导向和锚定写作反馈
发表机构 * University of Illinois Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校)
AI总结 通过构建FOXGLOVE数据集,系统比较了写作专家和大型语言模型在议论文反馈中的目标导向、锚定性和优先级,发现两者在反馈目标和位置分布上相似,但在具体句子选择和反馈复杂度上存在差异。
多电路,单机制:电路发现中的输入变化与评估粒度
发表机构 * UKP Lab, Technical University of Darmstadt(达姆施塔特技术大学UKP实验室) ; National Research Center for Applied Cybersecurity ATHENE(应用网络安全国家研究研究中心ATHENE)
AI总结 本文通过固定任务、改变输入统计量,发现电路结构差异并不对应功能差异(称为“伪特化”),并证明结构不同的电路实现相同计算,强调边缘级评估和跨条件迁移测试的必要性。
从自我到他人:评估LLM仇恨言论标注中的人口统计学视角采纳
发表机构 * Information Retrieval Lab(信息检索实验室) ; CITIC Research Centre(CITIC研究中心) ; Universidade da Coruña(科鲁纳大学)
AI总结 本研究通过评估人格化LLM在仇恨言论检测中模拟不同人口群体视角的能力,发现模型在群体间分歧、群体内敏感性和替代性预测三个维度上表现不一,其中使用Llama 3.1的替代性提示在多数人口统计轴上实现了最高跨群体一致性。
RedKnot: 基于头部感知的KV重用和SegPagedAttention的高效长上下文LLM服务
发表机构 * Xiaohongshu Inc., China(小红书公司,中国) ; Peking University(北京大学) ; Huawei Cloud(华为云)
AI总结 提出RedKnot系统,通过按KV头分解缓存并采用SegPagedAttention,实现位置无关的KV重用、前缀压缩、冷热分离和分布式放置,在不重训练模型的情况下提升资源效率。
RadiusFPS:通过球形体素剪枝在CPU和GPU上实现高效最远点采样
发表机构 * School of Computing(计算学院) ; Institute of Science(科学研究院) ; Tokyo(东京)
AI总结 提出RadiusFPS框架,利用球形体素剪枝加速最远点采样(FPS),在保持标准更新规则的同时,通过保守几何边界和坐标点跳过测试减少冗余计算,并在GPU上实现融合核,显著提升速度并降低内存占用。
通过测试时重建实现潜在推理的闭环
发表机构 * University of Illinois Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校) ; Google(谷歌) ; Florida State University(佛罗里达州立大学)
AI总结 提出ReLAT方法,利用自监督测试时训练通过查询重建损失优化潜在状态,实现潜在推理的闭环,提升数学推理、知识问答和代码生成的性能。
打破时间:一种用于分布式和连续时间SLAM的全高斯框架
发表机构 * Department of Computer, Control, and Management Engineering "Antonio Ruberti", Sapienza University of Rome(计算机、控制与管理工程系(Antonio Ruberti), 罗马萨皮恩扎大学) ; University of Stuttgart(斯图加特大学)
AI总结 提出G-solver,结合高斯信念传播和高斯过程运动先验的分布式连续时间轨迹估计框架,支持异构异步传感器和多相机场景。
GRAMformer: 通过体积多模态交叉注意力实现任意顺序模态交互
发表机构 * Dept. of Information Engineering, Electronics, and Telecommunications, Sapienza University of Rome(信息工程、电子与电信系,罗马萨皮恩扎大学)
AI总结 提出体积多模态交叉注意力(VMA)机制,通过计算查询与多模态键向量的联合几何体积来建模任意顺序的模态交互,并集成到新型多模态Transformer架构GRAMformer中,提升多模态学习的有效性和效率。
MPCoT: 奖励引导的多路径潜在推理用于测试时可扩展的视觉-语言-动作
发表机构 * Department of Electrical and Computer Engineering, Boston University(波士顿大学电气与计算机工程系) ; Department of Computer Science, Tsinghua University(清华大学计算机系)
AI总结 提出MPCoT框架,通过奖励引导的多路径潜在推理,在保持零推理令牌和原始动作接口的同时,提升长时域和高不确定性控制任务中的VLA策略性能。
面向机构文档数据快照提取的开源布局检测模型基准测试
发表机构 * Development Data Group Office of the World Bank Group Chief Statistician(世界银行发展数据分析组办公室世界银行统计主任) ; The World Bank(世界银行)
AI总结 针对机构文档中图表数据快照提取任务,构建基准数据集并评估多个开源布局检测模型,发现现有模型在操作型文档上泛化能力不足,存在内容混淆、碎片化及上下文缺失等问题。
大型语言模型温度缩放中的生成临界性
发表机构 * State Key Laboratory of Nuclear Physics and Technology, Institute of Quantum Matter, South China Normal University(核物理与技术国家重点实验室,量子物质研究院,华南师范大学) ; Key Laboratory of Atomic and Subatomic Structure and Quantum Control (MOE), Guangdong-Hong Kong Joint Laboratory of Quantum Matter(原子与亚原子结构及量子控制重点实验室(MOE),量子物质广深联合实验室) ; Guangdong Basic Research Center of Excellence for Structure and Fundamental Interactions of Matter, Guangdong Provincial Key Laboratory of Nuclear Science(物质结构与基本相互作用卓越基础研究中心,广东省核科学重点实验室) ; KEK Theory Center, Institute of Particle and Nuclear Studies(KEK理论中心,粒子与核物理研究所) ; RIKEN Center for Interdisciplinary Theoretical and Mathematical Sciences (iTHEMS), Wako(RIKEN交叉学科理论与数学科学中心(iTHEMS),Wako) ; Graduate University for Advanced Studies (SOKENDAI), Oho 1-1, Tsukuba, Ibaraki(高等研究大学(SOKENDAI),Oho 1-1,筑波,Ibaraki) ; Institute for Physics of Intelligence, The University of Tokyo(智能物理研究院,东京大学)
AI总结 通过统计场框架研究大型语言模型文本生成中的温度缩放,发现接近特征温度时出现类似连续相变的临界现象,为理解解码策略与临界现象的联系提供定量工具。
追踪神谕:改进扩散时间步调度用于3D CT重建
发表机构 * School of Computer Science and Engineering, University of Electronic Science and Technology of China(电子科技大学计算机科学与工程学院)
AI总结 针对3D CT重建中扩散模型推理计算开销大且均匀时间步调度引入大截断误差的问题,提出即插即用的TrO框架,通过动态规划优化时间步调度,在有限采样步数下显著提升重建保真度和计算效率。
设计一个可靠的LLM集成接口用于死亡率预测
发表机构 * Curtin University(Curtin大学)
AI总结 提出一个结合大语言模型(LLM)的接口,通过自然语言输入驱动确定性预测流程,在保持统计精度的同时提升非专家用户的可及性。
SAM-Flow:源锚定掩码流用于免训练图像编辑
发表机构 * Tianjin Key Laboratory of Imaging and Sensing Microelectronic Technology, School of Microelectronics, Tianjin University(天津影像与传感微电子技术重点实验室,微电子学院,天津大学) ; School of Cyber Security, Tianjin University(网络安全学院,天津大学)
AI总结 提出SAM-Flow框架,通过源锚定掩码流和动态软掩码机制实现局部免训练图像编辑,有效防止背景泄漏。
从奖励黑客激活到智能体风险状态:LLM智能体中的上下文校准机制监控
发表机构 * University of Cambridge(剑桥大学)
AI总结 本研究通过分析ReAct风格智能体在Gameable ALFWorld和WebShop环境中的奖励黑客行为,提出结合激活状态、熵和决策上下文的上下文校准监控方法,以更准确评估智能体风险。