Skip-It? Theoretical Conditions for Layer Skipping in Vision-Language Models
AI总结 视觉-语言模型在多种任务中表现出色,但其庞大的模型规模导致推理成本较高。本文提出了一种统一的理论框架,用于确定在何种冗余条件下可以跳过某些层以提升效率而不牺牲性能,核心在于引入可实验验证且可解释的冗余度量标准。研究不仅验证了早期和晚期视觉标记的冗余性,还为现代层跳过技术提供了理论依据,统一了相关方法的思想。
AI总结 视觉-语言模型在多种任务中表现出色,但其庞大的模型规模导致推理成本较高。本文提出了一种统一的理论框架,用于确定在何种冗余条件下可以跳过某些层以提升效率而不牺牲性能,核心在于引入可实验验证且可解释的冗余度量标准。研究不仅验证了早期和晚期视觉标记的冗余性,还为现代层跳过技术提供了理论依据,统一了相关方法的思想。
AI总结 本文提出Fidel-TS,一个用于时间序列预测的高保真多模态基准数据集,旨在解决现有数据集在规模、频率、数据污染和信息泄露等方面存在的问题。该基准遵循数据来源完整性、无泄露设计和结构清晰性等核心原则,揭示了先前基准的局限性,并为评估多种单模态和多模态预测模型及大语言模型提供了新的见解。
Comments new version
AI总结 本文提出TRUST,一种基于不确定性引导的SSM遍历的测试时适应方法,旨在提升状态空间模型(SSM)在分布偏移下的泛化能力。该方法通过生成输入图像的多种因果视角,并利用模型预测作为伪标签来更新Mamba特定参数,最终通过参数平均整合多视角信息。TRUST首次充分利用了SSM的独特架构特性,实验表明其在七个基准上显著提升了模型鲁棒性,优于现有测试时适应方法。
AI总结 本文探讨了人工智能系统在准确性、可信度和人类水平推理能力之间的根本性矛盾。研究定义了严格数学意义上的准确性与信任概念,并指出一个准确且可信的AI系统无法实现人类水平的推理能力,因为存在一些任务实例,人类可以轻松解决,而该系统却无法解决。该结论借鉴了哥德尔不完备定理和图灵停机问题的证明思路,核心在于将信任形式化,从而区分系统的内在属性与其认知状态。
Comments 19 pages, 1 figure
AI总结 本文提出了一种名为 BoHA 的参数高效微调方法,通过块级 Hadamard 乘积适配器,在冻结预训练模型权重的前提下,仅训练少量任务特定参数。BoHA 将冻结权重划分为网格块,并在每个块中学习独立的低秩因子,从而在保持与 LoRA 相当总秩数的同时提升性能。实验表明,BoHA 在多个大语言模型上优于 LoRA,并在连续学习任务中表现出更强的性能保留能力。
AI总结 本文研究了逆强化学习中在最大熵模型下的奖励函数恢复问题,提出了一种新的通用方法GenPQR,该方法通过分类和少量回归即可实现,无需依赖特定神经网络结构或锚定动作限制。GenPQR 模块化地估计行为策略、计算软Q函数并恢复归一化奖励,理论分析表明其在函数逼近下具有有限样本保证,并通过实验验证其在奖励恢复效果上优于 DeepPQR,同时具备更高的灵活性和模块性。
AI总结 本文提出了一种用于个体级动物行为分析的计算机视觉流水线,旨在解决传统人工观察方法在农业环境中效率低、主观性强的问题。该方法结合了零样本目标检测、运动感知分割与追踪以及视觉Transformer的高级特征提取,有效应对了动物遮挡和群养环境等挑战,并在爱丁堡猪行为视频数据集上实现了高达94.2%的总体准确率,显著优于现有方法。该模块化设计具有良好的扩展性,为精准养猪和福利评估提供了自动化、客观的持续分析方案。
Comments 9 figures
AI总结 本文介绍了用户体验感知洞察数据集(UXPID),该数据集从公共工业自动化论坛中提取并合成匿名用户反馈,包含7130条带有元数据的评论,并由大型语言模型标注了用户体验洞察、用户期望、严重程度、情感和主题分类。该数据集旨在促进用户需求分析、用户体验研究及AI驱动的反馈处理相关研究,尤其适用于因隐私和授权限制难以获取真实数据的场景,为工业产品支持和软件工程领域的自然语言处理方法研究提供了重要资源。
AI总结 CalexNet 是一种针对轻量级早退出分支的软级联对齐训练与校准方法,旨在解决冻结卷积主干网络在自适应推理中出现的训练-推理不匹配问题。该方法通过连续加权重要性采样、基于实际级联存活样本的精度阈值校准以及温度缩放的KL散度目标函数,有效提升了早退出分支的性能。实验表明,CalexNet 在多个数据集上优于现有基线方法,尤其在减少30%到70%计算量的场景中表现突出,且无需改变推理时的网络结构。
Comments 19 pages, 6 figures
AI总结 本文提出了一种名为SpikingBrain的新型脑启发大语言模型,旨在解决主流Transformer模型在训练计算和推理内存方面的效率瓶颈。该模型基于MetaX GPU集群,通过引入自适应脉冲神经元、高效的训练流程和专用的脉冲编码框架,实现了在非NVIDIA平台上的稳定高效训练。实验表明,SpikingBrain在保持性能与开源Transformer基线相当的同时,显著提升了长上下文处理效率,并在推理过程中实现了部分常数内存和事件驱动的脉冲行为,展示了脑启发机制在构建高效可扩展大模型中的巨大潜力。
AI总结 本文提出了一种新型稀疏自编码神经算子(SAE-NO),它在函数空间而非固定维度的欧几里得空间中进行操作,用于提升机制可解释性。通过引入功能表示假设,SAE-NO 将概念参数化为函数,从而不仅捕捉概念的存在,还描述其在输入域中的表达方式和位置。基于傅里叶神经算子实现的 SAE-FNO 在处理具有空间结构或频率结构的数据时表现出优越的性能,能够学习局部模式、高效利用概念,并在不同分辨率和领域规模下保持稳定性与泛化能力。
Comments Tolooshams and Shen has equal contribution. Preprint. Earlier version was presented as Oral and Extended Abstract at the Workshop on Unifying Representations in Neural Models (UniReps 2025) at NeurIPS
AI总结 该研究比较了混合多数投票和集成堆叠两种方法在肥胖风险预测中的性能,旨在评估其准确性与效率。通过两个数据集的实验分析,发现集成堆叠在复杂数据分布下表现出更强的预测能力,而混合多数投票则是一种稳健的替代方案。研究还探讨了不同机器学习算法在集成方法中的互补优势,为医疗健康领域的模型选择提供了参考。
Comments There are some errors found
AI总结 随着图数据规模的扩大,研究者越来越关注非欧几里得空间中的黎曼流形数据。本文提出了一种适用于黎曼流形的归一化最大似然(Rm-NML)方法,该方法考虑了流形的几何结构,且对坐标变换具有不变性,在欧几里得空间中与传统NML一致。研究还扩展了NML的计算技术至黎曼流形,并推导了在对称黎曼流形(如双曲空间)上简化Rm-NML计算的方法,最后通过在双曲空间上计算正态分布的Rm-NML验证了方法的有效性。
Comments 19 pages. This is a preprint of an article accepted for publication in the IEEE Transactions on Information Theory
AI总结 本文提出了一种名为 Dino U-Net 的新型编码器-解码器架构,旨在利用 DINOv3 视觉基础模型的高保真密集特征进行医学图像分割。该方法通过冻结的 DINOv3 主干网络构建编码器,并引入适配器模块融合语义特征与低级空间细节,同时设计了一种保真度感知投影模块以提升特征投影质量。实验表明,Dino U-Net 在多个公开医学图像数据集上取得了最先进的性能,且模型规模增大时分割精度持续提升,验证了其高效性和可扩展性。
Comments MICCAI 2026
AI总结 本文介绍了一种基于大语言模型(LLM)的智能代理系统,用于在药物资产尽职调查中快速绘制竞争格局。该系统能够根据特定疾病适应症,自动检索相关药物并提取标准化属性,解决数据碎片化、命名混乱及多模态等挑战。研究构建了一个结构化的评估数据集,并引入了一个用于验证竞争药物的LLM判别代理,显著提升了检索精度。实验表明,该系统在竞争药物召回率上达到83%,优于现有工具,并已在企业环境中部署应用,大幅提升了分析效率。
AI总结 本文针对智能体长期记忆内容生成质量低的问题,提出了一种基于认知心理学理论的多记忆段系统(MMS)。该系统将短期记忆分解为多个长期记忆片段,并构建检索记忆单元与上下文记忆单元,实现一一对应关系,从而在检索阶段精准匹配相关记忆单元,提升响应质量。实验表明,该方法在长期记忆生成和检索任务中具有显著效果和实用价值。
Comments The content has been significantly revised and the author has also changed. Therefore, the paper will be withdrawn for revision and then uploaded after the completion of the modifications
AI总结 该研究针对临床图像中皮下血管分割任务中标注数据稀缺、对比度低和噪声大的问题,提出了一种弱监督学习框架VesselRW。该方法利用中心线、点标记或短涂鸦等低成本稀疏标注,通过可微分的随机行走标签传播模型生成密集的像素级概率监督,并结合不确定性加权损失函数提升模型鲁棒性。同时,该方法与卷积神经网络分割器联合训练,无需显式边缘监督即可学习血管边界和连续性约束,实验表明其在临床数据集上优于传统方法,显著降低了标注工作量并保持了血管拓扑结构的准确性。
Comments arXiv admin note: This submission has been withdrawn due to violation of arXiv policies for acceptable submissions
AI总结 本文提出了一种专为黑色素病变分割设计的双分辨率残差网络架构,旨在解决皮肤镜图像中细微纹理和颜色变化、常见成像伪影以及精确边界定位的挑战。该方法结合高分辨率流以保留细节边界和多尺度上下文信息流,通过边界感知残差连接和通道注意力机制实现特征融合,同时引入轻量级伪影抑制模块和多任务训练策略提升模型鲁棒性与分割精度。实验表明,该方法在公开基准测试中显著提升了边界精度和临床相关分割指标,优于传统编码-解码基线模型,为自动化黑色素瘤评估系统提供了有效支持。
Comments arXiv admin note: This submission has been withdrawn due to violation of arXiv policies for acceptable submissions
AI总结 本文提出了一种针对医学图像中器官边界的精确检测方法,旨在解决传统卷积网络在医学影像中定位精度不足的问题。该方法采用自上而下的反向精炼架构,结合亚像素上采样技术,逐步融合高层次语义特征与低层次细节信息,从而生成高分辨率、高精度的器官边界。实验表明,该方法在多个CT和MRI数据集上显著提升了边界定位性能,并有效提升了后续器官分割、图像配准等医学影像任务的效果。
Comments arXiv admin note: This submission has been withdrawn due to violation of arXiv policies for acceptable submissions
AI总结 本文提出了一种深度双重监督学习框架,用于提高黑色素瘤的识别准确率。该方法通过双路径结构同时提取局部细粒度特征和全局上下文信息,并结合双重注意力机制动态强调关键特征,以捕捉黑色素瘤的细微差异。此外,引入多尺度特征聚合策略以增强模型在不同分辨率下的鲁棒性,实验表明该方法在基准数据集上显著优于现有先进方法,具有更高的检测准确率和更强的抗误报能力。
Comments arXiv admin note: This submission has been withdrawn due to violation of arXiv policies for acceptable submissions
AI总结 随着大语言模型的发展,偏好优化(PO)成为对齐模型与人类偏好的重要方法。本文提出了一种名为MaPPO的最大后验偏好优化方法,该方法在优化目标中显式引入先验奖励知识,从而在保持DPO等方法框架的基础上,提升了对齐效果并避免了响应的二分类简化。MaPPO无需额外超参数,支持离线和在线场景,并可作为插件提升现有DPO变体的性能,实验表明其在多个基准测试中均能有效提升对齐效果而不牺牲计算效率。
AI总结 VIDEE 是一个支持初级数据分析师通过智能代理进行高级文本分析的系统,旨在降低自然语言处理和文本分析的门槛。该系统采用人机协作的工作流程,包括任务分解、执行和评估三个阶段,结合了蒙特卡洛树搜索算法、可执行的分析流水线和基于大语言模型的评估与可视化。实验表明,VIDEE 不仅提升了非专家用户的使用体验,还揭示了人机协作中的关键设计问题,为智能文本分析系统的发展提供了重要参考。
AI总结 本文研究了如何在反事实生成任务中更精确地控制生成结果的属性变化,提出了一种新的引导方法——Factored Classifier-Free Guidance(FCFG)。该方法通过结合因果图对属性进行细粒度控制,解决了传统分类器无关引导(CFG)在全局尺度上导致的非目标属性异常变化问题。实验表明,FCFG在自然和医学图像数据集上显著提升了反事实生成的合理性与可逆性。
Comments Accepted at ICML 2026
AI总结 本文研究了在无法验证任务中使用强化学习训练大语言模型的挑战,并提出了一种约束强化学习框架。该框架通过在标记级别优化与推理质量对齐的密集推理反思奖励(R3),并引入评分表门控机制以确保最终答案符合任务标准。实验表明,该方法在多个领域数据集上优于现有方法,学习效率更高且能有效满足可行性约束。
AI总结 本文研究了稀疏线性常微分方程(ODE)在动态系统建模中的可识别性问题。尽管已有研究指出密集矩阵的线性ODE几乎可以由单一轨迹唯一确定,但稀疏矩阵的情况尚未被充分探讨。作者证明,在实际相关的稀疏度范围内,稀疏线性ODE系统以正概率不可识别,并提供了该概率的下界。实验表明,现有方法在估计稀疏ODE时也面临实际不可识别的问题,表明数据驱动的动态系统建模需要重新评估其可靠性。
Comments 9 pages, 4 figures
AI总结 本文提出LoopNav,一个用于评估世界模型空间一致性的基准数据集与测试平台。该研究关注世界模型在长期观测信息保留和空间表征构建方面的能力,针对现有数据集缺乏空间一致性约束的问题,构建了包含2.5亿帧的基于循环导航的Minecraft开放世界视频数据集,并引入场景图一致性得分以量化空间一致性。LoopNav为未来相关研究提供了开源的数据集、基准和代码支持。
Comments V3: SGCS
AI总结 本文提出了一种名为贝叶斯注意力机制(BAM)的概率框架,用于处理语言模型中的位置编码和上下文长度外推问题。该方法将位置编码建模为概率模型中的先验分布,统一了现有方法并引入了一种广义高斯位置先验,显著提升了模型在长上下文中的泛化能力。实验表明,BAM在训练上下文长度的500倍下仍能准确检索信息,在长上下文检索准确率上优于现有最先进方法,同时保持了相近的困惑度和较少的额外参数。
Comments Accepted to ICLR 2026
AI总结 CONSIGN 是一种基于符合性预测(CP)的图像分割方法,旨在提升分割结果的不确定性估计。该方法通过引入空间分组分解,有效考虑了图像中像素之间的空间相关性,从而生成具有用户指定高概率误差保证的有意义预测集。实验表明,CONSIGN 在多个医学影像和通用图像数据集上显著优于传统 CP 方法,提升了不确定性的量化质量与分割性能。
Comments Accepted as poster at ICLR 2026
AI总结 本文提出了一种名为RECON的鲁棒对称性发现方法,通过显式的规范方向归一化,无需预先指定对称变换群即可纠正任意规范表示,从而实现更自然、更贴合数据的规范对齐。该方法支持无监督发现实例特定的姿态分布、检测分布外姿态,并提供一个可插拔的测试时归一化层,能够提升预训练模型的性能而不需重新训练。实验表明,RECON在图像和分子数据集上均表现出优越的对称性发现能力和分类性能。
Comments Accepted as a conference paper at ICLR 2026
AI总结 本文研究了在基础模型嵌入时代下,如何利用多模态数据进行癌症建模。作者提出通过基础模型生成癌症数据的多模态嵌入表示,并在此基础上训练经典机器学习模型,实现了优于单模态模型的性能。研究还探讨了病理报告文本的利用价值,并严格评估了基于模型的文本摘要与幻觉效应,为多模态癌症分析提供了嵌入驱动的新方法。
Comments camera ready version for ML4H 2025, typo corrected