DCFold: Efficient Protein Structure Generation with Single Forward Pass
DCFold: 通过单次前向传递高效生成蛋白质结构
AI总结 本文提出DCFold,一种单步生成模型,实现了与AlphaFold3同等的精度,通过双一致性训练框架和新的时间测地匹配(TGM)调度器,在保持预测保真度的同时将推理速度提升15倍,验证了其在结构预测和结合设计基准上的有效性。
DCFold: 通过单次前向传递高效生成蛋白质结构
AI总结 本文提出DCFold,一种单步生成模型,实现了与AlphaFold3同等的精度,通过双一致性训练框架和新的时间测地匹配(TGM)调度器,在保持预测保真度的同时将推理速度提升15倍,验证了其在结构预测和结合设计基准上的有效性。
基于C++在Metal和CUDA上的轻量级高斯过程推断
AI总结 本文提出LightGP,一个无需依赖的C++17库,用于高斯过程回归,支持Apple Metal和NVIDIA CUDA后端,以及通过Apple Accelerate和OpenBLAS优化的CPU路径。LightGP提供了四种推断路径,覆盖从N=100到N=500,000的问题规模,并在不同硬件上实现了显著的性能提升。
评估交互式AI代理的认知年龄对齐
AI总结 本文提出ChildAgentEval,首个基于心理测量的交互式基准,用于评估基于多模态大语言模型的代理的认知年龄对齐,通过与年龄特定的人类发展阶段进行系统比较,揭示当前代理在模拟年龄特定认知行为方面的优劣。
注意力沉底与注意力残差中的异常值
AI总结 本文提出OASIS技术,通过层间空信号来解决注意力残差架构中注意力沉底、激活异常值以及推理稳定性下降的问题,通过双归一化设计和实验验证提升了模型的结构鲁棒性和量化鲁棒性。
多智能体AI系统在创造力上超越人类团队
AI总结 研究探讨了多智能体AI系统在创造力任务中的表现,发现其在四个多样化问题解决任务中,比单智能体和人类团队更具创造力,核心方法是通过语义空间路径分析生成过程,主要贡献是揭示了AI和人类团队在创造力预测上的不同机制。
PAIR:面向多轮代理优化的前缀感知内部奖励模型
AI总结 本文提出PAIR模型,通过结合冻结的隐藏状态探针和轻量级注意力头部,解决多轮任务中内部正确性探针的可靠性问题,从而在不依赖外部模型调用或地面真实依赖的情况下,为GRPO训练提供密集的步骤级奖励信号。
Comments Under Review
HexagonalWarriorMamba: 12导联ECG心脏异常的阈值依赖多标签分类的更优方法
AI总结 本文提出HexagonalWarriorMamba框架,通过将12导联ECG视为单通道2D图像而非传统1D时间序列,改进了传统深度学习模型在处理ECG信号长程依赖关系方面的不足,实现了对心脏异常的更优多标签分类。
Comments Submitted to Scientific Reports
HINT-SD:针对长 Horizon 智能体的定向 hindsight 自监督学习
AI总结 本文提出 HINT-SD,一种针对长 Horizon 智能体的定向 hindsight 自监督学习框架,通过全轨迹 hindsight 选择失败相关的动作,并仅在目标动作跨度上应用反馈条件自监督学习,实验表明该方法在 BFCL v3 和 AppWorld 上比密集的每回合反馈基线提高了 18.80 个百分点,同时训练时间降低 2.26 倍。
PySIFT:用于深度学习视觉流水线的GPU驻留确定性SIFT
AI总结 本文研究了经典SIFT在深度学习视觉流水线中的应用,展示了其在准确性和速度上的优势,并提出了PySIFT,一种完全在GPU上驻留的SIFT实现,能够提供确定性的输出和高效的性能。
Comments 9 pages, 6 figures
通过运动诱导采样用消费级LiDAR成像隐藏物体
AI总结 本文提出了一种多帧融合策略,利用运动诱导孔径采样模型,在消费级LiDAR上实现了非线视成像,实现了隐藏物体的3D重建、多物体跟踪和相机定位,并展示了消费级硬件无需额外设置即可实现非线视成像的潜力。
f-OPD: 通过新鲜度感知控制稳定长周期在线策略蒸馏
AI总结 本文提出f-OPD框架,通过引入样本级新鲜度评分来稳定长周期在线策略蒸馏,实现性能与效率的平衡,为大规模长周期智能体训练奠定基础。
PAREDA:自然语言处理研究讨论的多口音语音数据集
AI总结 本文提出PAREDA数据集,用于研究不同口音、自发性和领域特定语音的ASR性能,通过评估SOTA模型发现零样本设置下模型表现下降,但微调后显著降低WER,证明数据集捕捉了现有数据缺失的语言特征。
Comments Accepted and presented at SPEAKABLE 2026 workshop at LREC 2026
KISS - 地球科学的科学模拟知识基础设施:一种智能体的支架
AI总结 本文提出KISS,一种用于科学模拟的知识基础设施,通过将专业知识外化为经过验证的建模操作符、分阶段的领域协议和诊断恢复机制,使智能体能够生成物理合理且可验证的端到端模拟,从而降低非专业用户与过程模拟之间的接入门槛,并促进建模社区的整合。
通过对比信息传递学习正负边
AI总结 本文研究了在低标签率、高同质性和高边密度设置下,负边信息对图表示学习的价值,并提出对比信息传递机制以同时利用正负边信息提升性能。
一种具有软液压驱动的灵活机械手用于微重力操作
AI总结 本文提出将DexCoHand灵活的双指六自由度机械手与Astrobee自由飞行机器人集成,以实现微重力环境下的灵活操作,该机械手在保持稳定接触的同时减少了对自由飞行基底的干扰,提高了操作的连续性和适应性。
Comments Accepted to the IEEE ICRA 2026 Space Robotics Workshop (SRW). 4 pages, 3 figures
从有机数据生成预训练令牌以实现数据驱动的扩展
AI总结 本文提出SynPro框架,通过重新表述和重新格式化操作,帮助大语言模型更充分地利用有限的有机数据,从而在数据驱动的预训练中实现更高效的扩展。
稳定、扩展与增强MeanFlow用于大规模扩散蒸馏
AI总结 本文提出了一种稳定MeanFlow的方法,通过引入暖启动技术并结合轨迹分布对齐,提高了大规模工业模型蒸馏的性能和泛化能力。
Comments 10 pages
高效的元标签校正中的双层优化
AI总结 本文提出了一种高效的元标签校正方法EBOMLC,通过引入一步内循环更新、混合上界损失和对齐感知的动态障碍物,提高了元模型的训练效率和稳定性,实验表明其在高噪声环境下表现优异。
具有知识蒸馏的代理成本感知查询规划用于大数据分析
AI总结 本文提出了一种结合规则基教师规划器、UCB1老虎机探索、成本感知预测和知识蒸馏的轻量级学生规划器,以解决大数据分析中查询优化计算成本高且资源受限环境下的内存和延迟约束问题,实验结果显示在纽约出租车和IMDB数据集上相比默认规划器降低了23%的延迟并保持了94%的约束满足率。
Comments 8 pages, preprint, code at https://github.com/mahdinaser/agentic-kd-planner
记住更多,风险更多:具有记忆能力的LLM代理的纵向安全风险
AI总结 本研究探讨了具有记忆能力的LLM代理在长期任务中因记忆积累导致的安全风险,提出了一种触发-探测协议来评估记忆污染的影响,并发现记忆安全应被视为一个纵向属性而非单一状态属性。
交互评估需要一种设计科学
AI总结 本文探讨了交互评估应被视为一种原则性的评估范式,而非仅仅是新的智能体基准。通过定义评估为证据到判断的自主映射,文章展示了交互评估如何改变这一映射的两方面,并提出双轴分类法,制定设计原则和报告标准,分析了长期评估挑战在轨迹层面的再现。
Comments 10 pages
通过微分独立性进行内容-风格识别
AI总结 本文提出了一种新的结构条件,即内容-风格微分独立性(CSDI),用于在内容和风格可能依赖的情况下实现生成分析中的可识别性,通过在雅可比子空间上施加块状正交约束,并设计了基于数值雅可比近似的随机正则化器以支持高维生成模型。
Comments 24 pages, 15 figures, ICML 2026
CounterCount: 一种用于视觉语言模型计数偏差诊断的框架
AI总结 本文提出CounterCount框架,通过对比事实性与反事实性图像来诊断视觉语言模型在计数任务中的偏差问题,揭示模型对物体级先验知识的依赖,并提出统一的注意力调节策略提升反事实计数准确性。
为什么我们看那里:一种最大化场景理解的视网膜视觉语言模型表现出的人类样注视模式
AI总结 研究探讨了人类自由观看时注视模式的形成机制,发现最大化场景理解的视网膜视觉语言模型能够产生类似人类的注视模式,表明这种模式可能是优化场景理解的副产品。
释放傅里叶形状的表示能力以攻击红外目标检测
AI总结 本文提出了一种基于傅里叶形状的红外目标检测攻击方法,通过引入可学习的傅里叶形状,克服了传统形状方法在表示能力和优化能力之间的根本权衡问题,实现了高效的梯度优化生成具有欺骗性的形状,使人类目标逃避检测。
基于证据的未知拒绝用于高置信度近似未知物
AI总结 本文提出EGUR-A方法,通过改变决策方式从判断样本得分是否足够高到判断预测已知类别是否有足够证据接受样本,从而减少高置信度的误判接受。
Comments 8 pages, 2 figures,8 tables
秩序之中的混沌:在桌面堆叠重构中使用Topple动作的规划
AI总结 本文研究了桌面环境中堆叠重构任务,通过引入更丰富的非抓取聚合动作(特别是从堆叠中倒落物体到桌面的Topple动作)来增强任务规划领域。核心方法是提出一种新的Topple聚合工具,将候选任务计划计算转化为 Pebble Motion 问题变体,从而在IsaacSim物理模拟中验证了其效果,展示了在执行速度上的显著优势。
Comments 8 pages, 7 figures
going headless?关于垂直AI企业的边界
AI总结 本文探讨了垂直AI企业在会计、法律、医疗、采购等领域中,将工作流、领域逻辑和责任整合到单一应用中的传统模式,以及通用AI代理如何解构这种模式,促使企业采取"going headless"策略。文章指出,这种策略对某些企业有益,对另一些企业则可能造成破坏,并提出了基于任务-责任制度的三类分类体系及规则债务的概念。
一个模型,两种角色:共享递归变压器中的涌现专业化
AI总结 该研究探讨了共享权重的递归变压器是否能在未被分割成独立模块的情况下发展出不同的内部角色,通过不对称输入递归(AIR)架构发现,模型内部状态分化出不同的功能角色,并展示了这种分化与模型状态动态的关系。
Comments 21 pages, 13 figures, 8 tables
通过Wasserstein梯度流构建数据免费一步采样的统一框架
AI总结 本文提出了一种基于Wasserstein梯度流的数据免费一步采样的统一理论框架,展示了f-分歧度目标下诱导速度场的通用形式,并通过软欠覆盖功能理论推导了分歧度选择与质量运输几何之间的压缩-弹性恒等式,进一步扩展到Log-Variance分歧度,并通过KDE实现和归一化流路线实现了一步推断。