Mind Your Margin and Boundary: Are Your Distilled Datasets Truly Robust?
注意你的边界:你的蒸馏数据集真的鲁棒吗?
AI总结 针对数据集蒸馏中鲁棒性不足的问题,提出一种结合攻击感知课程学习与对比鲁棒性目标的框架C²R,通过优先处理最小鲁棒边界的对抗样本并扩大类间决策边界分离度,显著提升鲁棒准确率。
Comments Accepted to ICML 2026
注意你的边界:你的蒸馏数据集真的鲁棒吗?
AI总结 针对数据集蒸馏中鲁棒性不足的问题,提出一种结合攻击感知课程学习与对比鲁棒性目标的框架C²R,通过优先处理最小鲁棒边界的对抗样本并扩大类间决策边界分离度,显著提升鲁棒准确率。
Comments Accepted to ICML 2026
Weasel: 通过重要性-多样性数据选择实现Web智能体的域外泛化
AI总结 提出Weasel方法,通过优化平衡单步重要性与状态、网站、交互模式成对多样性的目标,选择固定预算的轨迹子集,结合目标中心AXTree剪枝和风格一致理由替换,提升Web智能体离线训练的域外泛化性能并降低训练成本。
Comments ICML 2026. Code is released at https://github.com/fatemehpesaran310/weasel
行人行为不确定性下安全自动驾驶的多智能体强化学习
AI总结 本文使用多智能体近端策略优化(MAPPO)联合训练自动驾驶汽车和12个行人,通过隐藏的行人特质模拟乱穿马路行为,相比固定策略基线显著降低了碰撞率,并揭示了速度差异指标可用于检测未预期的乱穿马路行为。
Comments Accepted to ICRA 2026 Workshop "8th Workshop on Long-term Human Motion Prediction"
你的邻居知道:利用局部邻居进行去中心化学习中的后门检测
AI总结 提出Argus框架,通过局部邻居协作分析模型更新并利用结构相似性度量区分真实后门与数据异构性导致的误报,实现去中心化学习中的后门检测,并提供理论收敛保证。
Comments 34 pages, 10 figures
作者身份信号在基于编码器的语言模型中出现在哪里?
AI总结 通过机械可解释性工具,研究不同评分机制对基于编码器的作者身份归因模型性能的影响,发现评分机制决定了编码器在何处整合作者身份信号。
Comments 12 pages, 6 figures. Under review
可发现的智能体知识——智能体知识图谱能力的形式化框架(扩展版)
AI总结 本文提出一个四维形式化框架(语义表达性、智能体可发现性、任务相对基础性和认知信任范围),并从中推导出智能体能力概况(AAP),作为VoID和DCAT之上的语义层,支持智能体在规划时进行原则性的知识图谱选择、组合和故障诊断。
自主AI代理在供应链管理中的可靠性与有效性
AI总结 本文通过MIT啤酒游戏研究多级供应链中的自主生成式AI代理,发现模型能力是性能主导因素,但平均性能掩盖可靠性风险,并引入代理牛鞭效应,提出基于GRPO的后训练框架以提高可靠性。
可辨识的令牌对应关系用于世界模型
AI总结 提出可辨识的令牌对应关系(ITC)方法,通过将下一帧预测建模为结构化分配问题,解决基于令牌的Transformer世界模型在长程推演中的时间不一致性,在四个基准上达到最先进性能。
SMDP中平均奖励强化学习的调和均值公式
AI总结 针对无限时域非回合制任务中的平均奖励强化学习,提出一种修正的调和均值算子,解决SMDP中奖励和持续时间非平稳时的奖励率计算问题,并证明其理论性质及有效性。
MultiSense-Pneumo:面向资源受限环境中肺炎筛查的多模态学习框架
AI总结 提出MultiSense-Pneumo多模态原型系统,整合症状、咳嗽音频、语音和胸片,通过可解释的后期融合实现肺炎筛查与分诊支持。
VT-Bench:视觉-表格多模态学习的统一基准
AI总结 提出首个视觉-表格多模态基准VT-Bench,涵盖9个领域14个数据集,评估23个模型,揭示视觉-表格学习的挑战。
通过最小切片传输计划的高效可迁移最优传输
AI总结 提出最小切片传输计划(min-STP)框架,研究优化切片器在不同分布对间的可迁移性,并引入小批量公式以提高可扩展性,在点云对齐和流生成建模中实现一次性匹配和摊销训练。
FLUIDSPLAT: 通过高斯原语从稀疏传感器重建物理场
AI总结 提出FLUIDSPLAT模型,利用高斯原语作为空间显式中间表示,从稀疏传感器数据重建流场,理论分析了表示能力与观测数的关系,并在多个基准上实现误差降低11-28%。
Comments 24 pages, 5 figures,preprint
AMARIS: 一种用于基于评分标准的强化学习的记忆增强评分标准改进系统
AI总结 提出AMARIS系统,通过持久化评估记忆存储纵向训练证据来改进评分标准,在科学、医学、指令遵循和创意写作任务上优于静态、局部自适应和无记忆基线方法。
Comments Preprint. Under review
RAVE: 重新分配大型多模态模型中的视觉注意力
AI总结 针对大型多模态模型中标准注意力机制存在的跨模态误分配和视觉内不平衡问题,提出轻量级成对门控机制RAVE,通过学习查询-键偏置重新分配视觉注意力,在多个多模态基准上平均提升3个百分点,尤其对感知密集型任务效果显著。
通过QLoRA微调将工具知识内化到小型语言模型中
AI总结 本文研究通过QLoRA参数高效微调将工具知识内化到小型语言模型中,在AssetOpsBench基准上,微调后的Gemma 4 E4B和Qwen3-4B模型在无描述推理下优于有完整工具描述的未微调基线,输入长度减少82.6%,规划分数提升。
GraphMind:从操作轨迹到自演化工作流自动化
AI总结 提出GraphMind系统,通过离线提取因果工作流图、在线多智能体遍历执行和自适应遍历强化,实现云数据库事故调查中的自动化工作流,相比基线方法减少8倍检索上下文并降低26%幻觉率。
RSD:一种用于学习向量块的局部三角剖分审计原语
AI总结 提出RSD(关系语义分解)作为局部三角剖分审计方法,通过拟合单纯形成员关系和坐标极点,结合关系解码器和坐标残差,实现学习向量块的可解释性审计。
Comments 8 pages, 1 figure. Revised version with clarified scope, experiments, and limitations
D-OPSD:用于连续调优步蒸馏扩散模型的在线自蒸馏方法
AI总结 提出D-OPSD,一种在线自蒸馏训练范式,使步蒸馏扩散模型在监督微调中保持少步推理能力,通过让模型同时作为教师和学生,利用不同上下文条件(学生仅文本特征,教师多模态特征)最小化预测分布,学习新概念和风格而不牺牲原有少步能力。
Comments Project Page: https://vvvvvjdy.github.io/d-opsd/
RoboMME:机器人通用策略的记忆基准与理解
AI总结 提出RoboMME基准,通过16个操作任务评估VLA模型在长时程和历史依赖场景中的记忆能力,并基于π0.5骨干网络探索14种记忆增强变体,发现记忆表示的有效性高度依赖于任务。
Comments Accepted to ICML 2026
属性增强指令微调用于大型语言模型的多任务分子生成
AI总结 提出PEIT框架,通过多模态对齐预训练和指令微调,提升LLM在分子描述、文本分子生成、属性预测和多约束分子生成任务上的性能。
Comments 9
动态对抗微调重组拒绝几何结构
AI总结 研究动态对抗微调如何改变安全对齐语言模型中拒绝行为的因果控制载体(低维子空间),发现R2D2沿鲁棒性-效用前沿重组几何结构但未建立自适应鲁棒性。
RadJEPA:基于联合嵌入预测架构的胸部X光放射学编码器
AI总结 提出RadJEPA,一种无需语言监督的自监督框架,通过联合嵌入预测架构在约84万张无标签胸部X光图像上预训练,学习预测掩码区域的潜在表示,在放射学报告生成等任务中达到或超越现有基线。
EgoExo-WM: 利用外部视频解锁自我世界模型
AI总结 提出通过从外部视频提取结构化身体姿态并利用人体运动学先验将其转换为自我视频,从而利用丰富的野外外部数据训练自我世界模型,显著提升预测质量和下游规划性能。
Comments Project Page: https://vision.cs.utexas.edu/projects/EgoExo-WM/
RAG 能知道检索错误吗?知识冲突下的上下文合规性诊断
AI总结 提出上下文驱动分解(CDD)方法,在推理时探测并干预检索增强生成中的上下文与参数知识冲突,揭示上下文合规性模式并提升鲁棒性。
Comments 12 pages, 4 figures, 3 tables
Hide to See: 面向VLM蒸馏中视觉锚定思维的推理前缀掩码
AI总结 提出一种推理前缀掩码蒸馏框架,通过掩码学生模型的显著推理前缀,迫使其在推理过程中更依赖视觉证据,从而缓解长推理轨迹中的视觉遗忘问题,提升多模态推理性能。
Comments Pre-print
视觉Mamba能否提升AI生成图像检测?一项深入研究
AI总结 本研究系统评估了Vision Mamba模型在AI生成图像检测中的性能,与CNN、ViT和VLM检测器进行对比,分析了准确性、效率和泛化能力。
MiVE:用于参考引导视频编辑的多尺度视觉语言特征
AI总结 提出MiVE框架,利用VLM的多尺度层次特征(早期层保留空间细节,深层编码全局语义)统一到自注意力扩散Transformer中,解决模态间隙和细粒度信息丢失问题,在参考引导视频编辑中达到SOTA性能。
Comments ICML 2026
《会同馆华夷译语》中的跨语言转写与音系表征
AI总结 本研究将《会同馆华夷译语》视为一个连贯的多语言转写系统,通过数字化和音系分析,揭示了其主要转写和补充转写的跨语言规律,并论证了该系统作为历史音系证据的价值。
Comments 49 pages; 1 figure; 40 tables; SLE2019; under review
MinT:用于训练和服务数百万LLM的托管基础设施
AI总结 提出MinT系统,通过LoRA适配器管理实现大规模基础模型上的高效训练与在线服务,支持百万级策略目录。
Comments 30 pages, technical report