BadBlocks: Low-Cost and Stealthy Backdoor Attacks Tailored for Text-to-Image Diffusion Models
BadBlocks: 针对文本到图像扩散模型的低成本、隐蔽后门攻击
AI总结 提出BadBlocks攻击方法,通过仅污染UNet架构中的特定块,在保持其他组件不变的情况下,以30%的计算资源和20%的GPU时间实现高成功率且绕过注意力检测防御,揭示了不同神经层的脆弱性差异。
BadBlocks: 针对文本到图像扩散模型的低成本、隐蔽后门攻击
AI总结 提出BadBlocks攻击方法,通过仅污染UNet架构中的特定块,在保持其他组件不变的情况下,以30%的计算资源和20%的GPU时间实现高成功率且绕过注意力检测防御,揭示了不同神经层的脆弱性差异。
驯服基于ML的安全任务中的数据挑战:使用生成式AI
AI总结 提出使用生成式AI(GenAI)生成的合成数据增强训练集,以改善机器学习安全分类器的泛化性能,在7个任务上实现最高32.6%的提升。
Comments Accepted at the 2026 ACM Asia Conference on Computer and Communications Security (AsiaCCS 2026)
正则化深度矩阵分解的完整损失景观分析
AI总结 本文通过闭式表征所有临界点并分类其类型,揭示了正则化深度矩阵分解的损失景观,解释了梯度方法几乎总是收敛到局部极小值的原因。
Comments 30 pages, 2 figures
你的大语言模型是否在过度收费?分词、透明度与激励
AI总结 研究当前按token计费机制下,服务提供商可能通过策略性报告token数量来过度收费,并提出按字符线性定价的激励相容机制以消除该财务激励。
Comments Selected as an oral presentation at ICML 2026
从频域角度增强扩散模型的成员推理攻击
AI总结 本文从频域角度揭示扩散模型处理高频信息的缺陷导致成员推理攻击误分类,并提出即插即用的高频滤波模块以提升攻击性能。
Comments Accepted to Forty-Third International Conference on Machine Learning (ICML 2026)
专业知识提升AI使用:比较普通人和专业艺术家的实验证据
AI总结 通过实验比较50位专业艺术家和普通人使用生成式AI进行图像复制和创意生成的表现,发现艺术家的专业技能迁移到AI使用中,在复制准确性和发散思维上均优于普通人,而GPT-4o在创意任务上平均略优于艺术家但未超越最佳人类。
Comments Eisenmann and Karjus contributed equally to this work and share first authorship
Agent4Edu:通过生成式智能体为智能教育系统生成学习者响应数据
AI总结 提出Agent4Edu,一种利用大语言模型构建生成式智能体模拟学习者行为,以解决智能教育系统中离线指标与在线性能差异的问题,并支持个性化学习算法评估与优化。
Comments Accepted by AAAI2025
神经网络与(虚拟)扩展公式
AI总结 通过将神经网络表示能力与多面体的扩展复杂度关联,证明单调或输入凸神经网络规模的下界,并引入虚拟扩展复杂度以推广到一般神经网络。
利用强化学习探索的社会环境模拟来塑造理想的气候轨迹
AI总结 本研究通过引入多智能体强化学习替代传统求解器,在综合评估模型中模拟合作与竞争的社会互动,发现合作智能体能一致地实现减排与经济改善,而竞争则导致难以达成理想气候目标。
Comments 23 pages, 13 Figures
CompilerDream: 学习编译器世界模型以实现通用代码优化
AI总结 提出基于模型的强化学习方法CompilerDream,通过编译器世界模型模拟优化pass属性并训练智能体,实现跨应用场景和语言的通用代码优化,在零样本泛化上超越LLVM内置优化。
Comments KDD 2025 camera-ready version with extended appendix. Code is available at https://github.com/thuml/CompilerDream. This update additionally fixes an issue in Table 6 where the dataset names in three rows were ordered incorrectly
量化设置下前馈神经网络验证的复杂性
AI总结 研究量化设置下前馈神经网络验证的计算复杂性,区分三类网络并分析线性规划和位向量规范下的复杂性,证明量化网络验证仍为NP完全,并为动态量化网络建立上界。
GUITestScape:面向探索性GUI测试的开放集评估
AI总结 提出GUITestScape基准和GUIJudge评估器,通过覆盖交互与显示缺陷的508个预设缺陷及过程感知评估方法,解决现有GUI测试评估局限于预定义标注和交互缺陷的问题。
KBF:知识边界作为语言模型和黑盒API审计的指纹
AI总结 提出KBF协议,利用知识边界附近的稳定数值召回率作为指纹,低成本黑盒审计模型API,检测替代和混合路由攻击。
Comments 20 pages, 13 figures
自动驾驶汽车的网络优化方面:挑战与未来方向
AI总结 本文综述了自动驾驶汽车网络优化的多学科方法,包括协同感知,旨在消除误解并展望未来方向。
新 Pro Se:生成式人工智能与联邦民事诉讼自我代理的激增
AI总结 本文利用约280万份联邦民事诉讼数据,分析生成式AI普及后自我代理原告率上升、投诉文本变化、诉讼结果及原告构成的变化,发现AI标记投诉更密集引用、多为首次起诉者、地理分布不均,且未改善胜诉率。
Comments 15 pages, 7 figures
企业违约预测模型中的进化规则提取
AI总结 本研究提出DEXiRE-EVO进化规则提取框架,结合多目标优化与CIU可解释性方法,从机器学习违约预测模型中提取经济意义明确的规则,兼顾预测性能与可解释性。
告知、指导、共情、倾听:审计LLM护理支持角色
AI总结 本研究通过操作化四种社会支持角色(告知、指导、共情、倾听),评估大型语言模型在非正式护理对话中的安全概况,发现支持角色系统性地影响交互风险,且存在感知质量-安全性权衡。
SciIntBench: 衡量大语言模型在对抗性框架下对科研诚信规范的遵从度
AI总结 提出SciIntBench对抗性基准,通过810个提示评估16个LLM在10个RCR类别中的框架敏感拒绝与帮助行为,发现模型对显性不当行为拒绝可靠,但对隐性违规(尤其是压力驱动的捷径)拒绝不足。
双变量生存结局的深度最优个体化治疗规则:基于自适应预测驱动学习
AI总结 针对随机试验中的双变量生存结局,提出一种基于深度神经网络的自适应预测驱动方法,通过随机策略建模治疗规则并耦合边际加速失效时间模型,以最大化联合生存概率。
编码助手如何辜负用户:基于20,574个真实会话的开发人员与智能体不一致的大规模分析
AI总结 通过对20,574个编码助手会话的分析,识别出七种常见的不一致形式,发现大多数不一致导致信任成本而非系统损坏,且多数仍需用户显式纠正。
AliMark: 增强句子级水印对文本释义的鲁棒性
AI总结 提出AliMark框架,将句子级水印重构为比特序列编码与对齐问题,通过多候选对齐检测策略提升对句子拆分合并等结构扰动的鲁棒性。
Comments Accepted by ICML 2026
DELOS: 使用对比学习框架检测开普勒测光中的浅凌星
AI总结 提出基于对比学习的DELOS框架,通过GPU加速折叠和卷积编码器检测低信噪比浅凌星,性能优于BLS和TLS。
Comments 25 pages, 19 figures, 1 table, submitted to ApJ
使用共轭梯度法构建理想观察者的高效通道
AI总结 针对医学成像系统图像质量的任务评估,提出基于共轭梯度(CG)的方法构建高效通道,以近似贝叶斯理想观察者(IO)和霍特林观察者(HO)的性能。
Comments Submitted to the Journal of Medical Imaging (JMI) Special Issue Honoring Dr. Harrison H. Barrett
基于可控边界的月船三号月球着陆实时重定向
AI总结 针对月船三号月球着陆任务,提出一种利用可控边界凸表示实现实时重定向的制导策略,通过数据驱动框架首次在运行任务中验证其有效性。
Comments 8 pages, 6 figures, Accepted for publication in American Control Conference 2026
基于四元数的解耦推力轴姿态控制用于月船三号月球着陆任务
AI总结 针对月船三号着陆任务,提出一种基于四元数的解耦方法,实现推力轴独立控制,避免制导与控制之间的不良耦合。
Comments 6 pages, 7 figures, Published in Indian Control Conference 2025
卸载分数:通过反事实工作流衡量AI依赖度
AI总结 本文提出卸载分数(offloading score),一种通过构建反事实工作流量化用户向AI工具卸载认知努力比例的依赖度度量,并通过内在验证和用户实验证明其能检测时间压力下的依赖度变化。
Comments Preprint
潜在词:密集检索器包含可轻易提取的符合齐夫分布的BM25就绪词汇表
AI总结 提出潜在词方法,揭示密集检索模型(单向量或多向量)学习到的表示可轻易分解为稀疏特征,通过稀疏自编码器提取潜在词汇表,无需检索特定调整即可直接用于BM25稀疏检索,匹配或超越原模型及SPLADE变体。
基于核的势均场博弈与无偏随机傅里叶 $U$-统计量
AI总结 针对运行交互成本和终端目标成本均由再生核最大均值差异(MMD)惩罚表示的势均场博弈子类,提出一种利用核结构的计算框架,通过无偏随机傅里叶U-统计量估计成本,并证明样本级几乎必然收敛定理和显式收敛速率。
分布式训练是否会破坏计算治理?
AI总结 本文探讨了分布式训练技术可能规避计算治理的可行性,并提出了包括举报、芯片追踪、法务会计以及集群内存和计算阈值在内的反制措施。
Comments TAIGR workshop in ICML 2026
无害却有害:针对Agent技能中隐蔽幻觉引导的中性提示攻击
AI总结 本文提出中性提示攻击(NPA),通过语义上看似无害的指令(如鼓励想象和详尽性)增加代码生成Agent的包幻觉倾向,从而引入软件供应链风险,并评估了其对多种编码LLM的有效性和逃避防御的能力。
Comments under review