LOKI: Memory-Free Null-Space Constrained Lifelong Knowledge Editing
LOKI: 无记忆零空间约束的终身知识编辑
发表机构 * Department of Electrical and Computer Engineering(电气与计算机工程系)
AI总结 提出LOKI方法,通过希尔伯特-施密特独立性准则动态选择层,并将梯度更新投影到模型权重的零空间,实现无需访问旧知识的终身知识编辑,平均准确率提升14%。
LOKI: 无记忆零空间约束的终身知识编辑
发表机构 * Department of Electrical and Computer Engineering(电气与计算机工程系)
AI总结 提出LOKI方法,通过希尔伯特-施密特独立性准则动态选择层,并将梯度更新投影到模型权重的零空间,实现无需访问旧知识的终身知识编辑,平均准确率提升14%。
TeleMorpher: 迈向鲁棒的同步运动-位置编辑
AI总结 提出TeleMorpher,一种基于扩散模型的一步式框架,通过运动先验、姿态扭曲和基线运动编辑器注入,实现视频中主角运动与位置的同步编辑,在定量和定性评估中表现优异。
ForEnt: 用于表征四足机器人在森林环境中被困的多模态数据集
发表机构 * University of Southampton(南安普顿大学)
AI总结 针对四足机器人在森林中因植被缠绕而倾覆的问题,提出多模态数据集ForEnt,包含RGB-D、LiDAR、本体感知和第三人称视频,记录69次被困事件,支持可重复的基准测试。
Comments 8 pages, 7 figures
阿克曼转向机器人在未映射环境中的安全局部导航
发表机构 * McMaster University(麦克马斯特大学)
AI总结 提出一种控制框架,通过局部障碍物检测确定最安全航向角,构建边界线并优化车辆-障碍物间距,实现阿克曼转向机器人在无全局目标环境中的安全局部导航。
Comments Presented at the 23rd Conference on Robots and Vision (CRV 2026)
Journal ref Proc. 23rd Conference on Robots and Vision (CRV), 2026
代码切换揭示多语言大模型中的语言锚定
发表机构 * Chung-Ang University(中央大学) ; Adobe Research(Adobe研究院)
AI总结 通过语法强制代码切换诊断多语言大模型中的语言锚定现象,提出锚定偏差度量并设计CANVAS干预方法,有效缓解代码切换导致的问答性能下降。
Comments 36 pages, 13 figures, 27 tables
CacheWeaver:面向高效接地RAG推理的缓存感知证据排序
发表机构 * Heinz College of Information Systems and Public Policy, Carnegie Mellon University(卡内基梅隆大学海因茨信息系统与公共政策学院)
AI总结 提出CacheWeaver,一种轻量级提示层方法,通过缓存感知的证据排序降低RAG推理的首令牌延迟,无需修改服务引擎或证据集。
学习何时去噪:优化潜在扩散的异步调度
发表机构 * Department of Electrical and Computer Engineering(电气与计算机工程系)
AI总结 提出学习异步调度策略,通过调度校正目标优化多表示扩散模型的去噪顺序,在ImageNet 256x256上以不到1%额外训练计算实现4倍加速,FID达1.02。
Comments 25 pages, 9 figures, 4 tables
基于RAG的聊天机器人中针对提示注入的分层安全框架
AI总结 提出三层防御框架,通过输入过滤、上下文指令层级和输出审计,将提示注入攻击成功率从71.4%降至11.3%,误报率4.8%,延迟开销61.2毫秒。
Comments Submitted in ICCK Transactions on Information Security and Cryptography
SAGE-OPD:面向多轮在策略蒸馏的选择性智能体引导干预
发表机构 * Meta AI
AI总结 提出SAGE-OPD框架,通过环境反馈和教师判断选择性干预学生响应,结合置信度加权和损失归一化,解决多轮在策略蒸馏中的错误累积问题,在ALFWorld任务中取得13.3%的相对提升。
Comments 21 pages, 3 figures
去噪隐式反馈用于冷启动推荐
发表机构 * Hong Kong Baptist University(香港浸会大学) ; Independent Researcher(独立研究员) ; Peking University(北京大学) ; Nanjing University(南京大学) ; Institute of Information Engineering, Chinese Academy of Sciences(中国科学院信息工程研究所)
AI总结 针对冷启动推荐中隐式反馈噪声问题,提出模型无关的去噪方法DIF,通过内容相似性推断伪标签并建模置信度与不确定性,在快手应用中显著提升冷启动场景商业指标。
Comments Accepted by KDD 2026 ADS Track
DF-ExpEnse: 扩散滤波探索用于高效样本微调
发表机构 * Stanford University(斯坦福大学) ; Brown University(布朗大学)
AI总结 提出DF-ExpEnse探索技术,利用生成控制策略的多模态建模能力和评论家集成,在微调中高效收集在线经验,提升样本效率。
Comments ICML 2026
PUFFERDOS:针对正则表达式拒绝服务漏洞的高效攻击字符串生成
AI总结 提出PUFFERDOS方法,通过定义三种脆弱模式并利用合成技术与组合符号执行,生成在现实长度预算内且经程序验证有效的ReDoS攻击字符串。
Comments Accepted by S&P'26
Lipschitz正则化浅层神经网络的凸训练
发表机构 * Polytechnique Montréal, GERAD & Mila, Montréal, QC, Canada(蒙特利尔理工学院,GERAD & Mila,加拿大魁北克省蒙特利尔市)
AI总结 提出一种凸限制方法求解非凸Lipschitz正则化训练问题,可全局最优求解,并作为预训练网络的后处理步骤,提升对抗鲁棒性和准确性。
BrainG3N:用于可控3D脑MRI生成的双用途分词器
发表机构 * Department of Biomedical Data Science, Stanford University School of Medicine(斯坦福大学医学院生物医学数据科学系) ; Department of Mathematical Modelling, Statistics & Bioinformatics, Ghent University(根特大学数学建模、统计与生物信息学系) ; Department of Electrical Engineering, Stanford University(斯坦福大学电气工程系)
AI总结 提出基于3D掩码自编码器的分词器,解耦编码器与解码器,在23项线性探测任务中21项超越SOTA,并支持条件生成和纵向预测。
从5万到820万在24小时内:Vozinha的算法封圣与世界杯可见性的多语言构建
发表机构 * Universidad Anáhuac México(墨西哥阿纳瓦克大学)
AI总结 通过多语言语料库和九框架叙事分类法,分析2026年世界杯后Vozinha的算法封圣过程,揭示不同语言承载不同叙事框架,将平台粉丝数作为语言对象研究可见性构建。
Comments 11 pages, 4 figures, 3 tables; v0.1 pilot preprint. Dataset and evidence package available at https://doi.org/10.5281/zenodo.20722235
SAFE-Cascade: 面向图表问答的成本自适应视觉语言路由
发表机构 * University of Arkansas(亚拉巴马大学)
AI总结 提出SAFE-Cascade系统,通过OCR和轻量语言模型先给出答案,再由学习路由器决定是否调用VLM,在ChartQA上以73.1%的VLM调用率达到69.1%准确率,减少26.9%的VLM调用和9.3%的成本。
Comments Demo paper submitted at CIKM 2026. 4 pages, 2 figures
提示质量与拉取请求结果:基于阶段的LLM辅助开发实证研究
AI总结 通过分析265个开发者与ChatGPT的交互,研究提示结构(上下文、具体性、验证)对LLM辅助开发中代码生成、采纳和集成深度的影响,发现不同维度在不同阶段有不同作用。
Comments 48 pages, 2 figures
扩展端到端驾驶的自我对弈
发表机构 * Mila(米拉研究所) ; Université de Montréal(蒙特利尔大学) ; Polytechnique Montréal(蒙特利尔理工学院) ; Torc Robotics ; NYU Tandon School of Engineering(纽约大学坦登工程学院) ; McMaster University(麦克马斯特大学) ; Princeton University(普林斯顿大学)
AI总结 提出大规模自我对弈训练策略,通过高效模拟器Gigapixel实现像素级自我对弈,结合DAgger蒸馏和感知适应,提升端到端驾驶模型性能。
创建多语言心理健康对话数据集:基于国籍和语言的人物角色本地化方法的局限性
发表机构 * Pennsylvania State University(宾夕法尼亚州立大学)
AI总结 研究通过修改人物角色中的国籍和语言参数生成中文、孟加拉语和印地语临床对话,发现仅添加这些参数会导致跨语言临床不一致,且LLM评估非英语文本的抑郁严重度时存在不准确性。
Comments 15 pages, 4 figures. Accepted to the 2026 Workshop on Computational Linguistics and Clinical Psychology (CLPsych 2026), co-located with ACL 2026
MiqraBERT:基于回归的Sentence-BERT微调用于圣经希伯来语平行检测
AI总结 提出MiqraBERT模型,通过余弦相似度回归微调Sentence-BERT,在圣经希伯来语中检测文本平行,将分布分离度提升2.7倍,重叠区域从24%降至6%。
标签之前:数据集构建如何塑造临床文本中的自杀检测
发表机构 * University of Washington(华盛顿大学)
AI总结 通过ScAN数据集案例研究,揭示EHR自杀数据集编码特定操作化定义,受数据作者、事件边界和歧义处理影响,并展示相同标签涵盖异质性临床框架。
Comments To appear in the Proceedings of the 11th Workshop on Computational Linguistics and Clinical Psychology (CLPsych 2026)
困难还是未触及?诊断数学推理难度估计中的采样盲点
发表机构 * Sapienza University of Rome(罗马大学)
AI总结 发现pass@k在数学推理难度估计中存在盲点,通过激活嫁接的确定性采样可恢复10.3-22.9%的零解样本,揭示结构可识别性。
Comments 9 pages of main paper, 4 figures and 5 tables in the main paper, with more in the appendix
Token Factory:高效整合多样化信号于大型推荐模型
AI总结 提出Token Factory框架,将传统信号转化为软令牌,高效集成到基于Transformer的大型推荐模型中,避免提示长度爆炸并提升性能。
Comments 8 pages, 10 figures
CTS-MoE: 基于混合专家模型的隐式地形适应感知运动
发表机构 * University of Illinois Urbana-Champaign(伊利诺伊大学厄巴纳-香槟分校) ; University of São Paulo(圣保罗大学)
AI总结 针对非连续地形上的感知运动问题,提出CTS-MoE方法,通过密集混合专家策略与感知门控组合共享行为,并用多批评家防止价值干扰,实现端到端训练和隐式地形适应,在仿真和硬件上优于基线。
通过决策树蒸馏对学习到的多智能体通信策略进行形式化验证
发表机构 * University of Arkansas at Little Rock(阿肯色大学小石城分校)
AI总结 提出通过决策树蒸馏将多智能体强化学习策略转化为可解释模型,并利用PRISM进行形式化验证,确保安全属性转移至原始网络,在无人机编队任务中实现88.9%属性满足率。
Comments 9 pages, 3 figures, 7 tables. Accepted at the 2026 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS 2026), Pittsburgh, Pennsylvania, USA, September 27-October 1, 2026
AI4SE 与 SE4AI 探索:回顾与展望的十年
发表机构 * Colorado State University(科罗拉多州立大学)
AI总结 本文回顾了人工智能与系统工程在三个阶段的进展,通过人机一致性文献综述识别出五个关键研究空白,并提供了AI采纳、保障和劳动力转型的指导。
Comments 10 pages, 5 figure
RIVET: 鲁棒的幂等语音属性编辑
发表机构 * Carnegie Mellon University(卡内基梅隆大学)
AI总结 提出RIVET训练框架,通过幂等性正则化提升语音属性编辑模型对标签噪声的鲁棒性,在合成噪声和真实噪声数据集上均优于标准训练。
VCG:极端冷启动条件下电商视频流的多模态检索框架
发表机构 * Zalando Switzerland AG(Zalando瑞士有限公司) ; TU Wien(维也纳技术大学) ; Zalando SE(Zalando德国分公司)
AI总结 针对电商视频流中的极端冷启动和偏差问题,提出基于领域自适应视觉-语言模型(CLIP)的可扩展多模态检索系统VCG,实现零样本检索,在线测试显示深度视频完成率提升50%。
Toten:基于知识本体的巴西葡萄牙语物理量和技术符号分词
发表机构 * Aia Context ; Universidade Federal do Maranhão(马拉尼昂联邦大学) ; Universidade de São Paulo(圣保罗大学)
AI总结 提出TOTEN框架,利用工程实体本体对物理量和技术符号进行声明式分类,替代统计分词,在巴西葡萄牙语语料上实现高原子性分词和数值重建。
社会推理从何而来?语言模型中的能力来源
发表机构 * Georgia Institute of Technology, College of Computing(佐治亚理工学院计算学院) ; MATS Program(MATS项目) ; EleutherAI ; KAIST AI(韩国科学技术院人工智能学院) ; Georgia Tech AI Safety Initiative(佐治亚理工学院人工智能安全倡议)
AI总结 通过训练数据归因方法,发现OLMo3-7B中社会推理和STEM推理依赖于不同的预训练语料区域,且推理层面的差异比知识层面更显著。
Comments Under review at COLM 2026 (Conference)