COLSON: Controllable Learning-Based Social Navigation via Diffusion-Based Reinforcement Learning
COLSON: 通过基于扩散的强化学习实现可控的社会导航
AI总结 本文提出了一种基于扩散的强化学习方法,用于社会导航,通过灵活的动作分布提高了导航的适应性和可控性,同时能够适应未见过的场景。
Comments ICRA 2026
COLSON: 通过基于扩散的强化学习实现可控的社会导航
AI总结 本文提出了一种基于扩散的强化学习方法,用于社会导航,通过灵活的动作分布提高了导航的适应性和可控性,同时能够适应未见过的场景。
Comments ICRA 2026
SEDD: 一种基于GPU的可扩展且高效的去重数据集处理方法
AI总结 本文提出SEDD,一种基于GPU的高效去重框架,通过引入计算高效且部分可重用的哈希函数、高度优化的GPU内核和硬件感知的自动参数选择机制,显著减少了通信瓶颈,提升了去重效率,同时保持了高去重精度。
Comments 13 pages, 7 figures
AdaSwitch: 一种在小型和大型代理之间自适应切换以实现有效的云-本地协作学习方法
AI总结 本文提出了一种新的LLM使用范式,通过自适应机制在云端和本地部署的LLM之间切换,以提高任务完成性能和效率,通过本地代理处理简单推理步骤,云代理处理复杂推理步骤,实验表明该方法在多个基准测试中有效提升了本地代理的性能。
Comments EMNLP 2024 Main Conference
MLAAD:多语言音频防伪数据集
AI总结 本文提出多语言音频防伪数据集(MLAAD)版本10,包含175个文本到语音(TTS)模型,总计1002.9小时的合成语音,涵盖54种语言,用于训练和评估音频深度伪造检测模型,并展示了其在多个数据集上的优越性能。
Comments IJCNN 2024
监督学习问题的腐败:类型与缓解方法
AI总结 本文提出了一种通用的腐败理论,通过马尔可夫核分析底层概率分布的变化,统一了不同类型的腐败模型,并探讨了针对各种腐败类型的缓解方法。
Comments 73 pages. To be published in Journal of Machine Learning Research 27 (2026) 1-73
噪声中的低语:通过多智能体框架引导的代理觉醒
AI总结 本文研究了在黑盒约束下如何通过多智能体框架从预训练模型中恢复被擦除的概念,提出了一种无需训练的代理方法,通过引导噪声状态来实现可控的觉醒,展示了当前概念擦除方法的局限性。
信贷风险预测的基础模型:变革性突破?
AI总结 本文研究了信贷风险预测中基础模型的应用,探讨了其在小数据环境下提升预测性能的能力,并通过对比多种方法验证了基础模型在PD和LGD建模任务中的优越性。
基于证据的前沿映射与代理假设生成在纳米医学中
AI总结 该研究提出了一种结合文章嵌入、相似性图分析、稀疏前沿提取、结构化证据包检索和审计过的大型语言模型(LLM)工作流的系统pArticleMap,用于支持纳米医学研究方向的选择和假设生成,通过生成和评分基于引用的假设,实现了证据导向的研究辅助。
生成式AI与生产力差距:教育中的人类-人工智能互补性
AI总结 本研究探讨了生成式AI对不同用户生产力影响的异质性,发现AI交互能力(AIC)是决定AI使用效果的关键因素,通过概念图干预可减少不平等,强调需结合AIC微培训和标准流程以实现持续价值捕获。
谁生成了这个3D资产?学习生成3D模型的来源归属
AI总结 该研究提出了一种方法,用于确定给定3D资产是由哪种生成模型创建的,通过构建首个被动来源归属基准,发现生成3D模型留下稳定的指纹特征,从而建立了可信的3D内容来源的新标准。
Rad-VLSM:一种结合语义辅助提示的跨模态框架用于医学分割与诊断
AI总结 本文提出Rad-VLSM框架,通过语义引导的提示机制,提升医学图像分割与诊断的准确性,解决现有模型易受背景组织和无关视觉相关性干扰的问题。
POST: 基于先验观察的时空关联对抗学习用于多变量时间序列异常检测
AI总结 本文提出了一种新的框架,通过联合先验观察对抗学习方法统一时空建模,以解决多变量时间序列异常检测中的空间过泛化问题,并在公开数据集和自建基准上展示了在时间检测和空间定位任务上的新状态。
WinTok: 一种通过分解视觉理解和生成来实现双赢的混合分词器
AI总结 本文提出WinTok,一种通过分解视觉理解和生成任务来实现双赢的混合分词器,通过引入可迁移的语义分词来减少跨任务干扰,从而在多个基准测试中提升了重建、理解和生成性能。
LLMs在回答孟加拉语医学视觉问题方面的表现如何?数据集与基准测试
AI总结 本文提出BanglaMedVQA数据集,用于评估当前基础模型在孟加拉语医学视觉问答任务中的表现,发现其性能显著低于英语基准,揭示了低资源语言在医学推理中的挑战。
Comments 14 pages, 7 figures, 5 tables, Proceedings of The Second AAAI Bridge Program on AI for Medicine and Healthcare, PMLR 317:1-14, 2026
TaskGround:全场景家庭推理的结构化可执行任务推断
AI总结 本文提出TaskGround框架,通过结构化任务推断提升全场景家庭推理能力,其核心贡献是引入FullHome评估套件,验证了在家庭场景中执行任务结构推断的重要性,并展示了紧凑本地模型在实际家庭部署中的有效性。
Comments Project page: https://aaronfengzy.github.io/TaskGround/
轰鸣声击中新闻摊位:对全球山体滑坡相关新闻报道和空间偏见的数据分析
AI总结 本文通过分析25年间近6万篇关于5500起山体滑坡事件的新闻文章,探讨德国报纸对全球山体滑坡的报道方式,揭示南欧和西欧地区报道过度的现象,为研究媒体对国际灾害关注的不平等提供参考。
Comments Work in progress
多模态大语言模型中的安全几何坍缩与自适应漂移修正
AI总结 本文研究了多模态大语言模型在跨模态安全转移中的不足,提出安全几何坍缩现象,并通过自适应漂移修正方法提升模型安全性。
SENSE: 基于卫星的能源合成以实现可持续环境
AI总结 本文提出SENSE,一种统一的生成性城市建筑能耗框架,通过结合生成扩散模型和大规模视觉模型知识,生成高分辨率的城市卫星图像和对齐的高质量建筑能耗和高度地图,以提高城市可持续发展预测性能。
Comments Accpted by KDD 2026 (Oral)
学习解决组合几何路由问题
AI总结 本文研究了组合几何路由问题(CGRP),这是一种涵盖点、线、面及任意混合任务几何的统一超类,为现实中的路由场景提供广泛抽象。为解决非点任务带来的不对称性和复杂性,作者提出DiCon框架,通过对比学习和差异注意力机制提升表示学习和决策能力。
Comments 27 pages, 10 figures
多语言大语言模型的高效路径:通过后训练PARAM$Δ$整合到再利用MoE进行语言扩展
AI总结 本文提出了一种高效的方法,通过将密集模型转换为MoE架构,并将不同语言分配给不同专家,从而在不进行复杂对齐阶段的情况下提升多语言大语言模型的性能,同时保留原始能力。
pyforce-1.0.0: 用于多物理问题数据驱动模型降阶的Python框架
AI总结 本文提出pyforce-1.0.0框架,采用数据驱动降阶建模技术用于多物理问题,主要应用于核工程领域,改进了传感器位置优化和实测数据整合,提升了物理系统认知。
Comments Github Repo: https://github.com/ERMETE-Lab/ROSE-pyforce
低精度softmax变换器的表达能力(摘要)链式思维
AI总结 本文研究了低精度softmax变换器在链式思维中的表达能力,通过构造三元激活和分离注意力分数的硬max变换器来模拟图灵机,从而将构造转换为等效的softmax变换器,并分析了最近提出的总结链式思维范式在模拟图灵机时的效率。
Comments Accepted to ICML 2026
通过对手感知盆地入口进行多智能体策略梯度的均衡选择
AI总结 本文研究了多智能体策略梯度方法在局部收敛到稳定纳什均衡时的均衡选择问题,提出通过对手感知的盆地入口概率机制来提升目标均衡集的进入概率,并通过实验验证了该机制在合作盆地中的有效性。
4DLidarOpen: 一个用于运动感知自动驾驶的开放4D FMCW激光雷达数据集
AI总结 本文提出4DLidarOpen数据集,用于自动驾驶,该数据集基于4D频率调制连续波(FMCW)激光雷达传感,包含点径向速度测量、多种激光雷达、环绕摄像头和6自由度车辆姿态数据,通过混合标注策略实现大规模训练和人工精修,用于3D目标检测、鸟瞰图分割和流预测及运动预测基准测试。
Comments 15pages, 9 figures
MusicDET: 零样本AI生成音乐检测
AI总结 本文提出MusicDET框架,通过频率引导的归一化流模型在无生成样本情况下实现零样本AI生成音乐检测,有效识别非分布音乐信号。
Comments Accepted by ICML 2026
KVDrive: 一个面向长上下文LLM推理的多层级KV缓存管理系统
AI总结 本文提出KVDrive,一个面向长上下文LLM推理的多层级KV缓存管理系统,通过联合缓存放置、流水线调度和跨层级协调,实现了高吞吐量的推理,在有限的GPU预算下保持高精度。
通过缓解过压缩来改进时空残差误差传播
AI总结 本文提出Teger模块,通过空间曲率感知的图重排机制改进误差相关的自回归预测,提升时空预测的连续排名概率得分。
PPAI: 促进个性化大语言模型代理在协作边缘智能中的互操作性
AI总结 本文提出PPAI系统,通过代理专长实现用户间协作,解决动态代理池和负载平衡问题,提升任务准确性并降低延迟。
MixCount数据集:弥合开放词汇物体计数的数据缺口
AI总结 本文提出MixCount数据集,通过自动生成管道解决开放词汇物体计数中混合物体场景下的数据不足问题,展示了在真实世界基准上的显著提升。
Comments Co-first authors. Dataset and project page https://corentindumery.github.io/projects/mixcount.html
嵌入式卷积网络集合:一种轻量级的阿拉伯手写字符识别方法
AI总结 本文提出了一种轻量级嵌入式卷积网络与集成学习相结合的方法,用于实现阿拉伯手写字符识别,通过实验验证了轻量模型在准确率上的优势以及集成学习对性能的提升。
Comments Accepted in the IEEE 15th Image, Video, and Multidimensional Signal Processing Workshop 2026