Separating Semantic Competition from Context Length in RAG Reading
在RAG阅读中区分语义竞争与上下文长度
发表机构 * Meta Platforms(Meta平台)
AI总结 通过匹配对照实验,分离出检索增强生成中阅读器的语义竞争效应,证明性能下降部分源于竞争而非仅上下文长度。
Comments 4 pages, 1 figure, 2 tables
在RAG阅读中区分语义竞争与上下文长度
发表机构 * Meta Platforms(Meta平台)
AI总结 通过匹配对照实验,分离出检索增强生成中阅读器的语义竞争效应,证明性能下降部分源于竞争而非仅上下文长度。
Comments 4 pages, 1 figure, 2 tables
BASIS: 基于单次采样信息共享的批量优势估计用于LLM推理
发表机构 * University of Science and Technology of China(中国科学技术大学) ; London School of Economics and Political Science(伦敦政治经济学院) ; University of Oxford(牛津大学)
AI总结 提出BASIS算法,通过单次采样和批次内信息共享改进价值函数估计,在减少计算开销的同时提升策略优化性能。
Comments 17 pages, 7 figures
并非总是谄媚:基于认知不确定性测量LLM的从众行为
发表机构 * Vanderbilt University(范德比尔特大学) ; Vanderbilt University Medical Center(范德比尔特大学医学中心) ; Intuit AI Research(Intuit AI研究院)
AI总结 本文提出MUSE框架,通过区分谄媚从众和不确定性驱动的从众,揭示LLM在用户反驳时改变立场的行为机制,并发现两种从众均随用户感知专业性和建议合理性增强。
一种用于发现多级图像阈值计数和值的动态规划框架
发表机构 * German University in Cairo(埃及盖尔马大学)
AI总结 提出一种基于动态规划和改进最小误差阈值准则的自动多级阈值方法,能自动确定阈值数量,在速度上优于传统动态规划方法,但SSIM和PSNR略低。
高维处理变量的因果风险最小化
发表机构 * University of Toronto(多伦多大学) ; Vector Institute(向量研究所) ; Vanguard(先锋)
AI总结 针对高维处理空间(如文本)的因果推断,提出通过分解因果误差为矩平衡误差序列并优化高阶平衡目标,以及将高维处理投影到低维属性的方法,实现无需属性特定训练的因果估计。
Comments 18 pages, 4 figures
使用66种疾病的迁移学习进行疾病预测应用
发表机构 * Statistics, Los Alamos National Laboratory(统计学,洛斯阿拉莫斯国家实验室) ; Computational Intelligence & Modeling, Los Alamos National Laboratory(计算智能与建模,洛斯阿拉莫斯国家实验室)
AI总结 本研究通过迁移学习整合66种传染病及多种数据流,发现大多数情况下加入其他数据流能提升预测性能,但数据质量至关重要,并构建了公开数据库。
迷失在采样中:通过词覆盖率评估大语言模型中的词汇可达性
发表机构 * Information and Processing Telecommunications Center(信息与处理电信中心) ; Universidad Politécnica de Madrid(马德里理工大学) ; Politecnico di Milano(米兰理工大学) ; Banco de España(西班牙银行)
AI总结 提出词覆盖率(WCS)指标,量化标准采样过滤器(如Top-p、Top-k、Min-p)如何抑制低频率高信息词汇的生存率,揭示解码机制对语言多样性的影响。
Comments 15 pages, 6 figures
Kan扩展变换器:注意力、扩散和预测-分离自条件的范畴统一
发表机构 * Adobe Research(Adobe研究院) ; University of Massachusetts(马萨诸塞大学) ; Amherst(阿默斯特)
AI总结 提出Kan扩展变换器(KETs)作为多种Transformer实现的统一范畴框架,将Transformer层视为加权结构化扩展算子,并通过预测-分离机制实现有效的自条件化,实验表明预测-分离机制比改变邻域族带来更大性能提升。
Comments 30 pages
LUCoS: 表格基础模型的潜在无监督上下文选择
发表机构 * Andalusian Research Institute in Data Science and Computational Intelligence (DaSCI)(安达卢西亚数据科学与计算智能研究 institute) ; Department of Computer Science and Artificial Intelligence (DECSAI)(计算机科学与人工智能系) ; Research Center in Information and Communication Technologies (CITIC)(信息与通信技术研究中心) ; Instituto de Investigación Biosanitaria Ibs.GRANADA, University of Granada, Granada, 18071, Spain(格拉纳达大学生物医学研究所)
AI总结 针对表格基础模型在低标签场景下的上下文选择问题,提出LUCoS方法,利用无监督先验拟合网络(PFN)的潜在几何结构选择代表性medoids作为上下文,在67个数据集上优于随机选择和原始空间方法。
Comments Comments: 18 pages, 4 figures, supplementary appendices included
Gumbel机器:通过Gumbel噪声引导生成反事实学生写作
发表机构 * University of Massachusetts Amherst(马萨诸塞大学阿默斯特分校) ; University Politehnica of Bucharest(布加勒斯特理工大学) ; Arizona State University(亚利桑那州立大学)
AI总结 提出Gumbel机器,一种利用β-Hindsight控制解码算法生成既符合评分标准又与学生原文相似的反事实文本的模块化方法。
Comments preprint
通过潜在迭代细化的符号回归
发表机构 * Georgia Institute of Technology(佐治亚理工学院)
AI总结 提出潜在方程嵌入(LEE)框架,通过迭代推断在功能基础化的潜在空间中缩小符号回归的推断差距,生成更简单且准确的表达式。
Comments Preprint. 21 pages, 11 figures
检索头能看见图像吗?长上下文视觉语言模型中的多模态检索头
发表机构 * HKUST(香港科技大学) ; University of Edinburgh(爱丁堡大学) ; CUHK(香港中文大学) ; NVAITC, NVIDIA, Santa Clara, USA(NVIDIA Santa Clara 分公司) ; Tsinghua University(清华大学)
AI总结 本文提出一种多模态检索头检测方法,发现视觉语言模型中仅有4.4-10.2%的注意力头贡献了50%的正检索分数,这些头对长上下文推理至关重要,且可直接用于文档检索提升性能。
Comments Work in Progress
ENPMR-Bench: 情感支持代理的主动记忆检索基准
发表机构 * Research Center for Social Computing and Interactive Robotics(社会计算与交互机器人研究中心)
AI总结 提出ENPMR-Bench基准,基于马斯洛需求层次评估情感支持代理主动推断用户潜在情感需求并检索适当记忆的能力,实验表明当前检索范式存在显著缺陷。
时间同步性预测情感语料库中的标注质量
发表机构 * Data Science for Social Impact, University of Pretoria(社会影响力数据科学,南非普里特里亚大学) ; Instituto Politécnico Nacional(技术学院国家) ; Department of African Languages, University of Pretoria(非洲语言系,南非普里特里亚大学) ; Imperial College London(伦敦帝国理工学院)
AI总结 通过分析Setswana情感数据集,发现标注者间一致性随时间下降的主要原因是时间同步性,即同时标注的样本一致性高,而间隔较长的标注一致性低。
基于特征和深度学习模型用于TROPOMI甲烷羽流筛选的可解释比较
发表机构 * SRON Space Research Organisation Netherlands(SRON空间研究组织荷兰) ; GHGSat Inc.(GHGSat公司) ; Department of Earth Sciences, Vrije Universiteit Amsterdam(地球科学系,阿姆斯特丹自由大学)
AI总结 本研究比较了基于特征(SVC、随机森林、XGBoost)和基于图像(ResNet-18、ResNet-34)的模型在甲烷羽流-伪影分类中的性能,并通过SHAP可解释性分析为操作筛选提供指导。
MRT:用于大规模分层图像生成与编辑的掩码区域变换器
发表机构 * Canva Research(Canva研究院)
AI总结 提出MRT,一个200亿参数的掩码区域扩散模型,通过统一文本到层、图像到层和层到层任务,并引入溢出感知画布层,实现高效的多层透明图像生成与编辑。
Comments CVPR 2026
覆盖幻觉:从检索前路由失败到生产RAG系统中的检索后级联
发表机构 * Aarhus University(奥胡斯大学)
AI总结 本文通过丹麦国家百科全书的案例研究,发现合成查询高估了LLM增强的需求(覆盖幻觉),并提出一种检索后级联策略,按成本递增顺序执行工作流,仅在无结果时升级到LLM增强,从而在无需训练开销的情况下提升质量并降低延迟。
基于核方法的非线性数据整合用于数据协作分析
发表机构 * Graduate School of Science and Technology, University of Tsukuba(科学技术研究生院,茨口大学) ; Institute of Systems and Information Engineering, University of Tsukuba(系统与信息工程研究所,茨口大学)
AI总结 针对分散保密数据协作分析中线性整合方法重建风险高且无法对齐非线性变换的问题,提出非线性核整合(NKI)方法,通过核岭回归和特征值问题获得全局最优解,并引入图正则化和中心化约束以捕获几何和目标变量信息,在图像分类任务中提升了准确率并降低了重建风险。
Comments 50 pages, 7 figures
在噪声中学习行动:通过噪声环境增强智能体鲁棒性
发表机构 * National University of Singapore(国立新加坡大学) ; Meituan(美团) ; Tsinghua University(清华大学) ; Tianjin University(天津大学) ; University of Science and Technology of China(中国科学技术大学)
AI总结 提出NoisyAgent框架,通过在训练中引入用户噪声和工具噪声,提升智能体在真实世界噪声环境下的鲁棒性和泛化能力。
GraphReview: 基于LLM的图消息传递的科学论文评估
发表机构 * School of Economics and Management, East China Normal University(东华师范大学经济管理学院) ; Institute of Big Data, Fudan University(复旦大学大数据研究院)
AI总结 提出GraphReview框架,通过图消息传递整合论文内在质量、同期关联和历时关联,利用LLM生成节点先验和边比较证据,结合个性化PageRank进行质量排序、决策预测和审稿生成,在决策和排序指标上平均提升29.7%。
生成式动画:面向提示驱动运动合成的多模型流水线
发表机构 * Canva ; Adobe
AI总结 提出一种结合大语言模型和分割模型的流水线,将自然语言提示自动转换为符合场景几何、深度遮挡和3D透视变换的动画运动路径。
Comments 5 pages, 6 figures
EpiCurveBench: 评估视觉语言模型在流行病曲线数字化中的表现
发表机构 * Computational Health Informatics Program(计算健康信息学项目) ; Boston Children’s Hospital & Harvard Medical School(波士顿儿童医院及哈佛医学院)
AI总结 针对现有图表数据提取基准中忽略时间序列结构的问题,提出包含1000张真实流行病曲线图像的EpiCurveBench基准和基于动态规划的EpiCurveSimilarity评估指标,实验表明最强模型仅达52.3% ECS,且ECS能更好区分模型性能。
并非所有标记都同等重要:基于关键标记监督的动态上下文向量蒸馏用于长医学报告生成
发表机构 * UNSW Sydney(新南威尔士大学悉尼分校) ; University of Technology Sydney(技术大学悉尼分校) ; School of Computer Science and Engineering, Sun Yat-sen University(中山大学计算机科学与工程学院) ; Stanford University(斯坦福大学) ; Shanghai Jiao Tong University(上海交通大学)
AI总结 提出DIVE框架,通过关键标记监督和状态条件动态引导,解决长文本生成中标记级蒸馏忽略关键标记的问题,在医学报告生成任务上取得最佳性能。
Comments Preprint. 20 pages, 6 figures
在大音频语言模型中学习何时在聆听时思考
发表机构 * University of Pennsylvania(宾夕法尼亚大学)
AI总结 提出一种可学习的等待-思考-回答控制机制,通过多奖励强化学习优化大音频语言模型在流式语音交互中的推理时机,在提升准确率的同时减少响应延迟。
Comments 19 pages, 4 figures, 6 tables
超越二元:认知评分层级中的语音表征
发表机构 * 1 Hertie Institute for AI in Brain Health, University of Tübingen, Tübingen, Germany 2 Tübingen AI Center, University of Tübingen, Tübingen, Germany 3 Department of Psychology, Humboldt-Universität zu Berlin 4 Geriatric Center, Tübingen University Hospital, Tübingen, Germany 5 Tübingen Center for Mental Health (TüCMH), Department of Psychiatry ; Psychotherapy, Tübingen University Hospital, Tübingen, Germany 6 German Center for Mental Health (DZPG), Partner Site Tübingen, Tübingen, Germany 7 Department of Neurology, University Medical Center Schleswig-Holstein ; Kiel University, Kiel, Germany 8 Center for Neurology, University Hospital Tübingen ; Hertie Institute for Clinical Brain Research, Tübingen, Germany 9 Pattern Recognition Lab, Friedrich-Alexander-Universität Erlangen-Nürnberg, Erlangen, Germany 10 Charit\'e--Universit\"atsmedizin, Department of Psychiatry
AI总结 本研究利用5,754份德语神经心理学评估录音,比较手工声学特征与自监督学习嵌入在轻度认知障碍认知评估层级(任务、领域、全局)中的表现,发现任务约束与评估层级之间的关联。
MAIGO: 通过历史清理的在线策略自蒸馏缓解对话丢失
发表机构 * Zhejiang University(浙江大学) ; Shanghai AI Laboratory(上海人工智能实验室) ; Huazhong University of Science and Technology(华中科技大学) ; Fuzhou University(福州大学) ; Tencent(腾讯)
AI总结 针对大语言模型在多轮对话中性能下降(对话丢失)的问题,提出MAIGO方法,通过在线策略自蒸馏和清理历史助手回复来减少自污染,无需验证器或推理时辅助,显著提升多轮对话准确性。
FoundObj: 自监督基础模型作为无标签3D物体分割的奖励
发表机构 * Shenzhen Research Institute, The Hong Kong Polytechnic University(深圳研究院,香港理工大学) ; vLAR Group, The Hong Kong Polytechnic University(vLAR小组,香港理工大学)
AI总结 提出FoundObj框架,利用自监督2D/3D基础模型的语义和几何先验作为奖励,通过强化学习引导超点合并,实现无标注复杂场景3D物体分割。
Comments ICML 2026. Zihui and Zhixuan are co-first authors. Code and data are available at: https://github.com/vLAR-group/FoundObj
AI在声音设计师工作流程与体验中的整合研究
发表机构 * Queen Mary University of London(伦敦大学玛丽女王学院)
AI总结 通过混合方法研究(76人调查+20人访谈),发现当前AI工具在快速消费媒体中表现良好,但缺乏高端声音设计所需的叙事复杂性,从业者偏好辅助性、任务特定的应用,而非端到端生成系统。
将文本嵌入与利益相关者关联对齐
发表机构 * University of Oxford(牛津大学) ; Institute for Wicked Problems(复杂问题研究所) ; The Chinese University of Hong Kong(香港中文大学) ; Danish Technical University(丹麦技术大学) ; Aarhus University(奥胡斯大学)
AI总结 提出利益相关者对齐练习方法,通过评估嵌入模型与人类专家的语义距离一致性,发现神经文本嵌入在丹麦政策案例中可靠性显著低于专家(差距19-26个百分点),且该差距在美国联邦AI用例中复现(16个百分点)。
TCBiRRT:紧耦合双臂空间机械臂的任务空间随机扩展快速运动规划
发表机构 * Harbin Institute of Technology(哈尔滨工业大学)
AI总结 针对紧耦合双臂空间机械臂在闭链约束下的运动规划问题,提出一种任务空间约束的双向快速随机扩展树算法(TCBiRRT),通过在任务空间直接采样和节点扩展,结合路径逆运动学映射和重抓取机制,显著提高规划成功率和速度。
Comments 12 pages, 9 figures