arXivDaily arXiv每日学术速递 周一至周五更新

AI 大模型

RAG / 检索增强生成

检索增强生成、向量检索、知识库问答和面向大模型的搜索系统。

今日/当前日期收录 29 信号源:cs.IR, cs.CL, cs.AI, cs.DB

1. 检索器 16 篇

2606.18508 2026-06-18 cs.CL cs.IR 新提交 专题 95

MCompassRAG: Topic Metadata as a Semantic Compass for Paragraph-Level Retrieval

MCompassRAG:主题元数据作为段落级检索的语义指南针

Amirhossein Abaskohi, Raymond Li, Gaetano Cimino, Peter West, Giuseppe Carenini, Issam H. Laradji

专题命中 检索器 :提出主题元数据增强段落检索的RAG框架

AI总结 提出MCompassRAG框架,通过主题元数据增强段落表示,利用LLM蒸馏训练轻量检索器,实现主题感知检索,在六个基准上平均信息效率提升8.24%,延迟降低5倍以上。

2605.29517 2026-06-18 cs.IR 版本更新 专题 95

FLASH-MAXSIM: IO-Aware Fused Kernels for Late-Interaction Retrieval

FLASH-MAXSIM: 面向IO感知的融合内核用于晚期交互评分

Roi Pony, Daniel Ezer, Adi Raz Goldfarb, Idan Friedman, Oshri Naparstek, Udi Barzelay

专题命中 检索器 :提出Flash-MaxSim内核加速晚期交互检索,核心是检索器优化。

AI总结 提出Flash-MaxSim,一种IO感知的融合GPU内核,通过流式分块和片上SRAM折叠行最大规约,避免物化完整相似度张量,显著降低内存占用并加速晚期交互检索(如ColBERT、ColPali)的MaxSim评分。

2606.18781 2026-06-18 cs.CL 新提交 专题 90

Lost in a Single Vector: Improving Long-Document Retrieval with Chunk Evidence Aggregation

迷失在单一向量中:通过分块证据聚合改进长文档检索

Shanshan Lyu, Yiwei Wang, Yujun Cai, Jiafeng Guo, Shenghua Liu

专题命中 检索器 :改进长文档检索,提出分块证据聚合策略。

AI总结 针对长文档检索中单向量编码削弱关键片段证据的问题,提出无训练的分块证据聚合策略DICE,通过独立编码分块并聚合为单一向量,在保持标准接口的同时显著提升检索性能。

Comments Code is available at https://github.com/PunchlineAAAA/DICE

2606.01697 2026-06-18 cs.CL 版本更新 专题 90

RCEM: Robust Conversational Search EMbedder in Distributional Shift

RCEM:配备查询重写技能的嵌入器,用于分布偏移下的鲁棒对话搜索

Kilho Son, Paul Hsu, Cha Zhang, Dinei Florencio

专题命中 检索器 :对话搜索嵌入器,结合LLM查询重写与检索

AI总结 提出RCEM模型,通过将LLM的查询重写能力蒸馏到嵌入模型中,实现无需显式重写的上下文感知检索,在分布偏移下提升鲁棒性。

2606.19037 2026-06-18 cs.IR 新提交 专题 85

Querit-Reranker: Training Compact Multilingual Rerankers via Efficient Label-Free Distribution Adaptation

Querit-Reranker: 通过高效无标签分布适应训练紧凑型多语言重排序器

Yunfei Zhong, Jun Yang, Wei Huang, Yinqiong Cai, Haosheng Qian, Yixing Fan, Ruqing Zhang, Lixin Su, Daiting Shi, Jiafeng Guo

专题命中 检索器 :多语言重排序器,用于检索增强。

AI总结 提出Querit-Reranker系列多语言交叉编码器重排序模型,采用数据驱动的无标签适应管道,通过合成查询挖掘和教师软标签进行分布适应,并利用球面线性插值合并检查点,在BEIR和MIRACL上显著提升nDCG@10,在MTEB多语言重排序上达到最优性能。

2606.18947 2026-06-18 cs.AI cs.CL cs.IR cs.MA 新提交 专题 85

Decoupling Search from Reasoning: A Vendor-Agnostic Grounding Architecture for LLM Agents

将搜索与推理解耦:面向LLM Agent的供应商无关的接地架构

Emmanuel Aboah Boateng, Kyle MacDonald, Amardeep Kumar, Siddharth Kodwani, Sudeep Das

专题命中 检索器 :实现搜索接地与推理解耦,优化检索增强生成

AI总结 提出解耦搜索接地(DSG)架构,将搜索接地从推理模型中分离,通过MCP兼容网关实现供应商路由、缓存等控制,在降低成本和延迟的同时保持或提升准确性。

Comments 15 pages, Figure 8

2606.18811 2026-06-18 cs.IR cs.AI 新提交 专题 85

Rescaling MLM-Head for Neural Sparse Retrieval

重新缩放MLM头部用于神经稀疏检索

Youngjoon Jang, Seongtae Hong, Jonah Turner, Heuiseok Lim

专题命中 检索器 :改进SPLADE神经稀疏检索,属于检索器

AI总结 针对SPLADE中MLM头部尺度不匹配导致训练不稳定和性能下降的问题,提出初始化时对MLM头部投影进行常数因子重缩放,零成本提升训练稳定性,使大范数骨干网络成为有竞争力的稀疏检索器。

2606.18406 2026-06-18 cs.CL 新提交 专题 85

CoreMem: Riemannian Retrieval and Fisher-Guided Distillation for Long-Term Memory in Dialogue Agents

CoreMem: 对话代理中长期记忆的黎曼检索与Fisher引导蒸馏

Jiaqi Chen, Yongqin Zeng, Shaoshen Chen, Yijian Zhang, Hai-Tao Zheng, Chunxia Ma, XiuTeng Zhou

专题命中 检索器 :提出黎曼检索方法用于对话长期记忆

AI总结 提出CoreMem架构,用黎曼检索替代余弦相似度解决高维检索枢纽问题,通过Fisher引导离散令牌蒸馏实现原则性压缩,在8GB显存边缘设备上实现长期记忆对话代理。

Comments 15 pages, 5 figures

2606.18310 2026-06-18 cs.CR cs.AI 新提交 专题 85

Conflict-Aware Retriever Editing for Knowledge Injection Attacks on LLM-Based RAG Systems

冲突感知检索器编辑:针对基于LLM的RAG系统的知识注入攻击

Xinru Liu, Xianglong Zhang, Di Cai, Zhumin Chen, Pengfei Hu, Xin Xin

专题命中 检索器 :提出冲突感知检索器编辑攻击,注入恶意知识到RAG。

AI总结 提出冲突感知检索器编辑框架CAREATTACK,通过模型中心攻击将恶意知识注入RAG系统,利用图检测和参数编辑投影解决冲突,并轻量校准保持攻击效果。

2606.15345 2026-06-18 cs.CL cs.IR 新提交 专题 85

Beyond Monolingual Deep Research: Evaluating Agents and Retrievers with Cross-Lingual BrowseComp-Plus

超越单语言深度研究:用跨语言 BrowseComp-Plus 评估智能体和检索器

Yuheng Lu, Qingcheng Zeng, Heli Qi, Puxuan Yu, Fuheng Zhao, Rui Yang, Hitomi Yanaka, Naoto Yokoya, Weihao Xuan

专题命中 检索器 :评估跨语言检索和智能体性能

AI总结 提出跨语言基准 XBCP,评估深度研究智能体在证据语言与查询不同时的表现,发现检索和智能体端均存在显著性能下降。

Comments Preprint

2606.18801 2026-06-18 cs.IR cs.AI 新提交 专题 80

SHIFT: Semantic Harmonization via Index-side Feature Transformation for Multilingual Information Retrieval

SHIFT: 通过索引侧特征变换实现多语言信息检索的语义对齐

Youngjoon Jang, Seongtae Hong, Hyeonseok Moon, Heuiseok Lim

专题命中 检索器 :多语言密集检索,缓解语言偏差

AI总结 提出SHIFT方法,在索引阶段通过平行翻译对估计相对语言向量并修正文档嵌入,以缓解多语言密集检索中的语言偏差,无需训练即可提升检索性能。

2606.12837 2026-06-18 cs.CL 新提交 专题 75

LoHoSearch: Benchmarking Long-Horizon Search Agents Beyond the Human Difficulty Ceiling

LoHoSearch: 超越人类难度上限的长时域搜索代理基准测试

Jiarui Zhao, Rongzhi Zhang, Lingchuan Liu, Hao Yang, Xunliang Cai, Xi Su

专题命中 检索器 :基于知识图谱构建复杂搜索问题

AI总结 提出LoHoSearch基准,基于700万维基实体知识图谱自动构建544个复杂问题,评估显示最强模型仅34.74%准确率,远超人类难度上限。

2606.18814 2026-06-18 cs.IR 新提交 专题 70

LensKit-Auto

LensKit-Auto的改进与增强

Max Breit, Anass Amezian El Idrissi, Rishikesh Giriraj Kulkarni, Luca Quade

专题命中 检索器 :自动推荐系统框架,与检索相关但非RAG核心

AI总结 本文改进了LensKit-Auto框架,使其能自动寻找适合数据集的推荐算法和超参数组合,增强了易用性和可视化功能,并适配了最新版本的LensKit框架。

2606.18878 2026-06-18 cs.DS cs.DB cs.FL 新提交 专题 60

Tractable Gap-Constraint Languages for Complex Event Recognition

复杂事件识别的可处理间隙约束语言

Antoine Amarilli, Florin Manea, Tina Ringleb, Markus L. Schmid

专题命中 检索器 :研究子序列匹配与间隙约束,与复杂事件识别相关,但非核心RAG内容。

AI总结 研究带间隙约束的子序列匹配问题,提出左凸语言类,可在O(|D|(|u|+|C|))时间内求解,并用于复杂事件识别中的高效枚举。

Comments 50 pages

2606.18530 2026-06-18 cs.CR cs.CL cs.LG 新提交 专题 60

Evaluating Prompting-Based Defenses Against Domain-Camouflaged Injection Attacks

评估基于提示的防御策略对抗领域伪装注入攻击

Aaditya Pai

专题命中 检索器 :防御检索内容中的注入

AI总结 针对领域伪装注入攻击,评估五种基于提示的防御方法(如释义、重点标记等)在三个模型家族和三个部署领域中的有效性,发现释义法最有效,可将伪装攻击成功率降低55-84%。

Comments 9 pages, 4 figures, 4 tables; under review at the AdvML-Frontiers x CoTMA workshop, COLM 2026

2601.08554 2026-06-18 cs.SI cs.DB cs.GR 版本更新 专题 60

Maintaining Leiden Communities in Large Dynamic Graphs

维护大规模动态图中的 Leiden 社区

Chunxu Lin, Yumao Xie, Yixiang Fang, Yongmin Hu, Yingqian Hu, Cheng Chen

专题命中 检索器 :社区检测用于RAG的层次索引,但非核心

AI总结 针对现有动态 Leiden 算法在频繁更新下效率低的问题,提出 HIT-Leiden 算法,通过维护连通分量和层次社区结构减少受影响顶点范围,实现高达五个数量级的加速。

2. 知识库问答 9 篇

2506.20869 2026-06-18 cs.SE cs.AI cs.IR 专题 95

Engineering RAG Systems for Real-World Applications: Design, Development, and Evaluation

为现实应用工程化RAG系统:设计、开发与评估

Md Toufique Hasan, Muhammad Waseem, Kai-Kristian Kemell, Ayman Asad Khan, Mika Saari, Pekka Abrahamsson

专题命中 知识库问答 :五个领域特定RAG系统的工程化实践

AI总结 本文介绍了五个领域特定的RAG应用,涵盖治理、网络安全、农业、工业研究和医疗诊断,通过多语言OCR、语义向量检索和领域适应LLM,评估六个维度并总结十二项关键经验教训。

Comments Published in the Proceedings of the 51st Euromicro Conference on Software Engineering and Advanced Applications, SEAA 2025. Lecture Notes in Computer Science, volume 16082, pages 143-158. Springer, 2026

Journal ref LNCS 16082, 143-158, 2026

2602.06495 2026-06-18 cs.CR 版本更新 专题 85

Graphs Don't Stay Secret: Practical Subgraph Reconstruction Attacks on Defended Graph RAG

图并非保密:对防御图RAG的实用子图重构攻击

Minkyoo Song, Jaehan Kim, Myungchul Kang, Hanna Kim, Seungwon Shin, Sooel Son

专题命中 知识库问答 :图RAG子图重构攻击

AI总结 提出GRASP攻击,通过多轮查询从防御的图RAG系统中重构子图,达到82.9 F1,并评估防御措施。

2602.20135 2026-06-18 cs.CL cs.AI cs.IR 专题 80

KNIGHT: Knowledge Graph-Driven Multiple-Choice Question Generation with Adaptive Hardness Calibration

KNIGHT: 基于知识图谱的多选题生成与自适应难度校准

Mohammad Amanlou, Erfan Shafiee Moghaddam, Yasaman Amou Jafari, Mahdi Noori, Farhan Farsi, Behnam Bahrak

专题命中 知识库问答 :基于知识图谱生成多选题用于RAG评估

AI总结 KNIGHT通过构建领域特定知识图谱,实现高效生成多选题数据集,支持自适应难度控制,提升生成效率与质量,验证了其在多个领域内的有效性。

Comments Accepted at the Third Conference on Parsimony and Learning (CPAL 2026). 36 pages, 12 figures. (Equal contribution: Yasaman Amou Jafari and Mahdi Noori.)

Journal ref Conference on Parsimony and Learning, Proceedings of Machine Learning Research, 328:989-1024, 2026

2606.18385 2026-06-18 cs.AI 新提交 专题 70

CaVe-VLM-CoT: An Interpretable Vision-Language Model Framework

CaVe-VLM-CoT:一种可解释的视觉-语言模型框架

Sneha Rao, Shaina Raza, Dhanesh Ramachandram

专题命中 知识库问答 :采用检索增强生成实现证据推理

AI总结 提出CaVe-VLM-CoT框架,通过五阶段闭环流水线(提取器、检索器、求解器、引用注入器、验证器)实现证据推理,并引入CaVeScore复合指标评估检索质量、引用忠实度和跨模态基础,在ScienceQA和MMMU上取得性能提升。

2604.06967 2026-06-18 cs.CR cs.DB 版本更新 专题 70

VulLink: A Dynamic Open-Access Vulnerability Graph Database for Cybersecurity Data Mining

VulLink: 用于网络安全数据挖掘的动态开放访问漏洞图数据库

Luat Do, Jiao Yin, Jinli Cao, Hua Wang

专题命中 知识库问答 :漏洞图数据库,可视为知识库,与RAG弱相关

AI总结 提出VulLink,一种通过自动化ETL管道集成多源漏洞数据、提供图数据库、Web接口和API的动态开放平台,支持漏洞利用性预测等下游挖掘任务。

2603.29247 2026-06-18 cs.CL cs.AI cs.LG 版本更新 专题 70

MemRerank: Preference Memory for Personalized Product Reranking

MemRerank:用于个性化产品重排序的偏好记忆

Zhiyuan Peng, Xuyang Wu, Huaixiao Tou, Yi Fang, Yu Gong

专题命中 知识库问答 :偏好记忆用于LLM购物代理重排序,含检索

AI总结 提出MemRerank框架,通过强化学习将用户购买历史提炼为查询无关的偏好记忆,用于LLM购物代理的个性化重排序,在1-in-5选择任务中准确率提升高达10.61个百分点。

Comments correct author name in metadata

2603.00026 2026-06-18 cs.CL cs.AI cs.IR 版本更新 专题 70

ActMem: Bridging the Gap Between Memory Retrieval and Reasoning in LLM Agents

ActMem:弥合LLM代理中记忆检索与推理之间的差距

Xiaohui Zhang, Zequn Sun, Chengyuan Yang, Yaqin Jin, Yazhong Zhang, Wei Hu

专题命中 知识库问答 :记忆管理涉及检索,但侧重推理

AI总结 提出ActMem框架,通过将非结构化对话历史转化为结构化因果语义图,结合反事实推理和常识补全,实现主动因果推理,显著提升LLM代理在复杂记忆依赖任务中的表现。

2606.18850 2026-06-18 cs.CL cs.IR 新提交 专题 60

ScholarSum: Student-Teacher Abstractive Summarization via Knowledge Graph Reasoning and Reflective Refinement

ScholarSum:基于知识图谱推理与反思性精炼的师生式抽象摘要生成

Bohou Zhang, Xiaoyu Tao, Mingyue Cheng, Huijie Liu, Qi Liu

专题命中 知识库问答 :使用知识图谱推理,非传统RAG。

AI总结 提出ScholarSum框架,通过构建层次知识图谱引导学生生成初稿,并利用教师式审阅者迭代检查与修正,实现科学文献摘要的流畅性与事实一致性。

2601.14288 2026-06-18 astro-ph.CO cs.AI cs.CE gr-qc hep-th 版本更新 专题 60

DeepInflation: an AI agent for research and model discovery of inflation

DeepInflation:用于暴胀研究与模型发现的AI智能体

Ze-Yu Peng, Hao-Shi Yuan, Qi Lai, Jun-Qian Jiang, Gen Ye, Jun Zhang, Yun-Song Piao

专题命中 知识库问答 :集成RAG知识库提供理论背景

AI总结 提出基于多智能体架构的AI智能体DeepInflation,集成大语言模型、符号回归引擎和检索增强生成知识库,自动发现与最新观测一致的单场慢滚暴胀势,并解释理论背景。

3. 长文档RAG 1 篇

2606.18381 2026-06-18 cs.CL cs.IR 新提交 专题 92

SproutRAG: Attention-Guided Tree Search with Progressive Embeddings for Long-Document RAG

SproutRAG: 基于注意力引导的树搜索与渐进嵌入的长文档RAG

Amirhossein Abaskohi, Issam H. Laradji, Peter West, Giuseppe Carenini

专题命中 长文档RAG :提出注意力引导的层次化RAG框架,解决长文档检索粒度与上下文连贯性权衡。

AI总结 提出SproutRAG,通过注意力引导构建句子级分块树,实现多粒度检索,无需额外LLM调用,平均信息效率提升6.1%。

4. 向量检索 2 篇

2606.18497 2026-06-18 cs.CR 新提交 专题 85

Ghost Vectors: Soft-Deleted Embeddings Remain Reconstructible in HNSW Vector Databases

幽灵向量:HNSW向量数据库中软删除的嵌入仍然可重构

Chandranil Chakraborttii, Jackeline García Alvarado, Sitora Abdulofizova, Shivanshu Dwivedi

专题命中 向量检索 :HNSW向量数据库软删除的安全漏洞

AI总结 研究揭示HNSW向量数据库的软删除机制存在安全漏洞,被标记删除的向量仍可通过存储层恢复,并提出基于加密密钥轮换的防护方案。

Comments 13 pages, 5 figures, 12 tables. Prepared for submission

2606.18897 2026-06-18 cs.IR cs.AI 新提交 专题 70

SAERec: Constructing Fine-grained Interpretable Intents Priors via Sparse Autoencoders for Recommendation

SAERec:通过稀疏自编码器为推荐构建细粒度可解释意图先验

Jiangnan Xia, Xuansheng Wu, Yu Yang, Xin Wang, Ninghao Liu

专题命中 向量检索 :利用稀疏自编码器构建意图先验用于推荐

AI总结 提出SAERec模型,利用稀疏自编码器从大型语言模型文本嵌入中解耦出细粒度可解释意图,作为先验指导推荐,并通过多分支注意力机制融合个人与公共意图,提升推荐性能与可解释性。

5. 其他RAG 1 篇

2606.13681 2026-06-18 cs.CL 新提交 专题 70

EvoArena: Tracking Memory Evolution for Robust LLM Agents in Dynamic Environments

EvoArena: 追踪记忆演化以构建动态环境中的鲁棒LLM智能体

Jundong Xu, Qingchuan Li, Jiaying Wu, Yihuai Lan, Shuyue Stella Li, Huichi Zhou, Bowen Jiang, Lei Wang, Jun Wang, Anh Tuan Luu, Caiming Xiong, Hae Won Park, Bryan Hooi, Zhiyuan Hu

专题命中 其他RAG :基于补丁的记忆范式用于环境演化推理

AI总结 提出EvoArena基准套件模拟终端、软件和社交领域的渐进环境变化,并设计基于补丁的记忆范式EvoMem记录结构化更新历史,使智能体能通过记忆变化推理环境演化,实验表明当前智能体在动态环境中表现不佳,EvoMem可稳定提升性能。