ScholarQuest: A Taxonomy-Guided Benchmark for Agentic Academic Paper Search in Open Literature Environments
ScholarQuest:开放文献环境中智能学术论文搜索的基于分类法的基准测试
AI总结 提出ScholarQuest基准,基于1000多个计算机科学主题和四种研究意图,构建可扩展的答案和共享检索后端,评估LLM智能体在开放文献环境中的学术论文搜索能力。
ScholarQuest:开放文献环境中智能学术论文搜索的基于分类法的基准测试
AI总结 提出ScholarQuest基准,基于1000多个计算机科学主题和四种研究意图,构建可扩展的答案和共享检索后端,评估LLM智能体在开放文献环境中的学术论文搜索能力。
使用角色-环境协调视频生成模型的电影级合成
发表机构 * City University of Hong Kong(香港城市大学) ; Independent Researcher(独立研究员)
AI总结 提出端到端视频扩散框架,通过三掩码引导和RGB-D联合去噪建模角色与环境的双向物理与光照交互,实现高质量动态视频合成。
不完美感知下的移动目标搜索:一种部分可观测随机博弈论方法
发表机构 * Shanghai Research Institute for Intelligent Autonomous Systems, Tongji University(同济大学上海自主智能无人系统科学中心) ; Department of Control Science and Engineering, Tongji University(同济大学控制科学与工程系)
AI总结 针对传感器限制、恶意干扰或通信噪声导致的不完美感知,采用部分可观测随机博弈(POSG)框架建模搜索者与目标间的对抗互动,提出可检测性概念和基于随机递归分析的充分判据,并开发服务器辅助分布式算法。
可再生能源社区数字孪生的SysML建模
AI总结 针对可再生能源社区数字孪生工程中的异构性挑战,提出基于SysML的MBSE工作流,通过设备分类和社区组织视图建模,并引入SAREF4ENER本体弥补语义鸿沟。
Comments Presented at the Workshop on Digital Twin Experiences and Model-Based Testing Methods, 12 June 2026, Västerås, Sweden, co-located with the 30th Ada-Europe International Conference on Reliable Software Technologies (AEiC 2026)
QMFOL:通过可量化的一元一阶逻辑测试用例生成来基准测试大语言模型推理
发表机构 * Huazhong University of Science and Technology(华中科技大学) ; Nanyang Technological University(南洋理工大学) ; Hubei University(湖北大学) ; East China Normal University(华东师范大学) ; National University of Singapore(新加坡国立大学)
AI总结 提出QMFOL框架,通过可控制复杂度的合取/析取模式生成一元一阶逻辑推理任务,并构建包含2880个实例的基准QMFOLBench,评估显示逻辑复杂度增加导致性能下降和计算开销上升。
可操作的激活方向:检测和缓解跨语言模型家族的突发性对齐失调
发表机构 * Universität des Saarlandes(萨尔大学)
AI总结 通过差分均值方向在最终层实现99.6%的对齐/失调分离,因果干预将代码泄露降低21-51点;跨架构迁移虽有效但缺乏特异性,揭示了两层特异性结构。
Comments 12 pages, 2 figures
DeepForestVisionV2:面向非洲热带森林相机监测的生态驱动分类扩展
发表机构 * UMR7206 Eco-Anthropologie, MNHN(UMR7206 生态人类学,法国国家自然历史博物馆) ; One Forest Vision initiative(One Forest Vision 倡议) ; Sebitoli Chimpanzee Project(塞比托利黑猩猩项目) ; Centre National de la Recherche Scientifique et Technologique(国家科学技术研究中心) ; Institut de Recherche en Ecologie Tropicale(热带生态研究所) ; Tacugama Chimpanzee Sanctuary(塔库加马黑猩猩保护区) ; Biotope(Biotope 公司) ; CIRAD(法国农业发展国际合作研究中心) ; Max Planck Institute for Evolutionary Anthropology(马克斯·普朗克进化人类学研究所) ; BOKU University(维也纳自然资源与生命科学大学) ; Agence Nationale des Parcs Nationaux du Gabon(加蓬国家公园管理局) ; Uganda Wildlife Authority(乌干达野生动物管理局) ; Addax Data Science(Addax 数据科学公司) ; Utrecht University(乌得勒支大学)
AI总结 针对非洲热带森林相机监测中生态梯度(垂直分层、场景开放度、人为界面)导致原35类分类过粗的问题,提出扩展至64类的DeepForestVisionV2,在保持离线工作流的同时提升野外实用性。
Comments Accepted at ICPR 2026 - Computer Vision for Biodiversity Monitoring and Conservation Workshop
Zero-VC: 通过说话人匿名化实现零前瞻流式语音转换
发表机构 * The Chinese University of Hong Kong, Shenzhen(香港中文大学(深圳)) ; Shenzhen Loop Area Institute(深圳环域研究所) ; Shenzhen Transsion Holdings Co., Ltd.(深圳传音控股股份有限公司)
AI总结 针对流式零样本语音转换中音色与语言内容解耦的挑战,提出将说话人匿名化作为扰动机制,在保留韵律效用的同时显式减轻音色泄露,实现严格因果的零前瞻网络。
Comments Accepted to Interspeech 2026
基于学习器的概念漂移检测:分析与评估
发表机构 * Department of Computer Science, University of Regina(里贾纳大学计算机科学系)
AI总结 本文从理论上分析概念漂移特征,并评估多种漂移检测算法在合成和真实数据集上的性能,旨在增强对漂移检测器行为及其适用性的理解。
Comments 2 authors, 29 pages
GNSS欺骗对V2X通信的威胁
AI总结 本文提出利用廉价软件定义无线电(SDR)对V2X通信实施GNSS欺骗攻击的方法,并在真实设备上验证了攻击效果,揭示了V2X通信易受欺骗且难以检测的安全漏洞。
Comments 2026 IEEE\@. Personal use of this material is permitted. Permission from IEEE must be obtained for all other uses, in any current or future media, including reprinting/republishing this material for advertising or promotional purposes, creating new collective works, for resale or redistribution to servers or lists, or reuse of any copyrighted component of this work in other works
加速工业物联网中的信任收敛:一种针对动态网络条件的机器学习方法
AI总结 针对工业物联网中网络质量波动导致信任收敛慢的问题,提出基于机器学习的信任收敛加速方法,通过预测收敛时间并动态调整转移概率,在挑战性条件下将收敛时间减少28.6%,并提升恶意节点场景下的评估准确性。
Comments Symposium: Communication \& Information Systems Security (CISS)
Journal ref IEEE Global Communications Conference (GLOBECOM) 2025, Dec 2025, Taipei, Taiwan. pp.4427-4432
CzechDocs:捷克少数民族语言格式化文档的多路平行数据集
发表机构 * Charles University, Faculty of Mathematics ; Physics Institute of Formal
AI总结 提出CzechDocs多路平行格式化文档数据集,覆盖捷克及少数民族语言,支持评估保留格式的机器翻译系统,并公开验证子集与评估工具。
用深度强化学习增强游戏AI
发表机构 * Electronic Arts (EA), Stockholm, Sweden(美国艺电公司(EA),斯德哥尔摩,瑞典)
AI总结 本文提出一种框架,通过深度强化学习训练游戏AI,以增强角色行为的真实感,并探讨了部署中的挑战与未来研究方向。
Comments Vision paper, published in Conference on Games 2026
FlowMaps: 使用流匹配建模长期多模态物体动态
发表机构 * Sapienza University of Rome(罗马大学) ; Université de Montréal(蒙特利尔大学) ; Mila - Quebec AI Institute(米拉-魁北克人工智能研究所)
AI总结 提出FlowMaps模型,通过潜在流匹配学习物体位置的多模态时空分布,预测动态物体未来位置,提升机器人在变化家庭环境中的导航性能。
超越准确性:衡量预测模型的逻辑合规性
AI总结 提出规则违反分数(RVS),一种独立于预测准确性的评估指标,用于量化预测模型对逻辑规则的遵守程度,并通过实验证明两个准确率相近的模型可能表现出截然不同的逻辑合规性。
大语言模型的心理特征很大程度上是测量假象
发表机构 * Max Planck Institute for Human Development(马克斯·普朗克人类发展研究所) ; University of Konstanz(康斯坦茨大学) ; Barcelona Supercomputing Center(巴塞罗那超级计算中心) ; University of Basel(巴塞尔大学)
AI总结 通过心理测量框架分析56个指令微调LLM,发现模型间差异主要源于方向性响应偏差而非特质,该偏差解释了81-90%的变异,且可通过题目选择操控,表明LLM心理特征是测量假象。
子模线性排序的紧致算法与难度
AI总结 针对一般子模函数的最小线性排序问题,提出多项式时间O(√(n/ln n))近似算法,并证明信息论下界匹配,任何多项式时间算法无法达到o(√(n/ln n))近似比。
Comments 25 pages. Accepted to the 53rd International Colloquium on Automata, Languages, and Programming (ICALP 2026)
艺术技能评估中的图像匹配评价
发表机构 * University of Dayton(代顿大学) ; University of Science, VNU-HCM(胡志明市国家大学理科大学) ; Vietnam National University, Ho Chi Minh City(胡志明市国家大学)
AI总结 提出通过手绘图像与模板匹配来评估绘画技能的方法,比较SIFT特征与孪生网络,发现SIFT关键点匹配更有效。
Comments MAPR 2024
爵士乐领谱、独奏转录、古典钢琴与单声部乐谱的音高拼写
发表机构 * École polytechnique(巴黎综合理工学院) ; INRIA(法国国家信息与自动化研究所)
AI总结 提出一种音高拼写与调性估计算法,通过两阶段优化(模态与调性)联合估计音符名称、全局调号和每小节局部音阶,在多种数字乐谱数据集上验证有效性。
稳定的Transformer-Actor-Critic模型预测控制:一种收缩分析方法
AI总结 提出一种Transformer-Actor-Critic MPC架构,通过证明Transformer满足增量输入-状态稳定性并利用黎曼收缩理论分析互联动力学,将理论界作为训练正则化项,实现可证明鲁棒的控制策略。
一次蒸馏,终身适应:探索数据集蒸馏用于持续测试时适应
发表机构 * KAIST, Visual Intelligence Lab(韩国科学技术院,视觉智能实验室) ; Chung-Ang University, FOV Lab(中央大学,FOV实验室)
AI总结 提出DO-ALL框架,通过数据集蒸馏生成紧凑的合成锚点,在持续测试时适应中提供稳定参考,无需保留原始源数据,提升长期鲁棒性。
Comments ECCV 2026
Belt-Finger: 一种经济实惠的软带驱动夹爪,用于灵巧的手内操作
发表机构 * University of Tübingen(图宾根大学) ; Max Planck Institute for Intelligent Systems(马克斯·普朗克智能系统研究所)
AI总结 提出一种双软带手指模块,为平行夹爪增加三个手内自由度(平移、俯仰、滚动),在保持低成本、易集成的同时提升灵巧操作能力,并通过MPC和遥操作验证其有效性。
HilDA:利用扩散的分层蒸馏推进自监督LiDAR预训练
发表机构 * KTH Royal Institute of Technology(瑞典皇家理工学院) ; Linköping University(林雪平大学) ; TRATON AB(TRATON公司) ; Qualcomm Auto Ltd Sweden Filial(高通汽车有限公司瑞典分公司)
AI总结 提出HilDA框架,通过分层蒸馏(多层蒸馏和全局上下文蒸馏)结合时间占用扩散目标,自监督预训练LiDAR骨干网络,在3D检测、场景流和语义占用预测任务上达到最先进水平。
Comments Accepted to ECCV 2026. Maciej and Jesper contributed equally
有效维度主导量子核视觉模型的泛化
AI总结 通过有效维度d_eff解释量子视觉模型中纠缠结构增强泛化与量子噪声提升测试精度的现象,提出噪声形状核的谱分解与正则化机制。
ReNikud:音频监督的希伯来语字素到音素转换
AI总结 提出ReNikud方法,利用音频监督和伪元音化架构,通过无标注音频的ASR伪标签和字符级对齐,解决希伯来语G2P转换中的元音缺失和发音歧义问题,在多个基准上达到最优。
评估与增强遥感多模态大语言模型的否定理解能力
发表机构 * Peng Cheng Laboratory(鹏城实验室) ; Tsinghua University(清华大学) ; Central South University(中南大学)
AI总结 提出RS-Neg基准评估遥感MLLMs的否定理解,并设计NeFo方法通过测试时学习利用约5%未标注样本显著提升模型性能。
Comments ECCV 2026 Accepted
基于无细胞DNA分析的多癌早期检测的计算方法与挑战
发表机构 * AGH University of Krakow(AGH克拉科夫大学) ; Norwegian Institute of Public Health(挪威公共卫生研究所)
AI总结 综述2022-2025年cfDNA多癌早期检测的计算方法,重点分析片段组学和表观遗传特征提取技术,指出多模态集成方法最具临床整合潜力,但需标准化评估协议。
使用大语言模型进行Qiskit代码迁移
AI总结 针对量子软件开发套件版本演进导致的代码维护问题,提出结合大语言模型与检索增强生成(RAG)的混合方法,利用自动生成的迁移场景分类体系引导模型,实现Qiskit代码跨版本自动迁移,有效减少幻觉并提升迁移建议质量。
基于多模态胎儿MRI预测早产背景下的出生胎龄
发表机构 * Leibniz University Hannover(莱布尼茨汉诺威大学)
AI总结 提出结合多模态胎儿MRI和机器学习流程预测出生胎龄,包括数据插补、特征选择和回归模型,在333例对照和93例早产数据上评估,R²=0.13,MAE=2.74周,准确率0.77。
Comments Accepted for publication at the Journal of Machine Learning for Biomedical Imaging (MELBA) https://melba-journal.org/2026:013
Journal ref Machine.Learning.for.Biomedical.Imaging. 2026 (2026)
多模态对比学习用于基于位置绑定的隐式地球嵌入
发表机构 * Computational Methods Lab, HafenCity University Hamburg(汉堡港城大学计算方法实验室) ; Dept. of Operations & Technology, Technical University of Munich(慕尼黑工业大学运营与技术系;海尔布隆数据科学中心;慕尼黑数据科学研究所) ; Heilbronn Data Science Center(波恩大学大地测量与地理信息研究所) ; Munich Data Science Institute ; Institute of Geodesy and Geoinformation, University of Bonn
AI总结 提出两种多模态对比学习架构MELT和SALT,通过位置绑定整合未配对地理数据,在四个下游任务中匹配最强双模态基线SATCLIP,但增加模态数未持续提升性能,表明位置编码器是主要瓶颈。