arXivDaily每日学术速递，同步arXiv全量数据，AI总结、翻译，覆盖人工智能、机器人、计算机、金融、统计学、数学、物理学、生物学、经济学、电气&系统等方向。

2601.03728 2026-05-11 cs.CV cs.AI

CSMCIR: CoT-Enhanced Symmetric Alignment with Memory Bank for Composed Image Retrieval

Zhipeng Qian, Zihan Liang, Yufei Ma, Ben Chen, Huangyu Dai, Yiwei Ma, Jiayi Ji, Chenyi Lei, Han Li, Xiaoshuai Sun

AI总结该论文研究了组合图像检索（CIR）中查询与目标图像在异构模态下表示空间不一致的问题，提出了一种名为CSMCIR的统一表示框架。该方法通过多级思维链（MCoT）提示策略引导大语言模型生成语义兼容的图像描述，结合对称的双塔结构和基于熵的动态记忆库策略，有效缩小了模态间的对齐差距。实验表明，CSMCIR在多个基准数据集上取得了优越的检索性能和训练效率。

2601.01822 2026-05-11 cs.RO cs.CV

DisCo-FLoc: Semantic-Free Floorplan Localization via $SE(2)$-Aware Contrastive Disambiguation

Ping Zhong, Shiyong Meng, Bolei Chen, Tao Zou, Chaoxu Mu, Jianxin Wang

AI总结视觉平面图定位（FLoc）在面对重复性极简布局时面临严重的结构混淆问题，导致定位精度下降。本文提出 DisCo-FLoc，一种无需语义标注的视觉几何对比去混淆方法，通过引入深度感知的射线回归预测器（RRP）将单目RGB图像投影为几何感知的射线特征，并结合空间扰动的对比学习目标，提升定位的方位分辨能力和空间分离性。实验表明，该方法在两个具有挑战性的基准数据集上显著优于基于语义的最新方法，尤其在方向定位精度方面表现出色。

Comments 9 pages, 3 figures

2601.01285 2026-05-11 cs.CV

S2M-Net: Spectral-Spatial Mixing for Medical Image Segmentation with Morphology-Aware Adaptive Loss

Md. Sanaullah Chowdhury Lameya Sabrin

AI总结本文提出了一种名为S2M-Net的新型医学图像分割网络，旨在解决局部精度、全局上下文和计算效率之间的矛盾。该网络通过频谱选择性token mixer和形态感知自适应分割损失两个创新模块，在保持全局感受野的同时显著降低了计算成本，并自动适应不同解剖结构的特性以优化分割效果。实验表明，S2M-Net在多个医学影像数据集上取得了优于现有方法的性能，且参数量远少于基于Transformer的方法。

Comments I would like to withdraw the paper from arXiv because the current version contains issues that need to be carefully revised before public dissemination

2601.00889 2026-05-11 cs.LG

FANoS-v2: Feedback-Controlled Momentum with Thermostat Damping for Lightweight Neural Optimization

Nalin Dhiman

AI总结 FANoS-v2 是一种基于反馈控制的轻量级神经网络优化器，通过引入标量反馈控制器对更新能量进行调节，并结合热力学阻尼机制，提升了优化过程的稳定性与效率。该方法支持多种预处理方式，并提供了用于稳定性分析的诊断工具。实验表明，FANoS-v2 在部分任务上相比 AdamW 取得了更高的准确率，但同时也带来了更高的计算时间开销，显示出其作为研究型优化器的潜力与当前性能瓶颈。

Comments 17 pages, 3 figures, 5 tables

2512.23770 2026-05-11 cs.LG cs.AI

SB-TRPO: Towards Safe Reinforcement Learning with Hard Constraints

Dominik Wagner, Ankit Kanwar, Luke Ong

AI总结在安全关键领域，强化学习智能体在完成任务的同时必须满足严格的零成本安全约束。本文提出了一种名为SB-TRPO的算法，通过动态结合奖励和成本的自然策略梯度，在保证安全约束的前提下优化策略，实现了安全性和任务性能之间的良好平衡。该方法在理论上有局部安全进展的保证，并在多个安全强化学习任务中表现出优越的性能。

2512.20974 2026-05-11 cs.LG cs.AI cs.RO

Generalised Linear Models in Deep Bayesian RL with Learnable Basis Functions

Jingyang You, Hanna Kurniawati

AI总结本文提出了一种名为GLiBRL的深度贝叶斯强化学习方法，通过引入可学习的基函数和广义线性模型，实现了对任务参数和模型噪声的完全可追踪贝叶斯推断，提升了任务表示的清晰度和政策性能。该方法支持精确的边缘似然评估，并能与多种策略梯度算法无缝结合，具有良好的泛化能力。实验表明，GLiBRL在多个基准任务上优于现有元强化学习方法，性能提升最高达1.8倍。

2512.19991 2026-05-11 cs.LG

Bloom Filter Encoding for Machine Learning

John Cartmell, Mihaela Cardei, Ionut Cardei

AI总结本文提出了一种利用布隆过滤器变换对机器学习数据进行预处理的方法，通过基于哈希的编码将每个样本转化为紧凑的位数组表示，从而在降低内存使用的同时模糊原始特征值。该方法无需密钥哈希，但也可选择性地使用密钥控制映射关系。实验在六个不同领域的数据集上验证了该方法的有效性，结果显示使用布隆过滤器编码训练的模型在多个数据集上性能与原始数据或传统降维方法相当，同时实现了稳定的内存节省，表明该编码方式可作为一种高效、通用的预处理表示方法，适用于多种学习任务并提供一定程度的数据模糊化。

Comments 14 pages, 7 figures

2512.17129 2026-05-11 cs.LG cs.MA cs.RO q-bio.QM

DiffeoMorph: Learning to Morph 3D Shapes Using Differentiable Agent-Based Simulations

Seong Ho Pahng, Guoye Guan, Benjamin Fefferman, Sahand Hormoz

AI总结本文提出了一种名为 DiffeoMorph 的端到端可微分框架，用于学习引导一群智能体从初始状态演化成目标三维形状的形态发生协议。该方法基于 SE(3) 等变图神经网络，使每个智能体能够根据自身状态和与其他智能体的交互信号更新位置和内部状态。研究引入了一种基于三维泽尔尼克多项式的形状匹配损失函数，能够将预测形状与目标形状作为连续空间分布进行比较，并对智能体顺序、数量和全局方向不变，同时保持对镜像的敏感性。实验表明，DiffeoMorph 能够从简单初始条件生成复杂三维结构，为形态发生、群体机器人和可编程自组装等领域的分布式控制策略学习提供了通用框架。

2512.15840 2026-05-11 cs.RO cs.CV

Large Video Planner Enables Generalizable Robot Control

Boyuan Chen, Tianyuan Zhang, Haoran Geng, Caiyi Zhang, Peihao Li, Kiwhan Song, William T. Freeman, Jitendra Malik, Pieter Abbeel, Russ Tedrake, Vincent Sitzmann, Yilun Du

AI总结该研究提出了一种基于大规模视频预训练的通用机器人控制方法，旨在解决机器人在多样化任务和环境中进行决策的问题。不同于传统的视觉-语言-动作（VLA）系统，该方法直接利用视频中包含的时空序列信息，构建用于机器人规划的开放视频模型。通过大规模互联网视频数据训练，模型能够生成针对新场景和任务的零样本视频计划，并提取可执行的机器人动作，实验表明其在实际机器人任务中具有良好的泛化能力和可行性。

Comments 29 pages, 16 figures

2512.15567 2026-05-11 cs.AI cond-mat.mtrl-sci cs.LG physics.chem-ph

Evaluating Large Language Models in Scientific Discovery

Zhangde Song, Jieyu Lu, Yuanqi Du, Botao Yu, Thomas M. Pruyn, Yue Huang, Kehan Guo, Xiuzhe Luo, Yuanhao Qu, Yi Qu, Yinkai Wang, Haorui Wang, Jeff Guo, Jingru Gan, Parshin Shojaee, Di Luo, Andres M Bran, Gen Li, Qiyuan Zhao, Shao-Xiong Lennon Luo, Yuxuan Zhang, Xiang Zou, Wanru Zhao, Yifan F. Zhang, Wucheng Zhang, Shunan Zheng, Saiyang Zhang, Sartaaj Takrim Khan, Mahyar Rajabi-Kochi, Samantha Paradi-Maropakis, Tony Baltoiu, Fengyu Xie, Tianyang Chen, Kexin Huang, Weiliang Luo, Meijing Fang, Xin Yang, Lixue Cheng, Jiajun He, Soha Hassoun, Xiangliang Zhang, Wei Wang, Chandan K. Reddy, Chao Zhang, Zhiling Zheng, Mengdi Wang, Le Cong, Carla P. Gomes, Chang-Yu Hsieh, Aditya Nandy, Philippe Schwaller, Heather J. Kulik, Haojun Jia, Huan Sun, Seyed Mohamad Moosavi, Chenru Duan

AI总结本文提出了一种基于真实科研场景的评估框架，用于评估大型语言模型在科学发现中的能力，涵盖了生物学、化学、材料科学和物理学等多个领域。该框架通过专家定义的研究项目分解为模块化场景，并从中生成经过验证的问题，从问题层面和项目层面两个维度对模型进行评估，包括假设生成、实验设计和结果解释等关键环节。研究发现，当前最先进的大型语言模型在科学发现任务中仍存在明显性能差距，且模型规模扩大带来的收益有限，揭示了现有模型在科学推理方面仍存在系统性不足。

2512.12116 2026-05-11 cs.LG stat.ML

Neural CDEs as Correctors for Learned Time Series Models

Muhammad Bilal Shahid, Zhanhong Jiang, Prajwal Koirala, Soumik Sarkar, Cody Fleming

AI总结本文提出了一种预测-校正框架，用于改进时间序列模型的多步预测性能。该框架中，预测器生成多步预测，而校正器采用神经控制微分方程来修正预测误差，能够处理不规则采样的时间序列，并兼容连续和离散时间预测器。研究还引入了两种正则化策略以提升校正器的外推能力和训练效率，并提供了理论上的稳定性与收敛性保证。实验表明，该方法在多种预测模型上均能有效提升预测精度，具有预测器无关的广泛适用性。

2512.10371 2026-05-11 cs.AI

AgentProg: Empowering Long-Horizon GUI Agents with Program-Guided Context Management

Shizuo Tian, Hao Wen, Yuxuan Chen, Jiacheng Liu, Shanhui Zhao, Guohong Liu, Ju Ren, Yunxin Liu, Yuanchun Li

AI总结随着移动图形用户界面（GUI）代理在长时任务自动化中的应用日益广泛，如何高效管理不断增长的交互历史成为关键挑战。本文提出AgentProg，一种基于程序引导的上下文管理方法，将交互历史重构为包含变量和控制流的程序结构，从而系统性地决定哪些信息需要保留、哪些可以舍弃。此外，AgentProg引入全局信念状态机制以应对部分可观测性和环境变化，实验表明其在长时任务上表现优异且稳定性强，优于现有方法。

Comments 16 pages, 8 figures

2512.05439 2026-05-11 cs.AI cs.FL

BEAVER: An Efficient Deterministic LLM Verifier

Tarun Suresh, Nalin Wadhwa, Debangshu Banerjee, Gagandeep Singh

AI总结随着大语言模型从研究原型转向生产系统，实践中亟需可靠的方法来验证模型输出并评估安全部署中的尾部风险。本文提出BEAVER，首个实用的框架，用于计算大语言模型满足安全属性的确定性、可靠的概率界。该方法通过新颖的Token trie和Frontier数据结构系统地探索模型输出空间，每一步都保持可证明的界内安全，实验表明其在计算成本仅为基线1/10的情况下，能识别出更多风险实例，有效揭示了传统方法容易遗漏的尾部风险。

2512.03476 2026-05-11 cs.LG cs.AI cs.MA cs.NA math.NA physics.comp-ph

ATHENA: Agentic Team for Hierarchical Evolutionary Numerical Algorithms

Juan Diego Toscano, Daniel T. Chen, George Em Karniadakis

AI总结 ATHENA 是一个用于分层进化数值算法的智能代理团队框架，旨在解决科学计算与科学机器学习中理论设计与计算实现之间的鸿沟。其核心是基于上下文老虎机问题的HENA循环，通过分析历史实验选择结构化操作，并将其转化为可执行代码以生成科学奖励。ATHENA 能够自主发现数学对称性、设计稳定数值求解器，并结合符号与数值方法解决多物理场问题，表现出超越人类的性能，并可通过人机协作进一步提升结果精度。

2512.03454 2026-05-11 cs.CV cs.AI

Think Before You Drive: World Model-Inspired Multimodal Grounding for Autonomous Vehicles

Haicheng Liao, Huanming Shen, Bonan Wang, Yongkang Li, Yihong Tang, Chengyue Wang, Dingyi Zhuang, Kehua Chen, Hai Yang, Chengzhong Xu, Zhenning Li

AI总结本文研究了如何让自动驾驶车辆理解自然语言指令并准确定位目标物体，针对现有方法在处理模糊或依赖上下文的指令时的不足，提出了一种基于世界模型思想的框架ThinkDeeper。该框架通过学习场景的潜在状态并预测未来空间变化，实现对指令的深入理解与定位决策。同时，作者还构建了一个多源视觉 grounding 数据集DrivePilot，并在多个基准测试中验证了方法的有效性，表现出优异的鲁棒性和效率。

2511.22316 2026-05-11 cs.LG

Outlier Smoothing with Closed-Form Rotations for W4A4 Large Language Model Quantization

Jinying Xiao, Bin Ji, Shasha Li, Xiaodong Liu, Ma Jun, Chao Wang, Wei Li, Ye Zhong, Xuan Xie, Nyima Tashi, Jie Yu

AI总结本文研究了大语言模型（LLM）量化中的收敛路径问题，提出了一种单次量化框架SingleQuant，通过解耦量化截断过程，有效消除梯度噪声和非光滑性，提升量化效率与模型性能。该方法引入对齐旋转变换（ART）和均匀性旋转变换（URT），分别针对不同类型的激活异常值进行闭式最优旋转和平滑处理，显著加速量化过程并提升任务表现。实验表明，SingleQuant在多个任务上优于现有方法，例如在量化LLaMA-2-13B时，其速度提升达1400倍，同时任务性能平均提高0.57%。

Comments 9 pages, 4 figures

2511.18085 2026-05-11 cs.RO cs.AI

Continually Evolving Skill Knowledge in Vision Language Action Model

Yuxuan Wu, Guangming Wang, Zhiheng Yang, Tianchen Deng, Maoqing Yao, Brian Sheil, Hesheng Wang

AI总结本文研究了视觉语言动作（VLA）模型在持续学习中的知识积累问题，提出了一个无需增加网络参数的知识驱动框架Stellar VLA。该方法通过联合优化任务表示和知识空间，实现自我演进的知识学习，并引入知识引导的专家路由机制，以提升任务适应能力。实验表明，Stellar VLA在LIBERO基准和实际双臂平台中均表现出优异的性能，尤其在分层操作任务中效果显著。

2511.15204 2026-05-11 cs.CV cs.AI

Physics-Based Benchmarking Metrics for Multimodal Synthetic Images

Kishor Datta Gupta, Marufa Kamal, Md. Mahfuzur Rahman, Fahad Rahman, Mohd Ariful Haque, Sunzida Siddique

AI总结当前主流的多模态图像评估指标如BLEU、CIDEr等在语义和结构准确性方面存在局限，尤其在特定领域或依赖上下文的场景中表现不足。本文提出了一种基于物理约束的多模态数据评估指标PCMDE，结合大型语言模型、知识映射和视觉-语言模型，以更准确地衡量合成图像的语义与结构合理性。该方法通过多阶段架构实现特征提取、置信度加权融合以及物理引导推理，有效提升了评估的准确性和适用性。

2511.12090 2026-05-11 cs.CV

Teaching Prompts to Coordinate: Hierarchical Layer-Grouped Prompt Tuning for Continual Learning

Shengqin Jiang, Tianqi Kong, Yuankai Qi, Haokui Zhang, Lina Yao, Quan Z. Sheng, Qingshan Liu, Ming-Hsuan Yang

AI总结该论文研究了持续学习中的提示调优方法，旨在在不更新预训练模型参数的前提下，通过引入可学习的提示来适应新任务，同时减少对先前任务知识的遗忘。现有方法通常为每个网络层独立添加任务特定提示，但这种高度灵活的调优方式可能导致某些层不必要的更新，增加灾难性遗忘的风险。为此，作者提出了一种分层分组的提示调优方法，通过共享组内提示和使用统一根提示生成子提示，增强了层间协同，提升了模型稳定性。实验表明，该方法在多个基准上优于现有先进方法。

Comments We have reconsidered the issue, and an updated version will be released later

2511.09907 2026-05-11 cs.AI cs.CV

Learning to Pose Problems: Reasoning-Driven and Solver-Adaptive Data Synthesis

Yongxian Wei, Yilin Zhao, Zixuan Hu, Li Shen, Xinrui Chen, Runxi Cheng, Sinan Du, Hao Yu, Chun Yuan, Dian Li

AI总结该研究提出了一种基于推理驱动和求解器自适应的数据合成方法，用于训练大型推理模型。核心方法是通过显式推理规划问题生成方向，并根据求解器的能力调整问题难度，同时利用中间推理过程增强问题多样性。实验表明，该框架在多个数学和通用推理基准测试中有效提升了模型性能，平均提升了3.4%。

2511.09598 2026-05-11 cs.LG

Amortized Multi-Objective Optimization Across Tasks with Generative Solution Modeling

Tingyang Wei, Jiao Liu, Abhishek Gupta, Chin Chun Ooi, Puay Siew Tan, Yew-Soon Ong

AI总结本文研究了在连续任务参数空间中高效求解多目标优化问题（EMOPs）的挑战，提出了一种基于生成解建模的参数化多目标贝叶斯优化方法。该方法通过学习逆模型，实现跨任务参数空间的优化成本摊销，能够在无需重新评估的情况下直接预测任意查询任务的解。核心创新在于结合条件生成模型与任务协同的获取函数搜索，有效提升了多任务优化的效率与泛化能力。

Comments Accepted by IJCAI 2026

2511.09117 2026-05-11 cs.CV

DKDS: A Benchmark Dataset of Degraded Kuzushiji Documents with Seals for Detection and Binarization

Rui-Yang Ju, Kohei Yamashita, Hirotaka Kameko, Shinsuke Mori

AI总结该论文提出了一种新的基准数据集DKDS，用于应对古日文草书（Kuzushiji）文档中因退化和印章干扰而导致的识别与二值化挑战。DKDS数据集由专业专家协助构建，包含退化和带印章的文档，并定义了两个任务方向：古日文字符与印章检测以及文档二值化。研究提供了多种检测和二值化方法的基线结果，为相关研究提供了新的实验基准。

Comments IJDAR 2026 (ICDAR-IJDAR Track)

2511.02805 2026-05-11 cs.CL cs.AI

MemSearcher: Training LLMs to Reason, Search and Manage Memory via End-to-End Reinforcement Learning

Qianhao Yuan, Jie Lou, Zichao Li, Jiawei Chen, Yaojie Lu, Hongyu Lin, Le Sun, Debing Zhang, Xianpei Han

AI总结 MemSearcher 是一种基于端到端强化学习的框架，旨在训练大型语言模型在多轮对话中高效地进行推理、搜索和记忆管理。该方法通过维护一个紧凑的内存，仅保留与当前问题相关的信息，从而避免了传统方法中因拼接完整历史记录而导致的上下文过长和计算开销增加的问题。实验表明，MemSearcher 在多个公开数据集上优于基于历史拼接的基线方法，且在多轮交互中保持了几乎恒定的 token 数量。

Comments Accepted to ACL 2026

2510.19788 2026-05-11 cs.AI cs.LG

Benchmarking World-Model Learning with Environment-Level Queries

Archana Warrier, Dat Nguyen, Michelangelo Naim, Moksh Jain, Yichao Liang, Karen Schroeder, Cambridge Yang, Joshua B. Tenenbaum, Sebastian Vollmer, Kevin Ellis, Zenna Tavares

AI总结该研究提出了一种新的评估方法WorldTest，用于检验智能体学习到的世界模型是否能够支持多样化的环境级查询，而不仅仅是基于观测轨迹的预测任务。研究构建了一个名为AutumnBench的基准平台，包含43个交互式网格世界环境和129个任务，用于评估人类和学习模型在不同查询类型下的表现。实验表明，人类在这些任务中显著优于现有前沿模型，这可能归因于人类在探索和信念更新方面的优势。该工作为评估世界模型的泛化能力提供了新框架，并为扩展到更复杂领域提供了参考。

Comments 34 pages, 10 figures

2510.08638 2026-05-11 cs.CV cs.AI

Into the Rabbit Hull: From Task-Relevant Concepts in DINO to Minkowski Geometry

Thomas Fel, Binxu Wang, Michael A. Lepori, Matthew Kowal, Andrew Lee, Randall Balestriero, Sonia Joseph, Ekdeep S. Lubana, Talia Konkle, Demba Ba, Martin Wattenberg

AI总结本文研究了DINOv2模型中任务相关概念的性质，通过线性表示假设和稀疏编码器（SAEs）构建了一个包含32,000个单元的词典，用于分析模型在不同任务中的概念使用模式。研究发现，不同任务如分类、分割和深度估计分别依赖于不同类型的感知概念，并揭示了表示并非严格稀疏而是部分密集，且具有几何结构特征。基于这些发现，作者提出了闵科夫斯基表示假设（MRH），将视觉Transformer的表示结构解释为由原型的凸组合构成，为理解模型内部表征提供了新的理论框架。

Comments Accepted at ICLR 2026

详情

Journal ref: ICLR 2024

英文摘要

DINOv2 is routinely deployed to recognize objects, scenes, and actions; yet the nature of what it perceives remains unknown. As a working baseline, we adopt the Linear Representation Hypothesis (LRH) and operationalize it using SAEs, producing a 32,000-unit dictionary that serves as the interpretability backbone of our study, which unfolds in three parts. In the first part, we analyze how different downstream tasks recruit concepts from our learned dictionary, revealing functional specialization: classification exploits "Elsewhere" concepts that fire everywhere except on target objects, implementing learned negations; segmentation relies on boundary detectors forming coherent subspaces; depth estimation draws on three distinct monocular depth cues matching visual neuroscience principles. Following these functional results, we analyze the geometry and statistics of the concepts learned by the SAE. We found that representations are partly dense rather than strictly sparse. The dictionary evolves toward greater coherence and departs from maximally orthogonal ideals (Grassmannian frames). Within an image, tokens occupy a low dimensional, locally connected set persisting after removing position. These signs suggest representations are organized beyond linear sparsity alone. Synthesizing these observations, we propose a refined view: tokens are formed by combining convex mixtures of archetypes (e.g., a rabbit among animals, brown among colors, fluffy among textures). This structure is grounded in Gardenfors' conceptual spaces and in the model's mechanism as multi-head attention produces sums of convex mixtures, defining regions bounded by archetypes. We introduce the Minkowski Representation Hypothesis (MRH) and examine its empirical signatures and implications for interpreting vision-transformer representations.

URL PDF HTML ☆

赞 0 踩 0

2510.07926 2026-05-11 cs.CL

Comprehensiveness Metrics for Automatic Evaluation of Factual Recall in Text Generation

Adam Dejl, James Barry, Alessandra Pascale, Javier Carnerero Cano

AI总结本文研究了如何自动评估大型语言模型生成文本在事实召回方面的完整性，重点在于检测遗漏的信息或未充分表达的观点。作者提出了三种自动评估指标：基于自然语言推理的分解方法、基于问答对比的评估方法以及直接利用大语言模型识别缺失内容的端到端方法。实验表明，尽管端到端方法在效果上表现突出，但其鲁棒性和可解释性相对较弱，研究还对多个主流开源大模型在多源信息下的回答完整性进行了评估。

Comments ACL 2026 Findings

2510.04850 2026-05-11 cs.CL cs.AI

Detecting Distillation Data from Reasoning Models

Hengxiang Zhang, Hyeong Kyu Choi, Sharon Li, Hongxin Wei

AI总结本文研究了如何检测推理模型的蒸馏数据，即判断某个问题是否被包含在模型的蒸馏数据中。为了解决蒸馏数据部分可见带来的挑战，作者提出了一种基于输出令牌概率偏差（TPD）的检测方法，通过分析模型生成的令牌概率模式，识别出已被模型见过的问题。实验表明，该方法在多个蒸馏数据集上显著提升了检测性能，AUC值最高提升了31%。

2510.01569 2026-05-11 cs.AI cs.CL

InvThink: Premortem Reasoning for Safer Language Models

Yubin Kim, Taehan Kim, Eugene Park, Chunjong Park, Cynthia Breazeal, Daniel McDuff, Hae Won Park

AI总结本文提出了一种名为 InvThink 的训练与提示框架，通过要求模型在生成最终响应前列举、分析并约束潜在失败情况，从而提升语言模型的安全性。该方法将生成过程分为三个步骤：列举潜在危害、分析其后果、在显式约束下生成响应，相比现有方法在更大模型规模下表现出更高的安全评分，并有效缓解了安全税问题。实验表明，InvThink 不仅在通用安全任务中表现优异，在医疗、金融、法律等专业伦理领域以及智能体对齐场景中也显著减少了有害行为。

2510.01290 2026-05-11 cs.LG

ThinKV: Thought-Adaptive KV Cache Compression for Efficient Reasoning Models

Akshat Ramachandran, Marina Neseem, Charbel Sakr, Rangharajan Venkatesan, Brucek Khailany, Tushar Krishna

AI总结本文提出了一种名为ThinKV的键值（KV）缓存压缩框架，用于提升大模型推理过程中的效率。该方法基于思维链（CoT）中注意力稀疏性所揭示的不同思维类型及其重要性差异，采用混合量化与淘汰策略，根据思维重要性动态调整token精度，并在推理过程中逐步淘汰不重要思维中的token。实验表明，ThinKV在保持接近原始精度的同时，将KV缓存占用降低至原规模的5%以下，并显著提升了推理吞吐量。

Comments ICLR 2026 (Oral)

2510.00436 2026-05-11 cs.AI cs.CL

Automated Evaluation can Distinguish the Good and Bad AI Responses to Patient Questions about Hospitalization

Sarvesh Soni, Dina Demner-Fushman

AI总结该研究探讨了如何通过自动化方法评估AI系统对患者住院相关问题的回答质量。研究者收集了28个AI系统对100个患者案例的回复，并从回答准确性、临床依据使用和医学知识应用三个维度进行评估。通过与医生撰写的参考答案对比，自动化评估方法能够有效区分优质与劣质的AI回答，表明精心设计的自动化评估可支持AI系统的规模化比较评估，并促进医患沟通。

Comments Accepted for publication in npj Digital Medicine