arXivDaily每日学术速递，同步arXiv全量数据，AI总结、翻译，覆盖人工智能、机器人、计算机、金融、统计学、数学、物理学、生物学、经济学、电气&系统等方向。

2605.10107 2026-05-12 cs.AI cs.AR

Arcane: An Assertion Reduction Framework through Semantic Clustering and MCTS-Guided Rule Exploring

Hongqin Lyu, Yonghao Wang, Zhiteng Chao, Tiancheng Wang, Huawei Li

AI总结本文提出了一种名为Arcane的断言约简框架，旨在解决基于断言的硬件验证中冗余断言导致的仿真效率低下问题。该方法结合语义聚类对大规模断言进行准确分类，并利用蒙特卡洛树搜索（MCTS）探索最优的规则应用顺序，以高效减少断言数量。实验表明，Arcane在保持形式化覆盖率和突变检测能力的前提下，最多可减少76.2%的断言数量，并使仿真速度提升2.6至6.1倍。

Comments 6 pages, 6 figures

2605.10106 2026-05-12 cs.CV cs.AI

ViSRA: A Video-based Spatial Reasoning Agent for Multi-modal Large Language Models

Tingshu Mou, Jiabo He, Renying Wang, Ce Liu, Hao Yang, Tiehua Zhang, Jingjing Chen, Xingjun Ma

AI总结本文提出了一种名为ViSRA的基于视频的三维空间推理代理，旨在提升多模态大语言模型（MLLMs）的空间推理能力。ViSRA无需额外训练，通过利用专家模型提供的显式空间信息，以模块化和可扩展的方式引导模型进行空间推理，实现了灵活的即插即用框架。该方法在多个现有基准和未见过的三维空间任务中均表现出色，相比基线方法分别提升了15.6%和28.9%的绝对性能，具有可迁移的三维理解能力和较低的计算成本。

2605.10091 2026-05-12 cs.LG

TopoU-Net: a U-Net architecture for topological domains

Gaurav Gaurav, Ibrahem ALJabea, Yaroslav Zakomornyy, Eric Frank, Mohamed Elhamdadi, Theodore Papamarkou, Mustafa Hajij

AI总结 TopoU-Net 是一种面向拓扑结构数据的 U-Net 架构，旨在处理包含点、边、区域、超边等复杂结构的数据。该方法将 U-Net 视为一种层次化的编码-解码框架，利用组合复形中的单元、关联和秩来构建表示空间与跳跃连接。通过引入秩路径的概念，TopoU-Net 在不同拓扑层级之间进行特征传递，并在多个任务中表现出优越的性能，尤其在异质图和高阶结构数据上效果显著。

2605.10087 2026-05-12 cs.CV

Initiation of Interaction Detection Framework using a Nonverbal Cue for Human-Robot Interaction

Guhnoo Yun, Juhan Yoo, Kijung Kim, Dong Hwan Kim

AI总结本文提出了一种基于音频和视觉传感器融合的非语言线索的人机交互（HRI）启动检测框架，用于家庭环境中的机器人交互。该框架通过声音源定位与人体跟踪信息结合，实现用户注视机器人时的交互启动检测，即使用户未直接说话，也能在注视时间超过预设阈值时识别交互意图。研究设计了状态转移模型，并在移动机器人上进行了实验验证，所有模块均集成于ROS系统中，实现了框架的完整实现与应用。

2605.10086 2026-05-12 cs.RO

A cell-decomposition based path planner for 3D navigation in constrained workspaces

João P. L. Morais, Luciano C. A. Pimenta, Marcelo A. Santos, Guilherme V. Raffo

AI总结本文提出了一种基于单元分解的路径规划算法，用于在受限三维工作空间中进行导航，确保每个单元与其至少一个相邻单元之间具有完全可见性。该方法构建了一个简化的路径可行性验证框架，并可方便地嵌入到优化问题中。通过结合Yen的k最短路径算法与二阶锥规划（SOCP），提出了一种名为KSP-SOCP的新方法，在保证路径质量的同时降低了计算负担，实验表明该方法在时间和内存效率上优于传统方法，适用于大规模场景。

Comments Accepted for publication at the 23rd IFAC World Congress (Busan, Korea)

2605.10083 2026-05-12 cs.LG

Unlocking air traffic flow prediction through microscopic aircraft-state modeling

Bin Wang, Anqi Liu, Jiangtao Zhao, Yanyong Huang, Peilan He, Guiyuan Jiang, Feng Hong, Yanwei Yu, Tianrui Li

AI总结本文研究了如何通过微观飞机状态建模提升终端空域短时空中交通流预测的准确性。提出了一种名为AeroSense的框架，该方法直接从ADS-B轨迹生成的动态飞机状态集合出发，建立从微观飞机状态到未来区域交通流的端到端映射。该方法无需依赖历史数据窗口，能够自然适应不同密度的交通状况，实验表明其在高密度交通场景下的预测精度显著优于基于聚合时间序列的传统方法。

2605.10079 2026-05-12 cs.CV

SocialDirector: Training-Free Social Interaction Control for Multi-Person Video Generation

Liangyang Ouyang, Ruicong Liu, Caixin Kang, Yifei Huang, Yoichi Sato

AI总结该论文提出了一种名为SocialDirector的训练-free交互控制器，用于提升多人物视频生成中社会互动的控制能力。该方法通过调节交叉注意力图，实现了对人物动作执行者、动作时机及目标对象的精确控制，有效解决了现有模型中人物与动作不匹配、社交动态混乱等问题。研究还构建了自动化评估流程，实验表明SocialDirector显著提升了生成视频的交互真实性，接近真实视频的表现水平。

2605.10071 2026-05-12 cs.CV

MFVLR: Multi-domain Fine-grained Vision-Language Reconstruction for Generalizable Diffusion Face Forgery Detection and Localization

Yaning Zhang, Tianyi Wang, Zan Gao, Yibo Zhao, Chunjie Ma, Meng Wang

AI总结随着高真实感人脸生成技术的快速发展，通用性的人脸伪造检测与定位方法变得尤为重要。本文提出了一种多领域细粒度视觉-语言重建模型（MFVLR），通过语言引导的细粒度人脸伪造表示学习，全面捕捉多领域中的视觉伪造痕迹，从而实现对扩散模型生成人脸伪造内容的通用检测与定位。该模型引入细粒度语言变换器、多领域视觉编码器和视觉解码器，并设计了创新的视觉注入模块，显著提升了模型在跨生成器、跨伪造类型和跨数据集场景下的性能。

2605.10065 2026-05-12 cs.CL cs.AI

NCO: A Versatile Plug-in for Handling Negative Constraints in Decoding

Hyundong Jin, Yo-Sub Han

AI总结在生成文本时，防止大型语言模型生成不适当内容（如脏话和个人身份信息）变得越来越重要。为了解决在解码过程中高效处理多个硬约束和正则表达式约束的问题，本文提出了一种名为NCO的解码策略，该方法通过在线模式匹配实现对约束的高效处理，避免了状态爆炸问题，并兼容多种采样和搜索方法。实验表明，NCO在实际任务中有效提升了内容过滤的效果。

2605.10064 2026-05-12 cs.AI

MAGE: Multi-Agent Self-Evolution with Co-Evolutionary Knowledge Graphs

Ruiyi Yang, Zechen Li, Hao Xue, Imran Razzak, Flora D. Salim

AI总结 MAGE 是一种基于多智能体协同进化的框架，通过构建包含四个子图的协同进化知识图谱，将智能体在学习过程中的经验与反馈外部化存储，从而支持冻结主干模型在推理时的稳定表现。该方法利用任务条件引导检索机制，结合任务级和技能级的强化学习策略，实现了知识的高效积累与应用。实验表明，MAGE 在多个复杂任务上显著优于基于提示的冻结主干模型，展示了其在自我进化学习中的有效性与广泛适用性。

Comments 25 pages, 3 figures

2605.10063 2026-05-12 cs.RO

EFGCL: Learning Dynamic Motion through Spotting-Inspired External Force Guided Curriculum Learning

Keita Yoneda, Kento Kawaharazuka, Kei Okada

AI总结本文提出了一种基于物理引导的强化学习方法——外部力引导课程学习（EFGCL），旨在解决足式机器人学习复杂全身动态运动时效率低、失败风险高的问题。受体操中“ spotting ”动作的启发，该方法通过在训练过程中引入辅助外力，使机器人能够物理上体验成功动作的执行过程，无需依赖特定任务的奖励设计或参考轨迹。实验表明，EFGCL显著提升了四足机器人学习跳跃等复杂动作的效率，并成功在真实机器人上复现了仿真中的运动，验证了该方法的有效性和通用性。

Comments Accepted at RA-L 2026, website - https://keitayoneda.github.io/kleiyn-efgcl/, YouTube - https://youtu.be/sFK00hm14No/

2605.10061 2026-05-12 cs.CL cs.AI

Not-So-Strange Love: Language Models and Generative Linguistic Theories are More Compatible than They Appear

R. Thomas McCoy

AI总结本文探讨了神经语言模型（LMs）与生成语言学理论之间的兼容性，指出LMs不仅能支持基于梯度和使用频率的语言理论，还能体现基于形式结构的生成理论。研究扩展了LMs可验证的语言理论范围，为使用频率理论与生成理论的融合提供了可能性。

Comments Accepted to Behavioral and Brain Sciences; 4 pages; Commentary on "How Linguistics Learned to Stop Worrying and Love the Language Models" by Richard Futrell and Kyle Mahowald

2605.10054 2026-05-12 cs.CV

Explanation-Aware Learning for Enhanced Interpretability in Biomedical Imaging

Zubair Faruqui, Rahul Dubey

AI总结该研究针对医学影像诊断中深度神经网络过度依赖非临床相关特征的问题，提出了一种在训练过程中直接引入解释性监督的方法，以引导模型关注具有临床意义的区域。研究系统分析了不同解释损失设计和监督强度对模型预测性能和解释可信度的影响，并引入了两个新的量化指标用于评估解释质量。实验表明，该方法在保持模型准确性的同时，能够显著提升解释的临床相关性，适用于多种标注的生物医学影像任务。

Comments Under review at IEEE Journal of Biomedical and Health Informatics (JBHI)

2605.10051 2026-05-12 cs.RO cs.AI

Guided Streaming Stochastic Interpolant Policy

Puming Jiang, Meiyi Wang, Kelvin Lin, Ce Hao, Harold Soh

AI总结本文研究了如何在推理时通过引导机制，使生成式机器人策略能够动态适应目标，而无需重新训练。传统方法受限于基于块的架构，存在延迟高、反应性差的问题。作者通过分析价值函数的时间演化，推导出针对随机插值策略的最优引导项，并提出了流式随机插值策略（SSIP），实现了快速且反应灵敏的实时控制。此外，还提出了两种互补机制，分别支持零样本适应和高效推理，实验表明该方法在动态复杂环境中表现出更优的反应能力和物理合理性。

Comments Accepted to Robotics: Science and Systems (RSS) 2026. The first two authors contributed equally

2605.10050 2026-05-12 cs.CV

EchoPrune: Interpreting Redundancy as Temporal Echoes for Efficient VideoLLMs

Jiameng Li, Minye Wu, Jiezhang Cao, Aleksei Tiulpin, Matthew B. Blaschko

AI总结视频大语言模型（VideoLLMs）在处理长视频时面临挑战，因为密集采样会导致大量视觉token，而稀疏采样则可能遗漏关键时间信息，引发模型幻觉。本文提出了一种轻量且无需训练的token剪枝方法EchoPrune，通过将冗余token解释为时间回声，利用跨模态相关性和时间重建误差对token进行评分，从而在固定token预算下提升时间分辨率。实验表明，EchoPrune使VideoLLMs在相同token预算下处理的帧数提升至原来的20倍，并在多个基准上提升了性能和推理速度。

Comments 9 pages

2605.10047 2026-05-12 cs.LG cs.AI

Rethinking Loss Reweighting for Imbalance Learning as an Inverse Problem: A Neural Collapse Point of View

Jinping Wang, Zixin Tong, Zhiwu Xie, Zhiqiang Gao

AI总结本文从逆问题的角度重新思考不平衡学习中的损失重加权问题，提出了一种基于神经崩溃（Neural Collapse）理论的动态权重调整策略。该方法以类间平均损失相等为目标，通过逆向推导动态确定类别权重，从而更有效地缓解类别不平衡带来的影响。实验表明，该方法在多个数据集上优于现有主流长尾分类方法，且能更好地贴近理想几何结构。

Comments Accepted by ICML2026

2605.10046 2026-05-12 cs.CV cs.LG cs.MA

PixelFlowCast: Latent-Free Precipitation Nowcasting via Pixel Mean Flows

Yufeng Zhu, Chunlei Shi, Yongchao Feng, Dan Niu

AI总结本文提出了一种名为PixelFlowCast的降水临近预报方法，旨在在不使用潜在空间压缩的情况下实现高效且高精度的短期雷达回波预测。该方法采用两阶段框架，第一阶段通过确定性模型生成粗粒度预测以捕捉整体演变趋势，第二阶段利用KANCondNet提取深度时空特征进行精确条件引导，并结合基于像素均值流的预测器，以少量步骤生成高质量预测结果。实验表明，PixelFlowCast在预测精度和推理效率方面均优于现有主流方法，尤其在长序列预测任务中表现突出，具有良好的实际应用前景。

Comments 26 pages, 7 figures

2605.10045 2026-05-12 cs.CV

ExtraVAR: Stage-Aware RoPE Remapping for Resolution Extrapolation in Visual Autoregressive Models

Feihong Yan, Shaoyu Liu, Haixuan Wang, Shuai Lu, Linfeng Zhang, Huiqi Li, Xiangyang Ji

AI总结视觉自回归（VAR）模型作为扩散模型的有力替代方案，在图像生成中表现出色，但其固定训练分辨率限制了其在更高分辨率下的直接生成能力。本文提出ExtraVAR方法，通过引入阶段感知的RoPE重映射策略，解决了VAR模型在分辨率外推过程中出现的全局重复、局部重复和细节退化等问题，并进一步提出基于熵驱动的自适应注意力校准方法，以适应高分辨率下注意力分布的变化，实验表明该方法在结构一致性和细节保真度方面均优于现有方法。

Comments 10 pages, 7 figures

2605.10044 2026-05-12 cs.LG cs.AI

Adaptive Action Chunking via Multi-Chunk Q Value Estimation

Yongjae Shin, Jongseong Chae, Seongmin Kim, Jongeui Park, Youngchul Sung

AI总结本文提出了一种名为Adaptive Action Chunking (ACH)的新方法，用于强化学习中的动作分块问题。该方法通过基于Transformer的架构，在一次前向传播中同时估计所有候选分块长度的动作价值，从而动态调整分块长度以适应当前状态，克服了传统固定分块长度方法在不同状态和任务下性能受限的问题。实验表明，ACH在34个复杂任务中均优于固定长度基线，展现出更优的泛化能力和学习效率。

2605.10043 2026-05-12 cs.CL cs.AI

Personalizing LLMs with Binary Feedback: A Preference-Corrected Optimization Framework

Xilai Ma, Liye Zhao, Weijun Yao, Haibing Di, Wenya Wang, Jing Li

AI总结该研究旨在通过二元反馈个性化大语言模型（LLM），以更好地对齐用户个体偏好。提出了一种基于偏好校准的优化框架C-BPO，通过将目标用户数据视为正反馈，其他用户数据作为隐式负反馈，捕捉用户间的差异。为解决偏好重叠问题，该方法基于正-未标记（PU）学习理论构建目标函数，有效去除正样本偏差，从而在保持模型通用性的同时实现更精准的个性化。实验表明，C-BPO在多种任务和模型上均优于现有方法，验证了其有效性。

Comments Accepted by ACL 2026 Main

2605.10038 2026-05-12 cs.AI

TimeClaw: A Time-Series AI Agent with Exploratory Execution Learning

Hangchen Liu, Dongyuan Li, Renhe Jiang, Jiewen Deng, Weiwei Ye, Yoshihide Sekimoto

AI总结 TimeClaw 是一种面向时间序列分析的 AI 智能体，旨在解决任务执行中探索经验难以复用的问题。该方法通过探索、比较、提炼和重注入的四阶段循环，将探索性执行转化为可复用的分层经验，结合指标监督学习、任务感知的工具丢弃以及推理时的经验注入，提升了模型在金融、气象等领域的预测与推理能力。实验表明，TimeClaw 在多个任务上优于现有方法，突显了探索经验处理机制对科学系统性能的关键影响。

Comments Under review

2605.10035 2026-05-12 cs.AI

From Single-Step Edit Response to Multi-Step Molecular Optimization

Haojie Rao, Kun Li, Yida Xiong, Jiameng Chen, Wenbin Hu, Yizhen Zheng, Jiajun Yu, Duanhua Cao

AI总结该研究旨在通过分子结构编辑实现特定性质的优化，面对结构相似分子数据稀缺及决策过程需遵循化学规则的挑战。提出了一种响应导向的离散编辑优化方法，包含单步分子编辑响应预测器和多步规划器，通过指导树搜索将局部预测组合为优化路径，从而减少对外部评估的依赖，并提升了数据利用效率。

2605.10034 2026-05-12 cs.RO

Beyond Self-Play and Scale: A Behavior Benchmark for Generalization in Autonomous Driving

Aron Distelzweig, Faris Janjoš, Andreas Look, Anna Rothenhäusler, Daniel Jost, Oliver Scheel, Raghu Rajan, Daphne Cornelisse, Eugene Vinitsky, Joschka Boedecker

AI总结本文提出BehaviorBench，一个用于评估自动驾驶策略泛化能力的综合性基准测试平台，旨在弥补当前大规模强化学习策略与标准评估体系之间的差距。该基准从评估体系、场景复杂度和行为多样性三个方面进行设计，支持在nuPlan等标准规划基准上评估大规模RL策略，并引入多样化的交互式交通代理以测试策略在不同行为模式下的表现。研究发现，基于纯自博弈训练的策略在面对真实交通场景时存在泛化不足的问题，并提出了一种结合策略梯度与规则规划的混合方法以提升性能。

详情

英文摘要

Recent Autonomous Driving (AD) works such as GigaFlow and PufferDrive have unlocked Reinforcement Learning (RL) at scale as a training strategy for driving policies. Yet such policies remain disconnected from established benchmarks, leaving the performance of large-scale RL for driving on standardized evaluations unknown. We present BehaviorBench -- a comprehensive test suite that closes this gap along three axes: Evaluation, Complexity, and Behavior Diversity. In terms of Evaluation, we provide an interface connecting PufferDrive to nuPlan, which, for the first time, enables policies trained via RL at scale to be evaluated on an established planning benchmark for autonomous driving. Complementarily, we offer an evaluation framework that allows planners to be benchmarked directly inside the PufferDrive simulation, at a fraction of the time. Regarding Complexity, we observe that today's standardized benchmarks are so simple that near-perfect scores are achievable by straight lane following with collision checking. We extract a meaningful, interaction-rich split from the Waymo Open Motion Dataset (WOMD) on which strong performance is impossible without multi-agent reasoning. Lastly, we address Behavior Diversity. Existing benchmarks commonly evaluate planners against a single rule-based traffic model, the Intelligent Driver Model (IDM). We provide a diverse suite of interactive traffic agents to stress-test policies under heterogeneous behaviors, beyond just using IDM. Overall, our benchmarking analysis uncovers the following insight: despite learning interactive behaviors in an emergent manner, policies trained via pure self-play under standard reward functions overfit to their training opponents and fail to generalize to other traffic agent behaviors. Building on this observation, we propose a hybrid planner that combines a PPO policy with a rule-based planner.

URL PDF HTML ☆

赞 0 踩 0

2605.10029 2026-05-12 cs.CV

Slum Detection and Density Mapping with AlphaEarth Foundations: A Representation Learning Evaluation Across 12 Global Cities

Shuyang Hou, Ziqi Liu, Haoyue Jiao, Zhangyan Xu, Xiaopu Zhang, Lutong Xie, Yaxian Qing, Jianyuan Liang, Xuefeng Guan, Huayi Wua

AI总结该研究利用AlphaEarth Foundations（AEF）这一全球一致的高分辨率地表嵌入数据，评估其在12个全球城市中用于贫民窟检测和密度估计的性能。通过多种训练策略和辅助特征配置，研究发现同一城市跨年训练效果最佳，并揭示了AEF在区分贫民窟边界和建模像素内密度梯度方面的局限性。研究还指出POI特征对密度估计有显著提升，并展示了AEF在长期贫民窟监测中的结构保持能力。

2605.10027 2026-05-12 cs.CL cs.AI

Speech-based Psychological Crisis Assessment using LLMs

Terumi Chiba, Yang Luo, Ziyun Cui, Yongsheng Tong, Chao Zhang

AI总结本文提出了一种基于大语言模型（LLM）的语音心理危机评估框架，旨在自动化识别通话中的心理危机等级，以提升心理热线服务的质量与效率。为更好地捕捉语音对话中的情感信号，研究引入了副语言注入方法，将识别出的非语言情感线索插入语音文本中，增强模型对语音细微情感的感知能力。同时，提出了一种增强推理的训练策略，通过生成诊断推理链作为辅助任务，提升分类性能，结合数据增强后，在三类分类任务中取得了较高的宏F1分数和准确率。

Comments 5 pages, 5 figures

2605.10026 2026-05-12 cs.CV

MUSDA: Multi-source Multi-modality Unsupervised Domain Adaptive 3D Object Detection for Autonomous Driving

Xiaohu Lu, Hamed Khatounabadi, Hayder Radha

AI总结随着自动驾驶技术的发展，多模态标注数据集日益丰富，为无需人工标注即可适应新环境的3D目标检测提供了可能。然而传统领域自适应方法通常仅针对单一来源或单一模态，难以应对多源多模态场景。本文提出了一种面向自动驾驶的多源多模态无监督领域自适应3D目标检测框架，通过引入分层空间条件领域分类器和原型图加权融合策略，有效对齐了不同来源和模态的特征，实验表明该方法在多个主流数据集上均优于现有先进方法。

2605.10025 2026-05-12 cs.CL cs.AI

Medical Incident Causal Factors and Preventive Measures Generation Using Tag-based Example Selection in Few-shot Learning

Yuna Haseyama, Tomoki Ito, Hiroki Sakaji, Itsuki Noda

AI总结在医疗等高风险领域，大型语言模型（LLM）生成临床见解的可靠性至关重要。本文提出了一种基于标签的少样本示例选择方法，用于引导LLM从医疗事件描述中生成背景/因果因素和预防措施。实验使用日本医疗事件数据集（JMID），结果表明，基于标签的示例选择方法在生成精度和稳定性方面优于随机采样和基于相似度的方法，为提升临床LLM应用的可靠性提供了有效策略。

2605.10020 2026-05-12 cs.LG

TrajDLM: Topology-Aware Block Diffusion Language Model for Trajectory Generation

Wilson Wongso, Lihuan Li, Arian Prabowo, Xiachong Lin, Baiyu Chen, Hao Xue, Flora D. Salim

AI总结生成高保真合成GPS轨迹在交通、城市规划和情景模拟等领域日益重要，但现有方法在生成效率与道路网络拓扑结构的忠实度之间存在矛盾。本文提出TrajDLM，一种基于块扩散语言模型的拓扑感知轨迹生成框架，通过将轨迹建模为离散道路段序列，并结合拓扑感知嵌入与约束采样，在保证轨迹真实性的同时显著提升生成速度。实验表明，TrajDLM在多个城市规模数据集上表现出优异的局部相似性性能，且比现有方法快2.8倍，同时具备跨领域零样本迁移能力。

2605.10019 2026-05-12 cs.LG cs.AI cs.CC stat.ML

The two clocks and the innovation window: When and how generative models learn rules

Binxu Wang, Emma Lucia Byrnes Finn, Bingbin Liu

AI总结该论文研究了生成模型在有限数据下学习规则时所面临的基本矛盾，即模型的训练目标使其更倾向于拟合经验分布而非目标分布。通过引入两个关键时间点——规则生效时间 $τ_{\mathrm{rule}}$ 和记忆重现时间 $τ_{\mathrm{mem}}$，论文分析了生成模型何时开始生成符合规则的样本以及何时开始复制训练数据。研究发现，这两个时间点受规则复杂度、模型容量和数据规模等因素影响，并定义了“创新窗口”作为模型真正创新的时期，揭示了生成模型在不同架构下学习规则的共性与差异。

Comments 48 pages, 28 figures. Earlier versions are presented in NeurIPS2025 SPIGM workshop as oral presentation https://openreview.net/forum?id=LjqX8OhPPi

2605.10018 2026-05-12 cs.LG

The Value of Mechanistic Priors in Sequential Decision Making

Itai Shufaro, Gal Benor, Shie Mannor

AI总结本文研究了在序列决策中引入机制先验（mechanistic priors）的价值，提出了一种量化机制模型信息量的指标——机制互信息，并分析了其在渐近和小样本（burn-in）两种场景下的理论性能。研究证明，使用机制先验可以显著降低样本复杂度，尤其在小样本阶段表现出更高的样本效率。通过基于实际药代动力学数据的5-氟尿嘧啶给药模拟，验证了混合机制先验的有效性，并对比了大型语言模型先验的不足，强调了在安全关键应用中使用物理基础先验的重要性。