arXivDaily每日学术速递，同步arXiv全量数据，AI总结、翻译，覆盖人工智能、机器人、计算机、金融、统计学、数学、物理学、生物学、经济学、电气&系统等方向。

2603.24577 2026-05-13 cs.CV cs.AI

EndoVGGT: GNN-Enhanced Depth Estimation for Surgical 3D Reconstruction

Falong Fan, Yi Xie, Arnis Lektauers, Bo Liu, Jerzy Rozenblit

AI总结本文提出了一种名为EndoVGGT的框架，用于提升手术场景中可变形软组织的三维重建精度。该方法引入了一个基于图注意力的变形感知模块（DeGAT），通过动态构建特征空间语义图来捕捉组织区域间的长程关联，从而在遮挡情况下更有效地传播结构信息，提高重建的鲁棒性和一致性。实验表明，EndoVGGT在SCARED数据集上显著提升了重建质量，并在未见数据集上表现出良好的泛化能力。

Comments We withdraw this submission due to significant errors in the presentation and logical structure of the paper. We found that the current version does not accurately convey the research findings and requires a major overhaul of the manuscript's methodology description and results analysis

2603.24033 2026-05-13 cs.LG

SRG: Score-based Relaxation-guided Generation for Mixed Integer Linear Programming

Ruobing Wang, Xin Li, Yujie Fang, Mingzhong Wang

AI总结本文提出了一种基于分数松弛引导的生成框架SRG，用于解决混合整数线性规划问题。该方法通过近似松弛引导的随机微分方程，结合基于Transformer的分数网络，将可行性和最优性信号融入生成模型中，从而在解空间中生成高质量的可行解。SRG在推理时无需额外引导模块即可直接采样多样解，并用于构建紧凑的信任区域子问题，实验表明其在多个基准测试中表现优异，尤其在生成候选解的困难场景中具有明显优势，并展现出良好的跨尺度和跨问题的零样本迁移能力。

2603.23878 2026-05-13 cs.LG cs.AI cs.LO

The Luna Bound Propagator for Formal Analysis of Neural Networks

Henry LeCates, Haoze Wu

AI总结本文提出了一种基于抽象解释的边界传播方法Luna，用于神经网络的形式化分析。Luna采用C++实现，支持区间边界传播、DeepPoly/CROWN分析以及alpha-CROWN分析，适用于一般的计算图结构。实验表明，Luna在VNN-COMP 2025基准测试中，在边界精度和计算效率方面均优于现有的alpha-CROWN实现。

Comments 32 pages, 29 Figures

2603.11383 2026-05-13 cs.RO cs.AI

Vision-Based Hand Shadowing for Robotic Manipulation via Inverse Kinematics

Hendrik Chiche, Antoine Jamme, Trevor Rigoberto Martinez, Gabriel Gomes

AI总结该研究提出了一种基于视觉的手部阴影逆运动学（IK）重定向方法，用于低成本机械臂的远程操作。通过单目RGB-D相机捕捉手部动作，结合深度感知和坐标变换，生成机械臂关节指令，并通过阻尼最小二乘法求解逆运动学问题，实现了对SO-ARM101机械臂的控制。实验表明，该方法在结构化环境中取得了较高的成功率，并在真实场景中通过引入替代手部检测器提升了鲁棒性，揭示了无标记手部重定向方法的潜力与当前局限。

Comments v2: accepted at IEEE Access (2026); minor revisions per peer review, added WiLoR occlusion-mitigation experiment, error analysis, EMA ablation, and author photos

2603.10281 2026-05-13 cs.LG cs.AI cs.CV

Taming Score-Based Denoisers in ADMM: A Convergent Plug-and-Play Framework

Rajesh Shrestha, Xiao Fu

AI总结本文研究了如何将基于分数的去噪器有效集成到ADMM优化算法中，以解决逆问题。针对训练数据流形与ADMM迭代几何不匹配以及收敛性缺乏保证的两个核心挑战，提出了一种新的ADMM-PnP框架，引入包含自动校正、方向校正和分数去噪三阶段的AC-DC去噪器。理论分析表明该框架在适当参数下具有弱非扩张性，保证了固定点球收敛，并在更宽松条件下支持自适应步长的收敛性。实验表明该方法在多种逆问题中优于现有基线。

2603.09678 2026-05-13 cs.AI cs.LG cs.SE

EsoLang-Bench: Evaluating Genuine Reasoning in Large Language Models via Esoteric Programming Languages

Aman Sharma, Paras Chopra

AI总结本文提出EsoLang-Bench，一个用于评估大语言模型在陌生编程语言中真实推理能力的基准测试，采用五种小众编程语言（如Brainfuck、Befunge-98等）作为测试语言。这些语言虽然图灵完备，但与主流语言（如Python、JavaScript）相比，在预训练语料中出现频率极低，且缺乏实际应用价值，因此能有效检验模型的分布外泛化能力。实验表明，当前最先进的模型在主流语言任务中表现优异，但在小众语言任务中准确率大幅下降，揭示了模型在跨语言泛化方面仍存在显著差距。

Comments 45 pages, 8 figures, preprint

2603.07388 2026-05-13 cs.LG cs.AI

Sparsity and Out-of-Distribution Generalization

Scott Aaronson, Lin Lin Lee, Jiawei Li

AI总结本文探讨了模型在分布外（OOD）场景下的泛化能力，提出了一种基于稀疏性的理论解释。研究认为，世界通过区分特征呈现，而稀疏假设（即依赖尽可能少的特征）更符合奥卡姆剃刀原则，并能在训练分布与测试分布足够重叠的特征上实现泛化。文章给出了一个形式化定理，扩展了经典样本复杂度界，并将稀疏分类器推广到子空间合取函数，为理解AI对齐中的泛化问题提供了新视角。

2603.04352 2026-05-13 cs.RO cond-mat.mtrl-sci

A Soft Robotic Demonstration in the Stratosphere

Codrin Tugui, Tirth Thakar, Anatol Gogoj, Alexander White, Ang Leo Li, Alexander Yin, Edward Pomianek, Mihai Duduta

AI总结该研究针对在极端环境如平流层中运行的软体机器人所面临的耐压、耐温及适应性挑战，提出了一种新型硅橡胶交联方法。通过紫外光引发的铂催化反应，实现了硅橡胶的快速固化与优异电致动性能，显著提升了介电弹性体致动器在极端温度和真空条件下的可靠性。研究通过高空气球实验验证了该材料在类太空环境中的有效性，为未来软体机器人在空间探索等领域的应用提供了新材料解决方案。

2602.22586 2026-05-13 cs.LG cs.AI cs.CL

TabDLM: Free-Form Tabular Data Generation via Joint Numerical-Language Diffusion

Donghong Cai, Jiarui Feng, Yanbo Wang, Da Zheng, Yixin Chen, Muhan Zhang

AI总结本文提出了一种名为 TabDLM 的统一框架，用于生成包含自由形式文本和结构化数值、类别属性的异构表格数据。该方法结合了掩码扩散语言模型与连续扩散过程，通过双向注意力机制实现文本与数值特征的跨模态交互，有效克服了传统扩散模型和大语言模型在处理异构数据时的局限性。实验表明，TabDLM 在多个基准数据集上表现优异，优于现有的扩散模型和基于大语言模型的生成方法。

Comments Preprint

2602.22507 2026-05-13 cs.LG cs.CV

Space Syntax-guided Post-training for Residential Floor Plan Generation

Zhuoyang Jiang, Dongqing Zhang

AI总结本文研究了住宅平面图生成中空间配置逻辑的优化问题，提出了一种基于空间句法的后训练框架SSPT，通过引入空间句法集成预言机（SSIO）对生成的平面图进行配置质量评估，并将其作为反馈信号指导模型优化。该方法包括两种策略：基于迭代训练的SSPT-Iter和基于强化学习的SSPT-PPO，并构建了新的评估基准SSPT-Bench。实验表明，该方法有效提升了生成平面图的公共空间主导性和功能层级一致性，尤其SSPT-PPO在提升效果和效率方面表现更优。

2602.19770 2026-05-13 cs.LG cs.AI

The Confusion is Real: GRAPHIC -- A Network Science Approach to Confusion Matrices in Deep Learning

Johanna S. Fröhlich, Bastian Heinlein, Jan U. Claar, Hans Rosenberger, Vasileios Belagiannis, Ralf R. Müller

AI总结本文提出了一种名为GRAPHIC的方法，用于分析深度学习模型中类别之间的混淆情况。该方法基于网络科学，将中间层的混淆矩阵解释为有向图的邻接矩阵，从而可视化和量化训练过程中的学习动态。GRAPHIC能够揭示类别可分性、数据集问题及网络结构行为，为理解神经网络的学习过程提供了新的视角。

Comments Transactions on Machine Learning Research, 2026

2602.13267 2026-05-13 cs.CV cs.RO eess.IV

SOAR: Regression-based LiDAR Relocalization for UAVs

Hengyu Mu, Jianshi Wu, Yuxin Guo, XianLian Lin, Qingyong Hu, Sheng Ao, Chenglu Wen, Cheng Wang

AI总结本文提出SOAR，一种基于回归的无人机激光雷达重定位框架，旨在解决在无GNSS环境下无人机高精度定位的问题。为应对无人机场景中姿态变化大、飞行路径不规则等挑战，SOAR引入了局部保持的滑动窗口注意力模块和局部不变的位置编码，以增强对视角变化的鲁棒性，并设计了坐标无关的特征初始化模块以减少对全局变换的敏感性。此外，作者构建了一个包含4个场景和13条不规则路径的大规模无人机激光雷达定位数据集，显著提升了无人机重定位研究的现实基准。实验表明，SOAR在定位成功率和误差指标上均达到先进水平。

Comments 24 pages, 14 figures

2602.13004 2026-05-13 cs.LG stat.ML

Towards Uncertainty-Aware Federated Granger Causal Learning

Ayush Mohanty, Nazal Mohamed, Nagi Gebraeel

AI总结该研究旨在解决联邦格兰杰因果学习中缺乏不确定性感知的问题，提出了一种能够量化跨客户端因果关系不确定性的方法。通过分析联邦学习框架中不确定性传播的机制，作者推导了客户端与服务器之间协方差的闭式递推公式，并建立了基于谱半径的收敛条件，从而获得了稳态方差的解析表达式。实验表明，该方法能有效区分真实的跨客户端因果关系与虚假连接，优于现有联邦因果结构学习方法。

Comments Manuscript under review

2602.07892 2026-05-13 cs.LG cs.CL

Safety Alignment as Continual Learning: Mitigating the Alignment Tax via Orthogonal Gradient Projection

Guanglong Sun, Siyuan Zhang, Liyuan Wang, Jun Zhu, Hang Su, Yi Zhong

AI总结该研究将安全对齐问题视为持续学习过程，旨在缓解大型语言模型在安全微调过程中可能产生的“对齐税”问题，即安全性能提升带来的通用能力下降。研究提出了一种名为OGPSA的方法，通过正交梯度投影技术，从通用能力数据中估计低秩参考子空间，并从安全梯度中去除该子空间的成分，从而在保证安全目标优化的同时减少对通用能力的负面影响。实验表明，OGPSA在多种微调设置下有效提升了安全与实用性的平衡，且兼容主流微调流程。

2602.07668 2026-05-13 cs.CV cs.AI cs.LG cs.RO

Looking and Listening Inside and Outside: Multimodal Artificial Intelligence Systems for Driver Safety Assessment and Intelligent Vehicle Decision-Making

Ross Greer, Laura Fleig, Maitrayee Keskar, Erika Maquiling, Giovanni Tapia Lopez, Angel Martinez-Sanchez, Parthib Roy, Jake Rattigan, Mira Sur, Alejandra Vidrio, Thomas Marcotte, Mohan Trivedi

AI总结该研究提出了一种融合视觉与音频信息的多模态框架L-LIO，用于提升智能车辆中的驾驶员状态评估与环境理解能力。通过引入音频信号，增强对驾驶员、乘客及车外人员状态的感知，从而在安全气囊部署、自动驾驶接管时间预测等场景中提供更全面的信息支持。实验表明，音频在复杂或语境丰富的场景中能提供关键的安全相关信息，为智能车辆决策系统提供了新的干预路径。

详情

英文摘要

The looking-in-looking-out (LILO) framework has enabled intelligent vehicle applications that understand both the outside scene and the driver state to improve safety outcomes, with examples in smart airbag deployment, takeover time prediction in autonomous control transitions, and driver attention monitoring. In this research, we propose an augmentation to this framework, making a case for the audio modality as an additional source of information to understand the driver, and in the evolving autonomy landscape, also the passengers and those outside the vehicle. We expand LILO by incorporating audio signals, forming the looking-and-listening inside-and-outside (L-LIO) framework to enhance driver state assessment and environment understanding through multimodal sensor fusion. We evaluate three example cases where audio enhances vehicle safety: supervised learning on driver speech audio to classify potential impairment states (e.g., intoxication), collection and analysis of passenger natural language instructions (e.g., "turn after that red building") to motivate how spoken language can interface with planning systems through audio-aligned instruction data, and limitations of vision-only systems where audio may disambiguate the guidance and gestures of external agents. Datasets include custom-collected in-vehicle and external audio samples in real-world environments. Pilot findings show that audio yields safety-relevant insights, particularly in nuanced or context-rich scenarios where sound is critical to safe decision-making or visual signals alone are insufficient. Challenges include ambient noise interference, privacy considerations, and robustness across human subjects, motivating further work on reliability in dynamic real-world contexts. L-LIO augments driver and scene understanding through multimodal fusion of audio and visual sensing, offering new paths for safety intervention.

URL PDF HTML ☆

赞 0 踩 0

2602.06412 2026-05-13 cs.CL cs.LG

Stopping Computation for Converged Tokens in Masked Diffusion-LM Decoding

Daisuke Oba, Danushka Bollegala, Masahiro Kaneko, Naoaki Okazaki

AI总结该研究针对掩码扩散语言模型（Masked Diffusion-LM）在生成过程中重复计算已稳定位置的问题，提出了一种名为SureLock的优化方法。通过在后验分布稳定时锁定该位置，跳过其后续的计算步骤并缓存其注意力键值，从而显著降低计算复杂度。实验表明，该方法在保持生成质量的同时，可减少30%到50%的算法浮点运算量。

Comments Accepted to ICLR 2026

2602.06339 2026-05-13 cs.RO cs.AI

Action Hallucination in Generative Vision-Language-Action Models

Harold Soh, Eugene Lim

AI总结该论文研究了生成式视觉-语言-动作模型在机器人领域中可能出现的动作幻觉问题，即模型生成违反物理约束的动作，进而导致计划层面的失败。研究分析了这类幻觉的成因，指出其源于可行机器人行为与常见模型结构之间的结构性不匹配，并探讨了拓扑、精度和时间跨度三个关键障碍所带来的不可避免的权衡。该工作为生成式机器人策略的失效提供了机制性解释，并为提升其可靠性与可信度指明了理论方向。

Comments 24 pages; updated setup with minor changes to proofs. changed template

2602.04042 2026-05-13 cs.LG stat.ME stat.ML

Partition Tree: Conditional Density Estimation over General Outcome Spaces

Felipe Angelim, Alessandro Leite

AI总结本文提出了一种名为 Partition Tree 的新型树状框架，用于在一般结果空间上进行条件密度估计，能够统一处理连续和分类变量。该方法通过数据自适应划分将条件分布建模为分段常数密度，并直接最小化条件负对数似然来学习树结构，提供了一种无需参数假设的可扩展非参数替代方案。此外，文章还引入了 Partition Forest，通过平均条件密度实现对 Partition Tree 的袋外扩展，并在实验中展示了其在概率预测方面的优越性和与最新方法的竞争力。

Comments Code available at https://github.com/felipeangelimvieira/partition_tree

2602.02799 2026-05-13 cs.LG cs.AI

Joint Learning of Hierarchical Neural Options and Abstract World Model

Wasu Top Piriyakulkij, Wolfgang Lehrach, Kevin Ellis, Kevin Murphy

AI总结该研究旨在开发能够通过组合已有技能学习新技能的智能体，提出了一个名为AgentOWL的新方法，该方法能够高效地联合学习抽象世界模型和分层神经选项。与现有方法相比，AgentOWL在数据效率和技能泛化能力方面表现出显著优势，并在部分以物体为中心的Atari游戏中验证了其有效性。

2602.02408 2026-05-13 cs.CV cs.AI

ReasonEdit: Editing Vision-Language Models using Human Reasoning

Jiaxing Qiu, Kaihua Hou, Roxana Daneshjou, Ahmed Alaa, Thomas Hartvigsen

AI总结 ReasonEdit 是一种用于编辑视觉-语言模型（VLM）的新方法，旨在在不干扰模型其他功能的前提下修正其错误，特别针对需要人类与模型进行推理的视觉问答任务。该方法引入了用户在编辑过程中提供推理解释的机制，并通过一种基于网络科学的多模态嵌入技术，在推理时检索相关事实，从而提升编辑效果。实验表明，ReasonEdit 在多个数据集上取得了当前最优的编辑性能，验证了引入人类推理对模型编辑泛化能力的显著提升。

2602.02133 2026-05-13 cs.AI cs.CL

A Theoretical Analysis of Why Masked Diffusion Models Mitigate the Reversal Curse

Moongyu Jeon, Sangwoo Shin, BumJun Kim, Kyelim Lee, Albert No

AI总结本文理论分析了为何掩码扩散语言模型（MDMs）能够缓解自回归语言模型（ARMs）中的“反转诅咒”问题。研究指出，MDMs通过其任意顺序的掩码训练目标，在参数层面建立了前向与反向条件之间的耦合，使得模型在训练中学习到的词对证据可以迁移到反转查询中。实验验证了这一机制的有效性，表明其有助于提升模型在反转任务中的预测性能。

2602.02007 2026-05-13 cs.CL cs.AI

Beyond RAG for Agent Memory: Retrieval by Decoupling and Aggregation

Zhanghao Hu, Qinglin Zhu, Runcong Zhao, Di Liang, Hanqi Yan, Yulan He, Lin Gui

AI总结本文针对传统检索增强生成（RAG）在智能体记忆应用中的不足，提出了一种新的记忆管理方法xMemory。该方法通过解耦和聚合的原理，将交互历史分解为可复用的事实、更新和区分细节，并构建分层的可修订记忆结构，以提升检索效率和信息准确性。实验表明，xMemory在多个任务和模型上均能有效提升答案质量与推理效率。

Comments Project Address: https://zhanghao-xmemory.github.io/Academic-project-page-template/; Code Address: https://github.com/HU-xiaobai/xMemory

2602.01682 2026-05-13 cs.LG cs.DS stat.ML

Finite and Corruption-Robust Regret Bounds in Online Inverse Linear Optimization under M-Convex Action Sets

Taihei Oki, Shinsaku Sakaue

AI总结本文研究在线逆线性优化问题，即根据随时间变化的可行集上观测到的最优动作，推断隐藏的目标向量，并推荐符合该目标的行动。研究关注在M-凸可行集（如拟阵）下，能否获得与维度多项式相关的有限悔度界。作者通过结合M-凸集最优解的结构特性与几何体积论证，证明了悔度界为 $O(d\log d)$，部分解决了该问题的开放性疑问，并进一步拓展到对抗性噪声场景，给出了无需先验知识的悔度界 $O((C+1)d\log d)$。

2602.01418 2026-05-13 cs.CV cs.LG

Parabolic Position Encoding: Vision-Centric, Principled, Extrapolatable, General

Christoffer Koo Øhrstrøm, Rafael I. Cabral Muchacho, Yifei Dong, Filippos Moumtzidellis, Ronja Güldenring, Florian T. Pokorny, Lazaros Nalpantidis

AI总结本文提出了一种基于抛物线的位置编码方法PaPE，专门用于视觉模态中的注意力架构。该方法从视觉特性的角度出发，结合平移不变性、旋转不变性、距离衰减、方向性和上下文感知等原则进行设计，能够更准确地编码图像、视频、点云等视觉数据中位置信息。实验表明，PaPE在ImageNet-1K等数据集上具有出色的外推能力，并在多个不同模态的数据集上展现出广泛适用性和优越性能。

2602.01103 2026-05-13 cs.AI

Probing RLVR training instability through the lens of objective-level hacking

Yiming Dong, Kun Fu, Haoyu Li, Xinyuan Zhu, Yurou Liu, Lijing Shao, Jieping Ye, Zheng Wang

AI总结本文研究了可验证奖励强化学习（RLVR）在混合专家（MoE）架构中训练不稳定的问题，提出了一种基于目标层“黑客攻击”的分析框架，揭示了训练不稳定性背后的机制。研究发现，训练与推理之间的差距异常增长是导致不稳定的关键病理动态，这一现象此前缺乏机制解释。通过大量实验，本文为设计更稳定的RLVR算法提供了理论指导。

Comments Accepted by ICML 2026

2602.00400 2026-05-13 cs.AI

KEPO: Knowledge-Enhanced Preference Optimization for Multimodal Reasoning with Applications to Medical VQA

Fan Yang, Rui Meng, Trudi Di Qi, Ali Ezzati, Yuxin Wen

AI总结该研究提出了一种名为KEPO的知识增强偏好优化框架，旨在提升多模态模型在医疗视觉问答等复杂推理任务中的表现。针对传统强化学习在稀疏奖励下训练不稳定、探索困难的问题，KEPO引入了质量门控的策略蒸馏机制，仅对高质量轨迹进行教师模型指导，并结合知识引导的探索策略，有效减少噪声干扰，提升推理连贯性与泛化能力。实验表明，KEPO在医疗VQA任务中展现出更优的训练稳定性与分布外性能。

2601.22334 2026-05-13 cs.LG

DP-λCGD: Efficient Noise Correlation for Differentially Private Model Training

Nikita P. Kalinin, Ryan McKenna, Rasmus Pagh, Christoph H. Lampert

AI总结本文提出了一种名为DP-λCGD的高效噪声相关方法，用于提升差分隐私模型训练的准确性。该方法通过仅与前一次迭代的噪声相关，并控制性地抵消部分噪声，减少了对历史噪声存储的需求。与现有方法相比，该方法在保持差分隐私保证的同时，显著降低了内存开销，并在实验中表现出更高的模型精度。

2601.22301 2026-05-13 cs.CV

Coarse-to-Real: Generative Rendering for Populated Dynamic Scenes

Gonzalo Gomez-Nogales, Yicong Hong, Chongjian Ge, Peiye Zhuang, Marc Comino-Trinidad, Dan Casas, Yi Zhou

AI总结传统渲染流程依赖复杂的模型、精确的材质和光照以及大量的计算资源来生成逼真的图像，但在处理包含大量动态人物的场景时仍面临可扩展性和真实感的挑战。本文提出C2R（Coarse-to-Real）生成渲染框架，通过粗略的3D模拟生成具有真实风格的都市人群视频，结合粗略3D渲染对场景布局、相机运动和人物轨迹进行显式控制，并利用学习到的神经渲染器根据文本提示生成逼真的外观、光照和细粒度动态。该方法采用两阶段的合成-真实领域对齐策略，先从大规模真实视频中学习生成先验，再利用少量配对的合成数据引入可控性，实现了从粗略到精细的控制，适用于多种CG和游戏输入，并能从最小的3D输入生成时间一致、可控且逼真的城市场景视频。

Comments Project website at https://gonzalognogales.github.io/coarse2real/

2601.21944 2026-05-13 cs.LG

Clarity: The Flexibility-Interpretability Trade-Off in Sparsity-aware Concept Bottleneck Models

Konstantinos P. Panousis, Diego Marcos

AI总结本文研究了稀疏感知概念瓶颈模型（CBMs）中灵活性与可解释性之间的权衡问题，提出了一种新的评估指标Clarity，用于衡量模型在保持稀疏性和概念激活精度的同时对下游任务的性能影响。通过基于真实概念标注数据集的评估框架，作者对比了多种基于视觉语言模型和属性预测器的CBM方法，并揭示了不同稀疏诱导策略在性能与语义对齐上的显著差异。实验和人类研究验证了Clarity能够更准确地反映人类对模型的信任程度，为可解释性模型的评估提供了新思路。

2601.21351 2026-05-13 cs.LG cs.AI

Analytical Provisioning for Attention-FFN Disaggregated LLM Serving under Stochastic Workloads

Chendong Song, Meixuan Wang, Hang Zhou, Hong Liang, Yuan Lyu, Zixi Chen, Yuwei Fan, Zijie Zhou

AI总结该研究针对分体式注意力-FFN（AFD）架构下的大语言模型服务，在随机工作负载条件下，提出了一个分析性的资源分配框架。研究通过分析每个计算槽的稳态令牌负载，识别出一个关键工作负载指标θ，并据此推导出最优的注意力与FFN计算比例，适用于任意预填充-解码分布。该方法还考虑了同步执行中的瓶颈效应，提供了闭式均场规则及高斯屏障感知的优化，实验表明其预测结果与仿真结果误差在10%以内，为分体式LLM服务的资源分配提供了理论依据和实用指导。

Comments Submitted to Neurips 2026