arXivDaily每日学术速递，同步arXiv全量数据，AI总结、翻译，覆盖人工智能、机器人、计算机、金融、统计学、数学、物理学、生物学、经济学、电气&系统等方向。

2512.23964 2026-05-12 cs.LG cs.AI

DUALFloodGNN: Physics-informed Graph Neural Network for Operational Flood Modeling

Carlo Malapad Acosta, Herath Mudiyanselage Viraj Vidura Herath, Jia Yu Lim, Abhishek Saha, Sanka Rasnayaka, Lucy Marshall

AI总结该论文提出了一种名为 DUALFloodGNN 的物理信息图神经网络模型，用于操作性洪水模拟。该模型通过在全局和局部尺度上嵌入物理约束，结合显式损失函数，实现了对节点水体积和边流量的联合预测。相比传统图神经网络和现有洪水模型，DUALFloodGNN 在预测水文变量（如水体积、流量和水深）方面表现出更高的准确性和计算效率，并且支持快速预测，适用于实际灾害管理场景。

Comments Accepted for publication at the IJCAI-ECAI 2026 AI4Tech track

2512.19995 2026-05-12 cs.CL cs.AI cs.LG

Schoenfeld's Anatomy of Mathematical Reasoning by Language Models

Ming Li, Chenrui Fan, Yize Cheng, Soheil Feizi, Tianyi Zhou

AI总结该研究探讨了大型语言模型在数学推理过程中所展现的思维结构，采用Schoenfeld的“事件理论”作为分析框架，提出了一种名为ThinkARM的可扩展方法，将推理过程抽象为如分析、探索、验证等明确的推理步骤。通过该方法，研究揭示了不同模型在推理过程中的动态特征和结构差异，并通过案例分析表明，探索步骤对推理正确性具有关键影响，效率导向的方法可能抑制评估反馈步骤而非单纯缩短响应。这一工作为系统分析语言模型推理结构提供了新的视角。

Comments ACL2026, camera-ready

2512.17593 2026-05-12 cs.LG math.OC

A Unified Representation of Neural Networks Architectures

Christophe Prieur, Mircea Lazar, Bogdan Robu

AI总结本文研究了神经网络架构在隐藏层神经元数量和隐藏层数目趋于无穷时的极限情况，将其形式化为连续体，并推导了相应的逼近误差。作者首先考虑单隐藏层神经网络，提出了一种广义的无限宽度积分神经网络表示，进而扩展到具有有限积分隐藏层和残差连接的深度残差CNN。通过结合神经ODE与深度残差网络的关系，作者提出了一个统一的分布参数神经网络（DiPaNet）表示，展示了大多数现有有限和无限维神经网络架构均可通过同质化或离散化方法与此表示相关联，为神经网络的理论分析提供了新的视角。

Comments Typographical corrections and additional clarifications, remarks; few new relevant references added and acknowledgements; main results unchanged

2512.15977 2026-05-12 cs.CV

Are vision-language models ready to zero-shot replace supervised classification models in agriculture?

Earl Ranario, Mason J. Earles

AI总结该研究评估了多种开源和闭源的视觉-语言模型（VLMs）在农业图像分类任务中的表现，涉及27个数据集、162个类别和248,000张图像。结果表明，零样本VLMs在多数任务中显著落后于监督学习的基准模型YOLO11，且在开放性提示下性能更低，需借助语义判断等方法提升效果。尽管部分开源模型如Qwen-VL-72B表现接近闭源模型，但整体来看，当前VLMs尚未具备作为独立农业诊断系统的能力，更适合在受限接口和领域知识支持下作为辅助工具使用。

2512.13919 2026-05-12 cs.LG cs.NA math.NA

Adaptive digital twins for predictive decision-making: Online Bayesian learning of transition dynamics

Eugenio Varetti, Matteo Torzoni, Marco Tezzele, Andrea Manzoni

AI总结本文研究了如何通过自适应机制提升数字孪生在土木工程中的价值实现，重点在于利用概率图模型对数字孪生中的状态转移模型进行自适应。通过动态贝叶斯网络建模物理与虚拟域之间的双向交互，并将状态转移概率作为具有共轭先验的随机变量，实现了基于贝叶斯更新的分层在线学习。该方法扩展了现有数字孪生框架中对分布类型的适用范围，并结合强化学习求解参数化马尔可夫决策过程，提升了系统的个性化、鲁棒性和成本效益，实验案例验证了其在铁路桥梁结构健康监测与维护规划中的有效性。

2512.13618 2026-05-12 cs.CL cs.LG

Temporal Tokenization Strategies for Event Sequence Modeling with Large Language Models

Zefang Liu, Nam H. Nguyen, Yinzhu Quan, Shi-Xiong Zhang

AI总结本文研究了在使用大语言模型（LLM）对事件序列进行建模时，如何有效表示连续时间这一关键但尚未充分探索的问题。通过系统比较多种时间编码策略，如数值字符串、高精度字节表示、日历语义标记、均匀分箱和自适应残差量化等，发现不同方法在不同统计分布的数据上表现各异。研究强调，时间标记策略应与数据的统计特性相匹配，揭示了时间标记设计在基于LLM的事件建模中是一个关键但常被忽视的维度。

2512.06949 2026-05-12 cs.CV

Can We Go Beyond Visual Features? Neural Tissue Relation Modeling for Relational Graph Analysis in Non-Melanoma Skin Histology

Shravan Venkatraman, Muthu Subash Kavitha, Joe Dhanith P R, V Manikandarajan, Jia Wu

AI总结在皮肤癌诊断中，组织病理学图像分割对于识别组织结构至关重要，但建模空间上下文和组织间关系仍是一个挑战，尤其是在组织重叠或形态相似的区域。为此，本文提出了一种新的分割框架——神经组织关系建模（NTRM），通过在卷积神经网络中引入图神经网络，建模不同组织类型之间的空间和功能关系，从而提升分割的结构一致性。实验表明，NTRM在非黑色素瘤皮肤癌分割数据集上显著优于现有方法，Dice相似性系数提升了4.9%至31.25%，展示了关系建模在提升分割准确性和可解释性方面的潜力。

Comments CVPR 2026 Workshops

2512.06427 2026-05-12 cs.LG

A new initialisation to Control Gradients in Sinusoidal Neural network

Andrea Combette, Antoine Venaille, Nelly Pustelnik

AI总结本文提出了一种针对正弦激活函数神经网络（如SIREN）的新初始化方法，旨在更好地控制梯度、缓解梯度消失或爆炸问题，并提升模型的训练与泛化能力。该方法通过分析前激活分布和雅可比矩阵方差的收敛性，推导出一种闭式初始化表达式，与原始SIREN方案不同。实验表明，该初始化方法在函数拟合和图像重建任务中显著优于现有方法，尤其在物理信息神经网络任务中表现突出。

2512.04949 2026-05-12 cs.LG cs.AI cs.CL

CARL: Criticality-Aware Agentic Reinforcement Learning

Leyang Shen, Yang Zhang, Chun Kai Ling, Xiaoyan Zhao, Tat-Seng Chua

AI总结本文提出了一种名为CARL的强化学习算法，旨在解决多步任务中传统策略优化方法因假设每一步贡献相同而导致的性能不足问题。CARL通过引入熵作为状态重要性的代理指标，专注于对关键状态的动作进行奖励分配，从而提升训练效率和效果。实验表明，CARL在多种评估场景中均表现出更强的性能和更高的效率。

Comments 18 pages, 6 figures

2511.23332 2026-05-12 cs.CV

UniGeoSeg: Towards Unified Open-World Segmentation for Geospatial Scenes

Shuo Ni, Di Wang, He Chen, Haonan Guo, Ning Zhang, Jing Zhang

AI总结本文提出 UniGeoSeg，一种面向遥感地景的统一开放世界分割框架，旨在解决现有方法在任务定义分散和指令数据有限方面的不足。研究构建了 GeoSeg-1M 数据集，包含大量图像-掩码-指令三元组，并设计了 GeoSeg-Bench 用于评估模型在复杂地景场景中的理解与推理能力。UniGeoSeg 通过任务感知的文本增强、潜在知识记忆和渐进式训练策略，实现了多任务学习，在多个基准测试中表现出色，具有强大的零样本泛化能力。

Comments Datasets and source code were released at https://github.com/MiliLab/UniGeoSeg ; Accepted by CVPR 2026

2511.22963 2026-05-12 cs.RO cs.AI

Commanding Humanoid by Free-form Language: A Large Language Action Model with Unified Motion Vocabulary

Zhirui Liu, Kaiyang Ji, Ke Yang, Yahao Fan, Jingyi Yu, Ye Shi, Jingya Wang

AI总结本文研究了如何使人形机器人理解并执行自由形式的自然语言指令，提出了一个名为Humanoid-LLA的大语言动作模型，能够将自然语言直接转化为可执行的全身运动。该方法通过学习统一的人类-人形机器人运动词汇，解决了语言语义与物理控制之间的对齐问题，并采用两阶段微调框架，结合监督学习与强化学习，提升了运动的物理稳定性和鲁棒性。实验表明，该模型在模拟和真实环境中均能生成多样且物理合理的动作，具有良好的语言指令泛化能力。

Comments Project page: https://humanoidlla.github.io/

2511.22565 2026-05-12 cs.AI cs.DB cs.LG

Counting Still Counts: Understanding Neural Complex Query Answering Through Query Relaxation

Yannick Brunink, Daniel Daza, Yunjie He, Michael Cochez

AI总结本文研究了神经网络在知识图谱上处理复杂查询（CQA）的能力，通过对比神经方法与一种无需训练的查询松弛策略，揭示了神经模型在推理模式上可能存在的局限性。研究发现，神经模型在多个数据集和查询结构上的表现并不一致优于查询松弛方法，且两者检索出的答案重叠较少，结合两者结果能提升性能。这一结果表明，当前神经CQA模型尚未完全涵盖查询松弛所捕捉的推理模式，强调了引入非神经基线和融合松弛原理对未来发展的重要性。

Comments Accepted in Transactions on Machine Learning Research (2026)

2511.07756 2026-05-12 cs.CV

Determinism of Randomness: Prompt-Residual Seed Shaping for Diffusion Generation

Song Yan, Wei Zhai, Chenfeng Wang, Xinliang Bi, Jian Yang, Yancheng Cai, Yusen Zhang, Yunwei Lan, Tao Zhang, GuanYe Xiong, Min Li, Zheng-Jun Zha

AI总结扩散模型从各向同性高斯潜在空间开始生成，但仅改变随机种子会导致生成结果在语义忠实度、构图和视觉质量上出现显著差异。本文通过分析从初始噪声到生成内容的语义映射，揭示了种子敏感性的几何原因：潜在空间中大多数方向对语义变化不敏感，而语义敏感的变化集中在较小的子空间内。基于这一发现，作者提出了一种无需训练的提示残差种子塑造方法，通过注入与语义变化相关的切向分量，将种子拉回到原始高斯分布的壳层，从而在保持先验兼容性的同时提升生成结果的对齐度和质量。

2511.02623 2026-05-12 cs.CL

The Realignment Problem: When Right becomes Wrong in LLMs

Aakash Sen Sharma, Debdeep Sanyal, Manodeep Ray, Vivek Srivastava, Shirish Karande, Murari Mandal

AI总结随着政策和价值观的变化，大型语言模型（LLMs）的对齐目标可能逐渐偏离现实需求，形成对齐-现实鸿沟。本文提出TRACE框架，通过分析现有数据中的对齐冲突，无需重新标注即可实现模型的再对齐。该方法利用一个更强的模型作为判断者，通过三阶段流程优化模型对齐效果，并在多个主流模型上验证了其有效性与通用性。

Comments ICML 2026

2511.01774 2026-05-12 cs.RO cs.SY eess.SY

MOBIUS: A Multi-Modal Bipedal Robot that can Walk, Crawl, Climb, and Roll

Alexander Schperberg, Yusuke Tanaka, Stefano Di Cairano, Dennis Hong

AI总结本文介绍了MOBIUS平台，这是一种能够行走、爬行、攀爬和滚动的双足机器人。该机器人配备四条肢体，包括两只6自由度的机械臂和两只4自由度的腿，结合强化学习与力控制的混合架构，实现了多种运动模式的无缝切换和稳定操作。研究通过硬件实验验证了其在复杂地形中的适应性与操作能力，展示了形态设计、高层规划与控制紧密结合在移动操作与抓取任务中的重要性。

Comments Paper is accepted at the Robotics: Science and Systems conference, held in Sydney, Australia, July 13th-17th, 2026. Alexander Schperberg and Yusuke Tanaka are co-first authors. Both were at the Robotics and Mechanisms Laboratory (RoMeLa) at UCLA when the work started, and are now with Mitsubishi Electric Research Laboratories and ETH Zurich (RSL) respectively

2510.27527 2026-05-12 cs.LG cs.AI

TetraJet-v2: Accurate NVFP4 Training for Large Language Models with Oscillation Suppression and Outlier Control

Yuxiang Chen, Yifan Liu, Xiaoming Xu, Pengle Zhang, Michael Beyer, Martin Rapp, Jun Zhu, Jianfei Chen

AI总结大型语言模型（LLM）的训练成本极高，因此低精度全量化训练（FQT）受到广泛关注。本文提出 TetraJet-v2，一种基于 NVFP4 格式的端到端 4 位 FQT 方法，用于激活、权重和梯度的量化。针对低精度训练中的权重震荡和异常值问题，该方法引入了无偏双块量化、OsciReset 算法和 OutControl 算法，有效提升了训练稳定性和精度。实验表明，TetraJet-v2 在多个大规模模型上实现了接近 BF16 的性能，同时相比 FP8 方法提升了 1.67 倍的训练速度。

2510.25372 2026-05-12 cs.CV cs.LG

Prompt Estimation from Prototypes for Federated Prompt Tuning of Vision Transformers

M Yashwanth, Sharannya Ghosh, Aditay Tripathi, Anirban Chakraborty

AI总结本文研究了如何在联邦学习环境下高效且通用地对视觉Transformer进行提示调优。为了解决全局提示调优泛化性差和个性化调优过拟合的问题，作者提出了PEP-FedPT框架，引入了一种基于类上下文混合提示（CCMP）的新方法，通过全局类原型和客户端类先验动态组合类特定提示，实现样本级提示个性化，而无需存储客户端参数。实验表明，该方法在多个数据集上优于现有方法，为联邦视觉Transformer调优提供了有效解决方案。

Comments Accepted to TMLR 2026

2510.18184 2026-05-12 cs.LG cs.AI

ActivationReasoning: Logical Reasoning in Latent Activation Spaces

Lukas Helff, Ruben Härle, Wolfgang Stammer, Felix Friedrich, Manuel Brack, Antonia Wüst, Hikaru Shindo, Patrick Schramowski, Kristian Kersting

AI总结大型语言模型（LLMs）在生成流畅文本方面表现出色，但其内部推理过程仍不透明且难以控制。为此，研究提出了一种名为ActivationReasoning（AR）的框架，通过在LLMs的潜在激活空间中嵌入显式的逻辑推理，使模型具备系统推理和行为引导的能力。该方法分三个阶段：首先通过稀疏自编码器（SAEs）识别并组织潜在概念表示，其次在推理时将激活的概念映射为逻辑命题，最后通过逻辑规则对这些命题进行推理，生成更高层次的结构、新概念并引导模型行为。实验表明，AR在多项推理任务中表现出良好的鲁棒性和泛化能力，为实现更透明、可控和可审计的AI提供了新路径。

Comments Proceedings of the 14th International Conference on Learning Representations (ICLR 2026)

2510.13397 2026-05-12 cs.LG stat.ML

Assessing the robustness of heterogeneous treatment effects in survival analysis under informative censoring

Yuxin Wang, Dennis Frauen, Jonas Schweisthal, Maresa Schröder, Stefan Feuerriegel

AI总结在临床研究中，由于患者提前退出（dropout）现象普遍，且退出可能与生存时间相关（即信息性删失），导致治疗效果估计存在偏差。本文提出了一种假设较少的框架，用于在信息性删失下评估条件平均处理效应（CATE）估计的稳健性，通过部分识别方法推导出CATE的置信区间，从而识别出在存在信息性删失情况下治疗仍有效的患者子群。此外，作者还提出了一种新型的模型无关元学习方法SurvB-learner，能够与任意机器学习模型结合使用，具有双重稳健性和近似最优效率等良好理论性质，并通过仿真和真实数据实验验证了其有效性。

2510.11233 2026-05-12 cs.CL

CNSocialDepress: A Chinese Social Media Dataset for Depression Risk Detection and Structured Analysis

Jinyuan Xu, Tian Lan, Xintao Yu, Xue He, Hezhi Zhang, Ying Wang, Pierre Magistry, Mathieu Valette, Lei Li

AI总结 CNSocialDepress 是一个用于检测和结构化分析中文社交媒体中抑郁风险的基准数据集。该数据集包含233名用户的44,178条帖子，并由心理专家标注了10,306段与抑郁相关的内容，提供了二分类风险标签及多维心理属性信息，支持细粒度和可解释的抑郁信号分析。实验表明，该数据集在结构化心理画像和大语言模型微调等任务中具有良好的应用效果，为中文语境下的心理健康研究提供了重要资源。

2510.10730 2026-05-12 cs.LG cs.AI stat.ML

Provable Anytime Ensemble Sampling Algorithms in Nonlinear Contextual Bandits

Jiazheng Sun, Weixin Wang, Pan Xu

AI总结本文提出了一种统一的算法框架，用于非线性上下文老虎机中的集成采样，并针对广义线性老虎机和神经网络上下文老虎机两种常见场景，分别给出了广义线性集成采样（GLM-ES）和神经网络集成采样（Neural-ES）方法，并证明了它们的高概率频繁主义遗憾界。研究通过在随机扰动数据上使用最大似然估计维护多个奖励模型参数估计器，解决了非线性模型中的理论挑战，并提供了无需固定时间步长的任意时间版本算法，具有较强的实用性和理论保证。实验结果表明，所提方法在实际中表现优异。

Comments 58 pages, 5 figures, 1 table

2510.10606 2026-05-12 cs.CV

ViSurf: Visual Supervised-and-Reinforcement Fine-Tuning for Large Vision-and-Language Models

Yuqi Liu, Liangyu Chen, Jiazhen Liu, Mingkang Zhu, Zhisheng Zhong, Bei Yu, Jiaya Jia

AI总结 ViSurf 是一种统一的单阶段微调方法，旨在解决大型视觉-语言模型在知识注入与性能提升之间的矛盾。该方法结合了监督微调（SFT）和基于可验证奖励的强化学习（RLVR）的优势，通过将真实标签直接注入RLVR过程，实现外部监督与内部强化的同步优化。ViSurf 还引入了三种新的奖励控制策略以保障训练稳定性，实验表明其在多个基准测试中均优于单独使用SFT、RLVR或传统两阶段方法。

2510.07500 2026-05-12 cs.LG cs.IT math.IT

Black-Box Detection of LLM-Generated Text Using Generalized Jensen-Shannon Divergence

Shuangyi Chen, Ashish Khisti

AI总结本文研究在实际约束下的黑盒检测问题，即在未知源模型与评分模型不匹配、且生成对比样本成本较高的情况下，如何检测机器生成的文本。提出了一种基于参考的检测方法 SurpMark，通过总结文本中 token 惊奇值的动态变化，利用离散化后的状态转移矩阵，并结合广义杰森-香农散度（GJS）与预设的人类和机器参考模型进行对比评分。实验表明，SurpMark 在多个数据集和生成模型上表现优异，具有良好的跨领域和跨生成器鲁棒性。

Comments ICML 2026

2510.04142 2026-05-12 cs.CV cs.AI cs.LG

Turning Drift into Constraint: Robust Reasoning Alignment in Non-Stationary Multi-Stream Environments

Xiaoyu Yang, En Yu, Wei Duan, Jie Lu

AI总结本文研究了在非平稳多流环境中，如何从多个多模态大语言模型中实现鲁棒的推理对齐问题。针对源模型推理分布随时间演变带来的系统性偏差，作者提出了一种新的约束满足框架——自主偏好优化（APO），将模型间差异视为动态负约束，并通过两阶段策略实现对齐：先通过监督引导使目标模型具备源模型的联合能力，再通过约束感知优化生成一致的共识流形。实验表明，该方法在胸部X光解读任务中表现出优越的鲁棒性，并发布了包含七个多模态大模型推理轨迹的CXR-MAX基准数据集。

Comments ICML 2026

2510.03895 2026-05-12 cs.RO cs.CV

NoTVLA: Semantics-Preserving Robot Adaptation via Narrative Action Interfaces

Zheng Huang, Mingyu Liu, Xiaoyi Lin, Muzhi Zhu, Canyu Zhao, Zongze Du, Ye Lin, Xiaoman Li, Yiduo Jia, Hao Zhong, Hao Chen, Chunhua Shen

AI总结该研究提出了一种名为NoTVLA的语义保持型机器人自适应框架，旨在解决视觉-语言-动作（VLA）模型在实际部署中面临的灾难性遗忘问题。其核心方法是通过关注稀疏轨迹而非密集动作序列，结合时间压缩和空间推理剪枝策略，优化轨迹规划并降低计算需求。NoTVLA在多任务评估中表现出优于现有模型的性能，同时显著减少计算资源消耗，并无需依赖腕部摄像头，实现了跨平台部署与零样本泛化能力。

2510.00883 2026-05-12 cs.LG cs.AI

GLAI: GreenLightningAI for Accelerated Training through Knowledge Decoupling

Jose I. Mestre, Alberto Fernández-Hernández, Cristian Pérez-Corral, Manuel F. Dolz, Jose Duato, Enrique S. Quintana-Ortí

AI总结本文提出了一种名为GreenLightningAI（GLAI）的新架构模块，旨在替代传统多层感知机（MLP），通过解耦训练过程中通常纠缠的结构知识和量化知识，实现更高效的训练。GLAI在结构稳定后固定其激活路径，仅优化数值参数，从而在保持MLP通用逼近能力的同时，显著提升了训练效率，平均减少约40%的训练时间。该模块具有通用性，可广泛应用于各类神经网络结构中，并在多种实验设置下表现出与MLP相当或更优的性能。

Comments 20 pages, 2 figures

2509.25080 2026-05-12 cs.LG

Towards a Certificate of Trust: Task-Aware OOD Detection for Scientific AI

Bogdan Raonić, Siddhartha Mishra, Samuel Lanthaler

AI总结在科学人工智能领域，数据驱动模型在天气预测和流体力学等关键任务中广泛应用，但其在面对分布外（OOD）数据时可能失效，如何检测此类失效仍是回归任务中的挑战。本文提出一种基于分数扩散模型的联合似然估计方法，结合输入数据与回归模型预测结果，生成任务感知的可靠性评分。实验表明，该方法在多个科学数据集上能有效反映预测误差，为构建可验证的“信任证书”提供了基础，有助于评估科学人工智能预测的可信度。

2509.24244 2026-05-12 cs.AI

Model Merging Scaling Laws in Large Language Models

Yuanyi Wang, Yanggan Gu, Yiming Zhang, Qi Zhou, Zhaoyi Yan, Congkai Xie, Xinyao Wang, Jianbo Yuan, Hongxia Yang

AI总结本文研究了大语言模型中模型合并的规模定律，通过交叉熵进行衡量。作者发现了一个简洁的幂律关系，揭示了模型规模与专家数量之间的联系，并指出随着模型容量增大，合并效果的下限降低，而专家数量带来的收益则呈现边际递减趋势。该定律适用于不同领域和多种合并方法，能够解释合并过程中收益快速衰减和波动减小的现象，并为模型合并提供了预测性规划的理论依据，为分布式生成式AI系统的发展提供了可预测的扩展原则。

Comments ICML 2026

2509.21892 2026-05-12 cs.CL cs.AI cs.LG

Elastic MoE: Unlocking the Inference-Time Scalability of Mixture-of-Experts

Naibin Gu, Zhenyu Zhang, Yuchen Feng, Yilong Chen, Peng Fu, Zheng Lin, Shuohuan Wang, Yu Sun, Hua Wu, Weiping Wang, Haifeng Wang

AI总结本文研究了混合专家（MoE）模型在推理时动态调整激活专家数量以适应不同硬件和负载需求的问题。传统MoE模型在训练和推理时固定激活专家数，难以应对实际场景中的变化。作者提出了一种新的训练框架Elastic MoE（EMoE），通过同时训练专家在不同组合下的协作能力，并引导路由器做出高质量选择，从而在推理时弹性调整激活专家数量，显著提升了模型在不同预算下的性能表现。实验表明，EMoE在多个大规模MoE架构和基准测试中均取得了更广的扩展范围和更高的峰值性能。

2509.21000 2026-05-12 cs.LG math.OC

Feature Augmentation of GNNs for ILPs: Local Uniqueness Suffices

Qingyu Han, Qian Li, Linxin Yang, Qian Chen, Qingjiang Shi, Ruoyu Sun

AI总结本文研究了如何提升图神经网络（GNN）在求解整数线性规划（ILP）问题中的表现。传统GNN因缺乏节点唯一标识而表达能力受限，而引入全局唯一标识（UID）又会导致泛化性能下降。为此，作者提出了一种局部唯一标识（Local-UID）方案，仅在每个节点的d-hop邻域内保证唯一性，并基于此设计了ColorGNN和ColorUID模型。实验表明，该方法在保持表达能力的同时显著提升了模型在ILP任务上的泛化性能。

Comments 19 pages, 9 Tables