arXivDaily每日学术速递，同步arXiv全量数据，AI总结、翻译，覆盖人工智能、机器人、计算机、金融、统计学、数学、物理学、生物学、经济学、电气&系统等方向。

2605.08268 2026-05-12 cs.MA cs.AI

Insider Attacks in Multi-Agent LLM Consensus Systems

Xiaolin Sun, Zixuan Liu, Yibin Hu, Zizhan Zheng

AI总结本文研究了多智能体大语言模型（LLM）共识系统中的内部攻击问题，即恶意内部智能体在系统内伪装成合法成员，试图破坏其他智能体达成共识的能力。为解决这一问题，作者提出了一种基于世界模型的框架，通过学习良性智能体的潜在行为状态动态，并结合强化学习训练攻击者，以实现对共识过程的有效干扰。实验表明，该方法相比直接使用恶意提示的基线方法，在降低共识成功率和延长分歧时间方面表现更优，展示了该方法在语言驱动的多智能体系统中对抗性攻击中的潜力。

2605.08267 2026-05-12 cs.SE cs.AI cs.DC cs.ET

Execution Envelopes: A Shared Admission Contract for Backend AI Execution Requests

Krti Tallam

AI总结随着企业级AI后端需要处理多种类型的执行请求，如何在不重复构建合同的情况下统一管理这些请求成为挑战。本文提出了一种名为“执行信封”的标准化内部准入对象，用于记录请求的执行内容、所需资源、相关政策范围以及后端最终授予的资源，从而为治理和可观测性提供统一的接入点。该方法不涉及具体服务的调度或授权机制，而是定义了一个描述性的准入接口，能够在后端处理前统一应用治理策略，为现代AI后端提供了一种有用的共享执行准入原语。

Comments Systems paper on backend admission contracts, 12 pages, 4 tables

2605.08266 2026-05-12 eess.IV cs.CV

Coarse-to-Fine: Progressive Image Compression for Semantically Hierarchical Classification

Jungwoo Kim, Jun-Hyuk Kim, Jong-Seok Lee

AI总结本文提出了一种基于语义层次的渐进式图像压缩方法，旨在实现从粗粒度到细粒度的语义可扩展性。该方法通过CLIP嵌入对ImageNet-1K类别进行语义层次划分，并基于通道自回归框架将潜在表示分解为按语义层级排序的通道块，每个块专门优化对应层次的语义信息。实验表明，该方法在低比特率下显著提升了粗粒度识别性能，同时在高比特率下保持了细粒度分类的准确性，为任务自适应图像编码提供了高效且可解释的解决方案。

Comments Accepted at ICIP 2026

2605.08263 2026-05-12 stat.ML cs.IT cs.LG eess.SP math.IT stat.ME

Decentralized Conformal Novelty Detection via Quantized Model Exchange

Kyle Loh, Yu Xiang

AI总结本文研究了在保护隐私和节省带宽的前提下，如何在异构复合零假设分布下实现去中心化的异常检测，并控制全局错误发现率（FDR）。研究提出了一种基于量化模型交换的框架，使各独立代理能够共享本地学习的非一致性评分函数的低精度表示。该方法在保证条件交换性的同时，提供了严格的有限样本FDR控制保障，实验验证了其在保持统计效力的同时显著降低了通信成本。

2605.08262 2026-05-12 cond-mat.mtrl-sci cs.AI

SLayerGen: a Crystal Generative Model for all Space and Layer Groups

Rees Chang, Andrew Novick, Ryan P Adams, Elif Ertekin

AI总结该论文提出了一种名为SLayerGen的晶体生成模型，专门用于生成符合任意空间群或层群对称性的晶体结构，以解决传统模型在处理二维超导体、薄膜半导体等双周期材料时的不足。SLayerGen结合了从粗到细的离散自回归晶格生成、基于Transformer的Wyckoff位置和原子元素采样，以及具有空间或层群等变特性的扩散过程，有效提升了生成材料的对称性准确性。研究还构建了双周期材料数据集，提出了相应的评估指标和对称性表示方法，显著提高了双周期材料的从头生成性能。

2605.08261 2026-05-12 cs.SE cs.AI

Computer Use at the Edge of the Statistical Precipice

Pierluca D'Oro, Sneha Silwal, William Wong, Yuxuan Sun, Fanyi Xiao, Manchen Wang, Eric Gan, Allen Bolourchi, Joseph Tighe

AI总结该论文探讨了在交互式环境中评估计算机使用代理（CUAs）时存在的方法论问题，并揭示了当前评估方法中的关键缺陷。研究指出，简单执行预录操作序列的脚本在某些基准测试中表现优于先进模型，这暴露了环境设计和评估方法的不足。为此，作者提出了PRISM设计原则和DigiWorld基准平台，并开发了一种基于置信区间聚合的评估框架，强调了规范的环境设计和严谨的评估方法对CUA研究的重要性。

2605.08257 2026-05-12 cs.CR cs.AI cs.LG

Research on Security Enhancement Methods for Adversarial Robust Large Language Model Intelligent Agents for Medical Decision-Making Tasks

Saisai Hu

AI总结本文针对医疗决策智能代理在对抗环境下的安全性问题，提出了一种全链路安全增强框架ARSM-Agent，通过输入风险感知、医学证据约束、知识一致性验证、决策置信度重加权和安全输出控制等模块协同工作，有效提升了模型的鲁棒性和安全性。实验表明，该方法在多种攻击场景下显著降低了攻击成功率，并提高了知识一致性得分，验证了其在医疗决策任务中的有效性与可靠性。

Comments 5 pages, 2 figures, 1 table.Accepted for oral presentation at AINIT 2026

2605.08247 2026-05-12 cs.PL cs.AI

LLM Translation of Compiler Intermediate Representation

Andrea Valenzuela Ramirez, Cristian Gutierrez-Gomez, Marta Barroso, Dario Garcia-Gasulla, Sara Royuela

AI总结该研究探讨了使用大语言模型（LLM）实现编译器中间表示（IR）之间的翻译问题，旨在解决不同编译器（如GCC和LLM）之间IR语义和结构差异带来的交互障碍。研究提出了一个名为IRIS-14B的140亿参数Transformer模型，专门用于将GCC生成的GIMPLE IR转换为LLVM IR，并在真实C代码和编程竞赛问题上进行了评估。该模型在翻译准确率上显著优于现有大型模型，是首个专门针对IR到IR翻译训练的模型，为构建混合神经符号编译器架构提供了新的可能性。

详情

英文摘要

GCC and LLVM underpin much of modern software infrastructure, relying on distinct Intermediate Representations (IRs) to drive optimizations and code generation. However, the semantic and structural differences between these IRs create significant barriers for cross-toolchain interaction, limiting the reuse of compiler frontends, backends, and optimization pipelines across programming languages and compilation ecosystems. Traditional rule-based translators have attempted to bridge this gap, but their complexity and maintenance cost have hindered practical adoption. In this context, Large Language Models (LLMs) appear to be an emerging technology that offers a data-driven alternative, capable of learning complex mappings between heterogeneous compiler IRs directly from sufficiently representative examples. To explore this approach, this paper presents IRIS-14B, a 14-billion-parameter transformer model fine-tuned to translate GIMPLE (as emitted by GCC) to LLVM IR (as emitted by LLVM). The model is trained on paired IRs extracted from C sources and evaluated on the GIMPLE-to-LLVM IR transformation applied to IRs derived from real-world C code and competitive programming problems. To the best of our knowledge, IRIS-14B is the first model trained explicitly for IR-to-IR translation. It outperforms the accuracy of widely used models, including the largest state-of-the-art open models available today, ranging from 13 to 1,000 billion parameters, by up to 44 percentage points. The proposed transformation supports the integration of LLMs as complementary components within hybrid neuro-symbolic compiler architectures, where models such as IRIS-14B act as interoperability layers enabling cross-toolchain workflows without modifying existing compiler passes, while traditional compiler infrastructure continues to perform deterministic compilation and optimization.

URL PDF HTML ☆

赞 0 踩 0

2605.08243 2026-05-12 cs.PL cs.DC cs.LG

GPU-Accelerated Synthesis of Mixed-Boolean Arithmetic: Beyond Caching

Gabriel Bathie, Baptiste Mouillon, Nathanaël Fijalkow

AI总结本文研究了从输入输出示例中合成混合布尔算术（MBA）表达式的问题，这对于程序反混淆、编译器优化和密码分析等任务至关重要。现有方法多基于CPU，难以处理大规模或复杂的任务，而近期基于GPU的加速方法虽然提升了效率，但依赖缓存策略，在MBA任务中因输出空间巨大而效果受限。本文提出了一种无需缓存的GPU加速合成工具SIMBA，采用自底向上的枚举策略，实现了高效并行计算，实验表明其在速度和处理规模上均优于现有方法，为定量领域的MBA合成提供了实用且可扩展的新方案。

2605.08242 2026-05-12 q-bio.QM cs.AI cs.LG

An Explainable Unsupervised-to-Supervised Machine Learning Framework for Dietary Pattern Discovery Using UK National Dietary Survey Data

Wing Yi Yu, Chun Yin Chiu

AI总结该研究提出了一种可解释的无监督到有监督机器学习框架，用于利用英国国家饮食与营养调查数据发现和解释饮食模式。通过比较多种聚类算法，研究识别出四种具有饮食学意义的饮食模式，并使用监督分类器验证了其可重复性。该方法不仅提升了饮食数据的解释能力，还为营养师参与的个性化饮食指导提供了潜在支持。

Comments 12 pages, 6 figures, 9 tables. Accepted by the 14th International Conference on Frontiers of Intelligent Computing: Theory and Applications (FICTA 2026)

2605.08233 2026-05-12 eess.SP cs.LG

Inverse Design of Multi-Layer Sub-Pixel-Resolution RF Passives Through Grayscale Diffusion with Flexible S-Parameter Conditioning

Tommaso Dreossi, Christopher M. Bryant, Hao Liu, Nathan Mirman, Noah Kessler, Michael Frei, Harish Krishnaswamy

AI总结本文研究了从部分S参数逆向设计多层射频无源器件的问题，提出了一种基于灰度扩散和灵活S参数条件的生成方法，能够在亚像素分辨率下生成双层铜布线结构，并满足物理约束和多种设计条件。该方法能够在数秒内生成候选设计，预测的S参数与目标误差较小，已通过实际制造验证了其有效性。

2605.08224 2026-05-12 cs.IT cs.SD math.HO math.IT

Uniqueness on a Continuum: Quantifying Tonal Ambiguity Using Information Theory

Michael Seltenreich

AI总结本文提出了一种基于信息论的连续度量方法，用于量化音调模糊性，扩展了传统的“唯一性”概念。该方法解决了原有唯一性概念无法区分具有唯一性的集合、无法捕捉有限转调模式中的层次结构以及无法考虑时间展开等问题。该度量适用于音高类集合和不同调音系统，拓展了音调关系的分析范围，并为音乐理论与分析提供了实用工具。

Comments 14 pages, 6 figures, 9 tables

2605.08211 2026-05-12 eess.SP cs.IT cs.LG math.IT

Learning the Channel Gain from Anywhere to Anywhere via Cross-environment Transformer Estimators

Prasenjit Dhara, Daniel Romero

AI总结本文研究了如何从任意环境中的少量测量数据中高效估计任意两点之间的信道增益地图。为解决传统方法依赖不准确模型或需要大量测量的问题，作者提出了一种基于元学习的Transformer估计器，通过利用不同环境中信道增益地图所共有的空间结构和物理规律，显著减少了所需测量数量。实验表明，该方法在保持估计精度的同时，相比现有方法减少了五倍的测量需求。

2605.08199 2026-05-12 eess.SP cs.LG

Domain-Adaptive Arrhythmia Classification Using a Hybrid Transformer on Wearable Heart Signals

Maedeh H. Toosi, Siamak Mohammadi

AI总结该研究针对可穿戴设备上心律失常分类中因设备差异导致的领域偏移问题，提出了一种融合变换器的混合模型，结合原始心电信号与七种心率变异性特征，分别捕捉心跳形态和节律统计信息。通过最大均值差异（MMD）等表征学习技术对齐不同领域的特征分布，提升模型在未知设备数据上的泛化能力。实验表明，该模型在未见过的可穿戴设备数据上取得了95%的F1-macro和96.15%的平衡准确率，性能下降仅为2%，展示了其在家庭和移动心电监测中的应用潜力。

2605.08192 2026-05-12 cs.CY cs.AI cs.LG cs.SE

NeurIPS Should Require Reproducibility Standards for Frontier AI Safety Claims

Varad Vishwarupe, Nigel Shadbolt, Marina Jirotka, Ivan Flechais

AI总结本文探讨了前沿人工智能安全声明的可复现性问题，指出当前AI安全领域中最具影响力的声明往往缺乏必要的验证材料，导致评估困难。作者建议NeurIPS应制定强制性的可复现性标准，以提升AI安全研究的透明度和可信度。文章提出了一种三级披露框架，并配套强制性声明清单和分阶段实施路径，旨在平衡安全与透明之间的需求。

Comments Preprint

详情

英文摘要

Frontier AI safety claims - published assertions that a highly capable general-purpose model is below a threshold of concern, adequately mitigated, or suitable for release - increasingly shape model deployment, governance, and public trust. Yet the artefacts needed to evaluate them are routinely withheld, producing an evidential inversion: the most consequential claims in AI safety are often the least reproducible. This position paper argues that NeurIPS should require reproducibility standards for papers making such claims, treating non-reproducibility not as a transparency preference but as an evaluation-methodology failure. The 2026 International AI Safety Report [Bengio et al., 2026] concludes that reliable pre-deployment safety testing has become harder to conduct and that models now distinguish test from deployment contexts; the 2025 Foundation Model Transparency Index [Wan et al., 2025] reports a sector-average transparency score of 40/100 with no major developer adequately disclosing train-test overlap; contemporaneous measurement-theory work shows that attack-success-rate comparisons across systems are often founded on low-validity measurements [Chouldechova et al., 2025]. We propose a three-tier disclosure framework, distinguishing public, controlled, and claim-restricted disclosure, paired with a mandatory claim inventory, scope statements, and a phased implementation path with graduated sanctions. The framework treats secrecy and openness as endpoints of a spectrum, with controlled review (via a federated colloquium of qualified secure-review hosts) covering claims whose artefacts cannot be released publicly, and right-scaling claims whose artefacts cannot be reviewed even confidentially. The standard the community applies to its most consequential claims should be at least as high as the standard it applies to its least.

URL PDF HTML ☆

赞 0 踩 0

2605.08187 2026-05-12 eess.SP cs.LG

Towards Interpretable Damage Detection based on Aerodynamic Pressure Measurements

Philip Franz, Max von Danwitz, Gregory Duthé, Alexander Popp, Eleni Chatzi

AI总结本文研究如何基于气动压力测量实现可解释的结构损伤检测，针对现代大型风力涡轮机叶片的结构监测需求，提出使用一种非侵入式、经济的Aerosense传感系统获取气动压力数据。通过实验验证，构建了基于卷积神经网络的损伤检测模型，并结合物理机理与可解释机器学习方法，提升了检测过程的透明性与物理一致性。

Comments 28 pages, 30 figures

2605.08186 2026-05-12 eess.AS cs.AI cs.LG

Rethinking Entropy Minimization in Test-Time Adaptation for Autoregressive Models

Wei-Ping Huang, Chee-En Yu, Guan-Ting Lin, Hung-yi Lee

AI总结本文研究了在测试时自适应（TTA）中熵最小化（EM）方法在自回归模型中的应用问题，指出当前方法缺乏统一的理论基础。作者推导出适用于自回归模型的严格熵最小化公式，证明其目标函数可分解为令牌级策略梯度损失和熵损失，并将以往方法解释为该框架的部分实现。实验表明，该方法在包括噪声、口音和多语言在内的20多个领域中显著提升了Whisper语音识别系统的性能。

Comments Submitted to INTERSPEECH 2026

2605.08184 2026-05-12 eess.SP cs.AI

Improving TMS EEG Signal Quality for Closed-Loop Neuro Stimulation via Source-Domain Denoising

Zhen Tang, Ameer Hamoodi, Stevie Foglia, Aimee Nelson, Zhen Gao

AI总结本研究旨在提升经颅磁刺激（TMS）诱发脑电（EEG）信号的质量，以支持闭环神经调控应用。通过构建一个经过严格预处理的参考数据集，评估了两种常用的基于源的伪影去除方法，并验证了其对信号质量提升和TMS诱发电位保留的效果。研究提出的预处理流程具有良好的鲁棒性，有助于提高数据可靠性，并为未来脑机接口（BCI）系统集成及临床与科研应用提供了基础支持。

2605.08180 2026-05-12 cs.IT cs.AI cs.IR cs.LG cs.NI eess.SP math.IT

Information Density as a Quantitative Measure for AI-enabled Virtual Sensing: Feasibility and Limits

Hrishikesh Dutta, Roberto Minerva, Reza Farahbakhsh, Noel Crespi

AI总结本文提出信息密度作为量化指标，用于支持传感器部署和实现人工智能驱动的虚拟传感。研究通过利用传感器信号在空间、时间和跨模态间的相关性，在没有物理传感器的情况下完成感知任务，并提出了两种互补的度量方法——特征空间中的相位和互信息，用于评估信息密度，从而优化传感器配置。实验验证表明，在一定误差范围内，虚拟传感器可有效替代物理传感器，展现出在智能环境中构建可扩展、节能感知系统的重要潜力。

Comments IEEE Transactions on Sustainable Computing (2026)

2605.08179 2026-05-12 eess.SP astro-ph.IM cs.LG

Neural Posterior Estimation of Terrain Parameters from Radar Sounder Data

Jordy Dal Corso, Annalena Kofler, Marco Cortellazzi, Lorenzo Bruzzone, Bernhard Schölkopf

AI总结本文研究如何从雷达声纳数据中估计地形参数，提出了一种基于模拟的推理方法，利用GPU加速的模拟器生成合成观测数据，训练神经网络进行后验密度估计。该方法通过引入参考地表假设，系统评估后验对地表变化的鲁棒性，并在模拟数据和实际火星雷达剖面中验证了模型的校准性和迁移能力，为行星地表参数分析提供了新的工具。

Comments 5 pages, 3 figures; accepted at IGARSS 2026, 9 - 14 August 2026, Washington D.C., USA

2605.08164 2026-05-12 cs.DC cs.AI cs.CR

parHSOM: A novel parallel Hierarchical Self-Organizing Map implementation

Rebekah Lane, Logan Cummins, Andy Perkins, George Trawick, Ioana Banicescu, Sudip Mittal

AI总结本文提出了一种新型的并行分层自组织映射（parHSOM）架构，旨在解决传统分层自组织映射（HSOM）在处理大规模数据集时训练速度慢的问题。通过引入并行计算机制，parHSOM在多个测试平台和网络安全数据集上均表现出更快的训练速度，且性能损失不显著。该研究为未来探索并行HSOM的实现提供了实验平台，对构建高效、可解释的网络安全入侵检测系统具有重要意义。

2605.08152 2026-05-12 cs.DC cs.AI

Privacy-Preserving Federated Learning: Integrating Zero-Knowledge Proofs in Scalable Distributed Architectures

Divya Gupta

AI总结本文研究了如何在可扩展的分布式架构中实现隐私保护的联邦学习，提出了一种集成零知识证明（ZKP）的新架构，以增强联邦学习过程中的安全性与效率。该方法通过在全局聚合前对节点计算进行密码学验证，有效防御模型中毒攻击，同时保持数据隐私。实验表明，该混合架构在对抗性条件下仍能保持高达94.2%的准确率，并支持千节点规模的高效分布式训练。

2605.08140 2026-05-12 physics.ins-det cs.AI cs.LG

Forecasting Source Stability in Scientific Experiments using Temporal Learning Models: A Case Study from Tritium Monitoring

Nicholas Tan Jerome, Nadia Aouadi, Christoph Koehler, Suren Chilingaryan, Andreas Kopmann

AI总结该研究针对卡尔斯鲁厄氚中微子实验（KATRIN）中氚气源稳定性预测的问题，利用深度学习时间序列模型，如LSTM、N-BEATS等，对实验中稀疏且瞬时的不稳定性事件进行建模与预测。研究揭示了在稀疏事件学习和长期时间预测方面存在的挑战，并发现N-BEATS模型在准确性和可重复性上表现最佳，展示了深度学习在优化大型物理实验中的潜力。该成果有助于提升实验调度与维护效率，对实验运行具有直接应用价值。

2605.08139 2026-05-12 cs.DC cs.AI

Intelligent Autonomous Orchestration for Distributed Cloud Resources using Complex-Stability Analysis

Gopal Krishna Shyam, Priyanka Bharti

AI总结在现代分布式云环境中，传统扩展机制常因网络延迟导致资源抖动，为此本文提出了一种基于复数稳定性分析的智能自主调度框架C-SAS。该方法通过解析复平面上的系统行为，将监控噪声转化为确定性的“安全区域”，并利用解析稳定性指数实时抑制不必要的资源波动，从而显著提升系统稳定性与资源效率。实验表明，C-SAS将虚拟机抖动降低了94%，资源利用率达到了96%，优于传统PID和基于机器学习的调度方法，为未来高可靠性云基础设施提供了新的思路。

Comments 7 pages

2605.08124 2026-05-12 cs.DC cs.CL cs.MA cs.NI

Scaling Mobile Agent Systems: From Capability Density to Collective Intelligence

Bowei He

AI总结移动代理系统作为在边缘设备和AIoT生态中实现智能应用的关键范式，其可扩展性受到设备计算能力有限和智能分布碎片化的制约。本文提出了一种统一的研究框架，从两个互补方向推动移动代理系统的扩展：一方面通过紧凑基础模型设计与压缩提升单个代理的能力密度，另一方面借助丰富的多代理协作实现群体智能。该研究旨在将孤立的移动代理转化为高效且可扩展的分布式智能系统。

Comments Accepted by ACM MobiSys 2026

2605.08121 2026-05-12 cs.DC cs.LG

Performance and Energy Trade-Off Analysis of Hierarchical Federated Learning for Plant Disease Classification

Athanasios Papanikolaou, Athanasios Tziouvaras, Pavlos Stoikos, Apostolos Xenakis, Shameem A Puthiya Parambath, George Floros, Enrica Zereik, Ivan Petrovic, Fabio Bonsignorio

AI总结本文研究了分层联邦学习在植物病害分类中的性能与能耗权衡问题，针对大规模物联网环境下的计算成本和能效挑战，提出了一种兼顾模型性能与能量效率的优化框架。通过设计空间探索，分析了不同模型与聚合策略的组合效果，并实验验证了多种卷积神经网络架构在分层联邦架构下的表现，揭示了不同配置在准确率与资源消耗之间的显著差异。

Comments Accepted for publication at the 2026 ERAS Conference

2605.08117 2026-05-12 eess.SP cs.CV cs.LG

Modular Retrieval-Augmented Generalization for Human Action Recognition

Peng Liao, Shangsong Liang, Lin Chen, Peijia Zheng

AI总结本文提出了一种名为MoRA的模块化检索增强通用化方法，专门用于惯性测量单元（IMU）的人类动作识别任务。该方法能够灵活集成到现有动作识别模型中，在提升识别性能的同时保持推理效率。通过引入不确定性自适应融合单元，MoRA有效解决了检索信息冗余和融合策略僵化的问题，结合IMU信号中的物理知识动态调整融合策略，显著提升了模型的鲁棒性和识别效果。实验结果表明，MoRA在多个真实数据集上均取得了稳定的性能提升。

Comments ICME 2026

2605.08115 2026-05-12 cs.GR cs.CV cs.LG

Alice v1: Distillation-Enhanced Video Generation Surpassing Closed-Source Models

Wang Xiaoyu, Phong Nguyen, Chen Zhao

AI总结本文介绍了Alice v1，一个拥有140亿参数的开源视频生成模型，通过引入一致性蒸馏与分数正则化（rCM）方法，在视频质量上达到了当前最优水平。该模型不仅在生成速度上比教师模型提升了7倍，还在多个自动评估基准中超越了教师模型及多个闭源系统。研究提出了三种关键机制，包括分数正则化聚焦高质量输出、针对性合成数据提升薄弱环节以及一致性约束实现隐式正则化，为开源视频生成研究提供了完整的技术方案和资源支持。

2605.08112 2026-05-12 cs.SE cs.AI cs.CE cs.LG cs.LO

Context-Augmented Code Generation: How Product Context Improves AI Coding Agent Decision Compliance by 49%

Drew Dillon, Kasyap Varanasi

AI总结该研究探讨了如何通过引入产品上下文信息来提升AI编程代理在遵循团队特定决策方面的表现。研究构建了一个受控基准，用于衡量AI在8个真实软件工程任务中对41个决策点的遵循程度，并对比了仅基于代码库的基线配置与加入产品上下文检索系统的增强配置。实验表明，增强配置在相同任务和代码库下，决策遵循率从46%提升至95%，提升了49个百分点，验证了产品上下文信息对提高AI编码代理决策一致性的重要作用。

Comments 16 pages, 3 figures, 16 tables. Benchmark repository: https://github.com/brief-hq/dcbench

2605.08103 2026-05-12 physics.comp-ph cond-mat.mtrl-sci cs.AI

Crystal Fractional Graph Neural Network for Energy Prediction of High-Entropy Alloys

Takanori Kotama, Yang Huang

AI总结本文提出了一种晶体分数图神经网络，用于预测高熵合金的能量，该方法通过整合局部原子环境与全局组分信息，提升了预测精度。模型包含晶体图神经网络、分数神经网络和特征融合网络三个部分，分别学习局部相互作用、全局元素比例以及融合特征进行能量预测。实验表明，该模型在1049个晶体结构数据集上训练后，在198个四元结构上验证，其均方根误差与第一性原理计算相当，尤其在低能量配置下仍保持较高准确性。