arXivDaily每日学术速递，同步arXiv全量数据，AI总结、翻译，覆盖人工智能、机器人、计算机、金融、统计学、数学、物理学、生物学、经济学、电气&系统等方向。

2605.08130 2026-05-12 cs.LG

Additive Atomic Forests for Symbolic Function and Antiderivative Discovery

Reda Belaiche

AI总结本文提出了一种从数据中同时恢复函数及其原函数的符号表达式的方法。该方法基于一种导数代数，通过递归应用乘积法则和链式法则，结合两个基础原语EML和SOL，构建一个能够自我扩展的函数-导数对库。通过“加法原子森林”结构，该方法能够在无需显式积分的情况下，同时拟合函数及其导数，实验表明其在多个数据集上表现优异并能生成可解释的公式。

2605.08129 2026-05-12 cs.LG

Towards Customized Multimodal Role-Play

Chao Tang, Jianzong Wu, Qingyu Shi, Ye Tian, Aixi Zhang, Hao Jiang, Jiangning Zhang, Yunhai Tong

AI总结该论文提出了一种新的任务——定制化多模态角色扮演（CMRP），旨在同时定制角色的个性、对话风格和视觉身份，并在文本和图像生成中保持跨模态的一致性。研究构建了包含20个角色的RoleScape-20数据集，并设计了基于统一模型的两阶段训练框架UniCharacter，通过少量样本即可实现对角色的高效定制。实验表明，该方法在角色生成任务中显著优于现有方法，为下一代具有角色特征和沉浸感的交互智能体提供了基础。

Comments Code available at https://github.com/Tangc03/UniCharacter Project page available at https://tangc03.github.io/UniCharacter.github.io/

2605.08128 2026-05-12 cs.LG cs.AI

Towards Universal Gene Regulatory Network Inference: Unlocking Generalizable Regulatory Knowledge in Single-cell Foundation Models

Jiaxin Qi, Hang Li, Yan Cui, Yuhua Zheng, Jianqiang Huang

AI总结该论文旨在解决单细胞基础模型（scFMs）在基因调控网络（GRN）推断中的泛化能力不足问题。研究提出了一种新的基准测试，用于评估模型在未见基因和数据集上的调控预测能力，并设计了两种新方法——虚拟值扰动和梯度轨迹，以从scFMs中提取隐含的调控信息，生成高度泛化的基因间特征。实验表明，该方法显著优于现有技术，为利用scFMs实现通用GRN推断提供了新范式。

Comments Accepted to the 43rd International Conference on Machine Learning (ICML 2026)

2605.08119 2026-05-12 cs.LG cs.AI

Feature Repulsion and Spectral Lock-in: An Empirical Study of Two-Layer Network Grokking

Yongzhong Xu

AI总结该研究探讨了两层网络在“grokking”现象中的特征排斥与谱锁定机制。通过实验证明，特征相似性在参数更新中表现出明确的符号规律，并在特定激活函数下产生可检测的谱特征。研究发现，特征排斥的效应与激活函数密切相关，不同激活下参数更新的谱结构存在显著差异，揭示了特征学习与权重更新之间的非对称关系。

Comments 11 pages, 4 figures

2605.08114 2026-05-12 cs.LG cs.IT cs.MS math.IT

Statistical Inference and Quality Measures of KV Cache Quantisations Inspired by TurboQuant

Paolo D'Alberto

AI总结本文研究了三种在相同比特预算下的KV缓存量化方案（KV、KQV和QKQV），分析了它们在不同分布和秩下的性能差异。通过统计推断和信息度量，揭示了QJL量化在K方向上会放大内积方差，并通过softmax非线性放大效应进一步影响模型表现。实验发现，KQV在多数实际场景下表现最优，而QKQV在某些预算下表现更佳，揭示了预算依赖的性能交叉现象，为量化与率失真理论提供了新的见解。

Comments 23 pages, 7 Figures, multiple tables, the process is highly assisted by AI

2605.08113 2026-05-12 cs.LG cs.CV

Do Foundation Model Embeddings Improve Cross-Country Crop Yield Generalisation? A Leave-One-Country-Out Evaluation in Sub-Saharan Africa

Yaw Osei Adjei

AI总结本文研究了基础模型嵌入在跨国家玉米产量预测中的表现，特别是在撒哈拉以南非洲地区。通过留一国交叉验证方法，对比了Prithvi-EO-1.0-100M和ViT-Base等基础模型嵌入与传统Sentinel-2光谱特征的性能，发现所有特征集在跨国家测试中均表现不佳，R²值普遍为负。研究指出，产量分布的国家间差异是影响泛化能力的主要因素，而非特征表示的质量，并为此提供了可复现的负基准以供未来研究参考。

Comments 9 pages, 10 figures, appendix, code and processed results released publicly

2605.08111 2026-05-12 cs.LG cs.AI stat.ME

TTCD:Transformer Integrated Temporal Causal Discovery from Non-Stationary Time Series Data

Omar Faruque, Sahara Ali, Xue Zheng, Jianwu Wang

AI总结该论文提出了一种名为TTCD的新型端到端框架，用于从非平稳时间序列数据中发现瞬时和滞后因果关系。TTCD结合了Transformer架构，引入了非平稳特征学习模块和自定义因果结构学习模块，通过重建引导的因果信号蒸馏方法，有效抑制噪声和虚假相关性，从而在无需强统计假设的前提下推断出潜在的因果图。实验表明，TTCD在多种合成和真实数据集上均优于现有方法，展现出在复杂现实场景中进行因果发现的有效性。

Comments 18 Pages

2605.08110 2026-05-12 cs.LG cs.AI

BaLoRA: Bayesian Low-Rank Adaptation of Large Scale Models

Dario Coscia, Sindy Löwe, Max Welling

AI总结本文提出了一种名为BaLoRA的贝叶斯低秩适配方法，用于在降低计算成本的前提下对大规模预训练模型进行微调。该方法通过引入输入自适应的贝叶斯参数化方式，对传统LoRA的低秩矩阵进行扩展，在几乎不增加参数和计算量的情况下，不仅提供了校准良好的不确定性估计，还显著提升了预测精度，缩小了与全量微调之间的性能差距。实验表明，BaLoRA在材料预测等任务中表现出更强的误差关联性和计算效率。

2605.08109 2026-05-12 cs.LG cond-mat.mtrl-sci physics.flu-dyn

Geometry-free prediction of inertial lift forces in microfluidic devices using deep learning

Jesse Ward-Bond, Ali Mashadian, Timothy C. Y. Chan, Edmond W. K. Young

AI总结本文提出了一种基于深度学习的几何无关方法，用于预测微流控器件中的惯性提升力，无需显式输入几何参数。该方法通过引入新的参数集训练神经网络模型，不仅在训练集中的通道几何结构上表现优异，还能有效推广到未见过的几何结构。研究成果可直接应用于粒子追踪仿真软件，准确预测多种通道设计下的粒子迁移行为，为微流控系统的设计与优化提供了高效工具。

2605.08104 2026-05-12 cs.LG

Distributional Reinforcement Learning via the Cramér Distance

Vanya Aziz, Ivo Nowak, E. M. T Hendrix

AI总结本文研究了在分布强化学习框架下应用软演员评论家（SAC）算法，并提出了一种基于克拉默距离的分布软演员评论家算法（C-DSAC）。该方法通过最小化平方克拉默距离来学习状态-动作值的分布，实验结果表明其在多个机器人基准任务中优于传统SAC及其他分布方法，尤其在复杂环境中表现更优。研究还分析指出，该方法的高效性部分归因于其基于置信度的Q值更新机制，能够有效抑制值估计的过估计问题。

2605.08102 2026-05-12 cs.LG stat.ML

Path-Based Gradient Boosting for Graph-Level Prediction

Claudio Meggio, Johan Pensar, Riccardo De Bin

AI总结本文提出了一种名为PathBoost的梯度树提升方法，用于图级别的分类与回归任务，能够直接从图结构中学习具有判别性的路径特征。该方法在原有针对化学应用的工作基础上进行了三项关键扩展，包括对二分类任务的适配、多节点和边属性的融合以及自动选择锚点节点。实验表明，PathBoost在多个基准数据集上表现优异，尤其在节点数量较多的图上效果更佳，展示了基于路径的提升方法在复杂图任务中的竞争力。

Comments 20 Pages, 1 figure

2605.08098 2026-05-12 cs.LG

Reinforcement learning for inverse structural design and rapid laser cutting of kirigami prototypes

Milad Yazdani, Shahriar Shalileh, Dena Shahriari

AI总结该研究提出了一种基于强化学习的逆向结构设计框架RL-Kirigami，用于快速生成可变形的Kirigami结构并实现激光切割。该方法结合最优运输条件流匹配与强化学习，有效解决了非线性展开、几何兼容性及切割布局可行性等问题。实验表明，该方法在生成精度和效率方面显著优于传统求解器，且能直接输出设计图纸并实现快速制造。

2605.06241 2026-05-12 cs.CL

Rethinking RL for LLM Reasoning: It's Sparse Policy Selection, Not Capability Learning

Ömer Faruk Akgül, Rajgopal Kannan, Willie Neiswanger, Viktor Prasanna

AI总结该论文重新审视了强化学习（RL）在大语言模型（LLM）推理能力提升中的作用，指出RL并非教会模型新策略，而是重新分配模型已有解的概率权重。研究发现，RL的实际效果主要体现在少数高熵决策点上的稀疏修正，这些修正无需RL训练即可通过模型自身熵值识别，并可通过一种名为ReasonMaxxer的简洁方法实现，其性能可与完整RL相当，但训练成本大幅降低。

2605.05443 2026-05-12 cs.CL cs.AI

SLAM: Structural Linguistic Activation Marking for Language Models

Fabrice Harel-Canada, Amit Sahai

AI总结本文提出了一种名为SLAM的新型白盒语言模型水印方案，通过在语言模型的结构几何中嵌入水印，而非改变词频分布，从而在不显著影响文本质量的前提下实现高精度检测。该方法利用稀疏自编码器识别编码语言结构的残差流方向，并在生成时对这些方向进行因果引导，保持词汇采样和语义的自由度。实验表明，SLAM在Gemma-2 2B和9B模型上实现了100%的检测准确率，质量损失仅为1-2个奖励点，远低于现有方法，同时保持了自然性和多样性。

Comments Under review

2604.24934 2026-05-12 cs.RO cs.SY eess.SY

TEACar: An Open-Source Autonomous Driving Platform

Zhongzheng Zhang, Maxwell Ruyle, Andrew Kappes, Tyler Ruble, William Shaoul, Dana Moreno, Jack Penn, Ivan Ruchkin

AI总结本文介绍了一款名为TEACar的开源自动驾驶平台，旨在为智能交通系统（ITS）提供硬件在环的实验验证环境。该平台采用模块化机械架构和基于ROS 2的软件系统，通过四层结构实现感知、计算、执行和供电子系统的物理解耦，提升了结构刚性和可重构性。实验表明，TEACar在机械稳定性、计算能力和系统鲁棒性方面表现良好，为ITS研究、教育和开发提供了一个可扩展、模块化且成本低廉的测试平台。

2604.18486 2026-05-12 cs.CV cs.CL cs.RO

Xiaomi OneVL: One-Step Latent Reasoning and Planning with Vision-Language Explanation

Jinghui Lu, Jiayi Guan, Zhijian Huang, Jinlong Li, Guang Li, Lingdong Kong, Yingyan Li, Han Wang, Shaoqing Xu, Yuechen Luo, Fang Li, Chenxu Dang, Junli Wang, Tao Xu, Jing Wu, Jianhua Wu, Xiaoshuai Hao, Wen Zhang, Tianyi Jiang, Lingfeng Zhang, Lei Zhou, Yingbo Tang, Jie Wang, Yinfeng Gao, Xizhou Bu, Haochen Tian, Yihang Qiu, Feiyang Jia, Lin Liu, Yigu Ge, Hanbing Li, Yuannan Shen, Jianwei Cui, Hongwei Xie, Bing Wang, Haiyang Sun, Jingwei Zhao, Jiahui Huang, Pei Liu, Zeyu Zhu, Yuncheng Jiang, Zibin Guo, Chuhong Gong, Hanchao Leng, Kun Ma, Naiyan Wang, Guang Chen, Kuiyuan Yang, Hangjun Ye, Long Chen

AI总结该研究提出了一种名为Xiaomi OneVL的统一视觉-语言-动作（VLA）与世界模型框架，旨在解决基于链式思维（CoT）的自动驾驶轨迹预测中推理延迟过高的问题。其核心方法通过引入视觉世界模型解码器和语言解码器，引导隐空间学习道路几何、代理运动和环境变化的因果动态，从而在保持推理准确性的前提下实现单步并行推理。实验表明，OneVL在多个基准测试中首次超越了显式CoT方法，在保持预测速度的同时提升了精度，验证了世界模型监督下隐式CoT方法的优越性。

Comments Technical Report; 49 pages, 22 figures, 10 tables; Project Page at https://xiaomi-embodied-intelligence.github.io/OneVL GitHub at https://github.com/xiaomi-research/onevl

2604.15113 2026-05-12 cs.AI

HyperSpace: A Generalized Framework for Spatial Encoding in Hyperdimensional Representations

Shay Snyder, Andrew Capodieci, David Gorsich, Maryam Parsa

AI总结本文提出了一种名为HyperSpace的开源框架，用于对超维度表示中的空间编码进行模块化操作，包括编码、绑定、捆绑、相似性计算、清理和回归等。通过该框架，研究者对比分析了两种典型的VSA后端——HRR和FHRR，在实际应用中发现尽管FHRR在单个操作上的理论复杂度较低，但由于相似性和清理操作在空间领域占主导，两者在端到端性能上表现相当。此外，HRR在内存占用方面具有优势，仅为FHRR的一半，揭示了VSA系统在实际部署中的权衡因素。

2604.15016 2026-05-12 cs.LG

DLink: Distilling Layer-wise and Dominant Knowledge from EEG Foundation Models

Jingyuan Wang, Zhihao Jia, Chenyu Liu, Xinliang Zhou, Haoran Luo, Ziyu Jia, Yong Li, Fang Li, Junfeng Yao, Yi Ding

AI总结本文提出DLink方法，旨在从脑电基础模型（EFM）中高效提取层间和主导知识，以提升知识蒸馏的效果。DLink通过光谱引导的蒸馏框架和输入条件化的层路由机制，将EFM中分散在中间层的任务判别信息有效传递给紧凑的学生模型，并通过幅度和相位谱对齐减少压缩带来的谱失真。实验表明，DLink在多个脑电基准数据集上显著提升了紧凑模型的性能，同时大幅降低了参数量、计算量和推理延迟。

2604.02474 2026-05-12 cs.LG stat.ML

Time-Warping Recurrent Neural Networks for Transfer Learning

Jonathon Hirschi

AI总结本文研究了如何利用时间拉伸方法在循环神经网络（RNN）中实现迁移学习，以应对物理系统在不同环境条件下演化速度变化的问题。提出的方法基于对时间尺度的重新标定，证明了LSTM可以高精度逼近一类线性微分方程模型，并在保持精度的前提下进行时间拉伸。该方法在预测燃料含水率的应用中得到验证，实验表明，仅调整少量参数即可实现对不同时间尺度数据的准确预测，效果与现有迁移学习方法相当。

2603.29261 2026-05-12 cs.LG cs.AI

Monodense Deep Neural Model for Determining Item Price Elasticity

Lakshya Garg, Sai Yaswanth, Deep Narayan Mishra, Karthik Kumaran, Anupriya Sharma, Mayank Uniyal

AI总结本文提出了一种名为Monodense的深度神经网络模型，用于从大规模交易数据中估计商品的价格弹性，无需依赖对照组设置。该模型结合嵌入层、密集层和Monodense层，能够更准确地捕捉消费者对价格变化的响应。实验结果表明，与传统的机器学习方法相比，Monodense模型在多类别零售数据上表现出更优的弹性估计性能，有助于企业优化定价策略和提升收益。

详情

DOI: 10.1109/AAIML67890.2026.11498150
Journal ref: 2026 International Conference on Advances in Artificial Intelligence and Machine Learning (AAIML)

英文摘要

Item Price Elasticity is used to quantify the responsiveness of consumer demand to changes in item prices, enabling businesses to create pricing strategies and optimize revenue management. Sectors such as store retail, e-commerce, and consumer goods rely on elasticity information derived from historical sales and pricing data. This elasticity provides an understanding of purchasing behavior across different items, consumer discount sensitivity, and demand elastic departments. This information is particularly valuable for competitive markets and resource-constrained businesses decision making which aims to maximize profitability and market share. Price elasticity also uncovers historical shifts in consumer responsiveness over time. In this paper, we model item-level price elasticity using large-scale transactional datasets, by proposing a novel elasticity estimation framework which has the capability to work in an absence of treatment control setting. We test this framework by using Machine learning based algorithms listed below, including our newly proposed Monodense deep neural network. (1) Monodense-DL network -- Hybrid neural network architecture combining embedding, dense, and Monodense layers (2) DML -- Double machine learning setting using regression models (3) LGBM -- Light Gradient Boosting Model We evaluate our model on multi-category retail data spanning millions of transactions using a back testing framework. Experimental results demonstrate the superiority of our proposed neural network model within the framework compared to other prevalent ML based methods listed above.

URL PDF HTML ☆

赞 0 踩 0

2603.22421 2026-05-12 cs.CV

OsteoFlow: Lyapunov-Guided Flow Distillation for Predicting Bone Remodeling after Mandibular Reconstruction

Hamidreza Aftabi, Faye Yu, Brooke Switzer, Zachary Fishman, Eitan Prisman, Antony Hodgson, Cari Whyne, Sidney Fels, Michael Hardisty

AI总结本文提出了一种名为OsteoFlow的流模型框架，用于从术后第五天的CT扫描预测下颌骨重建后的第一年骨重塑情况。其核心方法是基于李雅普诺夫引导的轨迹蒸馏技术，通过从配准得到的静态速度场中学习连续的演化轨迹，从而在保证解剖准确性的同时提升长期预测的一致性。实验表明，该方法在344对感兴趣区域上显著优于现有方法，手术切除区域的平均绝对误差降低了约20%，展示了轨迹蒸馏在长期医学影像预测中的潜力。

2603.14681 2026-05-12 cs.LG

Generalized Hierarchical Bayesian Segmentation with Irregular Designs, Multi-Sequence Hierarchies, and Grouped/Latent-Group Designs

Omid Shams Solari

AI总结该论文提出了一种名为 BayesBreak 的模块化贝叶斯分割框架，旨在解决具有不规则设计、多序列层次结构以及分组/潜在分组设计的数据分割问题。该方法将局部块评分与全局推理分离，通过动态规划结合各候选块的边际似然，实现对分割数量、边界和潜在信号的后验推断。研究支持多种先验设计和非共轭模型的近似推断，并提供了后验奇数的稳定性保证，适用于包括地质、基因组学和金融等多领域的实际数据分析。

2603.10960 2026-05-12 cs.LG math.ST stat.TH

Ranking Reasoning LLMs under Test-Time Scaling

Mohsen Hariri, Michael Hinczewski, Jing Ma, Vipin Chaudhary

AI总结本文研究了在测试时缩放（test-time scaling）条件下对推理大语言模型（LLMs）进行排名的问题，提出了一个名为Scorio的开源库，实现了多种统计排名方法，如配对比较模型、项目反应理论模型等。实验表明，在多个数学基准测试中，多数方法的排名结果与贝叶斯黄金标准高度一致，且部分方法在单次试验下仍能保持较高一致性。研究为不同预算下的模型排名提供了可靠的解决方案。

Comments Code is available at https://github.com/mohsenhariri/scorio

2603.04333 2026-05-12 cs.LG cs.AI

What Does Flow Matching Bring To TD Learning?

Bhavya Agrawalla, Michal Nauman, Aviral Kumar

AI总结该论文探讨了流匹配（flow matching）在时序差分（TD）强化学习中的作用，揭示了其相较于传统价值函数估计方法的优势。研究指出，流匹配通过积分过程中的逐步值读取和密集速度监督，提升了TD学习的稳定性与效率，具体表现为测试时误差的逐步恢复和网络更具可塑性的特征学习。实验表明，流匹配方法在高UTD在线学习等挑战性场景中显著优于传统方法，表现出更高的性能和样本效率。

Comments Added code link, updated acknowledgements

2602.07209 2026-05-12 cs.RO

Continuum Robot Localization using Distributed Time-of-Flight Sensors

Spencer Teetaert, Giammarco Caroleo, Marco Pontin, Sven Lilge, Jessica Burgner-Kahrs, Timothy D. Barfoot, Perla Maiolino

AI总结本文研究了如何利用分布式低分辨率飞行时间（ToF）传感器对柔性连续体机器人进行定位。针对传统高分辨率传感器不适用于连续体机器人的问题，作者提出了一种基于分布式ToF传感器与机器人形状先验信息融合的定位方法，能够在传感器频繁出现退化场景的情况下实现高精度定位。实验表明，该方法在多种环境下的定位误差平均为2.5厘米和7.2度，具有良好的鲁棒性和实用性。

Comments Print version, to be published at Robotics: Science and Systems (RSS) 2026

2602.07126 2026-05-12 cs.LG

Finding Connections: Membership Inference Attacks for the Multi-Table Synthetic Data Setting

Joshua Ward, Chi-Hua Wang, Guang Cheng

AI总结该论文研究了多表合成数据场景下的成员推理攻击问题，针对现实世界中用户信息分布在多个关联表中的情况，提出了新的攻击方法。作者提出了一种基于异构图神经网络的多表成员推理攻击（MT-MIA），能够在用户实体层面更准确地检测隐私泄露风险，相较于传统的单表攻击方法更具针对性。实验表明，该方法能有效揭示当前最先进的多表合成数据生成模型中存在的隐私漏洞。

2602.05902 2026-05-12 cs.LG cs.AI

CoreQ: Learning-Free Mismatch Correction and Successive Rounding for Quantization

Seohyeon Cha, Huancheng Chen, Dongjun Kim, Haoran Zhang, Kevin Chan, Gustavo de Veciana, Haris Vikalo

AI总结本文提出了一种无需训练的后训练量化方法 CoreQ，旨在解决量化过程中因前层量化误差导致的层间激活不匹配问题。CoreQ 通过几何分解推导出一个闭式系数，动态调整各层的校准目标，有效减少对有限校准数据的过拟合，并无需超参数调优。该方法结合贪心逐步四舍五入求解器和改进的束搜索扩展，显著提升了多种大语言模型在不同量化设置下的困惑度和下游任务性能。

2512.08875 2026-05-12 cs.LG cs.AI

When Tables Leak: Attacking String Memorization in LLM-Based Tabular Data Generation

Joshua Ward, Bochao Gu, Chi-Hua Wang, Guang Cheng

AI总结本文研究了基于大语言模型（LLM）生成表格合成数据时可能存在的隐私泄露问题，指出当前主流方法在生成过程中容易记忆并复现训练数据中的数字序列，从而导致隐私风险。为此，作者提出了一种名为LevAtt的无盒成员推理攻击方法，仅通过合成数据即可检测出模型是否泄露了训练数据中的信息，并在多个模型和数据集上验证了该攻击的有效性。针对这一问题，作者进一步提出了两种防御方法，其中一种新颖的采样策略能够在保持数据质量的同时有效缓解隐私泄露风险。

2509.21677 2026-05-12 cs.LG cs.SE

Prophecy: Inferring Formal Properties from Neuron Activations

Divya Gopinath, Corina S. Pasareanu, Muhammad Usman

AI总结本文提出了一种名为 Prophecy 的工具，用于自动推断前馈神经网络的形式化属性。该工具基于一个关键观察：网络内部层中神经元的激活状态能够捕捉其逻辑行为，Prophecy 通过提取基于神经元激活状态的规则，来推导出对输出属性（如预测类别）的保证条件。该方法在形式化解释、组合验证、运行时监控等多个方面展现出广泛应用潜力，尤其在大语言视觉模型时代具有重要价值。

2509.21484 2026-05-12 cs.LG stat.ML

High-probability zeroth-order online convex optimisation beyond Euclidean geometry

David Janz, El-Mahdi El-Mhamdi, Arya Akhavan

AI总结本文研究了在非欧几里得几何框架下的零阶在线凸优化问题，考虑了具有$\ell_q$-Lipschitz损失函数和$\ell_p$-正则化FTRL算法的优化方法，并基于$\ell_r$-球上的锥测度采样构造了随机两点有限差分梯度估计器。作者给出了适用于所有$p,q,r \in [1,\infty]$的高概率统一后悔界，并通过分析梯度估计器在对偶FTRL范数下的所有矩界，实现了时间一致的二次变分控制。该算法具有任意时刻有效和数据驱动的特点，其收敛速率在已有研究中得到了强化，并揭示了在$q > 2$时存在与估计器本身相关的性能瓶颈。