arXivDaily每日学术速递，同步arXiv全量数据，AI总结、翻译，覆盖人工智能、机器人、计算机、金融、统计学、数学、物理学、生物学、经济学、电气&系统等方向。

2605.10521 2026-05-12 cs.CV cs.AI

DuetFair: Coupling Inter- and Intra-Subgroup Robustness for Fair Medical Image Segmentation

Yiqi Tian, Sangjoon Park, Bo Zeng, Pengfei Jin, Yujin Oh, Quanzheng Li

AI总结医学图像分割模型在不同子群体中的表现可能存在差异，现有公平性方法大多关注提升子群体平均性能，忽略了子群体内部可能存在的隐藏失效问题。为此，本文提出DuetFair机制，通过联合考虑子群体间适应与子群体内鲁棒性，引入FairDRO方法，结合分布感知的专家混合模型与子群体条件分布鲁棒优化，有效提升了模型在不同子群体中的公平性与分割性能。实验表明，FairDRO在多个医学图像分割基准上取得了优越的公平性与性能提升。

Comments 16 pages, 2 figures

2605.10518 2026-05-12 cs.CL cs.AI

Infinite Mask Diffusion for Few-Step Distillation

Jaehoon Yoo, Wonjung Kim, Chanhyuk Lee, Seunghoon Hong

AI总结本文提出了一种名为Infinite Mask Diffusion Model（IMDM）的新型扩散模型，用于解决语言模型知识蒸馏中的少步生成问题。传统掩码扩散模型（MDM）因使用确定性单状态掩码而受到因子化误差的限制，难以实现高效少步生成。IMDM通过引入随机无限状态掩码，有效降低了理论误差下限，从而在保持MDM优势的同时提升了生成效率。实验表明，IMDM在少量步骤下优于现有蒸馏方法，尤其在LM1B和OpenWebText数据集上表现突出。

2605.10516 2026-05-12 cs.AI

Consistency as a Testable Property: Statistical Methods to Evaluate AI Agent Reliability

Harsh Raj, Niranjan Orkat, Suvrorup Mukherjee, Aritra Guha, Cheryl Flynn, Subhabrata Majumdar

AI总结本文提出了一套严格的AI智能体可靠性度量方法，通过语义保持扰动下的一致性来量化智能体的可靠性。研究引入了基于$U$-统计量的输出级可靠性评估和基于核方法的轨迹级稳定性分析，揭示了智能体核心能力与执行鲁棒性之间的区别。实验表明，轨迹级一致性指标比传统方法具有更高的诊断灵敏度，有助于识别和解决影响智能体在高风险实际环境中部署的架构问题。

Comments 33 pages, 5 figures, 2 tables

2605.10510 2026-05-12 cs.LG cs.AI

CMKL: Modality-Aware Continual Learning for Evolving Biomedical Knowledge Graphs

Yousef A. Radwan, Yao Li, Qing Qing, Ziqi Xu, Qixin Zhang, Yongcheng Jing, Renqiang Luo, Xikun Zhang

AI总结本文提出了一种名为CMKL的持续学习框架，用于处理动态演化的生物医学知识图谱，能够同时利用结构、文本和分子等多模态信息。该方法通过混合专家路由机制融合多模态数据，并结合EWC正则化和多样化的多模态回放缓冲区，有效保护已学知识，减少遗忘。实验表明，CMKL在持续实体分类和关系预测任务中均显著优于现有方法，尤其在多模态信息的利用上表现出明显优势。

详情

英文摘要

Biomedical knowledge graphs are increasingly large, dynamic, and multimodal, driven by rapid advances in biotechnology such as high-throughput sequencing. Machine learning models can infer previously unobserved biomedical relationships and characterize biomedical entities in these graphs, but existing knowledge graph embedding methods and their continual learning extensions either assume static graph structure or fail to exploit multimodal information under evolving data distributions. They also apply uniform regularization across all model parameters, ignoring that different modalities may exhibit distinct forgetting dynamics as the graph evolves. We propose the Continual Multimodal Knowledge Graph Learner (CMKL), a CL framework for biomedical KGs that natively encodes structure, text, and molecules, fuses them through a Mixture-of-Experts (MoE) router, and protects previously learned knowledge with standard EWC regularization and a K-means-diverse multimodal replay buffer. We evaluate CMKL on a 129K-entity biomedical continual benchmark with 10 tasks. On continual biomedical entity classification, CMKL reaches AP 0.591 versus 0.370 for the strongest structural baseline, a 60% gain that is driven by access to multimodal features and preserved across the sequence with near-zero forgetting (AF 0.008). On continual relationship prediction, CMKL reaches AP $0.062$, matching Naive Sequential and EWC (0.058) within seed noise and outperforming Joint Training (0.047, p=0.045) and LKGE (0.039). A frozen-text ablation reaches AP 0.136, more than double any jointly trained model, yet that signal is unreachable by margin-ranking gradients: the greedy-modality asymmetry lives at the representation level, not the fusion level, and MoE routing manages it by suppressing the unreachable modality without forcing it through a learned bottleneck. Code: github.com/yradwan147/cmkl-neurips2026

URL PDF HTML ☆

赞 0 踩 0

2605.10504 2026-05-12 cs.CL

Learning Less Is More: Premature Upper-Layer Attention Specialization Hurts Language Model Pretraining

Jinchang Zhu, Jindong Li, Yuwen Hao, Chengyu Zou, Rong Fu, Menglin Yang

AI总结本文研究了在语言模型预训练过程中，上层注意力机制过早固化可能对模型性能产生的负面影响。作者发现，在GPT类模型中，上层注意力在底层特征尚未稳定时就形成尖锐的注意力模式，导致模型表现下降。通过在训练初期临时减缓上层Q/K投影的学习速度，可以在不改变其他参数的情况下提升最终的困惑度和下游任务准确率。研究还指出，乘法门控的前馈网络是抑制底层残差特征更新的关键因素，并揭示了上层Q/K的学习时机是解码器结构与优化过程之间的重要交互点。

2605.10500 2026-05-12 cs.AI

SkillEvolver: Skill Learning as a Meta-Skill

Genrui Zhang, Erle Zhu, Jinfeng Zhou, Caiyan Jia, Hongning Wang

AI总结当前智能体技能大多是静态生成的，一旦创建便无法根据实际使用情况进行改进。本文提出了一种名为 SkillEvolver 的轻量级在线技能学习方法，通过一个元技能迭代生成、部署并优化领域特定技能，使技能能够持续进化。该方法直接学习技能的描述与代码，而非模型参数，使得生成的技能可直接用于任意智能体而无需重新训练。实验表明，SkillEvolver 在多个任务中显著优于人工编写技能和无技能基线。

2605.10498 2026-05-12 cs.CV cs.AI stat.ML

Simultaneous Long-tailed Recognition and Multi-modal Fusion for Highly Imbalanced Multi-modal Data

Heegeon Yoon, Heeyoung Kim

AI总结该研究针对高度不平衡的多模态数据，提出了一个同时处理长尾识别与多模态融合的新框架。该方法通过引入多专家架构，结合模态特异性网络估计各模态的信息量，并利用置信度引导的权重动态调整融合过程，从而更有效地整合多源数据。实验表明，该方法在多个基准和真实数据集上优于现有方法，展示了其在长尾分类任务中的鲁棒性和泛化能力。

2605.10494 2026-05-12 cs.SD cs.AI

Multi-layer attentive probing improves transfer of audio representations for bioacoustics

Marius Miron, David Robinson, Masato Hagiwara, Titouan Parcollet, Jules Cauzinille, Gagan Narula, Milad Alizadeh, Ellen Gilsenan-McMahon, Sara Keen, Emmanuel Chemla, Benjamin Hoffman, Maddie Cusimano, Diane Kim, Felix Effenberger, Jane K. Lawton, Aza Raskin, Olivier Pietquin, Matthieu Geist

AI总结本文研究了不同探针策略对生物声学任务中音频表征迁移性能的影响，提出使用多层注意力探针可以更有效地利用时间信息，提升模型在下游任务中的表现。研究对比了线性探针和注意力探针在多个生物声学基准上的性能，发现多层探针优于传统的单层探针，尤其在Transformer模型中，注意力探针显著优于线性探针。该工作为评估和提升音频表征的可迁移性提供了新的方法和见解。

2605.10488 2026-05-12 cs.CL cs.AI

DeepRefine: Agent-Compiled Knowledge Refinement via Reinforcement Learning

Haoyu Huang, Jiaxin Bai, Shujie Liu, Yang Wei, Hong Ting Tsang, Yisen Gao, Zhongwei Xie, Yufei Li, Yangqiu Song

AI总结 DeepRefine 是一种基于大型语言模型的推理方法，旨在提升智能体编译知识库的质量，以更好地支持开放场景下的下游任务。该方法通过与知识库进行多轮交互，进行归因诊断，定位潜在缺陷并执行针对性的优化操作，从而实现知识库的逐步完善。为了在没有标准答案的情况下优化优化策略，DeepRefine 引入了“超越草稿收益”奖励机制，并通过强化学习进行端到端训练，实验表明其在多个任务上均优于现有方法。

2605.10485 2026-05-12 cs.RO

VEGA: Visual Encoder Grounding Alignment for Spatially-Aware Vision-Language-Action Models

Hao Wang, Xiaobao Wei, Jingyang He, Chengyu Bai, Chun-Kai Fan, Jiajun Cao, Jintao Chen, Ying Li, Shanyu Rong, Ming Lu, Xiaozhu Ju, Jian Tang, Shanghang Zhang

AI总结 VEGA 是一种用于提升视觉-语言-动作（VLA）模型空间感知能力的框架，旨在解决当前模型因缺乏三维几何监督而导致的空间理解不足问题。该方法通过将 VLA 模型的视觉编码器输出与基于多视角一致的三维高斯点云监督训练的 DINOv2-FiT3D 模型特征对齐，实现更准确和可解释的空间感知对齐。VEGA 在视觉编码器输出层进行对齐，避免了语言语义的干扰，且对齐模块在推理时被移除，不增加额外计算负担，实验表明其在模拟和现实任务中均优于现有方法。

2605.10484 2026-05-12 cs.CV cs.RO

OpenSGA: Efficient 3D Scene Graph Alignment in the Open World

Gang Chen, Sebastián Barbas Laina, Stefan Leutenegger, Javier Alonso-Mora

AI总结本文提出了一种名为 OpenSGA 的高效三维场景图对齐框架，旨在解决机器人在开放环境中重新访问场景时的物体级定位与地图融合问题。该方法通过融合视觉-语言、文本和几何特征，并结合空间上下文信息，实现了即使在坐标偏差较大的情况下也能准确对齐场景图。此外，作者还构建了一个大规模数据集 ScanNet-SG，包含超过 70 万样本和丰富的物体类别，显著提升了场景图对齐任务的训练与评估能力。实验表明，该方法在帧到扫描（F2S）和子扫描到子扫描（S2S）任务中均取得了最佳性能。

Comments 13 figures

2605.10480 2026-05-12 cs.AI

ASIA: an Autonomous System Identification Agent

Dario Piga, Marco Forgione

AI总结本文提出了一种名为ASIA的自主系统识别代理框架，旨在自动化系统识别过程中的模型选择、算法训练和超参数调优等繁琐任务。该方法基于大型语言模型作为自主编码代理，通过自然语言描述问题，无需人工干预即可完成从假设生成到模型评估的闭环流程。研究在两个系统识别基准上验证了ASIA的有效性，分析了其搜索行为与发现的模型结构，并探讨了该方法的潜力及当前存在的测试泄露、透明度降低和可复现性等局限。

2605.10474 2026-05-12 cs.LG cs.AI

Formally Verifying Analog Neural Networks Under Process Variations Using Polynomial Zonotopes

Yasmine Abu-Haeyeh, Tobias Ladner, Matthias Althoff, Lars Hedrich

AI总结本文研究了模拟神经网络在制造工艺变化下的行为验证问题，提出了一种基于多项式的方法来建模神经元电路的性能变化，并利用多项式zonotope进行可达性分析，从而实现了对电路级模型的正式验证。该方法有效避免了传统的耗时蒙特卡洛仿真，实验表明其能在秒级时间内验证99%的工艺变化样本，显著提升了验证效率。

2605.10470 2026-05-12 cs.CV

Adaptive Context Matters: Towards Provable Multi-Modality Guidance for Super-Resolution

Jinyi Luo, Minghao Liu, Yifan Li, Zejia Fan, Jiaying Liu

AI总结超分辨率（SR）是一个严重病态的问题，存在固有的歧义性。本文首次对多模态超分辨率进行了理论建模，揭示了现有方法在模态利用上的不足，并提出了一种基于动态模态融合的多模态专家混合超分辨率框架（M$^3$ESR），通过空间动态模态权重模块和时间自适应模态温度调度机制，实现了更精确的风险控制和模态贡献优化。实验表明，该方法在泛化能力和语义一致性方面均有显著提升。

2605.10468 2026-05-12 cs.LG

Can Muon Fine-tune Adam-Pretrained Models?

Xingyu Qu, Peigeng Huang, Samuel Horvath

AI总结本文研究了在微调预训练模型时使用Muon优化器替代Adam所带来的性能下降问题。通过实验分析，作者发现这种性能下降源于优化器之间的隐式偏差不匹配，并提出通过限制更新幅度（如使用LoRA方法）可以有效缓解这一问题。研究结果为理解优化器不匹配对微调的影响提供了新见解，并展示了如何通过调整更新策略来减轻其负面影响。

2605.10466 2026-05-12 cs.LG

Self-Attention as a Covariance Readout: A Unified View of In-Context Learning and Repetition

Haoren Xu, Guanhua Fang

AI总结该论文探讨了大语言模型在上下文学习（ICL）和重复生成中的行为，揭示了其背后的统一机制。研究指出，当输入满足特定统计条件时，自注意力机制的输出可近似为输入协方差矩阵的线性读取，从而解释了模型在处理长上下文时对统计信息的提取与细节的遗忘。这一机制不仅能够实现单步的群体梯度下降，还为重复生成提供了结构化的解释，将两种看似无关的现象统一于协方差读取的原理之下。

2605.10464 2026-05-12 cs.CV

Automated Detection of Abnormalities in Zebrafish Development

Sarath Sivaprasad, Hui-Po Wang, Anna-Lisa Jäckel, Jonas Baumann, Carole Baumann, Jennifer Herrmann, Mario Fritz

AI总结本文提出了一种用于斑马鱼胚胎发育异常自动检测的方法，针对目前依赖人工评估效率低的问题，构建了一个包含高分辨率显微图像序列的大型数据集，涵盖正常发育和药物暴露两种条件，并提供了细粒度时间标注。研究还引入了基于Transformer的模型，能够融合时空特征以早期预测发育异常，在受精卵存活率分类和毒性评估任务中分别达到98%和92%的准确率，为自动化斑马鱼毒性分析提供了有效工具。

2605.10462 2026-05-12 cs.CL cs.LO

Coherency through formalisations of Structured Natural Language, A case study on FRETish

Joost J. Joosten, Marina López Chamosa, Sofía Santiago Fernández

AI总结本文提出了一种新的形式化指南——“通过形式化实现一致性”，主张在将自然语言需求转化为形式化语言的过程中，不同层次的描述应保持逻辑结构的一致性。研究以NASA的FRET工具和其控制自然语言FRETish为案例，提出了一种将其自动翻译为MTL形式化语言的新方法，并通过模型检测证明了其与原有翻译的等价性。实验统计结果显示新翻译具有优势，同时揭示了形式化过程中存在的不一致问题，为形式化方法的改进提供了新思路。

2605.10458 2026-05-12 cs.LG cond-mat.mtrl-sci physics.chem-ph

QT-Net: Rethinking Evaluation of AI Models in Atomic Chemical Space

Pablo Martínez Crespo, Stefano Ribes, Martin Rahm, Richard Beckmann, Robert S. Jordan, Marisa Gliege, Santiago Miret, Vijay Kris Narasimhan, Rocío Mercado

AI总结该研究针对原子尺度上AI模型的评估问题，提出了一种基于SOAP描述符的留出评估协议，用于更准确地评估机器学习模型在预测原子电荷和多极矩等化学特性时的泛化能力。通过严格的交叉验证和统计检验，作者比较了E(3)-等变模型与非等变模型的性能，并基于结果提出了旋转增强的非等变图神经网络QT-Net。该模型能够从QM9数据集外的分子中推断原子属性，并有效提升下游分子性质预测任务的性能，为原子尺度分子机器学习提供了新的归纳偏置。

2605.10456 2026-05-12 cs.RO

Learning Point Cloud Geometry as a Statistical Manifold: Theory and Practice

Jinwoo Lee, Jiwoo Kim, Woojae Shin, Giseop Kim, Hyondong Oh

AI总结该论文研究了如何从稀疏且不规则的激光雷达点云中学习几何结构，提出了一个基于统计流形的数学建模方法。核心思想是将每个点的局部几何结构建模为高斯分布，从而构建出一个统计流形表示。基于此，作者设计了Point-to-Ellipsoid（POLI）方法，通过自监督学习从点云中预测每个点的高斯几何参数，无需标注数据即可实现鲁棒的几何估计，并在多个机器人感知任务中取得了显著性能提升。

2605.10455 2026-05-12 cs.LG

AxiomOcean: Forecasting the Three-Dimensional Structure of the Upper Ocean

Sensen Wu, Yifan Chen, Guantao Pu, Xiaoyao Sun, Yijun Chen, Jin Qi, Ming Kong, Keyi Yang, Lichen Xu, Wenguan Wang, Xiaofeng Li, Zhenhong Du

AI总结 AxiomOcean 是一个全球人工智能海洋预测模型，旨在提升对上层海洋三维结构的预报能力。该模型通过引入全三维编码-主干-解码架构，显式表示水柱中的垂直分层和跨层依赖关系，结合海面大气强迫信息，联合预测温度、盐度及三维洋流等变量。实验表明，AxiomOcean 在10天预报中显著优于现有先进模型，降低了约20%至35%的均方根误差，同时保持更高的异常相关性，且在涡动能、温度和盐度方差等方面具有更好的保持能力，提升了预报的物理一致性与准确性。

2605.10453 2026-05-12 cs.LG cs.CL

SlimSpec: Low-Rank Draft LM-Head for Accelerated Speculative Decoding

Anton Plaksin, Sergei Krutikov, Sergei Skvortsov, Alexander Samarin

AI总结本文提出SlimSpec，一种用于加速推测解码的低秩语言模型头部（LM-head）参数化方法。该方法通过压缩草案模型的内部表示而非输出词汇表，有效降低了计算瓶颈，同时保持完整的词汇支持。实验表明，SlimSpec在多种目标模型和基准测试中实现了比标准LM-head架构4到5倍的加速，并在端到端速度提升上优于现有方法8%到9%。该方法对训练和推理流程的调整需求极小，适用于多种草案LM-head架构。

2605.10451 2026-05-12 cs.LG cs.NA math.FA math.NA

Don't Fix the Basis -- Learn It: Spectral Representation with Adaptive Basis Learning for PDEs

Xuxiang Zhao, Angelica I. Aviles-Rivero

AI总结该研究针对偏微分方程（PDE）学习中传统谱神经算子依赖固定基函数、难以有效捕捉空间异质性和多尺度动态的问题，提出了一种自适应基学习框架ABLE。ABLE通过学习数据相关的谱表示，构建空间自适应的Parseval框架，使算子在提升的谱空间中高效运作，同时保持可逆性和$O(N\log N)$复杂度。实验表明，ABLE在多个基准任务中提升了模型精度，尤其在梯度陡峭和多尺度场景下表现突出，并可作为模块化组件增强现有神经算子架构。

Comments 26 pages, 4 figures

2605.10449 2026-05-12 cs.CV

Automated high-frequency quantification of fish communities and biomass using computer vision

Kota Ishikawa, Takuma Masui, Keita Koeda, Rickdane Gomez, Lucas Yutaka Kimura, Michio Kondoh

AI总结该研究提出了一种基于计算机视觉的自动化方法，用于高频量化水下鱼类群落结构和生物量。方法结合了深度学习鱼类识别、多目标跟踪和三维重建技术，能够从立体摄像系统采集的视频中准确估计鱼类的种类、数量及生物量。研究在珊瑚礁鱼类群落中进行了20天的连续监测，展示了该方法在捕捉物种丰富度、数量和生物量动态变化方面的优势，并验证了其在非侵入性、持续性监测中的有效性。

Comments 21 pages, 3 figures, supplementary information under Ancillary files

2605.10448 2026-05-12 cs.AI

Can Agent Benchmarks Support Their Scores? Evidence-Supported Bounds for Interactive-Agent Evaluation

Shanshan Gao, Liyi Zhou

AI总结本文探讨了交互式智能体基准测试中评分的可靠性问题，指出当前基准测试往往依赖于表面信号而非实际行为路径，导致评分可能不准确。为此，作者提出了一种无需修改任务、智能体或评估者的新方法——引入一个结果证据报告层，用于明确验证所需证据、标记运行结果的证据状态，并报告支持证据的评分范围以反映不确定性。实验表明，该方法在多个公开基准上有效区分了不同类型的失败模式，提升了评估的透明度和可信度。

2605.10445 2026-05-12 cs.CV

Uni-Synergy: Bridging Understanding and Generation for Personalized Reasoning via Co-operative Reinforcement Learning

Zijun Shen, Sihan Yang, Ruichuan An, Ziyu Guo, Hao Liang, Ming Lu, Renrui Zhang, Wentao Zhang

AI总结本文提出了一种名为Sync-R1的端到端强化学习框架，旨在通过协同优化实现个性化理解和生成之间的桥梁。该方法引入了Sync-GRPO和动态组缩放（DGS）技术，以增强多任务间的协同效应并提升训练效率，同时构建了更贴近现实场景的UnifyBench++数据集。实验表明，Sync-R1在跨任务推理和个性化生成方面表现出色，且无需复杂的冷启动流程。

2605.10439 2026-05-12 cs.CV

Filtering Memorization from Parameter-Space in Diffusion Models

Yu Zhe, Yang Jiayan, Wei Junhao, Yu-Lin Tsai, Wang Chen

AI总结本文研究了扩散模型中低秩适配（LoRA）模块可能记住训练图像的问题，导致生成内容泄露受版权保护或敏感信息。为此，作者提出了一种无需训练和数据的后处理方法——Base-Anchored Filtering（BAF），通过分解LoRA更新为频谱通道，并衡量其与预训练主干网络主子空间的对齐程度，从而过滤掉可能包含记忆内容的通道。实验表明，BAF在多个数据集和扩散模型主干上有效减少了记忆效应，同时保持或提升了生成质量。

2605.10438 2026-05-12 cs.LG cs.CV

Beyond Spatial Compression: Interface-Centric Generative States for Open-World 3D Structure

Xiang Chen, Alexander Binder

AI总结当前3D编码器大多将表示视为空间压缩，虽然能重建表面几何，但无法明确组件归属和连接有效性。本文提出一种以接口为中心的生成状态表示方法，将编码过程构建为可操作的状态而非被动压缩代码，使得局部几何、组件归属和连接有效性在解码过程中可被查询、约束和修复。通过引入组件条件的局部规范标记（C2LT-3D），该方法在开放世界多组件场景中提升了结构鲁棒性，并展示了其潜在状态在装配级结构推理中的有效性。

2605.10434 2026-05-12 cs.CV

WorldReasonBench: Human-Aligned Stress Testing of Video Generators as Future World-State Predictors

Keming Wu, Yijing Cui, Wenhan Xue, Qijie Wang, Xuan Luo, Zhiyuan Feng, Zuhao Yang, Sudong Wang, Sicong Jiang, Haowei Zhu, Zihan Wang, Ping Nie, Wenhu Chen, Bin Wang

AI总结本文提出WorldReasonBench，用于评估视频生成模型作为未来世界状态预测器的能力，重点检验其在物理、社会、逻辑和信息一致性方面的推理能力。该基准包含436个结构化测试案例，并采用人类对齐的两阶段评估方法，分别验证推理过程和视频质量。研究揭示了当前视频生成模型在视觉合理性与世界推理能力之间存在显著差距，并提供了WorldRewardBench用于奖励模型评估，推动更真实的世界感知视频生成研究。

Comments Project Page: https://unix-ai-lab.github.io/WorldReasonBench/

2605.10419 2026-05-12 cs.CL cs.AI

Can Language Models Analyze Data? Evaluating Large Language Models for Question Answering over Datasets

Andreas Xenofontos, Pavlos Fafalios

AI总结本文研究了大型语言模型在数据集问答任务中的有效性，探讨了它们在直接回答数据集问题和根据数据库模式生成SQL查询两种场景下的表现。研究还评估了不同提示策略对模型性能的影响，并在两个包含不同难度问题的数据集上进行了实验。结果表明，大型语言模型表现出色，而小型、更节省资源的模型则存在明显局限，这些发现有助于更深入理解大语言模型在数据分析任务中的应用潜力与限制。

Comments Accepted for publication in CARMA 2026 proceedings