arXivDaily每日学术速递，同步arXiv全量数据，AI总结、翻译，覆盖人工智能、机器人、计算机、金融、统计学、数学、物理学、生物学、经济学、电气&系统等方向。

2603.23677 2026-05-13 cs.CV cs.AI

Prototype Fusion: A Training-Free Multi-Layer Approach to OOD Detection

Shreen Gul, Mohamed Elmahallawy, Ardhendu Tripathy, Sanjay Madria

AI总结本文提出了一种无需训练的多层特征融合方法，用于检测模型输入是否超出训练分布（OOD）。不同于现有方法主要依赖网络最后一层激活值，该方法利用中间层丰富的表征信息，通过聚合多层卷积块的特征并计算类均值嵌入，构建紧凑的类别原型。实验表明，该方法在多种架构上均表现出优越的OOD检测性能，显著提升了检测准确率并降低了误报率。

2603.22000 2026-05-13 cs.LG stat.ML

CRPS-Optimal Binning for Univariate Conformal Regression

Paolo Toccaceli

AI总结本文提出了一种基于分箱的非参数条件分布估计方法，通过将排序后的协变量观测划分为连续区间，并使用区间内的经验CDF作为预测分布。该方法通过最小化留一法连续排名概率分数（LOO-CRPS）确定最优分箱边界，并采用动态规划以高效求解全局最优分箱数。实验表明，该方法在保持预测区间覆盖率接近名义水平的同时，能显著缩小预测区间，优于多种主流的分层确认回归方法。

2603.21887 2026-05-13 cs.RO

IGV-RRT: Prior-Real-Time Observation Fusion for Active Object Search in Changing Environments

Wei Zhang, Ping Gong, Yujie Wang, Leilei Yao, Minghui Bai, Rongfeng Ye, Yinchuan Wang, Yachao Wang, Chen Sun, Chaoqun Wang

AI总结本文提出了一种名为IGV-RRT的概率规划框架，用于解决动态室内环境中目标物体导航（ObjectNav）的问题。该方法结合了基于场景先验的不确定性感知模型和视觉语言模型（VLM）的在线目标相关性估计，通过双层语义地图模块和实时规划器实现高效搜索。实验表明，该方法在复杂室内环境中能有效应对物体重新摆放的影响，显著提升了搜索效率和成功率。

2603.17510 2026-05-13 cs.RO

Interpreting Context-Aware Human Preferences for Multi-Objective Robot Navigation

Tharun Sethuraman, Subham Agrawal, Nils Dengler, Jorge de Heuvel, Teena Hassan, Maren Bennewitz

AI总结本文研究了如何使机器人在共享人类环境中的多目标导航中适应人类的上下文相关偏好。为了解决人类偏好通常以自然语言表达且依赖环境上下文的问题，作者提出了一种结合基础模型与多目标强化学习导航策略的框架，实现了对高阶语义信息的理解与低层运动控制的整合。该方法通过视觉语言模型提取环境上下文，利用大语言模型将用户反馈转化为可解释的行为规则，并将其映射为数值偏好向量以实时调整导航策略，实验表明该方法在多种室内场景中有效提升了机器人行为的适应性与可控性。

2603.16849 2026-05-13 cs.LG

GIST: Gauge-Invariant Spectral Transformers for Scalable Graph Neural Operators

Mattia Rigotti, Nicholas Thumiger, Thomas Frick

AI总结本文提出了一种名为GIST的可扩展图神经算子，用于解决不规则网格上神经算子在几何建模中的基本矛盾。GIST通过使用高效近似谱嵌入的成对内积来保持规范不变性，从而在保证计算复杂度为$\mathcal{O}(N)$的同时，实现了对网格分辨率和结构变化的鲁棒性。该方法在多个大规模网格数据集和标准图数据集上均取得了最先进的性能。

2603.15759 2026-05-13 cs.RO cs.AI cs.LG

Simulation Distillation: Pretraining World Models in Simulation for Rapid Real-World Adaptation

Jacob Levy, Tyler Westenbroek, Kevin Huang, Fernando Palafox, Patrick Yin, Shayegan Omidshafiei, Dong-Ki Kim, Abhishek Gupta, David Fridovich-Keil

AI总结该研究提出了一种名为 Simulation Distillation（SimDist）的框架，旨在通过模拟器预训练世界模型，以提高机器人在真实环境中的快速适应能力。核心方法是利用物理模拟器生成大量动作条件化的数据，预训练世界模型，然后在真实世界中仅更新模型的动力学部分，从而减少对大量真实数据的依赖。该方法在复杂操作和四足机器人运动任务中表现出色，相比现有方法具有更快的适应速度和更稳定的性能提升。

Comments Robotics: Science and Systems 2026

2603.15423 2026-05-13 cs.CL

Invisible failures in human-AI interactions

Christopher Potts, Moritz Sudhof

AI总结该研究分析了10万个人与AI的交互数据，发现79%的AI失败是“隐形”的，即用户并未明显察觉问题。研究识别出八类典型的隐形失败模式，并发现这些模式具有系统性关联，表明AI在满足用户需求方面存在深层次问题。通过构建对比数据集，研究还发现尽管AI能力提升使失败率下降，但大多数失败仍属隐形，且失败类型分布保持稳定，表明该分类体系对AI系统监控具有重要价值。

2603.13988 2026-05-13 cs.AI cs.LG

Faithful or Just Plausible? Evaluating the Faithfulness of Closed-Source LLMs in Medical Reasoning

Halimat Afolabi, Zainab Afolabi, Elizabeth Friel, Jude Roberts, Antonio Ji-Xu, Lloyd Chen, Egheosa Ogbomo, Emiliomo Imevbore, Phil Eneje, Wissal El Ouahidi, Aaron Sohal, Alisa Kennan, Shreya Srivastava, Anirudh Vairavan, Laura Napitu, Katie McClure

AI总结本文研究了封闭源大型语言模型（如ChatGPT和Gemini）在医疗推理任务中的解释可信度问题，指出其生成的解释可能看似合理但并不反映真实的推理过程。为此，作者设计了三种基于扰动的探测方法，包括因果消融、位置偏差和提示注入，评估模型推理过程与预测结果之间的关联性，并结合人类评估分析模型解释的可信度与用户信任之间的关系。研究发现，模型的推理步骤往往不直接影响预测结果，且容易受到外部提示的影响，强调在医疗场景中评估模型时，除了准确性，可信度也应成为核心考量。

2603.05947 2026-05-13 cs.CV

LucidNFT: LR-Anchored Multi-Reward Preference Optimization for Flow-Based Real-World Super-Resolution

Song Fei, Tian Ye, Sixiang Chen, Zhaohu Xing, Jianyu Lai, Lei Zhu

AI总结本文提出了一种名为LucidNFT的多奖励强化学习框架，用于基于流匹配的现实场景图像超分辨率任务。该方法通过引入一种对退化不变且对语义幻觉敏感的LR参考评估器LucidConsistency，以及解耦的奖励归一化策略和大规模真实退化图像集LucidLR，有效解决了现有方法在保持低分辨率输入真实性与提升视觉质量之间的平衡问题。实验表明，LucidNFT在多个基准上提升了感知质量，同时保持了对真实低分辨率输入的一致性。

2602.22347 2026-05-13 cs.CV cs.AI

Enabling clinical use of foundation models for computational pathology

Audun L Henriksen, Ole-Johan Skrede, Lisa van der Schee, Enric Domingo, Karolina Cyll, Sepp de Raedt, Ilyá Kostolomov, Jennifer Hay, Wanja Kildal, Joakim Kalsnes, Robert W Williams, Manohar Pradhan, John Arne Nesheim, Hanne Askautrud, Maria Isaksen, Karmele Saez de Gordoa, Miriam Cuatrecasas, Joanne Edwards, TransSCOT group, Arild Nesbakken, Neil A Shepherd, Ian Tomlinson, Daniel-Christoph Wagner, Rachel Kerr, Tarjei Sveinsgjerd Hveem, Knut Liestøl, Yoshiaki Nakamura, Marco Novelli, Masaaki Miyo, Sebastian Försch, David N Church, Miangela M Lacle, David J Kerr, Andreas Kleppe

AI总结该研究探讨了如何使基础模型在计算病理学中更适用于临床场景，解决了现有模型因捕捉扫描仪和预分析变异而影响下游任务性能的问题。研究提出在下游模型训练中引入新的鲁棒性损失函数，以减少对技术变异的敏感性，并通过大量临床病理图像实验验证了该方法的有效性。该方法在不重新训练基础模型的前提下，提升了模型的鲁棒性和分类准确性，有助于开发更适用于真实临床环境的深度学习系统。

2602.21625 2026-05-13 cs.RO

Tacmap: Bridging the Tactile Sim-to-Real Gap via Geometry-Consistent Penetration Depth Map

Lei Su, Zhijie Peng, Renyuan Ren, Shengping Mao, Juan Du, Kaifeng Zhang, Xuezhou Zhu

AI总结本文提出了一种名为Tacmap的高保真、计算高效的触觉仿真框架，旨在解决视觉触觉传感器在机器人操作中面临的仿真到现实的差距问题。该方法通过统一的形变图表示，将仿真与现实世界在几何空间中对齐，利用体积穿透深度计算仿真中的3D接触体积，并通过自动化数据采集装置在现实世界中学习触觉图像到真实深度图的映射。实验表明，Tacmap在多种接触场景中表现出与实际测量高度一致的性能，并成功实现了从仿真到物理机器人的零样本迁移。

Comments 8 pages

2602.15473 2026-05-13 cs.LG

POP: Prior-Fitted First-Order Optimization Policies

Jan Kobiolka, Christian Frey, Gresa Shala, Arlind Kadra, Erind Bedalli, Josif Grabocka

AI总结本文提出了一种基于强化学习的元学习优化策略 POP，用于预测梯度下降中的自适应学习率。该方法通过优化轨迹中的上下文信息进行学习，并引入了新的奖励函数、函数缩放策略和先验分布以生成大量合成优化问题。实验表明，POP 在包含 43 个不同复杂度优化函数的基准测试中显著优于传统梯度优化方法，且无需任务特定调参即可实现良好的泛化能力。

Comments Under Review

2602.13690 2026-05-13 cs.LG

Physics Aware Neural Networks: Denoising for Magnetic Navigation

Aritra Das, Yashas Shende, Muskaan Chugh, Reva Laxmi Chauhan, Arghya Pathak, Debayan Gupta

AI总结本文研究了在GPS不可用情况下利用地磁异常进行导航时的去噪问题，提出了一种基于物理约束的神经网络方法。该方法引入了无散度矢量场和E(3)等变性两个物理约束，确保学习到的地磁场符合麦克斯韦方程并具有正确的空间变换特性。通过生成合成数据集和对比多种神经网络结构，实验表明该方法在预测精度和物理合理性方面优于传统方法。

详情

英文摘要

Magnetic-anomaly navigation, leveraging small-scale variations in the Earth's magnetic field, is a promising alternative when GPS is unavailable or compromised. Airborne systems face a key challenge in extracting geomagnetic field data: the aircraft itself induces magnetic noise. Although the classical Tolles-Lawson model addresses this, it inadequately handles stochastically corrupted magnetic data required for navigation. To handle stochastic noise, we propose using two physics-based constraints: divergence-free vector fields and E(3)-equivariance. These ensure the learned magnetic field obeys Maxwell's equation and that outputs transform correctly with sensor position and orientation. The divergence-free constraint is implemented by training a neural network to output a vector potential A, with the magnetic field defined as its curl. For E(3)-equivariance, we use tensor products of geometric tensors represented via spherical harmonics with known rotational transformations. Enforcing physical consistency and restricting the admissible function space acts as an implicit regularizer that improves spatiotemporal performance. We present ablation studies evaluating each constraint alone and jointly across CNNs, MLPs, LTCs, and Contiformers. Continuous-time dynamics and long-term memory are critical for modelling magnetic time series; the Contiformer, which provides both, outperforms existing methods. To mitigate data scarcity, we generate synthetic datasets using the World Magnetic Model (WMM) and time-series conditional GANs, producing realistic, temporally consistent magnetic sequences across varied trajectories and environments. Experiments show that embedding these constraints significantly improves predictive accuracy and physical plausibility, outperforming classical and unconstrained deep learning approaches. Acknowledgement: This work was done in collaboration with Dirac Labs.

URL PDF HTML ☆

赞 0 踩 0

2602.12139 2026-05-13 cs.LG

Oscillators Are All You Need: Irregular Time Series Modelling via Damped Harmonic Oscillators with Closed-Form Solutions

Yashas Shende, Aritra Das, Reva Laxmi Chauhan, Arghya Pathak, Debayan Gupta

AI总结该论文提出了一种基于阻尼谐振子模型的新型时间序列建模方法，用于处理非均匀时间间隔的数据。通过将Transformer中的键值对建模为受驱阻尼振子，并以正弦基展开查询，该方法将注意力机制解释为共振现象，从而在保持模型表达能力的同时，避免了传统ODE求解器的计算开销。该方法具有理论保证，能够在非均匀时间序列任务上实现高精度且高效的表现。

2602.11126 2026-05-13 cs.LG

The Offline-Frontier Shift: Diagnosing Distributional Limits in Generative Multi-Objective Optimization

Stephanie Holly, Alexandru-Ciprian Zăvoianu, Siegfried Silber, Sepp Hochreiter, Werner Zellinger

AI总结本文研究了离线多目标优化中生成方法的分布限制问题，指出尽管生成模型在超体积指标上表现良好，但在其他关键指标如代际距离上却明显落后于进化算法。研究发现，这种性能差异源于离线数据集与帕累托前沿之间的偏移，即“离线前沿偏移”现象，这构成了离线多目标优化的根本性限制。作者提出通过目标空间中的分布外采样来应对这一限制，并指出生成方法在目标分布上趋于保守，难以有效突破数据分布的边界。

2602.09587 2026-05-13 cs.CV cs.AI

MieDB-100k: A Comprehensive Dataset for Medical Image Editing

Yongfan Lai, Wen Qian, Bo Liu, Hongyan Li, Hao Luo, Fan Wang, Bohan Zhuang, Shenda Hong

AI总结针对医学图像编辑领域高质量数据稀缺的问题，本文提出MieDB-100k，一个大规模、高质量且多样化的文本引导医学图像编辑数据集。该数据集从感知、修改和转换三个视角分类编辑任务，兼顾理解和生成能力，并通过专家模型与规则合成方法构建，经过严格人工审核确保临床准确性。实验表明，基于该数据集训练的模型在性能和泛化能力上均优于现有开源和商业模型，为医学图像编辑研究提供了重要基础。

2602.09368 2026-05-13 cs.RO

Certified Gradient-Based Contact-Rich Manipulation via Smoothing-Error Reachable Tubes

Wei-Chen Li, Glen Chou

AI总结该论文研究了如何在接触丰富的操作任务中，通过平滑动力学模型并补偿由此产生的误差，实现基于梯度的控制器优化与安全保证。核心方法是在可微分仿真中对接触动力学和平滑几何进行平滑处理，并通过集合值偏差量化模型失配，结合分析可达集优化时变仿射反馈策略，从而在原始非平滑动力学下实现闭环系统的鲁棒约束满足。该方法在多个接触密集任务中验证了其有效性，表现出更低的安全违规率和更小的目标误差。

Comments Robotics: Science & Systems (RSS) 2026

2602.08813 2026-05-13 cs.LG

Robust Policy Optimization to Prevent Catastrophic Forgetting

Mahdi Sabbaghi, George Pappas, Adel Javanmard, Hamed Hassani

AI总结本文研究了大型语言模型在多阶段微调过程中因后续更新导致的“灾难性遗忘”问题，即早期学习的行为（如安全性）可能被破坏。为解决这一问题，作者提出了一种名为FRPO的鲁棒强化学习框架，通过在策略的KL散度邻域内优化奖励，确保策略在后续微调时仍能保持稳定。实验表明，该方法在多个基础模型和下游任务中有效减少了安全性能的下降，同时保持了任务性能。

2602.05830 2026-05-13 cs.AI cs.LG

Learning Compact Boolean Networks

Shengpu Wang, Yuhao Mao, Yani Zhang, Martin Vechev

AI总结本文研究了如何学习结构紧凑且精度高的布尔网络，以应对资源受限场景下的高效推理需求。为解决布尔网络离散结构带来的学习难题，作者提出了三种互补的方法：一种无需参数的有效连接学习策略、一种利用空间局部性的紧凑卷积布尔架构，以及一种降低连续网络离散化精度损失的自适应量化方法。实验表明，该方法在多个视觉任务中实现了更优的精度-计算量权衡，相比现有方法在布尔运算数量上减少了高达47倍，并在FPGA上实现了更高的精度与更低的推理延迟。

2602.04476 2026-05-13 cs.CV

Vision-aligned Latent Reasoning for Multi-modal Large Language Model

Byungwoo Jeon, Yoonwoo Jeong, Hyunseok Lee, Minsu Cho, Jinwoo Shin

AI总结尽管多模态大语言模型在多种理解任务上取得了进展，但在需要多步骤推理的问题上仍存在不足，主要原因是视觉信息在长上下文生成过程中逐渐稀释。为此，本文提出了一种名为Vision-aligned Latent Reasoning（VaLR）的推理框架，通过在每一步推理前动态生成与视觉对齐的潜在标记，引导模型基于潜在空间中的感知线索进行推理。实验表明，VaLR在多个需要长上下文理解和精确视觉感知的基准测试中表现优异，并在VSI-Bench上将性能从33.0%提升至52.9%，显著优于现有模型。

Comments Published as conference proceeding for ICML 2026. Last two authors advised equally

2602.02282 2026-05-13 cs.LG

MoLF: Mixture-of-Latent-Flow for Pan-Cancer Spatial Gene Expression Prediction from Histology

Susu Hu, Stefanie Speidel

AI总结该研究提出了一种名为MoLF的生成模型，用于从组织学图像预测跨癌症类型的基因表达空间分布。MoLF通过条件流匹配目标，结合专家混合架构，将噪声映射到基因潜在空间，从而有效处理不同癌症类型的异质性。实验表明，MoLF在跨癌症基准测试中优于现有方法，并能在跨物种数据上实现零样本泛化，揭示了其对保守组织分子机制的捕捉能力。

Comments Accepted at Proceedings 43rd International Conference on Machine Learning, Seoul, South Korea

2602.00767 2026-05-13 cs.LG cs.AI

BLOCK-EM: Preventing Emergent Misalignment via Latent Blocking

Muhammed Ustaomeroglu, Guannan Qu

AI总结该研究探讨了在对语言模型进行细调时可能出现的“新兴对齐偏差”问题，即模型在学习目标行为的同时，可能产生不良的领域外行为。研究提出了一种机制性方法，通过识别并限制控制偏差行为的少量内部特征，有效抑制这种偏差，且不损害模型性能。实验表明，该方法在多个细调任务中可使偏差减少达95%，并通过多种验证方式确认了其有效性与机制的针对性。

Comments Accepted to ICML 2026

2602.00297 2026-05-13 cs.LG

From Observations to States: Latent Time Series Forecasting

Jie Yang, Yifan Hu, Yuante Li, Kexin Zhang, Kaize Ding, Philip S. Yu

AI总结该论文研究了时间序列预测中的潜在表示悖论问题，即模型在预测准确的同时往往学习到时间无序的潜在表示。为此，作者提出了一种新的方法——潜在时间序列预测（LatentTSF），通过将观测数据映射到潜在状态空间并在此空间中进行预测，使模型能够学习到更结构化的时序动态。实验表明，该方法有效缓解了潜在混沌问题，在预测精度和表示质量上均取得显著提升。

Comments Accepted at ICML 2026

2601.12912 2026-05-13 cs.AI

Human Emotion Verification by Action Languages via Answer Set Programming

Andreas Brännström, Juan Carlos Nieves

AI总结本文提出了一种基于答案集编程（ASP）和状态转移系统的动作语言C-MT，用于描述人类心智状态在可观测动作序列下的演变过程。该语言结合情绪评估理论等心理学理论，将情绪等心智状态形式化为多维配置，并引入新的因果规则以控制行为对心智状态的影响，从而实现对心智状态转移的精确建模与验证。该框架支持对不同心理原理下心智变化动态的比较分析，为情绪验证等应用提供了有力的逻辑编程工具。

Comments Under consideration in Theory and Practice of Logic Programming (TPLP)

2601.09448 2026-05-13 cs.SD cs.AI

One Prompt, Many Sounds: Modeling Listener Variability in LLM-Based Equalization

Ioannis Stylianou, Jon Francombe, Pablo Martinez-Nuevo, Sven Ewan Shepstone, Zheng-Hua Tan

AI总结本文提出了一种基于大语言模型（LLM）的音频均衡方法，通过自然语言提示映射到均衡设置，实现了对声音系统的对话式控制。该方法利用受控听音实验收集的数据，结合上下文学习和参数高效微调技术，使模型能够可靠地对齐人群偏好的均衡设置。实验结果表明，与随机采样和静态预设基线相比，该方法在分布对齐方面有显著提升，展示了LLM作为“人工均衡器”的潜力，为更易用、上下文感知和专家级的音频调音方法提供了新方向。

Comments 13 pages, 15 figures, 2 tables, IEEE JSTSP submission

2512.24985 2026-05-13 cs.CV cs.AI cs.LG cs.RO

DarkQA: Benchmarking Vision-Language Models on Visual-Primitive Question Answering in Low-Light Indoor Scenes

Yohan Park, Hyunwoo Ha, Wonjun Jo, Tae-Hyun Oh

AI总结本文提出DarkQA，一个用于评估视觉语言模型在低光室内场景下视觉原语问答能力的开源基准。该基准通过多级光照控制生成9,400个可验证的问题-图像对，模拟真实光照下降和传感器噪声，揭示了现有模型在低光条件下的性能退化问题。研究还系统评估了多种视觉语言模型和低光图像增强方法，展示了DarkQA在分析模型鲁棒性方面的有效性。

Comments This work has been submitted to the IEEE for possible publication

2512.20865 2026-05-13 cs.LG cs.SY eess.SY

Robustness Certificates for Neural Networks against Adversarial Attacks

Sara Taheri, Mahalakshmi Sabanayagam, Debarghya Ghoshdastidar, Majid Zamani

AI总结随着机器学习在安全关键领域中的广泛应用，对抗性威胁，尤其是数据投毒攻击，带来的风险日益加剧。本文提出了一种基于离散时间动态系统建模的正式鲁棒性认证框架，将梯度训练过程形式化，并借鉴控制理论中的屏障证书概念，为模型在最坏情况下的鲁棒性提供形式化保证。该方法通过神经网络参数化屏障证书，并结合场景凸优化推导出泛化性保证，首次实现了对训练时和测试时攻击的统一形式化认证，实验表明其在多个数据集上具有良好的鲁棒性认证效果。

详情

DOI: 10.1109/OJCSYS.2026.3689712
Journal ref: IEEE Open Journal of Control Systems, 2026

英文摘要

The increasing use of machine learning in safety-critical domains amplifies the risk of adversarial threats, especially data poisoning attacks that corrupt training data to degrade performance or induce unsafe behavior. Most existing defenses lack formal guarantees or rely on restrictive assumptions about the model class, attack type, extent of poisoning, or point-wise certification, limiting their practical reliability. This paper introduces a principled formal robustness certification framework that models gradient-based training as a discrete-time dynamical system (dt-DS) and formulates poisoning robustness as a formal safety verification problem. By adapting the concept of barrier certificates (BCs) from control theory, we introduce sufficient conditions to certify a robust radius ensuring that the terminal model remains safe under worst-case ${\ell}_p$-norm based poisoning. To make this practical, we parameterize BCs as neural networks trained on finite sets of poisoned trajectories. We further derive probably approximately correct (PAC) bounds by solving a scenario convex program (SCP), which yields a confidence lower bound on the certified robustness radius generalizing beyond the training set. Importantly, our framework also extends to certification against test-time attacks, making it the first unified framework to provide formal guarantees in both training and test-time attack settings. Experiments on MNIST, SVHN, and CIFAR-10 show that our approach certifies non-trivial perturbation budgets while being model-agnostic and requiring no prior knowledge of the attack or contamination level.

URL PDF HTML ☆

赞 0 踩 0

2512.17637 2026-05-13 cs.AI cs.FL cs.LO

About Time: Model-free Reinforcement Learning with Timed Reward Machines

Rajarshi Roy, Anirban Majumdar, Ritam Raha, David Parker, Marta Kwiatkowska

AI总结在强化学习中，奖励规范对指导智能体行为至关重要。为表达非马尔可夫奖励，已有研究引入奖励机，但传统奖励机难以建模精确的时间约束。本文提出了一种新的时间奖励机（TRM），将时间约束融入奖励结构，支持更丰富的奖励逻辑，例如对延迟施加惩罚或对及时动作给予奖励。研究基于无模型强化学习框架（如表格Q学习），通过时间自动机的抽象和反事实想象启发式方法，学习满足时间约束的最优策略，并在多个基准任务中验证了其有效性。

Comments Extended version of paper accepted at IJCAI 2026

2512.11114 2026-05-13 cs.LG cs.AI stat.ML

In-Context Multi-Objective Optimization

Xinyu Zhang, Conor Hassan, Julien Martinelli, Daolang Huang, Samuel Kaski

AI总结在多目标优化问题中，如何平衡多个竞争目标是一个普遍存在的挑战，尤其在药物设计和自主系统等领域。本文提出了一种名为TAMO的全摊销通用策略，利用Transformer架构实现对不同输入和目标维度的多目标黑盒优化，无需针对每个任务重新训练模型。通过强化学习预训练，TAMO能够在单次前向传播中快速生成优化方案，显著提升了计算效率，并在多个基准和实际任务中表现出优异的帕累托前沿质量。

2512.07150 2026-05-13 cs.LG cs.AI cs.CV

FlowLPS: Langevin-Proximal Sampling for Flow-based Inverse Problem Solvers

Jonghyun Park, Jong Chul Ye

AI总结本文提出了一种名为 FlowLPS 的训练-free 潜在流逆问题求解方法，基于朗之万-近端采样（Langevin-Proximal Sampling），旨在解决深度生成模型在图像逆问题中的有限步数权衡问题。该方法在每一步反向过程中使用少量朗之万更新对模型预测的干净估计进行扰动，以提供后验导向的随机初始化，随后通过局部 MAP 风格的近端优化快速提升测量一致性，并结合受控的 pCN 风格重噪声技术保持轨迹稳定性。实验表明，FlowLPS 在多个线性逆问题上实现了测量保真度与感知质量的良好平衡。