arXivDaily每日学术速递，同步arXiv全量数据，AI总结、翻译，覆盖人工智能、机器人、计算机、金融、统计学、数学、物理学、生物学、经济学、电气&系统等方向。

2605.11696 2026-05-13 cs.CV cs.AI cs.GR

WildRelight: A Real-World Benchmark and Physics-Guided Adaptation for Single-Image Relighting

Lezhong Wang, Mehmet Onurcan Kaya, Siavash Bigdeli, Jeppe Revall Frisvad

AI总结 WildRelight 是一个专为单图像重光照任务设计的首个真实场景数据集，包含高分辨率户外场景及其配对的高动态范围环境光映射，用于评估现有方法在真实环境中的表现。该数据集揭示了当前基于合成数据训练的先进模型在真实世界中存在严重的领域偏移问题。研究提出了一种基于物理引导的推理框架，结合扩散后验采样与时间感知的测试时自适应方法，实现了合成模型在真实场景中的实时对齐，为解决模拟到现实的挑战提供了新的思路。

Comments Companion paper to the CVPR26 findings paper 'WildRelight', introducing the physics-guided adaptation method evaluated on the dataset. Project Page: https://lez-s.github.io/wildrelight_proj/

2605.11695 2026-05-13 cs.CV cs.AI

Emergent Communication between Heterogeneous Visual Agents through Decentralized Learning

Mikako Ochiai, Masatoshi Nagano, Tadahiro Taniguchi

AI总结本文研究了在异构视觉代理之间通过去中心化学习产生的通信机制，探讨了当代理具有不同视觉表征时，哪些视觉信息可以被共享。研究中代理仅交换离散的标记序列，并基于本地感知证据更新自身模型，无需依赖共享的通信目标。实验表明，这种通信方式能够生成具有视觉信息的共享标记序列，在跨代理对齐、视觉特征预测和图像-文本检索任务中优于无通信基线，并揭示了视觉编码器异质性对通信内容和语言对称性的影响。

详情

英文摘要

Symbols are shared, but perception is private. We study emergent communication between heterogeneous visual agents through decentralized learning, asking what visual information can become shareable when agents have different visual representations. Instead of optimizing messages through a shared external communicative objective, our agents exchange only discrete token sequences and update their own models using local perceptual evidence. This setting focuses on an underexplored aspect of emergent communication, examining whether common symbols can arise without shared perceptual access, and how the similarity between private visual spaces constrains the content and symmetry of the resulting language. We instantiate this setting in the Metropolis-Hastings Captioning Game (MHCG), where two agents collaboratively form shared captions by exchanging proposed token sequences that a listener accepts or rejects using an MH-style criterion evaluated against its own visual features. We compare three pairings of frozen visual encoders, with agents starting from randomly initialized text modules. Experiments on MS-COCO show that MHCG produces visually informative shared token sequences that outperform a no-communication baseline in cross-agent alignment, visual-feature prediction, and image-text retrieval; all cross-agent metrics decline as encoder mismatch increases. Moderate encoder heterogeneity reduces the number of shared sequences while preserving per-sequence visual specificity, whereas stronger encoder heterogeneity yields fewer, coarser, and more asymmetric sequences. Ablations show that listener-side MH acceptance is critical for avoiding degenerate token formation. These results suggest that shared symbols can arise from local perceptual evaluation alone, with visual representational similarity across encoders shaping both the content and symmetry of the resulting language.

URL PDF HTML ☆

赞 0 踩 0

2605.11694 2026-05-13 cs.LG

Augmented Lagrangian Method for Last-Iterate Convergence for Constrained MDPs

Michael Lu, Max Qiushi Lin, Mo Chen, Sharan Vaswani

AI总结本文研究无限时间折扣约束马尔可夫决策过程（CMDPs）的策略优化问题，关注实际应用中需要部署单一最终策略的场景。为了解决现有理论保证通常针对混合策略而难以直接应用的问题，作者提出采用增强拉格朗日（AL）方法，并结合投影Q上升（PQA）算法，构建了一个具有可证明最终迭代收敛性的通用框架。该方法不仅适用于表格型CMDPs，还可推广到对数线性策略及复杂非线性策略，并在连续控制任务中验证了其有效性。

2605.11693 2026-05-13 cs.AI

Measuring What Matters Beyond Text: Evaluating Multimodal Summaries by Quality, Alignment, and Diversity

Abid Ali, Diego Molla-Aliod, Usman Naseem

AI总结该研究针对多模态摘要生成任务中现有评估方法的不足，提出了一种统一的评估框架MM-Eval，用于综合衡量文本质量、图像-文本对齐性以及视觉多样性。MM-Eval通过结合事实一致性、语义连贯性、图像相关性及视觉多样性等多维度指标，实现了对多模态摘要更全面和准确的评估。实验表明，该框架优于传统启发式方法，为多模态摘要系统的比较评估提供了可解释且弱依赖参考的解决方案。

Comments Accepted to Findings of ACL 2026

2605.11691 2026-05-13 cs.LG

Compositional Neural Operators for Multi-Dimensional Fluid Dynamics

Hamda Hmida, Hsiu-Wen Chang, Youssef Mesri

AI总结该论文提出了一种用于二维流体动力学的组合神经算子（CompNO）框架，旨在解决偏微分方程的高效求解问题。该方法将复杂的物理方程分解为多个预训练的基础模块，如对流、扩散和泊松求解器等，并通过一个自适应块进行组合，从而实现对非线性相互作用的学习。实验表明，该方法在适应新物理系统时具有更高的灵活性和可解释性，并能有效复用预训练模块。

Comments Published as a conference paper at ICLR 2026

2605.11689 2026-05-13 cs.LG cs.CL

Slicing and Dicing: Configuring Optimal Mixtures of Experts

Margaret Li, Sneha Kudugunta, Danielle Rothermel, Luke Zettlemoyer

AI总结本文系统研究了大规模语言模型中专家混合（MoE）架构的核心设计选择，包括专家数量、粒度、共享专家、负载均衡等，并在超过2000次预训练实验中分析了这些参数对模型性能的影响。研究发现，随着MoE参数规模的增加，模型性能持续提升，且最优专家规模主要取决于活跃参数数量，而非总参数量。此外，专家数量和粒度是影响模型质量的最关键因素，而其他配置如共享专家或负载均衡机制的影响相对较小。

2605.11688 2026-05-13 cs.LG cs.AI cs.MA

Shaping Zero-Shot Coordination via State Blocking

Mingu Kang, Sunwoo Lee, Yonghyeon Jo, Seungyul Han

AI总结本文研究了零样本协调（ZSC）问题，即如何使智能体在未与合作伙伴预先交互的情况下实现协作，这对于现实中的多智能体系统和人机协作至关重要。为解决现有方法在面对未见合作伙伴时泛化能力不足的问题，作者提出了一种名为状态阻断协调（SBC）的框架，通过生成虚拟环境中的多样化交互场景，使智能体在训练过程中接触多种次优合作伙伴策略，从而提升其零样本协调能力。实验表明，SBC在多个基准测试中表现出优越的协调性能，尤其在与人类合作伙伴的协作中具有显著优势。

Comments 9 technical page followed by references and appendix

2605.11687 2026-05-13 cs.AI

Persistent and Conversational Multi-Method Explainability for Trustworthy Financial AI

Georgios Makridis, Georgios Fatouros, John Soldatos, George Katsis, Dimosthenis Kyriazis

AI总结该研究针对金融领域对可信AI解释的需求，提出了一种持久化、多方法交叉验证且支持对话交互的可解释性AI架构。核心方法包括将多种XAI结果作为可检索的持久化对象进行存储，并通过检索增强生成技术实现多方法解释的对比与融合，同时引入自动化检查机制评估解释的可靠性。该架构在金融情感分析任务中进行了验证，显著提升了解释的准确性和可信度。

Comments 5 pages

2605.11685 2026-05-13 cs.CL

Robust LLM Unlearning Against Relearning Attacks: The Minor Components in Representations Matter

Zeguan Xiao, Xuanzhe Xu, Yun Chen, Yong Wang, Jian Yang, Yanqing Hu, Guanhua Chen

AI总结本文研究了大型语言模型（LLM）在面对“重学习攻击”时的健壮性问题，发现现有遗忘方法主要优化主成分，而次要成分未被有效修改，导致攻击者可通过调整主成分快速恢复被遗忘的知识。基于表示的谱结构分析，作者提出了一种针对次要成分的遗忘方法（MCU），通过在这些更具鲁棒性的方向上进行遗忘操作，显著提升了模型对重学习攻击的抵抗力，并在多个数据集上验证了其有效性。

2605.11684 2026-05-13 cs.LG eess.SP math.PR stat.AP

Partial Model Sharing Improves Byzantine Resilience in Federated Conformal Prediction

Ehsan Lari, Reza Arablouei, Stefan Werner

AI总结本文提出了一种基于部分模型共享的拜占庭鲁棒联邦共形预测方法，通过每次仅交换部分模型参数来提升系统安全性与通信效率。该方法在训练和校准阶段均增强了鲁棒性，训练阶段通过部分共享限制攻击面并减少恶意更新的影响，校准阶段则利用直方图特征向量进行异常检测与共形分位数估计。实验表明，该方法在多种拜占庭攻击场景下能实现更接近名义值的预测覆盖率，并显著缩小预测区间，为联邦不确定性量化提供了更高效且鲁棒的解决方案。

Comments 5 pages, 4 figures, Accepted for presentation at the 34th European Signal Processing Conference (EUSIPCO 2026) in Bruges, Belgium

2605.11683 2026-05-13 cs.CV

DORA: Dynamic Online Reinforcement Agent for Token Merging in Vision Transformers

Kaixuan He, Song Chen, Yi Kang

AI总结视觉 Transformer（ViT）由于自注意力机制的二次复杂度，计算开销较大。为解决这一问题，本文提出 DORA，一种基于强化学习的动态在线推理框架，用于在 ViT 中实现自适应的 token 合并。DORA 将 token 合并过程建模为马尔可夫决策过程，通过轻量级 RL 智能体根据当前特征状态和层间上下文动态决定合并策略，并通过非线性知识蒸馏惩罚函数优化智能体，以平衡计算效率与特征保真度。实验表明，DORA 在多个 ViT 尺度上均优于现有方法，在保持精度损失极小的前提下实现了显著的计算加速。

Comments Preprint. Under review

2605.11680 2026-05-13 cs.CV

ShapeCodeBench: A Renewable Benchmark for Perception-to-Program Reconstruction of Synthetic Shape Scenes

Shivam Kumar

AI总结本文介绍了 ShapeCodeBench，一个用于感知到程序重建的合成基准，旨在从渲染图像生成可执行的绘图程序，并与目标图像进行比较。该基准通过可重复的随机数生成器生成样本，支持创建无偏的测试集，包含不同难度级别的150个样本，并采用多种指标进行评估。实验表明，当前最先进的模型在精确匹配方面仍表现有限，表明该基准仍有较大的提升空间。

Comments 14 pages, 5 figures, 2 tables. Code, data, and artifacts: https://github.com/shivamk3r/shape-code-bench ; archival release: https://doi.org/10.5281/zenodo.20132286

2605.11678 2026-05-13 cs.AI

OOM-Free Alpamayo via CPU-GPU Memory Swapping for Vision-Language-Action Models

Seungwoo Roh, Huiyeong Kim, Jong-Chan Kim

AI总结本文提出了一种名为OOM-Free Alpamayo的框架，通过CPU-GPU内存交换技术，在不修改模型结构的前提下，实现了在显存受限的GPU上高效运行视觉-语言-动作（VLA）模型。该方法通过分层内存管理、流水线参数传输和驻留层决策策略，显著降低了显存占用并提升了推理速度。实验表明，该方法在NVIDIA Alpamayo-R1-10B模型上实现了比现有方法最高3.55倍的加速，同时保持了全BF16精度。

Comments Submitted to IEEE RTCSA on March 26, 2026 (KST); Accepted on May 4, 2026 (KST)

2605.11674 2026-05-13 cs.RO

A Proprioceptive-Only Benchmark for Quadruped State Estimation: ATE, RPE, and Runtime Trade-offs Between Filters and Smoothers

Ylenia Nisticò, João Carlos Virgolino Soares, Joan Solà, Claudio Semini

AI总结本文对比了三种先进的四足机器人本体感知状态估计器（MUSE、IEKF 和 IS），在 GrandTour 数据集的 CYN-1 序列上评估其长期和短期精度以及计算效率。研究发现，IEKF 和 IS 在长期轨迹误差上优于 MUSE，而短期误差在各方法间差异较小，不同方法在精度与计算延迟之间存在权衡。该研究为四足机器人状态估计器的选择提供了清晰的性能与计算成本参考，并开源了全部评估代码以保证可复现性。

Comments Submitted to IEEE Robotics and Automation Practice

2605.11672 2026-05-13 cs.AI cs.DB

A CAP-like Trilemma for Large Language Models: Correctness, Non-bias, and Utility under Semantic Underdetermination

Vinu Ellampallil Venugopal

AI总结本文受分布式系统中CAP定理的启发，提出了一种针对大语言模型（LLM）的类CAP三难困境：在语义不充分的情况下，模型无法同时保证强正确性、严格无偏和高实用性。研究指出，当输入提示缺乏唯一答案时，模型若要生成有用的回答，必须引入某种选择标准，但若该标准未由用户提供或由前提合理推导，则可能导致偏见；反之，若模型避免使用未经支持的偏好，则可能保持正确性和无偏性，但会牺牲实用性。该研究揭示了某些LLM失败的根源可能在于任务本身的语义不充分，而非模型能力的局限。

2605.11666 2026-05-13 cs.LG cs.AI

Evolutionary Task Discovery: Advancing Reasoning Frontiers via Skill Composition and Complexity Scaling

Liqin Ye, Yanbin Yin, Michael Galarnyk, Yuzhao Heng, Sudheer Chava, Chao Zhang

AI总结本文提出了一种名为Evolutionary Task Discovery（EvoTD）的框架，旨在通过结构化进化操作提升大语言模型的推理能力。该方法将数据合成视为在算法技能和复杂度属性构成的双轴流形上的定向搜索，引入了交叉操作以增强技能组合的多样性，并通过参数化变异操作调整结构约束以促进鲁棒泛化。实验表明，EvoTD能够有效扩展模型的推理边界，并在不同模型架构和预训练设置下展现出良好的泛化能力。

2605.11665 2026-05-13 cs.RO

Nautilus: From One Prompt to Plug-and-Play Robot Learning

Yufeng Jin, Jianfei Guo, Xiaogang Jia, Yu Deng, Zechu Li, Han Liu, Weiran Liao, Vignesh Prasad, Mathias Franzius, Gerhard Neumann, Georgia Chalvatzaki

AI总结当前机器人学习研究分散在不同的策略家族、基准测试和实际机器人系统中，导致各实现之间复杂交织，难以移植和复用。为解决这一问题，本文提出NAUTILUS，一个开源框架，能够将用户输入的单一指令（如“用基准B评估策略A”）自动转化为可执行的复现、评估、微调和部署流程。NAUTILUS通过统一接口、类型化契约和自动化验证机制，实现了对现有和用户自定义策略、仿真器、基准和真实机器人的灵活集成，显著降低了跨体系复现与评估的工程负担。

2605.11663 2026-05-13 cs.CL

Human-Grounded Multimodal Benchmark with 900K-Scale Aggregated Student Response Distributions from Japan's National Assessment of Academic Ability

Kyosuke Takami, Yuka Tateisi, Satoshi Sekine, Yusuke Miyao

AI总结该研究基于日本全国学力调查数据，构建了一个包含科学、数学和日语科目的多模态基准数据集，包含真实考试题目、图表及约90万份学生答题分布数据。该数据集保留了真实考试的结构和内容，支持在统一评估框架下对比人类与模型的表现。研究通过实测准确率和字符级F1指标评估了多模态大语言模型的性能，并进一步分析了自动评分的可靠性，为多模态教育推理提供了可复现的基准，支持未来在真实评估场景中的模型评估与可解释性研究。

2605.11659 2026-05-13 cs.CV cs.AI

Reviving In-domain Fine-tuning Methods for Source-Free Cross-domain Few-shot Learning

Yaze Zhao, Yicong Liu, Yixiong Zou, Yuhua Li, Ruixuan Li

AI总结本文研究了在源域数据不可用的情况下，如何通过少量样本将大模型（如CLIP）适配到目标领域的问题，即无源域少样本跨域学习（CDFSL）。研究发现，基于适配器的方法（如LoRA）在CDFSL中优于基于提示的方法，其优势源于对视觉CLS token注意力的修正，从而增强模态对齐和类别区分。基于这一发现，作者提出了一个通用的注意力建模框架——语义探针（Semantic Probe），有效提升了适配器和提示方法在CDFSL中的性能，并在多个基准上取得了最先进的结果。

2605.11636 2026-05-13 cs.AI

Seirênes: Adversarial Self-Play with Evolving Distractions for LLM Reasoning

Chi Zhang, Haibo Qiu, Qiming Zhang, Yufei Xu, Xinbo Gao, Jing Zhang

AI总结本文提出了一种名为 Seirênes 的自对抗自博弈强化学习框架，旨在将大语言模型在复杂上下文中推理失败的问题转化为训练信号，从而提升其鲁棒性。该方法通过单一模型同时生成具有干扰性的上下文和解决任务，迫使模型在噪声中识别核心逻辑，从而增强其深层推理能力。实验表明，Seirênes 在多个数学推理基准上取得了显著提升，并能有效暴露顶级闭源模型的推理盲点。

2605.11634 2026-05-13 cs.CV cs.AI

Unlocking UML Class Diagram Understanding in Vision Language Models

Artem Naboichenko, René Peinl

AI总结尽管视觉语言模型（VLMs）在各类应用中取得了显著进展，但在理解图表等结构化视觉内容方面仍存在不足，尤其在计算机科学领域的UML类图理解方面研究较少。本文提出了一种基于UML类图的视觉问答基准，兼具挑战性与可行性，并构建了一个包含16,000个图像-问题-答案三元组的大规模训练数据集。实验表明，基于LoRA的微调方法在该任务上表现优于当前主流的Qwen 3.5 27B模型。

2605.11633 2026-05-13 cs.AI

Can LLM Agents Respond to Disasters? Benchmarking Heterogeneous Geospatial Reasoning in Emergency Operations

Junjue Wang, Weihao Xuan, Heli Qi, Pengyu Dai, Kunyi Liu, Hongruixuan Chen, Zhuo Zheng, Junshi Xia, Stefano Ermon, Naoto Yokoya

AI总结该论文提出了一种名为DORA的基准测试平台，用于评估大型语言模型代理在灾难应急响应中的端到端能力。研究通过515个由专家设计的任务，覆盖45个真实灾难事件，涵盖从灾害感知、空间分析到疏散规划和多模态报告生成等多个维度，全面测试代理在异构地理空间数据上的推理与操作能力。实验揭示了当前LLM代理在灾难响应中的三大挑战，包括领域适应性不足、工具选择与参数理解困难以及长流程推理的脆弱性，为构建更可靠的灾难响应系统提供了重要参考。

Comments DORA stress-tests LLM agents on real-world disaster operations that demand comprehensive orchestration of 108 specialized tools over heterogeneous geospatial data

2605.11629 2026-05-13 cs.CL

OmniThoughtVis: A Scalable Distillation Pipeline for Deployable Multimodal Reasoning Models

Yuanhao Yue, Chengyu Wang, Yuanjie Lyu, Lei Shen, Jun Huang

AI总结近年来，多模态大语言模型在视觉语言任务中展现出强大的链式推理能力，但由于延迟和资源限制，其在实际系统中的部署受到限制。为了解决这一问题，本文提出OmniThoughtVis，一个可扩展的数据筛选与知识蒸馏框架，用于将大模型的多模态推理能力迁移到更小、更适合部署的模型中。该方法通过生成结构化的推理轨迹并结合多种策略保证数据质量，最终在多个基准测试中显著提升了小模型的推理性能，展示了其在实际应用中的重要价值。

2605.11628 2026-05-13 cs.CV

Single-Shot HDR Recovery via a Video Diffusion Prior

Chinmay Talegaonkar, Jinshi He, Christopher McKenna, Nicholas Antipa

AI总结本文提出了一种基于视频扩散先验的单次拍摄高动态范围（HDR）图像恢复方法，解决了现有方法在保真度和模型复杂度之间的平衡问题。该方法将HDR重建重新定义为条件视频生成任务，通过生成曝光序列并融合为最终HDR图像，提升了重建结果的准确性和可解释性。实验表明，该方法在多个评估指标上优于现有方法，并在人类评估中获得更高偏好，同时框架还可扩展到其他图像重建任务。

2605.11625 2026-05-13 cs.AI

Nice Fold or Hero Call: Learning Budget-Efficient Thinking for Adaptive Reasoning

Zhaomeng Zhou, Lan Zhang, Junyang Wang, Mu Yuan, Junda Lin

AI总结这篇论文研究了如何让大型推理模型在有限计算资源下更高效地进行适应性推理。作者提出了一种名为Budget-Efficient Thinking（BET）的两阶段框架，通过结合行为冷启动和投资成本感知奖励机制，使模型能够根据推理的预期收益而非问题难度来分配计算预算。BET使模型学会在简单问题上快速回答、在无解问题上提前放弃、在复杂但可解的问题上保留足够计算资源，从而在多个基准测试中显著减少了推理开销并提升了整体性能。

Comments 24 pages, 6 figures, 11 tables

2605.11622 2026-05-13 cs.CV

RNA-FM: Flow-Matching Generative Model for Genome-wide RNA-Seq Prediction

Yaxuan Song, Jianan Fan, Tianyi Wang, Qiuyue Hu, Hang Chang, Heng Huang, Weidong Cai

AI总结本文提出了一种名为RNA-FM的生成模型，用于基于组织病理学全切片图像（WSI）预测全基因组RNA测序（RNA-seq）数据。该方法将转录组预测建模为连续时间条件运输问题，通过学习形态条件下的速度场，从简单先验分布映射到目标基因表达分布，从而更准确地捕捉生物异质性和预测不确定性。RNA-FM结合通路级别的结构信息，实现了可扩展且具有生物学可解释性的全基因组基因表达填补，实验表明其在性能和生物学意义方面均优于现有方法。

Comments 15 pages, 13 tables, 3 figures. Accepted by the Forty-Third International Conference on Machine Learning (ICML2026). Code is available at https://github.com/YXSong000/RNA-FM

2605.11618 2026-05-13 cs.RO

Sampling-Based Follow-the-Leader Motion Planning for Manipulator-Mounted Continuum Robots

Chengnan Shentu, Nicholas Baldassini, Oluwagbotemi D. Iseoluwa, Radian Gondokaryono, Jessica Burgner-Kahrs

AI总结本文研究了用于机械臂搭载的连续体机器人的“跟随领导者”（FTL）运动规划问题，提出了一种基于采样的运动规划方法，能够同时考虑机器人构型和机械臂末端位姿。该方法通过几何构造直接计算末端位姿，避免了在线规划中的迭代优化，提升了效率，并保证了形状搜索的分辨率完备性与末端跟踪的收敛性。实验表明，该方法在多种测试场景中均实现了100%的成功率和较高的轨迹精度。

2605.11616 2026-05-13 cs.CV

Grounding by Remembering: Cross-Scene and In-Scene Memory for 3D Functional Affordances

Qirui Wang, Jingyi He, Yining Pan, Xulei Yang, Shijie Li

AI总结该研究旨在解决三维功能可操作性区域的定位问题，即在视觉语言模型中准确识别出物体上可用于交互的特定区域，如把手或按钮。为此，提出了一种名为AFFORDMEM的框架，通过跨场景和场景内两种记忆机制，无需模型微调或目标场景标注，即可从源场景中构建可复用的记忆库来辅助定位。实验表明，该方法在SceneFun3D数据集上显著提升了定位精度，验证了其在细粒度定位和空间关系理解方面的有效性。

2605.11613 2026-05-13 cs.LG cs.AI

From Generic Correlation to Input-Specific Credit in On-Policy Self Distillation

Guobin Shen, Lei Huang, Xiang Cheng, Chenxiao Zhao, Jindong Li, Dongcheng Zhao, Xing Yu

AI总结本文研究了在策略优化中使用自我蒸馏时，如何从通用相关性转向输入特定的奖励分配问题。作者提出，标准的自我蒸馏奖励本质上是响应与反馈之间的点互信息（pMI），并进一步将其分解为输入相关的部分和通用捷径部分。基于此，他们提出了CREDIT方法，通过对比学习分离输入特定的奖励成分，从而提升模型在多个任务上的表现，且计算开销极小。

2605.11612 2026-05-13 cs.CL cs.AI

When Emotion Becomes Trigger: Emotion-style dynamic Backdoor Attack Parasitising Large Language Models

Ziyu Liu, Tao Li, Tianjie Ni, Xiaolong Lan, Wengang Ma, Tao Yang, Guohua Wang, Junjiang He

AI总结该研究提出了一种针对大语言模型的新型后门攻击方法——Paraesthesia，通过将情绪作为动态触发因素，实现对模型的隐蔽性攻击。不同于传统基于固定触发词的后门攻击，Paraesthesia 利用情绪风格在语义空间中形成独立聚类的特性，将情绪作为触发信号嵌入训练数据，使模型在推理阶段遇到特定情绪输入时生成预设的恶意输出。实验表明，该方法在多种任务和不同模型上均能实现高达约99%的攻击成功率，同时保持模型的正常功能。