arXivDaily每日学术速递，同步arXiv全量数据，AI总结、翻译，覆盖人工智能、机器人、计算机、金融、统计学、数学、物理学、生物学、经济学、电气&系统等方向。

2605.14016 2026-05-15 cs.SE cs.SD

Case Studies and Reflections on Agentic Software Engineering for Rapid Development of Digital Music Instruments

Matthew John Yee-King

AI总结本文探讨了智能代理软件工程（ASE）在数字音乐乐器软件开发中的应用，旨在降低开发门槛、提升软件互操作性和长期可用性。通过三个案例研究，作者展示了如何利用ASE技术在C++和JUCE框架下开发音频软件，包括重新实现音乐鼠标插件、将Continuator系统从Python移植为原生插件以及开发新的3D音序器界面。研究通过开发者自身经验的叙述，总结了ASE在该领域的有效实践，并提出了未来与非程序员音乐家合作评估该方法的建议。

2605.13998 2026-05-15 q-fin.CP cs.LG

Synthetic American Option Pricing via Jump-HMM-Driven Heston Implied Volatility

Julia Sun, Zheyu Jin, Jiawei Zhang, Jeffrey D. Varner

AI总结该研究提出了一种用于生成合成美式期权价格的框架，解决了隐含波动率依赖真实期权价格而造成的循环依赖问题。通过结合跳跃隐马尔可夫模型生成多资产价格路径，并利用改进的Heston波动率模型生成隐含波动率曲面，最终使用二叉树模型计算美式期权价格。该方法无需外部校准即可生成波动率微笑、偏斜和期限结构，并通过神经网络代理模型和行业特征提升模型的泛化能力与跨资产鲁棒性。

详情

英文摘要

Generating realistic synthetic option prices requires implied volatility as an input, yet implied volatility is itself derived from observed option prices, creating a circular dependency that limits synthetic data for machine-learning and risk-analysis applications. We break this circularity with a pipeline in which implied volatility emerges as an output of a structural model of equity returns. A Jump Hidden Markov Model produces multi-asset price paths with realistic stylized facts and cross-asset tail dependence; a modified Heston variance process, whose mean-reversion target depends on regime state, days to expiration, moneyness, and a market-mood indicator, converts those paths into implied-volatility paths; and a recombining binomial lattice prices American options from the resulting surface. Initializing variance at its mean-reversion target for each strike-expiration pair lets smile, skew, and term structure emerge without external calibration. We calibrate the shape function through a hierarchy spanning a parametric baseline, a globally shared neural surrogate, and a sector-specific neural surrogate fit to a multi-ticker, multi-sector option ladder. A temporal holdout on a multi-day capture isolated scheduled corporate events as the dominant source of test-time generalization error, and calendar-derived earnings-distance and same-sector peer-coupling features recovered the anticipatory portion of that signal. We then apply the framework as a synthetic-data generator on real near-the-money put and call contracts, forward-simulating price paths, and recovering path-conditional implied volatility, finite-difference American Greeks, and terminal short-premium profit and loss from one coherent simulation, and confirm cross-ticker robustness by re-running on a second underlying from a different sector and volatility regime. The framework is released as an open-source Julia package.

URL PDF HTML ☆

赞 0 踩 0

2605.13979 2026-05-15 quant-ph cs.LG stat.ML

Winning Lottery Tickets in Neural Networks via a Quantum-Inspired Classical Algorithm

Natsuto Isogai, Hayata Yamasaki, Sho Sonoda, Mio Murao

AI总结本文提出了一种受量子算法启发的全新经典算法，用于从大型浅层神经网络中高效选取稀疏子网络。该算法通过优化概率分布进行采样，避免了传统方法中指数级的时间复杂度，实现了多项式时间复杂度的改进。实验表明，该算法在采样效率和经验风险方面均优于传统方法，展示了在无需量子硬件的情况下，经典计算机也能高效完成量子启发的稀疏子网络选择任务。

Comments 28 pages, 3 figures

2605.13940 2026-05-15 cs.CR cs.AI

AgentTrap: Measuring Runtime Trust Failures in Third-Party Agent Skills

Haomin Zhuang, Hanwen Xing, Yujun Zhou, Yuchen Ma, Yue Huang, Yili Shen, Yufei Han, Xiangliang Zhang

AI总结随着第三方技能成为大型语言模型（LLM）代理的常用组件，其带来的安全风险日益突出。为评估代理在使用第三方技能时抵御恶意运行时行为的能力，研究提出了AgentTrap，一个动态基准测试平台，包含141个任务，涵盖16个安全影响维度。实验发现，代理常在完成可见用户任务的同时，忽视由恶意技能引入的潜在安全风险，凸显了对实际运行环境中模型行为进行实时评估的重要性。

2605.13922 2026-05-15 cs.CR cs.LG stat.CO

XAI and Statistical Analysis for Reliable Intrusion Detection in the UAVIDS-2025 Dataset: From Tree to Hybrid and Tabular DNN Ensembles

Iakovos-Christos Zarkadis, Christos Douligeris

AI总结本文研究了如何利用可解释人工智能（XAI）和统计分析方法，提高无人机入侵检测系统（UAVIDS-2025）中机器学习模型的可靠性。通过对比多种树模型、深度神经网络、混合堆叠模型和集成神经网络，作者找到了性能最佳的XGBoost模型，并结合SHAP方法进行特征重要性分析，揭示了不同攻击类型的关键特征和误判原因。进一步通过密度估计和多重比较统计检验，发现了Wormhole和Blackhole攻击在数据集中的分布特性及其误判的根本原因，为构建可解释且可靠的入侵检测模型提供了重要参考。

2605.13918 2026-05-15 cs.SE cs.LG

CA2: Code-Aware Agent for Automated Game Testing

Valliappan Chidambaram Adaikkappan, Vincent Martineau, Joshua Romoff, David Meger

AI总结自动化游戏测试对于验证游戏功能至关重要，但目前仍是一项耗时且成本高昂的工作。本文提出了一种基于代码感知的智能体CA2，通过利用游戏内部的调用栈信息，学习有效的测试策略以提高测试覆盖率。实验表明，与不使用代码信号的传统方法相比，CA2在多种环境下均能实现更高效和精准的测试目标函数覆盖。

2605.13916 2026-05-15 stat.ML cs.AI cs.LG

A Regret Perspective on Online Multiple Testing

Qingyang Hao, Kongchang Zhou, Fang Kong, Hongxin Wei

AI总结本文从遗憾（Regret）的角度研究在线多重假设检验（OMT），旨在统一评估假阳性与假阴性之间高度不对称的成本。作者引入了加权遗憾指标，揭示了严格控制FDR的确定性方法在稀疏信号冷启动阶段会导致线性遗憾惩罚，并提出了Decoupled-OMT（DOMT）方法，通过引入非负随机扰动，在不增加假阴性的同时显著降低遗憾，实验证明其在非平稳环境下有效缓解阈值耗尽问题。

2605.13915 2026-05-15 stat.ML cs.AI cs.LG

Multi-Scale Dequant: Eliminating Dequantization Bottleneck via Activation Decomposition for Efficient LLM Inference

Lingchao Zheng, Yuwei Fan, Jun Li, Chengqiu Hu, Qichen Liao, Junyi Fan, Rui Shi, Fangzheng Miao

AI总结量化是实现大语言模型高效推理的关键技术，但反量化步骤在现代AI加速器上已成为性能瓶颈。本文提出多尺度反量化（MSD）框架，通过将高精度激活分解为多个低精度组件，直接与量化权重进行矩阵乘法，从而绕过传统反量化流程，显著提升计算效率。实验表明，MSD在保持精度的同时，有效减少了计算延迟和显存带宽需求，适用于多种权重格式并具有严格的误差界保证。

2605.13913 2026-05-15 stat.ML cs.LG

A Survey on Data-Dependent Worst-Case Generalization Bounds

Hubert Leroux, Jean Marcus, Julien Roger

AI总结本文综述了数据依赖的最坏情况泛化界的研究进展，旨在解释深度神经网络在高度参数化情况下仍具有良好泛化能力的现象。核心方法包括扩展PAC-Bayesian理论以适应数据依赖的假设集、利用优化轨迹的几何与拓扑特性改进复杂度项，以及通过稳定性假设替代信息论中的相关项。本文将这些成果统一在一个通用不等式框架下，并对不同方法的泛化界进行了对比分析。

Comments 15 pages, 4 figures, 3 tables. The LaTeX source uses the JMLR preprint style (jmlr2e.sty) and BibTeX (refs.bib). Central references in arXiv form include arXiv:2404.17442, arXiv:2006.09313, arXiv:2302.02766, arXiv:2407.08723, and arXiv:2507.06775

2605.13910 2026-05-15 stat.ML cs.CV cs.LG

Covariance-aware sampling for Diffusion Models

Andrea Schioppa, Tim Salimans

AI总结本文提出了一种协方差感知采样器，旨在提升扩散模型在少量采样步数下的像素空间生成质量。该方法通过显式建模反向过程的协方差，结合Tweedie公式和傅里叶空间分解，有效改进了传统仅依赖均值预测的采样方式。实验表明，在相同函数评估次数下，该方法在像素级扩散模型中生成的样本质量优于当前最先进的二阶采样器和最新aDDIM采样器。

2605.13907 2026-05-15 stat.ML cs.AI cs.LG

AIS: Adaptive Importance Sampling for Quantized RL

Jiajun Zhou, Wei Shao, Lingchao Zheng, Yuwei Fan, Ngai Wong

AI总结在大语言模型的强化学习中，低精度 rollout（如 FP8）与高精度训练（如 BF16）之间的不匹配会导致策略梯度偏差，影响训练稳定性。为了解决这一问题，本文提出自适应重要性采样（AIS）方法，通过实时诊断指标动态调整梯度修正强度，既保留了低精度 rollout 的探索优势，又抑制了其带来的不稳定因素。实验表明，AIS 在保持 FP8 加速效果的同时，在多个数学推理和规划任务上达到了与 BF16 基线相当的性能。

2605.13905 2026-05-15 cs.SE cs.AI

A Non-Destructive Methodological Framework for Modernizing Legacy Clinical Reporting Systems for AI-Driven Pharmacoinformatics: A SAS Case Study

Jaime Yan

AI总结本文提出了一种非破坏性的方法框架，用于现代化遗留的临床报告系统，以支持人工智能驱动的药学信息学应用。该框架通过引入元数据层，包括桥接映射、类型化中间表示和调度器，在不修改原有代码的基础上，将系统输出转换为结构化数据，供大语言模型使用。该方法在SAS报告库上进行了验证，实现了与AI系统的兼容，并在多个报告类型上达到了较高的数据一致性，为药物研发提供了更高效、合规的临床报告解决方案。

Comments 29 pages, 7 figures, 5 tables

2605.13904 2026-05-15 q-bio.NC cs.LG

Feature Visualization Recovers Known Cortical Selectivity from TRIBE v2

Stuart Bladon, Brinnae Bent

AI总结该研究提出了一种基于特征可视化的可解释性方法，用于分析脑编码模型对皮层功能组织的表征能力。通过在预训练的视觉和语言网络（TRIBE v2与V-JEPA 2结合）上进行梯度上升优化，研究在多个视觉皮层区域（如V1到V4、MT、FFA和PPA）中恢复出了与已知神经通路一致的特征层次结构和选择性模式。实验表明，该方法不仅能揭示模型内部激活的空间尺度和复杂度变化，还能生成具有高度特异性的刺激，显著增强目标脑区的响应，为脑编码模型的评估提供了直观且通用的分析工具。

Comments 8 pages, 3 figures, 2 tables. Code available at https://github.com/recozers/Tribe-V2-Interp

2605.13897 2026-05-15 q-bio.QM cs.LG

Attention-Based Multimodal Survival Prediction with Cross-Modal Bilinear Fusion

Hassan Keshvarikhojasteh, Josien P. W. Pluim, Mitko Veta

AI总结本文提出了一种基于注意力机制的多模态深度学习框架，用于患者的生存预测，整合了全切片组织学特征、RNA测序表达谱和临床变量。该方法通过低秩双线性交叉模态融合技术，将不同模态的嵌入进行高效整合，以建模模态间的条件交互关系，同时控制参数增长。实验表明，该框架在CHIMERA挑战数据集上优于基于拼接的基线方法，具有良好的泛化能力，为多模态生存预测提供了结构可解释且参数高效的解决方案。

2605.13894 2026-05-15 q-bio.PE cs.LG

Phylogenetic Tree Inference with Tropical Axial Attention

Chris Teska, Kurt Pasque, Ruriko Yoshida, Baran Hashemi

AI总结本文提出了一种基于热带轴注意力（Tropical Axial Attention）的神经网络架构，用于推断系统发育树。该方法将传统的softmax点积注意力替换为最大值-加法运算，从而引入了分段线性结构，与动态规划方法相一致。通过多物种序列比对，模型学习所有可能的成对距离，并结合$\ell_1$和热带对称距离损失函数进行训练，同时引入超度量违规惩罚项。实验表明，该方法在未知真实树结构的数据集上生成的距离矩阵比基线模型更接近BME诱导的树度量，显示了其在系统发育推断中的优越性和几何归纳偏差的有效性。

2605.13889 2026-05-15 eess.IV cs.CV cs.LG

Physics-Grounded Adversarial Stain Augmentation with Calibrated Coverage Guarantees

Mingi Hong

AI总结不同医院间染色差异会影响病理模型的部署性能，现有染色增强方法缺乏对参数的理论约束和对未知中心的覆盖保障。本文提出了一种基于物理原理的校准对抗染色增强方法（CASA），通过DKW不等式从多中心统计数据中校准增强预算，在Macenko染色参数空间中进行对抗增强。实验表明，CASA在Camelyon17-WILDS数据集上取得了更高的滑片级准确率和最差组准确率，显著优于其他对比方法。

2605.13887 2026-05-15 cs.NE cs.AI

Breaking Global Self-Attention Bottlenecks in Transformer-based Spiking Neural Networks with Local Structure-Aware Self-Attention

Lingdong Li, Hangming Zhang, Qiang Yu

AI总结本文研究了基于Transformer的脉冲神经网络（SNN）中存在的全局自注意力瓶颈问题，提出了一种新的局部结构感知的脉冲Transformer模型（LSFormer）。该模型通过引入脉冲响应池化（SPooling）和局部结构感知的自注意力机制（LS-SSA），有效解决了传统方法中特征信息丢失和计算冗余的问题。实验表明，LSFormer在多个基准数据集上取得了优于现有先进方法的分类性能，尤其在Tiny-ImageNet和N-CALTECH101数据集上分别提升了4.3%和8.6%的Top-1准确率，展示了其在能效和性能上的优势。

2605.13884 2026-05-15 q-bio.NC cs.AI

Consciousness as Uncommon Self-Knowledge: A Synergistic Information Framework

Krti Tallam

AI总结本文提出“非平凡自我知识”（USK）作为意识的候选标准，即系统在子系统协同作用中产生的、无法通过单独子系统获得的关于自身的协同信息。研究基于部分信息分解框架，将意识处理形式化为自我指向信息的协同分量，并指出该框架可区分意识与元认知、解决对现有意识理论的反例、通过部分信息速率分解进行操作化验证，并产生独特的实证预测，如意识与协同信息生成时间的关系等。研究结果与麻醉和阿尔茨海默病影响协同信息处理的实验发现一致。

Comments Conceptual and formal paper on consciousness as uncommon self-knowledge, 8 pages, 2 tables

2605.13874 2026-05-15 cs.NE cs.AI

GEAR: Genetic AutoResearch for Agentic Code Evolution

Ahmadreza Jeddi, Minh Ngoc Le, Hakki C. Karaimer, Konstantinos G. Derpanis, Babak Taati

AI总结该论文提出了一种名为GEAR的遗传自动研究框架，用于改进自主代码演化的研究代理。与传统单一路径搜索策略不同，GEAR采用基于种群的搜索方法，通过维护多个候选解决方案并结合变异和交叉操作来探索更多潜在方向。实验表明，GEAR在相同计算预算下优于现有基线方法，且能持续发现改进，避免陷入局部最优。

2605.13873 2026-05-15 cs.DL cs.AI cs.HC

Large Language Models for Web Accessibility: A Systematic Literature Review

Wajdi Aljedaani, Rubel Hassan Mollik

AI总结本文系统综述了38篇关于大语言模型（LLMs）在网页无障碍领域应用的同行评审研究，分析了其解决的无障碍任务、使用的模型与提示策略、系统架构、遵循的指南及评估方法。研究发现，现有工作主要聚焦于文本密集型和结构明确的无障碍任务，以WCAG为参考框架，较少涉及认知无障碍指南（COGA），且评估方法多样但用户参与度不足。本文旨在为研究人员和实践者提供当前LLM支持网页无障碍的综合参考，并为未来研究和工具开发奠定基础。

Comments Accepted at the 23rd International Web for All Conference (W4A 2026)

2605.13872 2026-05-15 cs.NE cs.AI

S-AI-Recursive: A Bio-Inspired and Temporal Sparse AI Architecture for Iterative, Introspective, and Energy-Frugal Reasoning

Said Slaoui

AI总结本文提出了一种名为 S-AI-Recursive 的生物启发式稀疏人工智能架构，将推理过程建模为一种基于激素调节的闭环迭代过程，而非传统的单次前向传播。该架构引入了两种新型激素——Clarifine 和 Confusionin，分别用于引导收敛和检测不确定性，通过它们的对抗性调节实现状态的逐步优化，最终达到稳定认知平衡。研究构建了完整的数学框架，并在实验中验证了该方法在参数数量远少于现有模型的情况下，仍能在抽象和符号基准测试中取得具有竞争力的推理性能。

Comments Preprint. 51 pages. No figures. S-AI-Recursive: A bio-inspired sparse AI architecture for iterative, introspective, and energy-efficient reasoning

2605.13871 2026-05-15 cs.NE cs.LG

Indian Wedding System Optimization (IWSO): A Novel Socially Inspired Metaheuristic with Operational Design and Analysis

Deepika Saxena, Kishu Gupta, Jitendra Kumar, Jatinder Kumar, Sakshi Patni, Vinaytosh Mishra, Niharika Singh, Ashutosh Kumar Singh

AI总结本文提出了一种受传统印度婚礼社会文化动态启发的新型群体元启发式优化算法——印度婚礼系统优化（IWSO）。该算法将家庭、候选人和媒人的协作匹配过程建模为一种有指导的、选择性搜索框架，用于求解复杂优化问题。IWSO引入了两个关键创新：一是由精英解引导的媒人影响策略，无需外部参数即可提升收敛性；二是自适应淘汰与重新初始化机制，通过替换表现不佳的个体来维持种群多样性并防止早熟收敛。实验结果表明，IWSO在收敛速度、解质量与鲁棒性方面优于遗传算法、粒子群优化等经典优化方法。

2605.13869 2026-05-15 cs.NE cs.AI cs.CV

Elastic Spiking Transformers for Efficient Gesture Understanding

Alberto Ancilotto, Gianluca Amprimo, Stefano Di Carlo, Elisabetta Farella

AI总结本文提出了一种弹性脉冲变换器（Elastic Spiking Transformer），用于高效的手势理解任务。该模型通过引入嵌套弹性结构，在特征提取、自注意力和前馈模块中实现运行时的动态调整，能够在不重新训练的情况下根据硬件资源实时调整网络宽度和注意力头数量。这种方法不仅提升了模型在不同硬件内存限制下的适应性，还通过减少活跃神经元数量降低了脉冲发放频率，从而显著减少能量消耗，适用于边缘设备上的实时手势识别。

2605.13863 2026-05-15 cs.NE cs.LG

Neuromorphic Graph Anomaly Detection via Adaptive STDP and Spiking Graph Neural Networks

Abdul Joseph Fofanah, Lian Wen, David Chen, Tsungcheng Yao, Kwabena Sarpong

AI总结本文提出了一种基于自适应脉冲时间动态可塑性（STDP）和脉冲图神经网络的新型图异常检测框架ASTDP-GAD，旨在解决动态网络中异常检测在能效、时间精度和适应性方面的挑战。该方法通过引入自适应LIF动力学、基于脉冲的图注意力机制、事件驱动的超图记忆以及多尺度时间卷积等关键技术，实现了高效且生物合理的异常检测。理论分析和实验结果表明，该方法在多个动态和静态图数据集上均表现出优越的检测性能，并具有较高的能效和生物学合理性。

2605.13862 2026-05-15 cs.GR cs.CV eess.IV

Seed3D 2.0: Advancing High-Fidelity Simulation-Ready 3D Content Generation

Diandian Gu, Jing Lin, Gaohong Liu, Jiahang Liu, Su Ma, Guang Shi, Jun Wang, Qinlong Wang, Qianyi Wu, Zhongcong Xu, Xuanyu Yi, Zihao Yu, Jianfeng Zhang, Zhuolin Zheng, Yifan Zhu, Rui Chen, Hengkai Guo, Xiaoyang Guo, Mingcong Han, Xu Han, Xiu Li, Yixun Liang, Weiqiang Lou, Junzhe Lu, Guan Luo, Minghan Qin, Shuguang Wang, Yuang Wang

AI总结本文提出 Seed3D 2.0，这是一个在生成精度、仿真就绪能力及应用范围方面均有显著提升的三维内容生成系统。其核心方法包括分阶段生成几何结构、局部感知的 VAE 优化纹理与材质生成，并引入统一的 PBR 模型和语义条件控制，以提高生成质量和细节表现。此外，系统还支持场景布局规划与部件级交互生成，实现了跨物理与图形引擎的高一致性场景构建，实验表明其在纹理化三维资产生成方面优于多个商业模型。

Comments Seed3D 2.0 Technical Report; Official Page on https://seed.bytedance.com/seed3d_2_0

2605.13861 2026-05-15 cs.SI cs.AI

Spectral Analysis of Fake News Propagation

Weibin Cai, Reza Zafarani

AI总结本文从谱分析的角度研究虚假新闻的传播结构，通过建立图谱与传播特性之间的严格谱界，提出了一种统一的信息传播谱表示方法。研究引入了新的谱界并结合已有方法，用于下游分类任务，并设计了离散结构优化框架以解释传播模式。实验表明，该方法能有效区分真假新闻，具有较高的分类性能和可解释性。

2605.13860 2026-05-15 cs.SI cs.AI cs.LG

The Moltbook Observatory Archive: an incremental dataset of agent-only social network activity

Sushant Gautam, Annika W. Olstad, Klas H. Pettersen, Michael A. Riegler

AI总结《Moltbook Observatory Archive》是一个记录由自主AI代理生成的社交网络活动的增量数据集。该数据集通过持续调用Moltbook平台API，被动采集代理用户资料、帖子、评论、社区元数据及词汇频率趋势等信息，并以SQLite数据库和分区Parquet文件形式存储，便于高效分析与可复现研究。该数据集覆盖了78天的平台活动，包含超过260万条帖子和120万条评论，是首个大规模记录纯AI代理构成社交网络行为的观测数据集，旨在支持多智能体通信、群体行为演化及安全相关现象的研究。

Comments 12 pages, 5 figures

2605.13859 2026-05-15 cs.NE cs.AI cs.LG

BiSpikCLM: A Spiking Language Model integrating Softmax-Free Spiking Attention and Spike-Aware Alignment Distillation

Sihang Guo, Chenlin Zhou, Jiaqi Wang, Kehai Chen, Qingyan Meng, Zhengyu Ma

AI总结本文提出了一种名为BiSpikCLM的全二值化脉冲语言模型，旨在解决传统脉冲神经网络在语言建模中计算复杂度高、训练困难的问题。该模型引入了无需softmax的脉冲注意力机制（SFSA），去除了浮点运算，同时采用基于对齐的知识蒸馏方法（SpAD），在嵌入层、注意力图、中间特征和输出层之间对齐教师ANN模型与学生SNN模型，从而在大幅减少训练数据量的情况下实现与传统模型相当的性能。实验表明，BiSpikCLM在自然语言生成任务中仅需4.16%至5.87%的计算成本即可达到竞争力的性能，验证了全二值化脉冲驱动语言模型的可行性和有效性。

2605.13858 2026-05-15 cs.NE cs.CL cs.LG

A Hormone-inspired Emotion Layer for Transformer language models (HELT)

Eslam Reda, Sara El-Metwally

AI总结该研究提出了一种受人体激素系统启发的情感处理模块（HELT），用于增强Transformer语言模型的情感理解与生成能力。通过引入六个连续的激素样数值，结合专门设计的注意力机制和输出投影，模型能够生成与情感上下文相适应的响应。实验表明，该方法在情感准确性与人类评价中均优于基线模型，为构建更具情感智能的对话系统提供了新思路。

Comments 24 pages, 5 figures

详情

英文摘要

Large Language Models have demonstrated remarkable capabilities in generating contextually relevant and grammatically correct text. However, they fundamentally lack the ability to process and respond to emotional context in a manner analogous to human emotional cognition. Current approaches to emotion modeling in NLP systems rely primarily on discrete emotion classification or simplistic sentiment analysis, which fail to capture the continuous, multi-dimensional nature of human emotional states. In this paper, we introduce HormoneT5, a novel architecture that augments transformer language models with a biologically-inspired Hormone Emotion Block that simulates the human endocrine system's role in emotional processing. Our approach computes six continuous hormone-like values through specialized per-hormone attention heads, each with orthogonally initialized learnable queries, temperature-scaled attention mechanisms, and deep output projections. These hormone values are then transformed into an emotional embedding that modulates the encoder hidden states, enabling emotionally-appropriate response generation. We propose a multi-objective training framework combining sequence-to-sequence loss, hormone prediction loss with margin penalties, and diversity regularization to prevent attention collapse. Experimental results on our curated emotion-labeled dataset demonstrate that HormoneT5 achieves 85%+ per-hormone accuracy within a 0.15 tolerance threshold, with hormone differentiation ranges exceeding 0.85 across all six hormones between contrasting emotional tones. Human evaluation studies show significant preference (p < 0.01) for HormoneT5-generated responses in terms of emotional appropriateness and empathetic quality compared to baseline T5 outputs. Our work opens new directions for biologically-grounded affective computing and emotionally intelligent conversational agents.

URL PDF HTML ☆

赞 0 踩 0

2605.13857 2026-05-15 cs.GR cs.CV cs.LG

MoZoo:Unleashing Video Diffusion power in animal fur and muscle simulation

Dongxia Liu, Jie Ma, Xiaochen Yang, Jiancheng Zhang, Bin Xia, Zhehan Kan, Nisha Huang, Jun Liang, Wenming Yang, Jin Li

AI总结本文提出 MoZoo，一种基于生成扩散模型的动物毛发与肌肉动态模拟方法，旨在高效生成高质量的动物视频效果。该方法通过角色感知的 RoPE 和非对称解耦注意力机制，实现了从粗略网格生成高保真视频，并引入 MoZoo-Data 数据集和 MoZooBench 基准以支持训练与评估。实验表明，MoZoo 在多种动物骨骼和布局上均能保持优秀的时空一致性与毛发模拟效果。

Comments Github Page:https://dongxialiu15.github.io/MoZoo/