Receiver-Aware Analysis and Verification of the Spectral Separation Coefficient Under Interference-Induced Degradation
接收机感知的干扰诱导退化下频谱分离系数的分析与验证
AI总结 本文通过引入接收机前端特性计算依赖接收机的频谱分离系数(SSC),并利用真实和仿真数据集实验验证了干扰影响计算的鲁棒性。
Comments 7 pages, 4 figures
接收机感知的干扰诱导退化下频谱分离系数的分析与验证
AI总结 本文通过引入接收机前端特性计算依赖接收机的频谱分离系数(SSC),并利用真实和仿真数据集实验验证了干扰影响计算的鲁棒性。
Comments 7 pages, 4 figures
Joycent: 基于扩散的口音语音合成,无需口音音素预测
发表机构 * University of Science and Technology of China(中国科学技术大学)
AI总结 提出Joycent,一种基于扩散模型的口音TTS方法,直接从标准音素序列和语音参考合成口音语音,无需口音音素预测,通过条件层归一化集成口音和说话人表征,并引入WhisAID口音识别模型,在保持说话人身份的同时提升口音自然度。
一种智能调度混合(SSH)EKF-FGO状态估计方法
发表机构 * GitHub ; arXiv
AI总结 本文通过智能调度混合EKF-FGO框架,实验性地将优化调度作为独立设计变量,研究其在平衡估计精度与计算成本中的作用,并在平面SLAM仿真中验证了调度对预优化漂移、瞬态误差和运行时间的显著影响。
Comments This work has been accepted for presentation/publication at the 2026 IEEE Canadian Conference on Electrical and Computer Engineering (CCECE). The final published version will appear in IEEE Xplore
基于上下文学习的音频情感分类的LLM合成真实标签生成
发表机构 * School of Business, Technical University of Applied Sciences Augsburg(应用技术大学阿沙芬堡商学院) ; Data Science und Autonome Systeme Technologietransferzentrum (TTZ)(数据科学与自主系统技术转移中心(TTZ))
AI总结 提出利用大语言模型(LLM)和上下文学习(ICL)从多用户VR环境的流式语音数据中自动生成情感相关合成真实标签,解决团队协作状态标注难题。
Comments https://icaiit.org/paper.php?paper=14th_ICAIIT_2/3_9
过驱动飞行器的可解释控制效能学习与非线性控制分配集成方法
发表机构 * University of Stuttgart, Faculty of Aerospace Engineering and Geodesy, Institute of Flight Mechanics and Control (iFR)(斯图加特大学航空航天工程与大地测量学院飞行力学与控制研究所)
AI总结 提出一种基于稀疏非线性动力学辨识的学习控制效能映射方法,结合在线自适应机制,实现过驱动飞行器的高效非线性控制分配,兼具可解释性和低计算成本。
信息论与统计学习
AI总结 本文是Cover & Thomas《信息论基础》第三版的章节预印本,系统介绍了散度度量在模型训练中的作用,涵盖线性回归、生成扩散模型等,并给出了扩散模型更系统的推导。
迈向真正的多语言ASR:将代码切换ASR泛化到未见语言对
发表机构 * University of Tokyo(东京大学)
AI总结 通过模型合并和领域泛化方法,研究从有限语言对中学到的代码切换能力能否泛化到未见语言对,实验表明双语CS-ASR模型对未见语言对有一定泛化能力但有限。
Comments ICML 2026 Workshop on Machine Learning for Audio
集成探索感知的无人机路径优化与轨迹规划
发表机构 * Department of Aerospace Engineering, University of Michigan(密歇根大学航空航天工程系) ; Department of Electrical Engineering, Brigham Young University(BYU 电子工程系) ; Department of Aerospace Engineering, Department of Civil and Environmental Engineering, and Department of Industrial and Operations Engineering, University of Michigan(密歇根大学航空航天工程系、土木与环境工程系和工业与运营管理工程系)
AI总结 提出一种集成探索感知的无人机路径优化与轨迹规划框架,通过风险地图、不确定兴趣区域建模、B样条轨迹优化和在线重规划,在灾害监测中平衡报告点访问与新信息探索,实现平均KL散度降低15.9%。
复频率作为广义特征值
AI总结 本文研究了复频率在描述线性时不变系统状态时作为特征值的广义形式,通过几何频率的定义和分解,展示了复频率在二维欧几里得平面中的应用,并证明了线性系统中复频率与特征值的等价性,同时指出非线性系统不具有这一等价性。
分析韩语语音问答中ASR-LLM级联中的误差传播
发表机构 * Korea Culture Technology Institute, Republic of Korea(韩国文化科技研究所) ; Maum AI Inc., Republic of Korea(马姆人工智能公司)
AI总结 本文研究了韩语语音问答中ASR-LLM级联中误差传播的问题,通过分析下游语义失败,揭示了传统ASR指标无法完全捕捉的误差影响,发现不同性能的LLM在级联降级上的一致性,识别出单字符ASR错误作为语义失败通道,并通过辅助比较表明大音频语言模型在噪声韩语SQA中优于匹配语言模型的ASR-LLM流水线。
Comments Preprint. Submitted to APSIPA ASC 2026
95毫克昆虫尺度扑翼飞行机器人的模型参考自适应飞行控制
发表机构 * Washington State University(华盛顿州立大学)
AI总结 针对昆虫尺度扑翼飞行机器人参数不确定性和扰动问题,提出模型参考自适应控制(MRAC)架构,结合混合乘性扩展卡尔曼滤波,实现高精度位置控制,并通过95毫克机器人实验验证了悬停和轨迹跟踪性能。
Comments Under review, 8 pages, 7 figures
基于策略驱动的DRL的NR-U与Wi-Fi共存中的TXOP自适应
发表机构 * Research Center for Information Technology Innovation (CITI), Academia Sinica (AS)(资讯科技创新研究所以(CITI),中华学术界(AS)) ; Department of Electrical Engineering, National Taiwan Normal University (NTNU)(国立台湾师范大学电子工程系(NTNU))
AI总结 针对NR-U与Wi-Fi在非授权频谱共存中的频谱利用不平衡问题,提出一种基于策略驱动的深度强化学习框架,通过奖励设计实现公平性、吞吐量和效用的灵活权衡控制。
Comments 15 pages, 13 figures, 2 tables, submitted to IEEE Open Journal of the Communications Society
NIM4-ASR:迈向高效、鲁棒且可定制的实时基于LLM的语音识别
发表机构 * Advanced Intelligent Systems Group, NIO(蔚来智能系统集团)
AI总结 提出NIM4-ASR框架,通过重新设计多阶段训练范式(包括预训练架构优化、迭代异步SFT和ASR专用强化学习)以及生产优化(噪声鲁棒性、流式推理和RAG热词定制),在2.3B参数下实现SOTA性能。
量子代数多样性:通过群结构测量进行单副本密度矩阵估计
AI总结 将代数多样性框架扩展到量子测量,提出量子代数多样性定理,通过群结构POVM从单副本量子态估计密度矩阵,实现高保真度,并建立经典-量子对偶映射和最优性继承定理。
Comments v3: copy-reduction claim corrected; fidelities fixed; 1 figure removed
平面跟踪中的反馈速度控制
发表机构 * Department of Mechanical and Aerospace Engineering, University of South Florida(南佛罗里达大学机械与航空航天工程系)
AI总结 针对领航-跟随平面跟踪问题,提出一种反馈速度控制律与恒定方位角转向策略,实现并排编队并证明渐近稳定性,扩展至N-agent链网络。
HBS——硬件构建系统:直接Tcl与间接抽象硬件构建方法的特征化与比较
AI总结 本文特征化并比较了两种硬件构建系统方法:直接Tcl方法(构建代码由EDA工具直接执行)和间接抽象方法(构建系统生成Tcl脚本后由EDA工具运行),并提出了新的直接Tcl构建系统HBS,以弥补现有直接Tcl系统功能不足,用于与间接抽象系统进行对比。
预设时间分布式广义纳什均衡求解
AI总结 针对安全关键多智能体系统,提出首个全分布式算法,在用户预设时间T内求解带共享耦合约束的广义纳什均衡问题,采用多速率增益调度解耦观测器、优化与对偶一致性三层耦合。
Comments 12 pages, 5 figures
言语背后的声音:量化语音大语言模型中的交叉偏见
发表机构 * 1 Department of Speech, Music ; Hearing, KTH Royal Institute of Technology, Sweden 2 Centre for Speech Technology Research, University of Edinburgh, UK 3 Texas A\&M University, USA
AI总结 本研究通过2880次受控交互,评估三种语音大语言模型在六种英语口音和两种性别呈现中的口音与性别交叉偏见,发现东欧口音(尤其女性)获得更低有用性评分,且人类评估者比LLM评判更敏感。
Comments 5 pages, 3 figures, 1 table, Accepted to Interspeech 2026
基于CBF的去中心化安全滤波器:面向输入受限的协同导弹系统碰撞避免
AI总结 针对多飞行器拦截场景,提出基于鲁棒控制屏障函数的去中心化安全滤波器,通过事件触发和松弛变量优化实现碰撞避免,兼顾计算效率与可扩展性。
Comments 7 pages, 5 figures, accepted for presentation at the 2026 American Control Conference (ACC 2026)
具有结构不确定性的Lipschitz有界自适应闭环系统的鲁棒安全滤波器
AI总结 针对自适应控制系统的瞬态安全问题,提出一种基于参考的自适应安全框架,利用Lipschitz有界跟踪误差推导鲁棒CBF条件并转化为凸SOCP,减少保守性并保证前向不变性和闭环稳定性。
Comments 6 pages, 4 figures, accepted for publication in the IEEE Control Systems Letters (L-CSS)
面向同步视听重建的语义卫星通信
AI总结 提出自适应多模态语义传输系统,通过双流生成架构和动态关键帧更新机制,在带宽受限的卫星场景下实现高质量同步视听重建,显著降低带宽消耗并提升鲁棒性。
使用级联累加器高效计算时间索引加权和
AI总结 提出一种利用级联累加器高效计算时间索引加权和的方法,将乘法次数从K×N减少到K+1次常数乘法,无需存储数据块,适用于实时逐样本处理系统。
Comments This work has been submitted to the IEEE for possible publication
Journal ref IEEE Signal Processing Letters, vol. 33, pp. 893-897, Feb. 2026
ZeSTA: 基于领域条件训练的零样本文本转语音增强用于数据高效的个性化语音合成
发表机构 * Maum AI Inc.(Maum AI公司) ; Humelo Inc.(Humelo公司)
AI总结 提出ZeSTA框架,通过轻量领域嵌入区分真实与合成语音,结合真实数据过采样,在极低资源下提升零样本文本转语音增强的说话人相似度,保持可懂度和感知质量。
Comments 6 pages, accepted to INTERSPEECH 2026
输入受限的高超声速滑翔飞行器控制分配算法
AI总结 针对高超声速滑翔飞行器执行机构强非线性和物理约束,提出一种迭代控制分配方法,通过嵌入阻力敏感软约束提高能效并降低表面温度,在GHGV-2模型上验证了有效性。
Comments 43pages, 21 figures, accpeted for publication in the AIAA Journal of Guidance, Control, and Dynamics
不确定线性时变系统的鲁棒输出调节
AI总结 针对线性时变系统的鲁棒输出调节问题,提出轨迹匹配系统浸入框架,揭示参数不确定性的根本影响,建立有限线性参数化的精确代数边界,并设计近似鲁棒控制器以实现任意小的有界跟踪误差。
基于虚拟模型控制的周期性鲁棒机器人砍切
发表机构 * University of Cambridge(剑桥大学) ; University of Tokyo(东京大学)
AI总结 提出一种物理结构化的虚拟模型控制器,通过切换虚拟机构生成鲁棒的周期性砍切运动,无需预规划轨迹,在Franka机械臂上实现多种蔬菜的亚毫米级精确切割。
DiT-JSCC:基于扩散变换器与语义表示的深度JSCC再思考
发表机构 * Beijing University of Posts and Telecommunications(北京邮电大学) ; Shanghai Jiao Tong University(上海交通大学) ; University of Shanghai for Science and Technology(上海科技大学)
AI总结 提出DiT-JSCC框架,联合学习语义优先表示编码器和扩散变换器生成解码器,通过粗细粒度条件解码和基于Kolmogorov复杂度的自适应带宽分配,在极端信道条件下提升语义一致性与传输效率。
Comments 14pages, 14figures, 2tables
建模全天心电图信号以可解释人工智能预测心力衰竭风险
发表机构 * Leumit Health Services(Leumit健康服务)
AI总结 提出DeepHHF深度学习模型,利用24小时单导联心电图数据预测五年内心力衰竭风险,AUC达0.80,优于短时片段和临床评分,可解释性分析显示模型关注心律失常和心脏异常。
非线性矩阵分解的交替方向乘子法
发表机构 * University of Mons(蒙斯大学)
AI总结 提出基于交替方向乘子法(ADMM)的算法求解非线性矩阵分解(NMD),支持多种非线性函数和损失函数,在真实数据集上验证了适用性和效率。
Comments 16 pages, 7 figures. v3: Revised version: added new experiments and comparisons. Code available from https://gitlab.com/Atharva05/admm-for-nmd
面向最优分布式控制的图信息遗憾度量
AI总结 提出空间遗憾度量,衡量分布式控制器与拥有额外传感信息的先知控制器之间的最坏性能差距,并基于该度量设计分布式控制器,通过凸优化实现有限维近似,在电力系统仿真中有效抑制局部扰动。