On the Convergence Rates of Federated Q-Learning across Heterogeneous Environments
AI总结 本文研究了异构环境下联邦Q学习的收敛速率问题,探讨了在多个智能体协同学习最优Q函数时,通信频率与智能体数量对收敛速度的影响。研究发现,虽然增加智能体数量可以线性加速收敛,但增加通信间隔会导致性能显著下降,且这一现象具有本质性。论文还揭示了收敛过程中的两阶段特性,并提出了通过调整学习率以加快整体收敛的策略。
AI总结 本文研究了异构环境下联邦Q学习的收敛速率问题,探讨了在多个智能体协同学习最优Q函数时,通信频率与智能体数量对收敛速度的影响。研究发现,虽然增加智能体数量可以线性加速收敛,但增加通信间隔会导致性能显著下降,且这一现象具有本质性。论文还揭示了收敛过程中的两阶段特性,并提出了通过调整学习率以加快整体收敛的策略。
AI总结 该论文提出了一种名为RSEA-MVGNN的多视图图神经网络,旨在有效融合具有不同图结构特征的多视图图数据。该方法通过主观逻辑估计每个视图的不确定性,并利用去相关算法进行可靠的结构增强,从而提升特征多样性;同时,模型基于视图的信念和不确定性评估视图质量,使高质量视图在图神经网络聚合中占据主导地位。实验表明,该方法在多个真实数据集上优于现有先进方法。
AI总结 随着大型语言模型在文本标注中的应用日益广泛,研究发现模型输出的可重复性可能受到提示设计微小变化的影响。为此,本文提出了一种通用的提示稳定性评估框架,通过借鉴编码者内部与外部一致性评分方法,定义了“提示稳定性评分(PSS)”,并开发了相应的Python工具包。实验在多个数据集上验证了该方法的有效性,并为实际研究者提供了提升标注稳定性的实践建议。
Comments 39 pages, 5 figures
AI总结 个性化扩散模型(PDMs)在使用少量数据生成特定人物图像方面表现出色,但其对微小对抗性扰动高度敏感,导致在受污染数据上微调时性能显著下降。本文通过 Shortcut Learning 的视角深入分析了 PDMs 的微调过程,揭示了对抗扰动在 CLIP 嵌入空间中引发的潜在语义对齐问题,并据此提出了一种系统性的反制框架,包括图像净化和对比解耦学习,有效提升了模型的鲁棒性和泛化能力。
Comments Code is available at https://github.com/liuyixin-louis/DiffShortcut
AI总结 本文提出了一种名为NEON的神经网络架构,用于在无限维函数空间中进行带有不确定性的预测,其参数数量远少于性能相当的深度集成方法。研究聚焦于复合贝叶斯优化问题,即优化由未知函数映射和已知函数组成的复合函数,并通过实验表明NEON在多个场景下取得了领先的优化效果,同时显著降低了模型复杂度。
AI总结 本文提出了一种名为RAR的方法,旨在提升多模态大语言模型(MLLMs)在细粒度和少样本视觉识别任务中的性能。RAR结合了CLIP的多模态检索能力与MLLMs的丰富知识库,通过建立多模态检索器来扩展模型的上下文窗口,并在推理时检索相关类别信息供MLLMs进行排序和预测。该方法有效解决了MLLMs在面对大量类别时性能下降的问题,在多个细粒度和零样本识别基准上取得了显著的性能提升。
Comments Project: https://github.com/Liuziyu77/RAR
AI总结 在图神经网络中,如何有效适配不同预训练策略的模型仍是一个挑战。本文提出了一种子图级通用提示调优方法(SUPT),通过在子图层面分配提示特征,保持方法的通用性,同时大幅减少调优参数数量。实验表明,SUPT在多种下游任务中表现优异,尤其在少样本场景下平均性能提升超过6.6%。
AI总结 本文探讨了“线性表示假设”,即高层概念在表示空间中以线性方向形式表示的问题,提出了“线性表示”的两种形式化定义,并分别对应输出(词)空间和输入(句子)空间。通过引入因果内积,作者建立了一个非欧几里得的内积结构,能够统一各种线性表示的概念,并用于构建探针和引导向量。实验表明,大型语言模型中确实存在概念的线性表示,且内积的选择对解释与控制模型具有基础性作用。
Comments Accepted for a presentation at ICML 2024 and an oral presentation at NeurIPS 2023 Workshop on Causal Representation Learning. Code is available at https://github.com/KihoPark/linear_rep_geometry
AI总结 该研究旨在解决开放词汇物体检测中的检测与分割问题,提出了一种名为CondHead的动态网络结构,以提升模型对新类别物体的泛化能力。核心方法通过条件参数化网络头,利用语义嵌入引导模型学习类别特异性知识,从而实现更准确的边界框回归和分割预测。该方法在保持计算开销极小的前提下,显著提升了现有开放词汇检测方法的性能。
Comments We appologize that author Nan Li was not on the published version due to cvpr23 policy that authors cannot be added after abstract deadline
AI总结 本文提出了一种基于切比雪夫多项式逼近的高效且稳定的深度神经网络构建方法——ChebNet,用于提升对光滑函数的逼近能力。相比传统使用幂级数逼近的RePU激活函数网络,ChebNet通过频率域中的分层切比雪夫逼近结构,实现了更稳定且计算效率更高的网络构造。实验表明,ChebNet不仅保持了与幂级数方法相当的逼近性能,还具有更高的稳定性,并可通过微调获得更优结果,为实际应用中高效逼近光滑函数提供了可行方案。
Comments 6 figures, 3 tables, to appear on Communications in Mathematics and Statistics
为AI时代设计数据中心电力交付层级
AI总结 本文研究了AI时代数据中心电力交付层级设计的挑战,提出了一种评估框架,结合吞吐量、功率和成本指标,分析多资源短缺对部署容量、资本支出和性能的影响。
AI介导的交流可以引导集体意见
AI总结 本文研究AI在人类间交流中对集体意见形成的影响,通过实证和理论分析展示AI引入的方向性偏见如何通过网络放大并改变集体观点,探讨平台如何控制此类偏见。
从原子坐标预测通用磁结构并实现接近实验精度
AI总结 本文提出磁结构网络(MSN),通过原子晶体结构直接预测磁结构,利用原始调制结构表示(PMSR)统一编码调制结构,实现高精度磁结构预测,为磁性材料发现提供新方法。
Comments 9 pages, 3 figures
通过数值积分实现的可扩展非参数连续时间生存模型
AI总结 本文提出QSurv模型,通过高斯-勒让德数值积分实现非参数连续时间生存建模,无需时间离散化或限制分布假设,有效捕捉非平稳危险动态,实验表明其在即时危险函数估计上具有优势。
为LLM-代理可操作论文的协调约定
AI总结 本文提出paper.json文件,通过稳定声明ID、明确不声明列表、精确图示命令和稳定定义ID等约定,解决LLM代理在阅读学术论文时的重复失败问题。
面向可扩展大语言模型训练的运行时优化
AI总结 本文提出Asteria系统,通过分离二次优化逻辑与GPU训练路径,解决大规模矩阵优化器状态维护的系统成本问题,实现在内存受限和分布式训练中提升大语言模型的训练效率。
偏斜自适应置信预测
AI总结 本文提出一种偏斜自适应置信预测方法,通过非对称区间族和 gauge 方法构建置信分数,利用逆双曲正弦变换训练额外预测模型以适应特征空间中的不确定性倾斜,保持了样本有限的边缘有效性,同时实现了对局部尺度和偏斜的适应。
Comments 17 pages, 2 figures
可扩展的神经形态计算:基于自主脉冲动态的无时钟可重构芯片
AI总结 本文提出了一种基于无时钟数字电路自主连续演化的脉冲动态的可扩展神经形态架构,通过FPGA实现可配置的布尔脉冲神经元网络,展示了在音频分类任务中高效处理脉冲编码数据的性能,且能耗显著低于传统数字方案。
GeoGS-CE: 利用3D高斯分布学习延迟-波束信道先验以应对高机动场景
AI总结 本文提出GeoGS-CE框架,通过3D高斯分布建模高机动场景中的信道特性,利用延迟-波束功率谱作为先验信息,提升稀疏试点下的信道频率响应重建精度。
针对大视觉-语言模型的跨模态提示注入攻击:仅图像扰动
AI总结 本文提出CrossMPI攻击,通过仅图像扰动实现跨模态提示注入,改进模型隐藏状态空间优化并采用层选择策略与距离递减扰动策略,有效提升攻击性能。
面向关系数据库的foundation models的语言模型与图神经网络方法
AI总结 本文提出结合语言模型和图神经网络的混合架构,通过关系实体图建模提升关系数据库的预测性能,实验表明其在多个任务中表现优异,接近监督基线并缩小与RDL的差距。
Comments 15 pages, 7 figures, 4 tables. Preprint of a paper accepted at the 1st Workshop on Extraction from Triplet Text-Table-Knowledge Graph and associated Challenge (TRIPLET), co-located with ESWC 2026
基于神经网络代理模型的不确定性传播性能数值研究
AI总结 本文研究神经网络代理模型在捕捉整个概率空间中解场完整分布的能力,尤其关注分布尾部表现,通过热传导方程对比了全连接网络与深度算子网络的性能。
XSearch: 通过概念到代码对齐实现可解释的代码搜索
AI总结 本文提出XSearch框架,通过将代码搜索转化为概念对齐问题,提升代码搜索的可解释性和泛化能力,在分布偏移基准测试中性能提升显著。
Comments Accepted to ISSTA 2026
可解释AI还不够!重新思考算法可争议性
AI总结 本文探讨了算法可争议性的重要性,提出了一种新的定义,指出传统XAI方法不足以挑战算法决策,提出了三种证据类型以支持决策逆转。
谁拥有这个智能体?追溯AI智能体回其所有者
AI总结 本文提出了一种基于canary的智能体归属追踪方法,解决无法追溯恶意或误配置智能体所有者的问题,展示了其在实际场景中的可靠性与鲁棒性。
Comments Under Review
利用协方差查询测试图模型中树的性质
AI总结 本文研究高维图模型下树结构的性质测试,设计了基于子二次查询数量的随机测试方法,针对叶子数、最大度、典型距离和直径等属性提出显式查询复杂度界限。
通过网络驾驶:延迟和视频失真下的性能与负载
AI总结 研究通过驾驶模拟器探讨网络延迟和视频质量对驾驶员性能和负载的影响,发现延迟和带宽增加会提升操作负荷,但生理指标显示亚加性交互作用,而性能和眼动指标交互作用较小。
Comments Preprint of VEHITS 2026 : 12th International Conference on Vehicle Technology and Intelligent Transport Systems
湍流中利用Q学习进行钟态嗅觉搜索:烟雾恢复的几何学
AI总结 本文通过Q学习训练嗅觉搜索代理,利用时间钟表恢复烟雾,结合昆虫行为提升导航策略,但需改进策略适应局部间歇性水平以增强鲁棒性。
Comments 15 pages, 13 figures, 1 table
无监督领域偏移检测与可解释子空间归因
AI总结 本文提出一种无监督领域偏移检测工具,通过高维特征空间中的局部密度异常检测,识别偏移特征子空间,从而可解释偏移来源,并提供补偿协议。
SLIP与伦理:面向AI情感伴侣的渐进干预
AI总结 本文提出SLIP与ETHICS框架,通过渐进干预方法解决AI情感伴侣的安全与亲和力矛盾,实验显示在高能量状态下干预不足,但提升模型能力可改善检测效果。
Comments Accepted to PervasiveHealth 2026. 11 pages, 2 figures, 4 tables. Proc. of the 20th EAI International Conference on Pervasive Computing Technologies for Healthcare (PervasiveHealth 2026)