All-atomistic Transferable Neural Potentials for Protein Solvation
AI总结 该研究提出了一种名为PHNN的全原子可迁移神经势能模型,用于蛋白质溶剂化计算。该模型通过学习可迁移的参数修正来改进隐式溶剂模型的准确性,而非对最终能量进行事后调整。PHNN结合物理先验知识以提高数据效率,在传统分析方法基础上显著提升了预测精度,并在超出训练域的蛋白质系统中保持良好的泛化能力。
AI总结 该研究提出了一种名为PHNN的全原子可迁移神经势能模型,用于蛋白质溶剂化计算。该模型通过学习可迁移的参数修正来改进隐式溶剂模型的准确性,而非对最终能量进行事后调整。PHNN结合物理先验知识以提高数据效率,在传统分析方法基础上显著提升了预测精度,并在超出训练域的蛋白质系统中保持良好的泛化能力。
AI总结 本文提出了一种简单的机制,解释了多层网络中特征学习如何产生缩放定律。研究对象是一个高维的分层目标函数,该函数虽然整体复杂度很高,但可以通过一组权重呈幂律衰减的潜在组合特征来表示。通过设计一种逐层谱算法,能够逐步恢复这些潜在特征,且在样本量较小时就能检测到强特征,而弱特征则需要更多数据。理论分析表明,该方法在预测误差上实现了明确的幂律衰减,并通过数值实验验证了特征逐步恢复的现象和与非分层方法的性能差异。
AI总结 本文提出了一种名为MemDocAgent的长视野智能代理框架,用于生成一致且层次分明的仓库级代码文档。该方法通过依赖感知的遍历引导和基于记忆的代理交互,实现了对整个代码仓库的集成化文档生成,有效解决了现有方法中冗余检索、描述冲突和结构混乱的问题。实验表明,MemDocAgent在多个评估指标上优于开源和闭源基线方法,具有实际的软件开发应用价值。
AI总结 DiffPhD 是一种统一的、基于 GPU 加速的可微分投影动力学框架,旨在解决含异质材料、大变形超弹性以及复杂接触交互的弹性动力学问题。该方法通过引入刚度感知的投影权重、信任域特征值过滤与改进的 Anderson 加速策略,并整合到统一的 GPU 计算流程中,实现了对异质材料的高效且稳定的模拟。DiffPhD 在保持梯度精度的同时显著提升了计算效率,并在大刚度对比场景下仍保持收敛性,为复杂物理系统的端到端优化提供了有力支持。
AI总结 本文研究了高维核岭回归(KRR)中在更广泛核函数下的泛化误差行为,扩展了之前仅针对球面内积核的结果。作者提出了一类新的高维核函数,并推导了其对应的泛化误差收敛速率。研究发现,即使在更一般的核设置下,仍存在最小最大最优性、饱和效应以及收敛速率的周期性平台和样本量相关的多重下降现象,从而拓展了对高维KRR行为的理解。
AI总结 该论文针对生成式推荐(GenRec)模型中存在的输入和输出瓶颈问题,提出了一种不对称的连续-离散框架AsymRec。通过多专家语义投影(MSP)和多视角分层量化(MHQ)方法,分别提升了输入表示的语义丰富性和输出目标的结构化精度,有效缓解了流行度偏差和细粒度语义丢失的问题。实验表明,AsymRec在多个数据集上显著优于现有生成式推荐方法,平均性能提升达15.8%。
AI总结 本文研究了电力电子系统在受到网络攻击时的脆弱性量化问题,提出了一种基于阻抗的攻击可达域(ARD)框架,用于评估在权限受限条件下节点可能被推近不稳定的程度。该方法通过阻抗重塑映射可行的攻击动作到关键特征值迁移,并定义了攻击穿透指数以综合表征系统稳定性裕度的渗透程度和成功攻击的可达性。为应对逆变器模型缺失的情况,还构建了一个实用的灰盒评估流程,结合现有阻抗识别与可微代理工具,实验表明该方法能有效揭示传统电网强度指标无法反映的脆弱性模式。
AI总结 本文提出了一种基于深度强化学习的全动态再平衡方法,用于解决无桩共享单车系统中的车辆调度问题。该方法通过图模拟器建模服务系统,并将再平衡问题建模为马尔可夫决策过程,利用深度强化学习代理实时调度单车,根据时空关键性评分执行局部的取车、还车和充电操作。实验结果表明,该方法在真实数据上显著减少了车辆可用性失败,同时减少了空间不平等和出行荒漠现象,展示了基于学习的再平衡方法在提升共享微出行系统效率和可靠性方面的价值。
Comments 6 pages, 5 figures, 1 table, accepted at the 23rd IFAC World Congress, Busan, South Korea, Aug. 23-26, 2026. Open invited track 9-131: "Control and Optimization for Smart Cities"
AI总结 该研究针对多媒体验证任务中准确性和透明性并重的需求,提出了一种可争议的多智能体框架,结合多模态大语言模型、外部验证工具和基于竞技场的双极论证计算方法。该方法将每个案例分解为以主张为中心的模块,检索针对性证据并生成带有来源和强度评分的支持与攻击论点,通过局部论证图进行冲突解决和不确定性处理,最终生成结构清晰、可编辑且具有实际计算可行性的验证报告。
Comments ACM ICMR 2026 Grand Challenge on Multimedia Verification
AI总结 该研究探讨了检索增强代码生成中使用过时代码片段可能对代码补全造成的负面影响。通过在五个Python仓库中对17个生产辅助函数签名变化进行受控实验,研究发现仅使用过时代码片段会显著诱导模型生成与当前状态不兼容的代码,而完全不使用检索则导致生成结果无法通过验证。实验还表明,引入当前有效的代码信息可以有效缓解过时信息带来的问题,揭示了检索内容的时间有效性是评估代码检索增强生成鲁棒性的重要因素。
Comments 31 pages, 2 tables. Submitted to Information and Software Technology (Elsevier)
AI总结 该研究针对电商搜索中生成式召回方法的实用化难题,提出了一种高效的生成式召回框架CQ-SID,通过语义聚类ID和专家引导强化学习方法,有效降低了搜索复杂度并提升了召回效果。CQ-SID结合类别和查询约束的对比学习与残差量化VAE,生成分层语义标识符,显著减少束搜索规模;同时提出的EG-GRPO方法通过引入真实样本,优化生成召回与后续排序的一致性。实验表明,该方法在语义点击率和个性化点击率上分别提升26.76%和11.11%,并在实际系统中取得了显著的GMV和转化率提升。
AI总结 该研究提出了一种名为PRISMA的插件式生成框架,用于多卫星降水估计。该方法通过从IMERG最终场中学习无条件降水先验,并结合独立训练的传感器特定条件分支,实现了无需重新训练生成主干即可灵活集成新传感器数据。实验表明,PRISMA在降水估计精度和效率方面均有显著提升,尤其在融合红外与微波观测数据时,显著提高了关键成功指数并降低了均方根误差。
AI总结 MemLineage 是一种针对大型语言模型(LLM)代理记忆的防御机制,通过为每条记忆条目附加密码学来源信息和LLM推导链,确保记忆内容的可信性。该方法将记忆管理视为一种“保管链”问题,利用 Merkle 日志和有向无环图(DAG)记录记忆的生成过程,从而在防止恶意内容被用于敏感操作的同时,保留有用的回忆能力。实验表明,MemLineage 在多个记忆污染场景中表现出色,显著降低了误动作率,且性能开销极低。
Comments 24 pages, 8 figures. Rui Hou is the corresponding author
AI总结 该论文指出,当前大语言模型(LLM)越狱攻击的评估中存在一个关键问题:攻击成功率(ASR)并不稳定,导致不同研究之间的结果难以比较。研究发现,即使某些攻击在封闭模型上表现出高ASR,但在实际测试中却只能以50%的连续成功率通过开放模型,揭示了越狱攻击生成和评估过程中随机性(stochasticity)的影响。为此,作者提出了一种新的评估框架CAS-eval和生成框架CAS-gen,有效提升了攻击的一致性和成功率,为越狱攻击的标准化评估提供了新方法。
AI总结 SWE-Chain 是一个用于评估代码智能体在连续版本升级场景下表现的基准,聚焦于包级别的连续发布升级任务。该研究设计了一种基于版本说明与代码差异对齐的合成流程,生成真实可行的升级需求,并构建了包含 9 个真实 Python 包、155 个版本转换和 1660 个升级要求的测试集。实验表明,当前主流代码智能体在连续升级任务中仍面临较大挑战,难以在不破坏现有功能的前提下完成准确的升级操作。
AI总结 本文提出了一种名为 Darwin Family 的框架,通过无训练的进化合并方法提升大语言模型的推理能力。该方法基于梯度-free的权重空间重组,引入了自适应合并基因、MRI-Trust融合机制以及跨架构映射器,实现了对现有模型检查点中潜在能力的重新组织与优化。实验表明,Darwin 模型在多个任务上超越了其原始训练模型,展示了无需额外训练即可提升模型推理性能的有效性。
Comments NeurIPS 2026 submission. 18 pages including appendix
AI总结 本文研究了神经重参数化全波形反演(NeurFWI)的收敛机制,提出了神经灵敏度核(NSK)和波切线核(WTK),揭示了神经表示如何通过调节原始灵敏度核和波切线核的特征结构,影响反演过程中的谱滤波效应、梯度波数调制和波频偏差等关键行为。基于这些理论分析,作者提出了改进的NeurFWI方法,提升了反演性能与效率,并在地震勘探和医学成像中验证了其有效性。
AI总结 该研究针对大语言模型在开发工具中面临的上下文窗口效率问题,提出了一种基于文件大小的预执行过滤框架,用于在代码仓库扫描前高效剔除超出上下文限制的非代码文件。该方法仅依赖操作系统级别的元数据,具有极低的计算开销,能够在不进行索引和语义分析的情况下实现快速过滤。实验表明,该方法在多个开源仓库中显著减少了输入令牌数量,同时提升了代码生成的准确性并降低了幻觉发生率。
AI总结 该研究探讨了如何通过简短的情绪文本补充可穿戴设备的数据,以更全面地监测大学生的长期健康状况。研究采用开放式问题收集学生关于自身担忧的简短回答,并结合可穿戴设备数据,利用多种自然语言处理方法分析情绪与睡眠、活动等健康指标的关系。结果表明,情绪表达而非具体话题内容对健康指标有显著影响,提示简短情绪反馈可有效提升被动生理数据的心理可解释性。
Comments Submitted to ACM IMWUT
AI总结 本文提出了一种基于随机稳定原子特征的物理信息系统识别框架,通过将脉冲响应表示为稳定极点所关联的阻尼复指数的随机叠加,将系统识别转化为带有线性、二阶锥和KYP约束的凸正则化最小二乘问题。该方法推广了随机傅里叶和拉普拉斯特征,适用于工程系统中的阻尼非平稳情形,同时保持模态可解释性和可扩展的有限维计算。研究还从算子理论角度分析了稳定极点正测度生成正定核的特性,并给出了核空间到ℓ₁空间的嵌入、随机特征收敛性以及稀疏恢复的条件保证。
Comments Extended version of the conference paper submitted for IFAC World Congress, 2026
AI总结 本文提出了一种基于模拟射频(RF)计算的新范式,用于在多用户多输入多输出(MU-MIMO)无线系统中实现高效节能的边缘人工智能推理。该方法通过基站广播编码的神经网络权重波形,客户端利用无源混频器进行本地输入编码波形的乘法运算,从而在无线接收端高效完成矩阵-向量乘法操作。研究设计了一种面向计算的物理层框架,优化了计算精度与能耗之间的平衡,并提出了一种低复杂度算法解决非凸优化问题,实验表明该方法相比传统数字计算可将客户端能耗降低近两个数量级,为边缘推理提供了高效的无线计算新途径。
Comments 13 pages, 6 figures, 2 tables. This paper proposes analog RF computing as a new paradigm for energy-efficient edge inference over wireless networks and studies the corresponding physical layer design framework
AI总结 随着大型视觉-语言模型(LVLMs)的快速发展,未经授权的数据抓取和微调行为带来了严重的版权和隐私风险。为此,本文提出MMGuard,通过注入人类不可感知的扰动生成“不可学习”的示例,主动防御数据被用于未经授权的LVLM微调。该方法利用模型的学习动态,制造优化捷径,使模型在训练时过度拟合噪声,从而在推理时性能下降。此外,MMGuard引入跨模态关联破坏策略,增强防御效果,并在多种威胁模型下展现出高效、隐蔽且鲁棒的保护能力。
AI总结 本文指出,当前基于ReAct架构的大型语言模型代理在处理网页任务时存在安全隐患,因为其在决策过程中直接使用未验证的网页内容,容易受到提示注入攻击。作者主张网页代理应采用“先规划后执行”的范式,即在观察网页内容前制定任务特定的执行计划,从而隔离不可信数据对控制流的影响。研究分析了WebArena基准,发现大多数任务可通过纯程序化规划完成,而无需运行时调用LLM子程序,并指出实现该范式的关键在于构建类型化、可审计的网页API接口,而非改进模型本身。
AI总结 本文研究了在完全信息的扩展式博弈中对博弈策略进行水印的技术,旨在检测游戏代理是否未经授权地使用了AI工具。作者借鉴了大型语言模型的KGW水印方法,提出了一种适用于博弈代理的水印方案,并通过统计检验实现水印的检测。实验表明,水印对策略质量的影响可以忽略不计,且仅需少量对局即可有效检测水印。
AI总结 本文提出了一种无需训练的生成采样方法MM-SOLD,通过矩匹配的得分平滑技术,直接从训练数据中估计目标分布的统计特性,并在采样过程中保持这些矩不变。该方法基于过阻尼朗之万动力学,能够在不训练神经网络的情况下实现高质量的样本生成,实验表明其在二维分布和图像生成任务中表现优异,具有计算高效、鲁棒性强的特点。
Comments 35 pages
AI总结 本研究探讨了中学生在在线作文写作过程中如何运用自我调节学习(SRL)策略,以及这些策略随时间的变化和对学习成果的影响。研究通过分析哥伦比亚两所中学学生在两周内的在线写作过程数据,结合过程挖掘和无监督机器学习方法,识别出三种主要的SRL策略,并发现这些策略的使用存在显著差异,其中“先阅读后写作”的策略较为普遍,而“密集写作、选择性阅读”策略虽较少见,却与更好的学习成果相关。研究结果为在线学习支持系统的优化提供了重要参考。
Comments 16 pages, 4 figures, submitted to Journal of Computer Assisted Learning (JCAL) [Under Review]
AI总结 本文提出了一种基于小波变换的Koopman算子分析方法,通过引入小波基观测函数,证明其在特定Banach空间下是Koopman半群的特征函数。在此基础上,构建了Koopman半群及其预解算子的闭式表达,并结合扩展动态模态分解(EDMD)提出了一种新的小波动态模态分解算法(cWDMD),用于数值近似Koopman算子的作用。该方法在两个数值例子中得到了验证,展示了其理论有效性与应用潜力。
AI总结 本文通过实证研究探讨了基于大语言模型(LLM)的微服务应用鲁棒性测试方法。研究针对不同架构的微服务系统,应用七种提示策略和三种开源LLM生成测试用例,发现提示策略对测试多样性的影响比模型规模更大。研究提出了两种新策略——Guided和GuidedFewShot,结合领域知识提升测试覆盖效果,其中GuidedFewShot在两个系统中均实现了较高的失败模式覆盖率,且保持了较低的模型间相似性。实验表明,仅依赖分类规则不足以引导LLM生成有效测试,具体示例对模型理解输入突变至关重要。
AI总结 本文研究了在线随机匹配问题中的一种新场景,其中本地通信带宽而非匹配时机成为主要瓶颈。为此,作者提出了一种两阶段的本地稀疏化框架,要求每个请求在全局优化前将其兼容集合缩减到一个固定大小的预算。研究设计了一种基于期望实例分数解的本地选择策略,并理论证明在足够分散度下该方法能够近似保持最大匹配的期望规模。实验表明,即使在严格的本地预算限制下,该方法仍能实现接近最优的全局匹配效果,优于传统在线算法。
AI总结 本文研究了大型语言模型(LLMs)对高层消息序列图(HMSCs)形式语义的理解程度。通过让三种主流LLMs完成129项与HMSC语义相关的任务,发现它们对基本语义概念的理解较好,但在涉及抽象、组合以及追踪和标签转换系统等复杂语义推理任务时表现较差。研究揭示了当前LLMs在处理具有严格形式语义的软件设计模型时仍存在显著局限。