Bayesian Latent Space Models for Graphs Are Misspecified: Toward Robust Inference via Generalized Posteriors
基于图的贝叶斯潜在空间模型存在规格问题:通过广义后验实现稳健推断
AI总结 本文研究了基于图的贝叶斯潜在空间模型的规格问题,提出了一种广义后验框架,通过Link-Sequential R-SafeBayes方法改进模型的鲁棒性,提升了校准性和链接预测性能。
基于图的贝叶斯潜在空间模型存在规格问题:通过广义后验实现稳健推断
AI总结 本文研究了基于图的贝叶斯潜在空间模型的规格问题,提出了一种广义后验框架,通过Link-Sequential R-SafeBayes方法改进模型的鲁棒性,提升了校准性和链接预测性能。
从分裂到决策:利用时间细胞阶段分割预测胚胎可转移性
AI总结 该研究提出TransFACT框架,利用时间 lapse 视频中的早期发育阶段信息,通过结合帧级时间特征和阶段级表示,预测胚胎可转移性,优于现有方法。
SynGR:释放跨模态协同在生成推荐中的潜力
AI总结 本文提出SynGR框架,通过显式鼓励生成过程中的跨模态依赖,以捕捉新兴物品语义,从而提升生成推荐性能。
Comments Accepted by ICML2026, 15 pages
MoCo-EA:利用对抗模式连接实现高效的进化攻击
AI总结 本文提出MoCo-EA,一种通过利用对抗模式连接来提高效率的进化攻击方法,该方法通过贝塞尔交叉算子优化扰动,提升了攻击效果并减少了收敛时间和查询需求。
ESLD (外部代理潜在防御):一种用于更快、更强提示注入防御的潜在空间架构
AI总结 本文提出了一种名为ESLD的潜在空间架构,通过利用守卫模型内部表示中的信号来加速安全检查并提高检测准确性,无需重新训练或修改守卫模型。
DMN: 一种用于多图像输入多模态大语言模型的组合框架
AI总结 本文提出DMN框架,通过分布式指令、多模态证据和数字链任务,提升多图像输入多模态大语言模型的 jailbreak 性能,实验表明其在GPT-4o、Gemini-2.5-pro和Claude Sonnet 4上的攻击成功率超过90%。
Comments ACL 2026 main conference
SCAFDS: 基于边特征图注意力的跨银行欺诈检测与归因驱动的SAR生成
AI总结 本文提出SCAFDS系统,通过七阶段集成监控流程解决现有方法的五个结构性限制,利用欺诈共现边特征进行跨银行拓扑编码,结合节点表示和欺诈共现边特征进行边特征引导的图注意力,生成机构级系统性欺诈风险评分,并通过归因条件生成SAR叙述,实现每个FinCEN SAR断言的可追溯性,最终在IEEE-CIS欺诈检测数据集和合成FDIC对齐的跨银行网络上取得了显著的AUPRC和AUROC提升。
通过头部随机探测实现快速且轻量的后门检测
AI总结 本文提出HTell,一种基于头部随机探测的快速且轻量的数据无关后门检测器,通过分析模型预测头部在随机潜在探测下的响应统计,实现高效准确的后门检测。
轻量且快速的后门模型检测
AI总结 本文提出DFBScanner,一种轻量级静态参数检查框架,用于快速检测后门。通过分析后门诱导的特征扰动在最终分类层引起的异常参数更新,实现高效且攻击无关的检测。
变分扩散通道解码器
AI总结 本文提出一种高效的变分扩散模型基于通道解码器,结合领域特定的信念传播过程和扩散模型的强学习能力,实现了低成本和高纠错性能。
一种用于预测儿童疟疾严重程度的逻辑回归模型
AI总结 本研究提出了一种逻辑回归模型,利用环境和生物学因素预测儿童疟疾的严重程度,通过83.3%的准确率验证了模型的有效性,并强调了样本代表性的的重要性。
基于多尺度交叉注意力变换器的跨受试者颅内脑电重构(使用头皮记录)
AI总结 本文提出了一种基于多尺度交叉注意力变换器(CAST)的方法,通过两阶段迁移学习策略,从头皮脑电中重建未见过的受试者的颅内脑电信号,实现了无需患者特定训练的跨受试者颅内脑电重构。
不要在没有充分鲁棒性审计的情况下从LLM社会模拟中绘制科学结论
AI总结 本文研究了从LLM社会模拟中得出的科学结论不应强于支持它们的鲁棒性审计,通过两个案例研究展示了小扰动如何影响模拟结果,并提出TRAILS框架以规范鲁棒性审计。
极值栈是速率无关函数的最小充分统计量:一个柯尔莫哥洛夫复杂性特征化
AI总结 本文证明了离散序列的极值栈是所有可计算、因果、速率无关函数的最小充分统计量,从柯尔莫哥洛夫复杂性的角度出发。具体来说,建立了K(Pi_n) - O(1) ≤ K_R(u_{0:n}) ≤ K(Pi_n) + O(1),其中K_R(u_{0:n})是回答类别R中所有查询的最短程序长度,O(1)的开销与序列长度n和栈深度k无关。充分性源于Preisach滞回操作符的经典擦除性质。最小性通过一个有限指示族的速率无关性得到验证。因此,任何保留完整类别R的滞回驱动流压缩必须至少保留K(Pi_n) - O(1)位;由结果隐含的基于栈的压缩算法具有柯尔莫哥洛夫最优性保证,而标准时间序列压缩方法均无法提供。
Comments 6 pages, 1 algorithm, 1 table. Submitted to Information Processing Letters (Elsevier)
心力衰竭再入院风险的肺部超声生物标志物预后价值:一项试点数据驱动分析
AI总结 本研究通过数据驱动方法利用住院期间获得的B型肺部超声(LUS)数据,预测30天内心力衰竭再入院风险,发现依赖性下肺区域、时间差特征以及多视图特征拼接在预测中表现最佳,展示了超声生物标志物在非侵入性心力衰竭风险分层中的实用性。
GenAI-FDIA:基于物理的生成模型用于虚假数据注入攻击
AI总结 本文提出GenAI-FDIA框架,通过物理兼容的生成模型合成虚假数据注入攻击,验证了不同架构在电力系统中的有效性,并解决了生成模型中出现的新型故障模式。
Comments Submitted to IEEE Transactions on Smart Grid
DarkLLM: 利用大语言模型学习语言驱动的对抗攻击
AI总结 本文提出DarkLLM,一种基于大语言模型的对抗攻击框架,通过将自然语言攻击指令转换为潜在攻击向量,生成有效的对抗扰动,统一了多种攻击类型并实现了灵活可控的对抗生成。
Comments 23 pages, 13 figures
99%成功悖论:当近完美检索等于随机选择
AI总结 该研究引入了Bits-over-Random(BoR)指标,揭示了高成功率可能掩盖随机水平性能的现象,指出在大规模数据集上,即使检索结果覆盖率达到99%,其选择性仍可能接近零,从而表明需要重新考虑检索深度和传统指标的报告方式。
Comments 12 pages, 2 figures, 7 tables. Accepted at ICLR 2026 Blog Track, https://iclr-blogposts.github.io/2026/blog/2026/bits-over-random/
KadiAssistant: 一种用于Kadi4Mat研究数据生态中信息检索的对话式AI代理
AI总结 本文提出KadiAssistant,一种集成了隐私设计的AI助手,旨在帮助研究人员高效访问、聚合和整合异构且敏感的研究数据,通过结合自托管的大语言模型和隐私保护的语义搜索,提升信息检索效率并满足复杂的访问控制需求。
通过物理基础的代理工作流发现胰岛素输送聚合物
AI总结 本文提出了一种基于物理的代理工作流方法,用于发现胰岛素输送的聚合物,通过大规模语言模型和物理工具的结合,在有限预算内高效搜索离散的PSMILES空间,实现了优于强化学习和贝叶斯优化的胰岛素-聚合物相互作用能。
为小型语言模型引导的推理:评估可执行的多项选择题问答框架
AI总结 本文提出Code-Guided Reasoning(CGR)评估协议和生成程序资源,用于衡量可执行推理框架如何提升小型语言模型在多项选择题问答任务中的表现,通过实验展示了使用可执行框架带来的性能提升。
Comments 28 Pages, 18 Figures
RecoAtlas: 从语义合理性到集级效用在LLM推荐代理中
AI总结 本文提出RecoAtlas,一个用于评估购物代理的基准和工具包,通过行为基础的度量标准来评估推荐代理的性能,揭示语义合理性并不一定代表行为基础的效用。
Comments Benchmark on LLM Recommendation Agents
一种用于可穿戴PPG心血管稳定性的非线性复杂性指数:多尺度验证、系统性评估修正与贝叶斯参数优化
AI总结 本文提出了一种基于心脏稳定性理论的非线性复杂性指数(SCSI),通过多尺度验证和系统性评估修正,结合贝叶斯参数优化,提高了可穿戴PPG心血管稳定性估计的准确性与可靠性。
信任还是弃权?一种自感知RAG方法
AI总结 本文提出了一种自感知RAG方法SABER,通过构建知识冲突基准并引入自感知信念估计器,提升RAG在冲突场景下的准确性和可靠性,同时在弃权策略上实现风险与覆盖的平衡。
SpecX:多模态光谱的大规模基准及跨范式评估
AI总结 本文提出SpecX,一个用于多模态光谱的大规模基准,通过不同层级的数据集支持分子解析、光谱模拟和理解任务,揭示了专用光谱模型和多模态语言模型在光谱智能中的不同优势。
Comments 9 pages,1 figures
特征有生命周期。我们应当关心
AI总结 研究探讨了语言模型中特征的生命周期,发现了一种稳定的表征基础架构,并揭示了其在训练过程中的四个关键特性。
Comments 21 pages, 7 figures
LLMs能否模拟人类信念动态?
AI总结 研究探讨了大型语言模型(LLMs)能否模拟人类在社交网络中形成和改变信念的过程,发现LLMs在初始信念分布和整体一致性方面表现不佳,并警告在社交模拟中使用LLMs作为人类代理的风险。
PO4ISR的可重复性分析:诊断和缓解基于LLM的会话推荐中的语义漂移
AI总结 本文研究了PO4ISR在不同语义领域中的可重复性,发现标准推理提示在长会话中出现严重的上下文漂移,导致性能下降。为此,作者提出了PO4ISR++,通过反思提示和一致排名检测增强鲁棒性,并在多个数据集上验证了其有效性,提升了会话推荐的性能。
XFlowMap:大规模出行生成数据的跨尺度泛化与制图
AI总结 本文提出XFlowMap框架,用于大规模出行生成数据的跨尺度泛化与制图,通过整合跨尺度流量模式检测、自动化流量制图泛化和新的制图表示法,实现复杂出行流量结构的分析与可视化。
Mask-to-Correct$^+$: 利用检索器多样性进行掩码引导的忠实事实修正
AI总结 本研究提出Mask-to-Correct$^+$框架,通过利用检索器多样性来改进掩码引导的事实修正,通过结合多个检索器的修正结果以减少检索偏差并提高鲁棒性,实验表明其在多个基准数据集上均优于现有方法,SARI得分提升达14%。