A Theoretical Analysis of Memory and Overfitting Phenomena in Stochastic Interpolation Models
随机插值模型中的记忆与过拟合现象的理论分析
AI总结 本文通过闭式解分析随机插值模型中的记忆化现象,揭示连续时间下确定性及随机生成过程均恢复训练样本,离散化与估计误差导致样本偏离,并给出过拟合与欠拟合的理论定义。
随机插值模型中的记忆与过拟合现象的理论分析
AI总结 本文通过闭式解分析随机插值模型中的记忆化现象,揭示连续时间下确定性及随机生成过程均恢复训练样本,离散化与估计误差导致样本偏离,并给出过拟合与欠拟合的理论定义。
什么构成了关系深度学习的理想图?
AI总结 研究发现,从数据库模式直接导出的图存在信息过载和语义碎片化问题,通过过滤和注入操作平衡可提升性能,并开发了自动优化器。
Comments This article has been accepted by ICML 2026
破解生成困惑度:为何无条件文本评估需要分布度量
AI总结 本文指出生成困惑度(gen-PPL)作为非自回归语言模型评估指标存在缺陷,通过构造零参数朴素采样器在LM1B和OpenWebText上达到SOTA gen-PPL但生成不连贯文本,建议采用直接量化生成文本与参考文本分布差异的评估套件。
Comments Accepted to the Workshop on Structured Probabilistic Inference & Generative Modeling (SPIGM) at ICML 2026
面向复杂网络系统中动力学的图基础模型:来自多层网络超级传播者识别的教训
AI总结 本文提出图基础模型在动力学中需具备归纳跨网络泛化能力,通过仅基于合成多层网络训练的ts-net模型,在真实多层网络上实现零样本泛化,并优于传统方法。
QueryWeaver: 基于LLM图生成的可靠多工具查询执行规划
AI总结 提出将自然语言查询转换为结构化图并通过确定性规划器执行的系统,利用深度优先搜索解决跨工具依赖,实现高可靠性查询。
超越智能体架构:基于LLM的交易系统中的执行假设与可复现性
AI总结 本文通过审计30项相关研究,发现LLM交易研究中执行假设报告不足,导致结果难以比较,提出需建立执行现实性、可复现性和评估可比性的报告标准。
约束释义一致性用于大语言模型幻觉检测
AI总结 提出约束一致性幻觉检测器(CCHD),通过约束优化利用释义一致性,无需额外数据,在多个基准上超越现有方法。
Comments Accepted to ICASSP 2026
跨释义不变性学习用于幻觉检测
AI总结 提出CPIL框架,通过构建正负样本对进行两阶段对比学习,仅用1%标注数据即在11个任务上超越基线,高效检测LLM幻觉。
Comments Accepted to ICASSP 2026
Contract2Tool: 学习可靠工具增强型LLM代理的前提条件和效果
AI总结 提出Contract2Tool框架,从元数据、文档和执行轨迹中推断工具契约,实现因果工具过滤,在保持可靠性的同时大幅减少工具选择和token使用。
大型语言模型应学习个性化而非聚合的人类偏好
AI总结 本文主张大型语言模型应学习个性化偏好而非聚合偏好,分析聚合偏好的理论局限与实证问题,提出通过有界个性化框架兼顾个体自主与集体安全。
Comments Accepted to ICML 2026
项目反应缩放定律:一种高效且可泛化的神经缩放估计的测量理论方法
AI总结 提出项目反应缩放定律(IRSL),将项目反应理论融入缩放定律框架,通过Beta-IRT模型利用语言模型的概率响应,将参数复杂度从O(M×N)降至O(M+N),在预训练和测试时缩放场景中仅用50个问题即可实现可靠估计。
从Medline数据库中结合领域知识发现概念间的新连接
AI总结 提出一种基于Swanson ABC模型的改进自适应模型,用于文献发现中隐藏的概念连接,通过中间主题B连接看似无关的主题A和C。
EvoIR-Agent: 通过经验驱动学习实现自进化图像修复智能体
AI总结 本文提出EvoIR-Agent,通过经验驱动学习解决图像修复中经验不足导致的规划失败问题,通过构建分层经验池和自进化机制提升修复性能和效率,实验表明其在全参考指标上表现优异,且在性能与效率之间取得显著平衡。
Comments Temporarily withdrawn for institutional clearance and compliance review. A revised version will be uploaded once the process is finalized
QuickLAP: 为半自主代理快速语言-动作偏好学习
AI总结 本研究提出QuickLAP,一种融合物理和语言反馈的贝叶斯框架,用于实时推断奖励函数,通过大规模语言模型提取奖励特征注意力掩码和偏好偏移,从而在半自主驾驶模拟器中将奖励学习误差降低70%,并通过用户研究验证其可理解性和协作性。
上下文胜过计算 人类在环优于迭代思维链提示在面试回答质量上的表现
AI总结 本文通过对比人类在环和自动思维链提示方法,发现人类在环在面试回答质量评估中表现更优,且迭代次数更少,同时具有更高的训练效果。
两个数据集在统计意义上是否足够接近?一种核分布接近性检验方法
AI总结 针对分布接近性检验(DCT)在复杂数据上的局限性,提出基于核的最大均值差异(MMD)的改进度量NAMMD,并构建NAMMD-DCT方法,在保持I类错误有界的同时提高检验功效。
G-MaP-SE: 基于GMM先验匹配的引导式语音增强
AI总结 提出G-MaP-SE框架,利用高斯混合模型构建干净语音嵌入先验,通过匹配噪声条件嵌入来提升语音增强性能,无需注册音频即可接近理想干净条件上限。
Comments Accepted to Interspeech 2026
Cherry-pick Override:混合证据下LLM法官的不安全方向性承诺
AI总结 针对混合证据场景,发现LLM法官会错误地返回方向性裁决(SUPPORTS/REFUTES)而非授权非方向性裁决(CONFLICTING),定义为Cherry-pick Override(CCO);通过诊断协议和干预实验,提出外部承诺控制层分离裁决生成与授权。
Comments 12 pages, 1 figure
迁移学习用于因果森林
AI总结 提出一种针对因果森林HTERF的迁移学习方法,通过偏移量估计源域与目标域之间的模型偏移,并给出目标域上CATE误差的上界,仿真和真实数据验证了有效性。
宏观情景下的前瞻性压力测试:基于混合GPR-HS框架与SACS的稳定SVaR估计
AI总结 本文扩展混合高斯过程回归历史模拟框架至前瞻性压力情景,提出情景平均协方差稳定方法,在三种宏观情景下实现稳定的压力在险价值估计,满足监管要求。
Comments 15 pages, 3 figures. Extension of a hybrid GPR-HS framework to forward-looking stress testing with scenario-based SVaR and covariance stabilization (SACS)
警惕带来礼物的极客:构建真正的欧盟前沿人工智能主权
AI总结 本文提出一个涵盖经济竞争力、韧性、安全与国防、欧洲价值观和对外关系五大主权支柱,以及五层26组件29子组件的前沿AI堆栈分解框架,用于识别欧盟政策中的关键缺口、冗余和权衡,以支持战略自主。
基于Stein无偏风险的自适应导数估计
AI总结 提出SURDE方法,通过Stein无偏风险评估候选滤波器长度并软组合输出,实现因果FIR导数滤波的噪声-偏差权衡,证明极小极大最优性,在仿真和真实数据上优于ICI和AWVE。
Comments Submitted to IEEE Transactions on Signal Processing, 23 pages
Kagome晶格上风车价键固体的拓扑三线态激发
AI总结 研究变形Kagome晶格化合物Rb2Cu3SnF12中风车价键固体的三线态激发,利用键算符平均场理论计算能带、动力学结构因子、贝里曲率和热霍尔效应,发现Dzyaloshinskii-Moriya相互作用和外磁场赋予三线态能带非平庸陈数。
线性Ricci迹变形与Rastall型引力中的操作等价性
AI总结 分析爱因斯坦场方程的线性Ricci迹变形,分类场方程并校准参数,证明两种常用参数化仅在同时变换变形参数和引力耦合时代数同构,但操作不等价,并区分于单模引力。
Comments 23 pages, 0 figure
关于固定阶特征在 $1/2<σ\leq 1$ 处 Dirichlet $L$-函数大值的一个注记
AI总结 本文通过简单论证,证明了固定阶本原特征的 Dirichlet $L$-函数在 $σ\in (1/2,1]$ 处存在推测性尖锐大小的大值,并给出了显式常数。
Comments 7 pages
$N$ 玩家 $\alpha$-势博弈的极限理论
AI总结 研究 $N$ 玩家 $\alpha$-势博弈当 $N\to\infty$ 时的极限行为,证明其收敛到势平均场博弈,并建立 $\lim_{N\to\infty}\alpha_N=0$ 与势平均场博弈存在条件的等价性,同时利用 Wasserstein 空间微分几何构造势函数。
扭转TMD Chern绝缘体中的持续电流、漩涡和局域Chern标记
AI总结 本文研究扭转过渡金属二硫族化物同质双层中的持续电流和漩涡,提出电流密度幅值可作为拓扑序的精确追踪器,并分析有限尺寸效应对霍尔电导量子化的影响。
Comments 7 pages, 4 figures + Supplemental Material
欧洲脉冲星计时阵列DR2引力波信号的暴胀解释及约束
AI总结 本文用暴胀模型解释EPTA DR2引力波背景信号,通过参数化张量功率谱并综合CMB、BBN和LIGO-Virgo-KAGRA约束,得到参数空间范围,发现信号可能源于辐射主导时期再入哈勃半径的张量模式,但需要极低的重加热温度。
临界Besov空间中可压缩Navier-Stokes方程的高马赫数极限
AI总结 研究临界Besov框架下可压缩Navier-Stokes系统的高马赫数极限,通过参数依赖的低阶估计证明小初始数据下系统的整体适定性,并恢复无压Navier-Stokes系统的全局强解,对d≥3导出定量误差估计。
Comments 30 pages
病态函数空间与一个未解决的数学分析 I 问题
AI总结 本文研究单位圆盘上的一类病态全纯函数空间,其中存在函数虽可用多项式逼近,但无法用其泰勒级数部分和逼近,并由此引出一个仍未解决的级数收敛问题。
Comments 18 pages