Interactions Between Crosscoder Features: A Compact Proofs Perspective
交叉编码器特征间的交互:一个紧凑证明的视角
AI总结 本文从紧凑证明角度形式化交叉编码器特征交互,提出交互度量并应用于计算稀疏性、语义聚类和检测休眠代理。
Comments Accepted at the NeurIPS 2025 Workshop on Mechanistic Interpretability
交叉编码器特征间的交互:一个紧凑证明的视角
AI总结 本文从紧凑证明角度形式化交叉编码器特征交互,提出交互度量并应用于计算稀疏性、语义聚类和检测休眠代理。
Comments Accepted at the NeurIPS 2025 Workshop on Mechanistic Interpretability
RKSC:面向多步LLM推理的感知推理的KV缓存共享与自信提前退出
AI总结 提出RKSC框架,通过注意力相似性KV共享、置信门控提前退出和推理选择性块缓存管理,消除多分支LLM推理中的结构冗余,实现平均3.008倍加速,错误率仅0.37%。
Comments Accepted to the ICML 2026 Workshop on Statistical Frameworks for Uncertainty in Agentic Systems
一个镜头,多个世界:面向世界模型可解释性的能力类型接口
AI总结 提出WorldModelLens,通过能力类型适配器统一不同世界模型(如PlaNet、IRIS、I-JEPA)的可解释性分析,避免重复实现。
nCMD: 面向不平衡网络入侵检测的良性锚定特征选择
AI总结 提出良性锚定类均值偏差(nCMD)方法,通过计算攻击类分布与良性类均值的偏差进行特征选择,在四个基准数据集上优于传统过滤方法,尤其适用于特征预算紧张和类别严重不平衡的场景。
Comments 6 pages, IEEE double columns
当强化学习在监督微调后失效:恢复模型可塑性以实现稳健的SFT到RL交接
AI总结 针对SFT过度训练导致RL阶段改进有限的问题,提出Rejuvenation方法,通过基模型锚定融合和神经元重置恢复模型可塑性,在数学推理和智能体任务上提升RL性能。
介于遗忘与混沌之间:可训练耗散振荡器网络的记忆稳定性表现力三难困境
AI总结 本文研究可训练非线性振荡器网络,发现记忆范围、梯度稳定性和动态表现力三者受阻尼控制,存在无法同时最大化的三难困境,并通过实验验证了理论边界。
具有可学习通道-类别分配的前向传播卷积神经网络
AI总结 提出可学习的通道-类别分配机制,结合熵和正交正则化,以及基于验证性能的损失感知层贡献策略,在残差CNN上实现前向传播学习,在CIFAR-10/100和Tiny-ImageNet上达到FF模型最佳性能,缩小与反向传播的差距。
可训练平滑旋转变换与学习通道尺度用于LLM量化
AI总结 针对大语言模型量化中激活值量化困难的问题,提出基于分位数鲁棒的缩放策略和梯度优化的通道尺度学习,在W4A4量化下显著降低误差。
Comments 6 pages, 8 figures, 3 tables. Accepted to IEEE INES 2026 conference proceedings
在你挣扎处采样:通过熵引导的幂采样增强基础模型推理
AI总结 提出熵引导的幂采样(EGPS),一种无需训练和验证器的采样方法,通过利用前向传播中的token级熵将MCMC移动定位到高熵区域,在多个基准上以高达12.6倍加速达到最优或并列最优准确率。
AudioProcessBench: 音频基础推理中过程错误识别的基准
AI总结 提出AudioProcessBench基准,用于评估音频-语言模型在推理步骤中的过程错误识别能力,涵盖步骤正确性、错误类型检测和链级聚合三种范式。
Sigma-Branch: 用于动态推理的分层单路径网络重构,减少活跃参数
AI总结 提出Sigma-Branch框架,通过分层二叉树结构将预训练密集网络重构为共享主干、分层路由器和专用叶子,利用激活聚类初始化并微调,推理时仅执行单一路径,在CIFAR-100/ResNet-50等任务上减少58-60%活跃参数,性能损失小于1.72个百分点。
神经算子的共形预测:物理模拟中无分布不确定性量化
AI总结 提出将分裂共形预测应用于神经算子物理模拟,实现无分布预测区间和有限样本覆盖保证,并通过归一化共形预测方案生成自适应宽度区间。
Comments 13 pages, 7 tables, 7 figures. Full-scale experiments on NVIDIA V100
Co-GLANCE: 异构机器人团队的不确定性感知主动感知
AI总结 提出Co-GLANCE系统,通过蒸馏视觉语言模型实现实时遮挡分割与机器人分配,结合共形预测与选择性弃权提供统计保证的不确定性量化,驱动主动感知,在真实场景中遮挡分割和分配准确率分别提升25%和36%,推理延迟降低350倍。
Comments Code, videos, and dataset available at https://co-glance.github.io/
SPDM: 基于流形约束的几何调制状态空间建模用于时间序列预测
AI总结 提出SPDM,一种将对称正定流形约束引入状态空间模型的几何感知架构,通过流形轨迹和几何门控机制调制选择性扫描,在保持线性复杂度同时提升多变量时间序列预测精度。
IntentKV: 面向Agent推理的跨轮次意图感知KV缓存剪枝
AI总结 针对多轮LLM Agent中KV缓存成为服务瓶颈的问题,提出IntentKV方法,通过会话级QueryMemory和残差注意力头实现跨轮次意图感知的KV剪枝,在保持精度的同时大幅降低峰值请求token和KV读取量。
混合而非挑选:为什么合成语料组合对时间序列基础模型预训练至关重要
AI总结 针对时间序列基础模型预训练中合成数据生成器选择困难的问题,提出简单等权混合所有生成器的方法,匹配或超越最优单个生成器,并与真实数据结合获得最强预训练语料。
Comments Accepted at the ICML 2026 Workshop on Foundation Models for Structured Data (FMSD), Seoul, South Korea
LongMoE:基于轨迹感知的混合专家模型的纵向多模态学习
AI总结 提出LongMoE框架,通过上下文感知插补、注意力标记化、轨迹感知编码和稀疏MoE路由,联合解决临床多模态学习中模态缺失和纵向动态两大挑战,在ADNI等数据集上验证了鲁棒性。
集成局部和全局熵用于大语言模型的不确定性量化
AI总结 本文提出GLU方法,通过融合隐藏状态几何熵(全局)和token级熵(局部)来量化LLM不确定性,有效捕捉自信但错误的失败模式,无需额外训练。
Comments 17 pages, 2 figures
Rotate2Think:通过正交旋转进行几何提示以提升语言模型推理能力
AI总结 发现推理模型的输入嵌入与思考嵌入存在高锥度且方向非共线,提出无训练方法Rotate2Think,通过正交Procrustes分析估计旋转并注入合成思考向量,在30/32配置中提升数学、科学和代码任务准确率。
SD-GRPO:面向长格式视觉-语言生成的可验证片段分解
AI总结 提出SD-GRPO方法,通过将长格式输出分解为片段并计算逐片段优势,解决GRPO在视觉-语言任务中粗粒度信用分配不足的问题,实验证明其在多种长格式生成任务中优于基线。
QSplitFL: 基于能力感知的深度Q学习在分割联邦学习中的最优分割点选择
AI总结 提出QSplitFL框架,利用深度Q网络基于客户端硬件指标(CPU、内存、电池、网络延迟)动态选择最优分割点,解决异构设备上的分割联邦学习挑战,通过衰减损失奖励函数和委员会投票机制提升收敛速度和精度。
Comments Accepted by ECML-PKDD 2026
双人探戈:面向安全LLM微调的耦合任务-参考选择
AI总结 提出DualSelect框架,通过耦合任务与安全参考选择,在微调时保持安全对齐,提升安全评分至少5.10点。
LLM作为判别器:当合成表格看起来仍然真实
AI总结 提出用LLM区分真实与合成表格数据,测试不同设置和模型,发现LLM判别可作为实用的隐私审计信号。
模糊窗口注意力
AI总结 提出模糊窗口注意力(BLA),一种基于Dirichlet核插值重构模糊KV历史的有界记忆控制方法,在合成任务中状态效率比滑动窗口注意力高8倍,且随状态增大性能提升。
时间序列作为语言:通用时间序列基础模型的通用分词器
AI总结 提出UniTok通用分词器将时间序列转化为离散令牌,并基于NTP预训练UniTok-FM基础模型,支持零样本预测、提示增强预测以及少样本生成和分类,无需任务特定修改。
基于梯度提升与无分布覆盖的非酒精性脂肪肝病共形风险预测
AI总结 提出结合梯度提升决策树与共形预测的机器学习框架Method,实现非酒精性脂肪肝病个体风险的无分布校准覆盖预测,在中国多中心队列中AUROC达0.912,优于多种方法。
使用概率程序训练大型语言模型的归纳推理
AI总结 提出基于程序的后验训练(PPT)方法,利用LLM生成概率程序场景,通过推理产生分布目标,微调模型以提升归纳推理准确性、与人类判断的一致性及校准能力。
Comments 20 pages, 5 figures
多智能体大语言模型能否识别其同类?角色约束政治分析中的笔迹风格指纹识别
AI总结 研究多智能体LLM在政治分析中能否通过笔迹风格识别模型家族,提出SD-CV协议,T5模型在五类归属任务中达到F1=0.991,证明提示级匿名化无法消除模型身份信号。
Comments 24 pages, 3 figures
语言模型中对齐算法的机制分析
AI总结 本文通过层间线性探针、稀疏自编码器和交叉编码器,系统分析了六种偏好优化方法在语言模型中的内部机制,发现不同目标函数导致不同的表示几何变换,并揭示了行为对齐与内部结构变化的不一致性。
Comments Work in Progress
一阶轨迹匹配:混沌、湍流、随机系统的快速集成预测
AI总结 提出一阶轨迹匹配(FTM)方法,通过学习随机系统轨迹的一阶局部概率质量输运,实现低成本的集成预测,并捕捉通量、环流等轨迹量。