Efficient Pre-Training of LLMs through Truncated SVD Layers
通过截断SVD层实现LLM的高效预训练
发表机构 * Cognizant AI Lab(认知AI实验室) ; UT Austin(得克萨斯大学奥斯汀分校)
AI总结 提出TSVD框架,利用谱能量启发式自适应秩选择和缓存机制保持低秩与严格正交性,在减少计算开销的同时匹配或超越全参数基线的性能。
通过截断SVD层实现LLM的高效预训练
发表机构 * Cognizant AI Lab(认知AI实验室) ; UT Austin(得克萨斯大学奥斯汀分校)
AI总结 提出TSVD框架,利用谱能量启发式自适应秩选择和缓存机制保持低秩与严格正交性,在减少计算开销的同时匹配或超越全参数基线的性能。
稀疏自编码器特征匹配与电路压缩的语义最优传输
发表机构 * University of Florida(佛罗里达大学)
AI总结 提出基于最优传输的分布框架,通过激活加权分布和Wasserstein距离统一解决跨层特征匹配与电路压缩问题。
Comments preprint
思维树作为经典启发式搜索问题:形式化基础与设计模式
发表机构 * Guni Sharon
AI总结 本文通过经典启发式搜索术语统一分类法,将基于LLM的推理映射到搜索组件,并识别出系统搜索和前瞻性策略两种设计模式。
Comments Extended version of the SoCS 2026 paper. Includes appendices omitted from the proceedings version
Journal ref Proceedings of the Nineteenth International Symposium on Combinatorial Search (SoCS 2026), AAAI Press, 2026
评估脑电图基础模型泛化能力的多维框架
发表机构 * Signal Analysis and Interpretation Laboratory(信号分析与解释实验室)
AI总结 提出一个多维评估框架,在低资源条件下系统评估EEG基础模型(如LaBraM、CSBrain、CBraMod)的泛化能力,发现其在长上下文任务中表现优异,但在短窗口BCI任务中与监督模型相当,且对通道限制鲁棒性不足。
Comments 24 pages, 5 Figures
Soft-SVeRL: 基于软奖励的自验证强化学习
发表机构 * Cohere Labs(Cohere实验室)
AI总结 针对部分可验证任务,提出基于检查表分解的软奖励框架Soft-RLVR及其自验证变体Soft-SVeRL,通过密集部分信用信号提升强化学习训练效果,并解决自验证中的奖励膨胀问题。
高性能,低可靠性:表格基础模型的不确定性基准测试
发表机构 * CentraleSupélec(中央理工大学) ; ENS Paris-Saclay(巴黎-萨克雷大学) ; Université Paris-Saclay(巴黎-萨克雷大学)
AI总结 通过TALENT基准测试,发现表格基础模型虽在预测性能上优于梯度提升决策树,但在不确定性校准上表现更差,存在性能-不确定性权衡。
Comments 6 pages, 2 figures, 2 tables. Accepted at ESANN 2026 (European Symposium on Artificial Neural Networks, Computational Intelligence and Machine Learning), 22-24 April 2026, Bruges (Belgium)
Journal ref ESANN 2026 proceedings, European Symposium on Artificial Neural Networks, Computational Intelligence and Machine Learning, Bruges (Belgium) and online event, 22-24 April 2026, pp. 115-120, i6doc.com publ., ISBN 9782875870964
解码前拒绝:检测和利用中间LLM激活中的拒绝信号
发表机构 * University of Padua(帕多瓦大学) ; Örebro University(欧雷布罗大学) ; Fondazione Bruno Kessler(布鲁诺·凯索基金会)
AI总结 本文通过线性探针在变压器块的残差流激活中检测拒绝行为,并提出Mechanistic AutoDAN方法,利用探针引导的遗传搜索实现高效攻击,显著降低搜索时间并保持攻击成功率。
使用Smooth-Mamba深度强化学习建模安全关键交互中车辆类型特定的行人碰撞规避行为
发表机构 * Transportation Informatics Lab, Department of Civil and Environmental Engineering, Old Dominion University(交通信息实验室,土木与环境工程系,旧 Dominion 大学) ; Department of Electrical and Computer Engineering, Old Dominion University(电气与计算机工程系,旧 Dominion 大学) ; Department of Transportation and Urban Infrastructure Studies, SMARTER Center, Morgan State University(交通与城市基础设施研究系,SMARTER 中心,莫根州立大学)
AI总结 本研究利用Smooth-Mamba深度确定性策略梯度框架(SMamba-DDPG)从Argoverse 2数据集中提取安全关键交互,建模行人与自动驾驶车辆(AV)和人类驾驶车辆(HDV)的碰撞规避行为,发现行人对AV反应更快、穿越速度更低,且AV场景冲突率更低。
Comments 37 page. 15 Figure, 9 table
SPRINT: 用于人形运动短跑的高效频谱先验
发表机构 * College of Intelligence Science and Technology, National University of Defense Technology(智能科学与技术学院,国防科技大学) ; School of Artificial Intelligence and Robotics, Hunan University(人工智能与机器人学院,湖南大学)
AI总结 提出SPRINT框架,利用频率自适应频谱先验生成运动学可行的关节轨迹,实现零样本仿真到现实迁移,在Unitree G1平台上达到6 m/s峰值速度。
GEM: 生成式监督助力具身智能
发表机构 * Tsinghua University(清华大学) ; Tencent Hunyuan(腾讯文心)
AI总结 提出GEM模型,通过在视觉语言模型预训练中引入深度图生成任务,联合训练以提升具身智能的语义理解与物理操作能力,并发布大规模数据集GEM-4M,在多个基准上取得最优结果。
Comments Project Page: https://zhaorw02.github.io/GEM/
DriveWAM: 视频生成先验实现自动驾驶的可扩展世界-动作建模
发表机构 * The Chinese University of Hong Kong, Shenzhen(香港中文大学(深圳)) ; Voyager Research, Didi Chuxing(Voyager Research,滴滴出行)
AI总结 提出DriveWAM,通过将预训练视频扩散Transformer适配为自回归视频-动作策略,并引入场景演化驾驶引导和选择性KV记忆,实现可扩展的世界-动作建模,在NAVSIM和PhysicalAI基准上取得强规划性能。
语言模型中的文化绑定头
发表机构 * Mistral-7B ; Mistral-Nemo-12B ; Llama-3.1-8B ; Gemma-2-9B
AI总结 通过机制可解释性和析因设计,识别出8个语言模型中2-3个中间层注意力头对文化绑定有因果贡献,且绑定主要在预训练阶段形成,知识探测表明模型知道的知识远多于其行为表现。
GUI-CIDER:通过因果内化和密度感知示例重选进行GUI代理的中期训练
发表机构 * School of Computer Science, Shanghai Jiao Tong University(上海交通大学计算机科学学院) ; Meituan(美团) ; Zhejiang University(浙江大学) ; The Chinese University of Hong Kong(香港中文大学)
AI总结 提出GUI-CIDER中期训练方法,通过因果内化和密度感知示例重选显式内化GUI世界知识,提升代理对GUI操作的理解和任务成功率。
基于预测投注的半监督假设检验
发表机构 * Department of Computer Science, Technion – Israel Institute of Technology(计算机科学系,技术Ion – 以色列理工学院) ; Department of Electrical and Computer Engineering, Technion – Israel Institute of Technology(电气与计算机工程系,技术Ion – 以色列理工学院)
AI总结 提出一种基于预测投注的框架,利用无标签数据增强序贯假设检验的效力,通过引入e统计量实现任意有效的检验,并在标签偏移或概念偏移下保持有效性。
智能体知道它们不能做什么吗?评估使用工具的智能体的可行性意识
发表机构 * University of Edinburgh(爱丁堡大学)
AI总结 提出FeasiGen自动构建不可行任务管道,通过屏蔽关键工具将可解任务转为不可解,评估发现多数模型缺乏可行性检测能力,错误继续率高达73.9%。
Comments 14 pages
稳定化无分布概率预测
发表机构 * Faculty of Economics and Business(经济与商业学院) ; Department of Electrical Engineering, Shanghai Jiao Tong University(上海交通大学电气工程学院) ; Dyson School of Design Engineering, Imperial College London(帝国理工学院设计工程学院) ; Department of Technology, Management and Economics, Technical University of Denmark(丹麦技术大学技术、管理与经济学系) ; CoRE, Aarhus University(阿贾克斯大学CoRE)
AI总结 提出一种基于神经网络参数化回归样条的方法,联合优化无分布概率时间序列预测的质量与稳定性,以控制预测更新导致的波动,并在两个数据集上验证了其有效性。
冻结的VLA已经知道关于成功的信息:对基础机器人策略中价值类结构的探测研究
发表机构 * Peking University(北京大学) ; China Agricultural University(中国农业大学)
AI总结 通过线性探测从冻结的VLA特征中预测蒙特卡洛结果目标,发现其编码了成功信息,并可用于测试时动作选择提升成功率。
Comments 14 pages, 1 figure, 11 tables. Equal contribution: Jiachen Zhang, Junnan Nie, and Junyi Lao. Corresponding author: Songfang Huang. Preprint
面向掩码语言建模的熵感知掩码策略
发表机构 * AImotion Bavaria(AImotion巴伐利亚) ; Technische Hochschule Ingolstadt(英戈尔施塔特技术大学)
AI总结 提出基于熵分布的掩码策略,通过模型预测熵识别信息量高的token进行掩码,并引入自掩码方法提升训练效率,在GLUE上平均提升5%。
Comments accepted at starsem 2026 Conference
让关系说话:面向欺诈检测的端到端LLM-GNN软提示框架
发表机构 * School of Computer Science and Technology, Tongji University(同济大学计算机科学与技术学院)
AI总结 提出LGSPF框架,通过软提示桥接图结构与语义空间,并引入并行GNN编码器将多关系拓扑转化为图令牌,实现端到端优化,在欺诈检测中达到最优性能。
Comments 14 pages,3 figures
ClinicalEncoder26AM:一个多语言可诊断的ColBERT模型——来自MultiClinNER共享任务的证据
发表机构 * Parallia AI
AI总结 本文提出ClinicalEncoder26AM,一个基于BGE-M3的多语言可诊断ColBERT模型,通过多适配器蒸馏和ColBERT式检索目标进行临床后训练,在MultiClinNER任务中微调为BIO标注器,实现了最先进的多语言实体召回率和字符加权F1分数前五。
GS-FUSE: 格兰杰监督的门控融合与多粒度对齐用于事件驱动的金融预测
发表机构 * Southwestern University of Finance and Economics(西南财经大学)
AI总结 提出GS-Fuse框架,通过格兰杰因果监督的门控融合模块和多粒度对齐机制,选择性利用事件文本与价格信号,提升金融事件对市场影响的预测精度。
带动量的随机梯度下降具有算法稳定性
发表机构 * Department of Mathematics, The University of Hong Kong(香港大学数学系) ; Department of Mathematics and Mathematical Statistics, Umeå University(乌梅大学数学与统计学系)
AI总结 本文通过算法稳定性分析,证明了带动量的随机梯度下降(SGDM)在光滑凸问题上具有泛化保证,并建立了最优的过界总体风险界。
SVRG的学习理论:泛化与收敛性分析
发表机构 * Department of Mathematics, The University of Hong Kong(香港大学数学系) ; Department of Mathematics and Mathematical Statistics, Umeå University(乌梅大学数学与统计学系)
AI总结 本文通过算法稳定性分析,首次为非凸和强凸设置下的SVRG方法建立了非平凡的泛化界,揭示了优化与泛化之间的相互作用,并得到了最优的过量风险界。
论形式数学中的组合学习行为
发表机构 * University of York(约克大学)
AI总结 本文提出 S2B-LM 基准,通过去除数值处理混淆并添加思维链框架来评估组合学习行为(CLB),发现 CLB 能力对于形式数学验证的困难部分必要但不充分。
Comments work in progress, under review
基于流形优化的未知数量超平面拟合
发表机构 * Department of Electronic and Electrical Engineering, Southern University of Science and Technology, ShenZhen, China(南方科技大学电子与电气工程系) ; Department of Computing, The Hong Kong Polytechnic University, Kowloon, Hong Kong(香港理工大学计算机系) ; School of Comuputer Science and Engineering, Sun Yat-Sen University, GuangZhou, China(中山大学计算机科学与工程学院) ; Research Institute of Multiple Agents and Embodied Intelligence, Pengcheng Laboratory, ShenZhen, China(鹏城实验室多智能体与具身智能研究院)
AI总结 针对未知数量超平面拟合的非凸、非可微及模型阶数未知问题,提出基于流形优化的两阶段算法,通过黎曼期望最大化与投影密度估计实现高精度鲁棒拟合。
功能熵:通过不确定性量化预测LLM生成代码的功能正确性
发表机构 * CVS Health(CVS健康)
AI总结 针对LLM生成代码功能不正确的问题,提出基于功能等价性的不确定性量化方法(功能熵),在多个编程语言和模型上优于现有方法。
Janus-LoRA:面向持续学习的平衡低秩适配
发表机构 * School of Computer Science and Technology, Tongji University, Shanghai, China(同济大学计算机科学与技术学院,上海,中国) ; School of Computer Science and Engineering, University of Electronic Science and Technology of China, Chengdu, China(电子科技大学计算机科学与工程学院,成都,中国) ; Shanghai Innovation Institute, Shanghai, China(上海创新研究院,上海,中国) ; Independent Researcher(独立研究者)
AI总结 提出Janus-LoRA框架,通过梯度修正实现参数级正交性以克服灾难性遗忘,并利用解耦边际损失增强特征级分离,从而在持续学习中平衡稳定性与可塑性。
Comments 9pages, International Conference on Machine Learning
一个带有句法语义和跨语言义项的新语义标注语料库
发表机构 * Université Paris-Est(巴黎-埃松大学)
AI总结 本文构建了一个包含20个法语多义动词实例的新语义标注语料库,每个实例标注了三种义项:平行语料中的英语翻译、法语计算词典(Lexicon-Grammar表)条目以及两者的组合细粒度义项。
Journal ref Language Resources and Evaluation (LREC), 2012, Istanbul, Turkey, pp.597-600
DiscoForcing:基于扩散强制的实时音频驱动角色控制统一框架
发表机构 * ShanghaiTech University(上海科技大学)
AI总结 针对实时音频响应角色控制问题,提出DiscoForcing框架,结合因果音乐编码器和扩散强制序列模型,在严格因果、有限延迟的流式生成中实现音频与全身运动的稳定对齐。
Comments accepted by ICML 2026
SSR3D-LLM: 通过潜在步骤实现结构化空间推理以实现统一3D-LLM中的细粒度定位
发表机构 * The Hong Kong University of Science and Technology(香港科学与技术大学) ; Soochow University(苏州大学)
AI总结 针对统一3D-LLM中细粒度查询的脆弱性,提出SSR3D-LLM,通过潜在空间推理步骤和几何感知评分器逐步精炼候选排名,在多个基准上取得最优结果。