Spectral Principal Paths: A Spectral Perspective on Linear Representation Formation in LLMs
谱主路径:大语言模型中线性表示形成的谱视角
AI总结 提出输入空间线性假设和谱主路径框架,利用谱理论解释大语言模型中线性表示的形成与稳定性,并给出严格保证。
Comments arXiv admin note: text overlap with arXiv:2503.22720
谱主路径:大语言模型中线性表示形成的谱视角
AI总结 提出输入空间线性假设和谱主路径框架,利用谱理论解释大语言模型中线性表示的形成与稳定性,并给出严格保证。
Comments arXiv admin note: text overlap with arXiv:2503.22720
基于f-散度的扩散模型遗忘统一框架
AI总结 提出一个基于f-散度的统一框架,将扩散模型概念遗忘中的MSE损失推广到任意f-散度,并通过理论分析和实验验证不同散度对遗忘效果的影响。
Comments Accepted at ICML 2026
BESPOKE:通过诊断反馈进行搜索增强型大语言模型个性化的基准测试
AI总结 提出BESPOKE基准,通过收集真实用户历史并配对细粒度偏好分数与反馈,系统评估搜索增强型大语言模型在个性化信息检索任务中的表现。
Comments Accepted to ICML 2026
通过在大规模工业数据集上的异常引导预训练推进金属表面缺陷检测
AI总结 提出异常引导自监督预训练(AGSSP)方法,通过两阶段框架利用异常先验引导表示学习,在金属表面缺陷检测中显著提升性能,mAP@0.5提升高达10%。
Comments Accepted for publication in Pattern Recognition
LAD-VF:LLM自动微分实现基于形式化方法反馈的无微调机器人规划
AI总结 提出LAD-VF框架,利用形式化验证反馈和LLM自动微分自动优化提示词,无需微调即可提升机器人规划任务中规范符合率,成功率从60%提升至90%以上。
Comments Presented at ICRA 2026
ISTASTrack:通过ISTA适配器桥接ANN和SNN用于RGB-事件跟踪
AI总结 提出首个基于Transformer的ANN-SNN混合跟踪器ISTASTrack,利用ISTA适配器双向融合RGB和事件特征,实现高效鲁棒跟踪。
Comments Accepted by IEEE Transactions on Image Processing, DOI: 10.1109/TIP.2026.3694138, 15 pages, 8 figures
LLMs在重排序任务上的推理有多可靠?
AI总结 本研究分析不同训练方法对LLMs在重排序任务中语义理解的影响,并探究模型能否生成更知情的文本推理以克服透明度和数据有限的挑战。
Comments This chapter has been published in Advancements in AI From Foundations to Cross-Disciplinary Applications, Springer, 2026
动手实践:从连续序列中分割单个手势
AI总结 针对连续手语分割难题,提出基于Transformer的架构,利用HaMeR手部特征和3D角度,采用BIO标注方案建模时序动态,在DGS语料库上达到最优性能。
Comments Accepted in the 19th IEEE International Conference on Automatic Face and Gesture Recognition. Code Implementation Released
结构化关系推理用于群体活动评估
AI总结 提出ProGraD框架,利用冻结视觉基础模型和轻量级GroupContext Transformer,通过结构化关系推理在单次前向传播中联合推断群体位置、成员关系和活动,仅用10M参数即在Cafe和Social-CAD基准上取得最优性能。
Comments Accepted to CVPR 2026 Workshop (SAUAFG)
PersianMedQA: 在波斯语-英语双语医学问答基准上评估大型语言模型
AI总结 本文提出PersianMedQA数据集,包含20,785道波斯语医学多选题,用于评估41个LLM在零样本和思维链设置下的双语医学推理能力,发现闭源通用模型表现最佳,而波斯语模型性能较差,且翻译会丢失文化临床线索。
Comments Accepted at LREC 2026 (The Fifteenth Language Resources and Evaluation Conference), Palma, Mallorca, Spain, May 2026
SONAR-LLM:在句子嵌入中思考、以令牌说话的自回归Transformer
AI总结 提出SONAR-LLM,一种在连续SONAR嵌入空间“思考”但通过令牌级交叉熵监督的解码器-only Transformer,融合语义抽象与似然训练信号,在39M至1.3B参数规模上取得有竞争力的生成质量。
真的是你吗?探索逼真说话头像视频中的生物特征验证场景
AI总结 本文研究在逼真说话头像视频中,利用面部运动模式作为行为生物特征进行身份验证,提出基于图卷积网络的轻量级模型,AUC接近80%。
Comments Accepted at the IEEE International Joint Conference on Biometrics (IJCB 2025)
ODOV:开放域开放词汇目标检测基准
AI总结 针对真实场景中域偏移和类别偏移同时发生的问题,提出开放域开放词汇目标检测任务,构建OD-LVIS基准数据集,并设计基于VLM的基线方法,通过域无关类别提示和域投影嫁接模块提升检测性能。
MolPIF: 一种用于分子生成的参数插值流模型
AI总结 提出参数插值流模型MolPIF,通过参数空间分布插值统一连续坐标与离散原子类型的生成,在CrossDocked2020数据集上优于基线方法。
Comments Accepted to Bioinformatics
思维链如何工作?从解码、投影和激活追踪信息流
AI总结 通过反向追踪解码、投影和激活阶段的信息流,揭示思维链作为解码空间剪枝器的作用,并发现其以任务依赖方式调节神经元激活。
Comments Accept by ACL 2026
Pusa V1.0: 通过向量化时间步长适应解锁预训练视频扩散模型中的时间控制
AI总结 提出向量化时间步长适应(VTA)方法,在统一视频扩散框架中实现细粒度时间控制,零样本完成图像到视频生成、起止帧控制等任务,且不破坏基础模型能力。
Comments Code is open-sourced at https://github.com/Yaofang-Liu/Pusa-VidGen
城市街景中什么需要关注?从场景理解到道路安全:视觉驱动数据集与研究的综述
AI总结 本文通过系统分类交通场景中需要关注的关键元素,全面分析35个视觉驱动任务和73个数据集,提出统一分析框架,旨在促进道路安全研究。
Comments 40 tasks, 78 datasets
Normal Patch Retinex 稳健算法用于数字显微镜白平衡
AI总结 提出一种基于Normal Patch Retinex的全自动白平衡算法,用于校正数字显微镜彩色图像,实验证明其优于经典算法。
AlignEvoSkill: 迈向知识感知与任务对齐的智能体技能进化
AI总结 提出AlignEvoSkill框架,通过联合建模知识覆盖和任务对齐,从失败轨迹中识别知识标签、检索并适配候选技能,再基于知识覆盖和任务对齐分数筛选高质量技能,在3个基准和4个LLM骨干上相对提升34.7%,实现技能进化新SOTA且成本更低。
领域知识增强的大语言模型用于欺诈和概念漂移检测
AI总结 提出一种领域知识增强的大语言模型框架,通过集成结构化领域知识和漂移检测单元,实现高准确率的欺诈对话检测和概念漂移分类。
自适应多提示对比网络用于少样本分布外检测
AI总结 针对少样本分布外检测问题,提出自适应多提示对比网络(AMCN),通过CLIP学习可学习文本提示和类间/类内分布,实现ID-OOD分离边界自适应。
Comments Published in ICML 2025
将数据追踪的机器遗忘提升为基础模型的知识追踪
AI总结 本文提出将数据追踪的机器遗忘提升为基础模型的知识追踪,以应对多样化遗忘请求,并更接近人类遗忘机制,通过视觉语言模型案例展示实现范式。
Comments Accepted to TMLR
通过激活引导实现体裁控制的音乐生成
AI总结 提出一种在推理时对自回归生成模型MusicGen进行干预的方法,利用线性探针权重引导残差流,实现细粒度的体裁控制。
自级联扩散模型用于任意尺度图像超分辨率
AI总结 提出自级联扩散框架CasArbi,通过将任意缩放因子分解为连续小步骤,逐步提升分辨率并保持尺度一致性,在感知和失真指标上优于现有方法。
车辆边缘计算中的智能卸载:深度强化学习方法与架构综述
AI总结 本文综述了基于深度强化学习的车辆边缘计算卸载方法,分类比较了学习范式、系统架构和优化目标,并分析了马尔可夫决策过程的应用及未来研究方向。
Comments 33 Pages, 6 Figures, 7 Tables. Machine Learning, Reinforcement Learning, Multi Agent Reinforcement Learning, Computational Offloading and Edge Computing
提示的鲁棒性:增强大型语言模型对抗提示攻击的鲁棒性
AI总结 提出RoP(提示鲁棒性)策略,通过错误校正和引导两个阶段,增强LLM对输入扰动的鲁棒性,在算术、常识和逻辑推理任务上显著提升性能。
Comments Accepted by IEEE Transactions on Artificial Intelligence
“给我BF16,否则给我死亡”?LLM量化中的精度-性能权衡
AI总结 本文通过超过50万次评估,全面研究了FP8、INT8和INT4量化在Llama-3.1模型族上的精度-性能权衡,发现FP8无损、INT8精度损失低、INT4权重仅量化具有竞争力,并基于vLLM框架给出了不同部署场景下的最优量化格式建议。
Comments Accepted to ACL 2025
消息传递状态空间模型:利用现代序列建模改进图学习
AI总结 提出MP-SSM,将现代状态空间模型的核心计算嵌入消息传递神经网络,实现静态和时序图上的高效、置换等变和长程信息传播,并通过精确敏感性分析刻画深层信息流问题。
Doc-CoB:通过视觉链式框推理增强文档理解
AI总结 提出Doc-CoB框架,通过粗到细的布局感知视觉推理,结合多模态大语言模型,逐步聚焦查询相关布局区域,提升文档理解性能。
OCR-Reasoning基准:揭示MLLMs在复杂文本丰富图像推理中的真实能力
AI总结 提出OCR-Reasoning基准,包含1069个人工标注样本,覆盖6种核心推理能力和18个实际推理任务,通过双标注(最终答案和逐步推理过程)评估多模态大语言模型在文本丰富图像推理中的能力,发现最先进模型准确率均低于50%。
Comments ICLR 2026