Physically Consistent Null Space Alignment for Detection of Low-Magnitude False Data Injection Attacks
物理一致零空间对齐用于检测低幅值虚假数据注入攻击
发表机构 * Ben-Gurion-University(本-古里安大学)
AI总结 提出物理一致零空间对齐(PCNSA)框架,通过伪零空间守恒预处理保持物理零空间与测量伪零空间的几何对应,从而检测低幅值但高影响的隐蔽虚假数据注入攻击。
物理一致零空间对齐用于检测低幅值虚假数据注入攻击
发表机构 * Ben-Gurion-University(本-古里安大学)
AI总结 提出物理一致零空间对齐(PCNSA)框架,通过伪零空间守恒预处理保持物理零空间与测量伪零空间的几何对应,从而检测低幅值但高影响的隐蔽虚假数据注入攻击。
更多废话,更少意义:揭示小语言模型中的自我改进行为
发表机构 * American University of Armenia(亚美尼亚美国大学) ; NVIDIA(英伟达)
AI总结 本研究通过构建充分性测试,发现小语言模型在自我纠正中仅获得4.4%的准确率提升,且较长的提示反而与错误答案正相关,表明其推理能力有限。
LUNA-AD: 面向自动驾驶的轻量级不确定性感知语言模型与终身学习
发表机构 * The Hong Kong University of Science and Technology (Guangzhou)(香港科技大学(广州))
AI总结 提出LUNA-AD,一种结合三系统架构、多智能体分析、双头轻量模型和反思驱动终身学习的轻量级不确定性感知语言模型,在nuPlan上实现高成功率与低推理延迟。
置信陷阱:图神经网络的校准攻击
发表机构 * Virginia Polytechnic Institute and State University(弗吉尼亚理工学院暨州立大学) ; The Pennsylvania State University(宾夕法尼亚州立大学) ; VinUniversity ; University of Illinois at Chicago(伊利诺伊大学芝加哥分校)
AI总结 提出统一图校准攻击(UGCA)框架,通过KL散度损失、重排序机制和混合损失等策略,在保持分类精度下显著提高期望校准误差,揭示高精度或多类模型更易受攻击。
个性化且鲁棒的主动机器人辅助:基于不确定性引导的大语言模型推理
发表机构 * Concordia University(康考迪亚大学)
AI总结 提出GLOBE框架,结合n-gram马尔可夫模型与不确定性引导的大语言模型推理,在家庭环境中实现高效鲁棒的主动机器人辅助,并在HOMER-Noise数据集上验证了其性能与效率。
超越线性激活引导:用于控制大语言模型行为的可逆潜在变换
发表机构 * Indiana University Bloomington(印第安纳大学伯明顿分校)
AI总结 提出INNSteer框架,通过可逆神经网络将LLM激活映射到潜在空间进行线性控制,再逆变换回原空间,实现非线性、输入依赖的激活引导,在多个模型和基准上优于现有方法。
基于漂移加惩罚的持续学习的理论基础
发表机构 * IIIT Delhi(德里印度理工学院) ; IIT Dharwad(达尔瓦德印度理工学院)
AI总结 提出COLD框架,利用漂移加惩罚原理调节稳定性-可塑性权衡,通过虚拟队列控制遗忘,理论保证收敛性,实验优于现有方法。
谄媚作为多语言对齐失败:安全性能如何随语言、主题和模型退化
发表机构 * IIT Gandhinagar(印度理工学院甘地讷格尔分校) ; Asian Institute of Technology(亚洲理工学院)
AI总结 研究多语言模型中谄媚现象,发现低资源语言中谄媚率激增,且与主题无关,归因于分词器生育率,表明对齐方法在非高资源语言中泛化差。
GIFT: 基于LLM引导的状态-奖励接口用于金融强化学习
发表机构 * East China University of Science and Technology(华东理工大学) ; University of Science and Technology of China(中国科学技术大学) ; Southwestern University of Finance and Economics(西南财经大学) ; University of Sydney(悉尼大学) ; City University of Hong Kong(香港城市大学) ; Northeastern University(东北大学) ; The Ohio State University(俄亥俄州立大学) ; National University of Singapore(新加坡国立大学)
AI总结 提出GIFT框架,利用大语言模型引导PPO强化学习中的状态增强和奖励塑造,提升金融交易策略的样本外风险调整收益。
Sparrow: 用于大语言模型稳定高效长上下文强化学习的稀疏 rollout
发表机构 * Carnegie Mellon University(卡内基梅隆大学) ; Cornell University(康奈尔大学) ; Intel(英特尔) ; Amazon AGI(亚马逊AGI)
AI总结 针对RLVR中长上下文rollout计算昂贵的问题,提出Sparrow方法,通过动态稀疏度调度保持token级策略失配的下尾统计量稳定,在Qwen3系列模型上实现2.0-2.4倍加速,并推广到更大模型和编程领域。
长会议文档摘要的段级树搜索
发表机构 * GSAI, POSTECH(浦项科技大学人工智能研究院) ; CSE, POSTECH(浦项科技大学计算机科学与工程系) ; ETH Zurich(苏黎世联邦理工学院) ; ETH AI Center(苏黎世联邦理工学院人工智能中心) ; Agentic AI Lab, KT(KT公司智能体人工智能实验室) ; LILT(LILT公司)
AI总结 提出基于蒙特卡洛树搜索的段级摘要框架S3,无需训练即可组合段级候选摘要,使用7B模型达到72B模型性能。
GraspFoM:基于3D基础先验的重建驱动机器人抓取
发表机构 * The Hong Kong University of Science and Technology (Guangzhou)(香港科技大学(广州)) ; Peking University(北京大学) ; The Hong Kong University of Science and Technology(香港科技大学)
AI总结 提出GraspFoM框架,利用3D基础先验(SAM3D)构建共享3D物体潜变量,联合优化重建与抓取姿态预测,通过锚点初始化的截断姿态推理扩散器生成连续多模态抓取,实现高保真重建与最优抓取。
轨迹精炼蒸馏
发表机构 * McGill University(麦吉尔大学) ; Mila Quebec AI Institute(米拉魁北克人工智能研究所) ; UT Austin(德克萨斯大学奥斯汀分校)
AI总结 提出轨迹精炼蒸馏(TRD),通过教师指导修正学生轨迹中的前缀错误,解决在线策略蒸馏中的前缀失败问题,提升大语言模型的单次准确率和推理覆盖。
TinyGiantALM:面向资源约束下意图感知推理的紧凑型音频-语言模型
发表机构 * University of Science, VNU-HCM(胡志明市国立大学下属理科大学) ; Vietnam National University, Ho Chi Minh City(胡志明市国立大学)
AI总结 提出紧凑型1.5B参数音频-语言模型TinyGiantALM,通过指令感知特征精炼框架(查询引导投影器+语义门控)过滤用户意图相关声学信号,在MMAR基准上零样本准确率46.4%,超越7B-13B基线,并优于8倍大模型。
基于跨图像多对比度特征记忆库检索增强的分割辅助脑MRI合成
发表机构 * South China University of Technology(华南理工大学) ; University of Technology Sydney(悉尼科技大学)
AI总结 提出分割辅助的闭环生成对抗框架,通过辅助分割分支和双库检索增强策略,提高多对比度脑MRI中肿瘤区域的合成保真度。
CheXanatomy: 面向胸部X光片的解剖感知视觉-语言建模
发表机构 * Stanford Center for Artificial Intelligence in Medicine and Imaging, Stanford University(斯坦福大学医学与影像人工智能中心) ; Department of Radiology, Stanford University(斯坦福大学放射学系)
AI总结 提出CheXanatomy框架,通过自回归令牌空间监督将解剖知识融入预训练视觉-语言模型,实现解剖分割,在合成和真实X光片上性能媲美U-Net,并提升域迁移鲁棒性和样本效率。
AsyncLane: 扩散语言模型解码中精炼与推进的解耦
发表机构 * National University of Singapore(新加坡国立大学) ; University of Southampton(南安普顿大学)
AI总结 提出AsyncLane,一种无需训练的解码调度器,通过将生成过程分叉为精炼和推进两个通道,解耦块间依赖,在保持质量的同时显著提升扩散语言模型的解码吞吐量。
具有主动对话查询的可证明高效个性化多目标老虎机
发表机构 * The Ohio State University(俄亥俄州立大学) ; University at Buffalo(布法罗大学)
AI总结 提出MO-PQUCB算法,通过主动查询获取用户偏好信号,结合Plackett-Luce模型和正则化UCB,解决多目标老虎机中偏好与奖励的耦合问题,实现更优的遗憾界。
TimpaTeks: 通过扩散语言模型引导实现自动原地文本序列修改
发表机构 * MBZUAI(穆罕默德·本·扎耶德人工智能大学)
AI总结 提出TimpaTeks方法,将激活引导扩展到扩散语言模型,实现原地文本修改以改变概念,在情感和概念引导任务上降低困惑度并保持句子结构。
自进化科学智能体发现可泛化的物理推理流体控制
发表机构 * National University of Singapore(新加坡国立大学)
AI总结 提出一种由大语言模型驱动的自进化科学智能体工作流,通过迭代代码生成和物理仿真诊断,自动构建可解释的控制器,并在欠驱动双关节狗鲨游泳器目标到达任务中实现零样本泛化。
SceneConductor: 基于多智能体编排的单图像3D场景生成
发表机构 * Nanyang Technological University(南洋理工大学) ; University of Oxford(牛津大学) ; Meshy AI
AI总结 提出多智能体编排框架,将单图像3D场景生成分解为场景初始化、环境构建和多智能体细化三个阶段,并引入几何感知布局预测器,在几何精度、空间一致性和感知真实性上超越现有方法。
TrustMargin: 大语言模型中参数化记忆与检索证据之间的无训练仲裁
发表机构 * Peking University(北京大学)
AI总结 针对大语言模型在知识问答中参数记忆与检索证据冲突的问题,提出无训练仲裁层TrustMargin,利用模型自身似然度评分选择更可信的答案,无需微调或外部评判。
当正确决策隐藏内部压力:多模态语言模型中的决策状态探测
发表机构 * The University of Melbourne(墨尔本大学)
AI总结 提出S³E框架,通过正锚定A/B强制选择任务和隐藏状态分析,发现多模态语言模型在正确行为下仍存在语义压力导致的决策状态位移。
Muon的谱动力学与噪声几何
发表机构 * Massachusetts Institute of Technology(麻省理工学院)
AI总结 研究Muon优化器通过极分解替换矩阵梯度,证明其偏置为平坦谱,在欠定回归中导出奇异值动力学,实验表明其效果依赖于谱方向活跃度。
审计大型语言模型中的专有对齐:一种无需真实标准的比较框架
发表机构 * University of Waterloo(滑铁卢大学) ; Vector Institute(向量研究所)
AI总结 提出一种统计框架,通过比较目标模型与基线模型在共享语义空间中的响应偏差,检测黑盒语言模型中的专有对齐行为,无需真实标准即可实现外部审计。
TT-DAC-PS:用于最优交易执行的双目标确定性演员-评论家与策略平滑
发表机构 * University of Reading(雷丁大学) ; University of Göttingen(哥廷根大学) ; GWDG(哥廷根数据处理中心) ; Henley Business School(亨利商学院)
AI总结 提出TT-DAC-PS算法,结合双指数移动平均评论家目标、悲观最小备份、TD3风格策略平滑噪声、延迟演员更新和保守Q正则化,以抑制过高估计,并在限价订单簿数据上优于经典和强化学习基线。
RiskNet:一个来自新闻的大规模AI风险事件数据集,包含对齐和多维标注
发表机构 * Beijing University of Posts and Telecommunications(北京邮电大学) ; Beijing Key Laboratory of Multimodal Data Intelligent Perception and Governance(多模态数据智能感知与治理北京市重点实验室)
AI总结 提出RiskNet,一个从多语言新闻构建的大规模AI风险事件数据集,通过结构化流水线进行事件识别、对齐和多维分类,支持AI安全、治理和风险分析研究。
少步全原子流图共折叠
发表机构 * Genesis Molecular AI ; Massachusetts Institute of Technology(麻省理工学院) ; Carnegie Mellon University(卡内基梅隆大学) ; Imperial College London(伦敦帝国学院) ; Mila
AI总结 提出DeCAF框架,将全原子共折叠扩散模型蒸馏为流图,仅需几步推理即可生成高质量样本,并通过奖励引导搜索提升采样质量。
开放学习的信息论定义
发表机构 * Stanford University(斯坦福大学)
AI总结 提出基于比特等价的信息论定义开放环境,证明经典赌博机非开放,设计算法实现开放学习。
稀疏自编码器引导副作用的干预前预测
发表机构 * University of Michigan(密歇根大学)
AI总结 提出一种干预前筛选框架,利用特征统计预测SAE引导的副作用(效果不稳定和附带扩散),在多个模型和字典上验证了解码器几何等信号优于基线,但预测效果因模型而异。