Cost-Aware Diffusion Draft Trees for Speculative Decoding
用于推测解码的成本感知扩散草稿树
发表机构 * Zhejiang University(浙江大学) ; Westlake University(西湖大学)
AI总结 提出CaDDTree方法,通过联合优化树结构和节点预算直接最大化令牌吞吐量,并证明在凸验证成本下吞吐量函数是单峰的,从而无需离线预算搜索。
用于推测解码的成本感知扩散草稿树
发表机构 * Zhejiang University(浙江大学) ; Westlake University(西湖大学)
AI总结 提出CaDDTree方法,通过联合优化树结构和节点预算直接最大化令牌吞吐量,并证明在凸验证成本下吞吐量函数是单峰的,从而无需离线预算搜索。
“我知道这会如何发展”:通过渐进条件惊奇度刻画多样性
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; University of Cambridge(剑桥大学) ; Stanford University(斯坦福大学)
AI总结 提出一种基于上下文学习的多样性度量方法 Decan(D_{Ca_n}),通过单次前向传递计算每个字节的得分,无需嵌入模型、参考语料或人工标注,在多个基准上验证了其有效性。
Comments 28 pages, 18 figures, 9 tables. Accepted to the Workshop on Generative AI, Creativity, and Human-AI Co-Creation @ ICML 2026 (non-archival). Code and data: https://github.com/AMindToThink/icl-diversity
Token 预测器不是规划器:构建物理基础的因果推理器
发表机构 * Tsinghua University(清华大学) ; Microsoft Research Asia(微软亚洲研究院) ; MBZUAI
AI总结 针对具身视觉-语言规划中模型依赖语言统计先验而非因果推理的问题,提出 Causal-Plan-Bench 基准和 Causal-Plan-1M 数据集,并训练 Causal Planner 模型,实现从 token 预测到物理因果推理的转变。
Comments 77 pages, appendices included. Code: https://github.com/THUSI-Lab/Causal-Reasoner
基于电影MRI的个性化三维心肌梗死几何重建用于心脏数字孪生
发表机构 * Department of Biomedical Engineering, National University of Singapore(新加坡国立大学生物医学工程系) ; Department of Medicine, National University of Singapore(新加坡国立大学医学系) ; Department of Cardiology, National University Heart Centre Singapore(新加坡国立心脏中心心内科部)
AI总结 提出一种显式几何-运动嵌入模型,从多视角电影MRI中全自动重建个性化、可仿真的三维心肌梗死几何结构,采用双分支自适应融合和AHA-17引导的多尺度监督,实现无对比剂梗死表征。
Comments 14 pages
ProbeScale: 通过探测分析优化神经缩放定律以实现高效小语言模型推理
发表机构 * Department of Computer Science and Engineering(计算机科学与工程系) ; Indian Institution of Information Technology Kalyani(印度信息技术学院Kalyani)
AI总结 提出ProbeScale框架,利用缩放定律和探测分析从预训练小语言模型中识别参数高效子网络,在参数预算下最大化任务加权探测性能,实现5-10倍参数压缩并保持95%-98%原始性能。
Comments 7 pages, 2 figures, ACL
OctoT2I:一种自我进化的智能文本到图像路由系统
发表机构 * School of Electronic and Computer Engineering, Peking University(电子与计算机工程学院,北京大学) ; Guangdong Provincial Key Laboratory of Ultra High Definition Immersive Media Technology, Shenzhen Graduate School, Peking University(广东省超高清沉浸媒体技术重点实验室,北京大学深圳研究生院)
AI总结 提出OctoT2I框架,通过自进化机制构建知识库并采用状态化多轮路由策略,联合优化生成质量与推理效率,在GenEval上达到0.96性能,同时实现90.3%推理加速和56.6%能效提升。
从结构视角看大语言模型的多语言性
发表机构 * Nara Institute of Science and Technology(奈良科学技術研究所)
AI总结 本研究通过表示结构分析探索大语言模型的多语言性,发现低资源语言与英语的结构差异大于高、中资源语言,且语言特定后训练改变结构但保留语言间关系。
树引导的识别-然后-利用:决斗式赌博机中最佳臂识别与遗憾最小化的统一框架
发表机构 * State Key Lab of CAD&CG(计算机辅助设计与图形学国家重点实验室)
AI总结 针对Condorcet赢家假设下的N臂随机决斗式赌博机,提出树引导的识别-然后-利用(TG-ITE)统一框架,通过共享树引导识别方法在O(N)次比较内找到高置信度候选,并针对不同目标设计利用策略,首次同时实现最佳臂识别O(N)样本复杂度、弱遗憾O(N)和强遗憾O(N log T)保证,并消除现有方法中O(log N)的次优差距。
STaR-KV: 面向GUI视觉语言模型的时空自适应KV缓存压缩重加权方法
发表机构 * EPIC Lab, SJTU(上海交通大学EPIC实验室) ; HKUST (GZ)(香港科技大学(广州)) ; The University of Sydney(悉尼大学) ; UESTC(电子科技大学) ; ZJU(浙江大学)
AI总结 提出STaR-KV,一种无需训练的KV缓存压缩框架,通过子空间感知评分、时间稳定性折扣和熵驱动温度三个维度自适应校准令牌重要性,在GUI任务中实现高精度和近40%的峰值GPU内存节省。
用于因果发现的基准一致性评估
发表机构 * Independent researcher(独立研究者) ; UNSW Australia(新南威尔士大学澳大利亚分校) ; CSIRO Australia(澳大利亚联邦科学与工业研究组织)
AI总结 提出自动检索论文并利用大语言模型检查基准因果图与领域研究一致性的流程,评估11个流行基准,发现其一致性差异显著。
PlatonicNav: 在导航中揭示柏拉图式拓扑地图的语义对应
发表机构 * USYD(新南威尔士大学) ; Maincode ; UNSW(新南威尔士大学) ; La Trobe(拉特罗布大学)
AI总结 提出PlatonicNav框架,通过自监督视觉编码器构建柏拉图式拓扑地图,无需跨模态训练即可统一视觉目标导航、跨模态目标导航和视觉语言导航任务。
并行异步自适应一阶方法的随机收敛性
发表机构 * Université de Toulouse, INP, IRIT, Toulouse, France(图卢兹大学,INP,IRIT,法国图卢兹) ; IA Artificial and Natural Intelligence Toulouse Institute (ANITI)(图卢兹3IA人工智能与自然智能研究所(ANITI)) ; NAXYS, University of Namur, Namur, Belgium(NAXYS,纳慕尔大学,比利时纳慕尔)
AI总结 本文提出一类新的异步自适应一阶优化方法,包括多种流行算法的异步变体,并分析其在非凸函数上的随机收敛性,达到O(1/√t)的收敛速率。
结构引导的自适应传播用于蛋白质-蛋白质相互作用位点预测
发表机构 * Institute of Computing Science and Technology, Guangzhou University(广州大学计算机科学与技术学院) ; School of Computer Science, Peking University(北京大学计算机科学学院) ; Information Science & Technology Department, Beijing Capital International Airport Co., Ltd.(北京首都国际机场有限公司信息科学与技术部) ; School of Information Science and Technology, Dalian Maritime University(大连海事大学信息科学与技术学院)
AI总结 提出SGAP-PPIS模型,利用等变图神经网络的多尺度几何状态生成残基级传播系数,实现自适应信息扩散,在Test_60上取得竞争性能。
Comments 9 pages, 3 figures
HarnessForge:面向自适应智能体系统的协同框架与策略进化
发表机构 * Beijing Advanced Innovation Center for Future Blockchain and Privacy Computing, School of Artificial Intelligence, Beihang University(北京未来区块链与隐私计算先进创新中心,人工智能学院,北京航空航天大学) ; Tsinghua University(清华大学)
AI总结 提出HarnessForge元自适应框架,通过框架-策略协同进化实现LLM智能体系统的全系统自适应,在多个基准上显著提升性能。
Comments 25 pages, 13 figures
Trans2Occ: 从仿真到现实的透明物体体素占用估计与抓取
发表机构 * Shanghai AI Laboratory(上海人工智能实验室) ; SUSTech(南方科技大学) ; CUHK(香港中文大学) ; Harbin Institute of Technology(哈尔滨工业大学) ; University of Oxford(牛津大学) ; Beihang University(北京航空航天大学) ; Nanyang Technological University(南洋理工大学) ; University of Science and Technology of China(中国科学技术大学)
AI总结 提出基于单视图RGB输入的体素占用预测框架,结合仿真数据生成与规则抓取策略,实现透明物体的鲁棒3D感知与操作。
FLARE: 混合语言模型的扩散方法
发表机构 * Adobe Research(Adobe研究院) ; Georgia Institute of Technology(佐治亚理工学院)
AI总结 提出FLARE框架,通过结合自回归和扩散目标、硬件感知内核和统一推理,将混合注意力LLM转换为支持并行解码的扩散模型,在保持能力的同时提升吞吐量。
PillarDETR:基于YOLO骨干和RT-DETR头的实时3D目标检测
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 提出PillarDETR架构,结合YOLOv8的CSP骨干和RT-DETR解码器,实现无需NMS的端到端实时3D目标检测,在KITTI和nuScenes上取得精度与速度的良好平衡。
Comments 6 pages, 1 figures, 8 tables
EvoCut:面向高效大型视觉语言模型的多层演化感知视觉标记压缩
发表机构 * Harbin Institute of Technology(哈尔滨工业大学) ; Xiaohongshu(小红书) ; Fudan University(复旦大学)
AI总结 提出一种无需训练和注意力的视觉标记压缩方法EvoCut,通过分析多层演化偏差估计标记重要性,在LLaVA-1.5-7B上仅保留11.1%的视觉标记即可保持94.4%的平均性能。
Comments Preprint. 12 pages, 6 figures, 7 tables
TriAlign: 迈向个性化大语言模型对齐中的通用真值一致性
发表机构 * Department of Data Science & AI, Monash University(数据科学与人工智能系,墨尔本大学) ; Defence Science and Technology Group, Australia(澳大利亚国防科学与技术集团)
AI总结 针对个性化大语言模型在不同社会群体间存在的通用真值不一致问题,提出TriAlign框架,通过离线多智能体强化学习联合优化真值准确性、跨群体一致性和个性化,实现公平对齐。
质量引导的半监督学习用于医学图像分割
发表机构 * School of Computing Science, Simon Fraser University, Canada(Simon Fraser大学计算机科学学院)
AI总结 提出一种质量引导的半监督学习框架,通过专用网络估计分割质量,并利用质量感知正则化和伪标签重加权提升医学图像分割性能。
Comments Early Accept at MICCAI 2026, 13 pages, 2 figures
基于BERT和图神经网络的历史知识图谱构建
发表机构 * Shandong Management University(山东管理大学) ; Maria Curie-Sklodowska University(玛丽·居里-斯洛多夫斯卡大学)
AI总结 本文提出结合BERT和图神经网络的高层架构,从历史文本中提取实体和关系,构建知识图谱,在精度、召回率和F1分数上优于传统方法和深度学习基线。
Comments 9 pages, 4 figures
敏感性是一把双刃剑:判别性与对抗鲁棒性之间的权衡
发表机构 * University of California, Berkeley(加州大学伯克利分校)
AI总结 本文发现全连接分类器的高敏感性带来判别性但也导致脆弱性,而ℓ2距离分类器的不敏感性带来鲁棒性但限制性能,为此提出基于混合原型混合框架的ℓ2重分类器,通过融合稳定原型和动态原型实现判别性与鲁棒性的平衡,并设计混合替代攻击评估协议。
Comments 13 pages including reference, 4 figures
THRD:一种针对大语言模型越狱攻击的无训练多轮防御框架
发表机构 * Beijing Language and Culture University(北京语言大学)
AI总结 提出无训练框架THRD,通过显式建模时间风险累积(包括逐轮风险评估、跨轮意图检测、响应评估和决策模块)防御多轮越狱攻击,将攻击成功率降至0.2-4.0%且模型效用损失小于1.5%。
TrafficRAG:用于交通事故责任认定的多模态RAG框架
发表机构 * Southwest Petroleum University(西南石油大学) ; Sichuan Police College(四川警察学院)
AI总结 提出TrafficRAG框架,通过视觉语言模型生成结构化描述、混合检索获取法规和案例、大语言模型融合多模态证据进行推理,实现自动化交通事故责任分析报告生成。
Comments 12 pages, 3 figures, accepted at ICANN 2026
FlatVPR: 用于基础模型特征流形几何校正的即插即用地线性残差适配器
发表机构 * Fundamental Engineering for Knowledge-Based Society, Graduate School of Engineering, University of Fukui(知识社会基础工程,工程研究生院,福井大学)
AI总结 提出FlatVPR范式,通过可学习残差适配器和Pullback Flatness Loss抑制特征流形曲率,实现稀疏锚点下的线性插值重建,在NCLT数据集上显著提升视觉位置识别精度。
Comments 5 pages, 1 figure, technical report
基于迹驱动仿真的通用任务多模型智能体AI系统特征分析
发表机构 * The Pennsylvania State University(宾夕法尼亚州立大学) ; SK Hynix(SK海力士) ; KAIST(韩国科学技术院)
AI总结 本文提出GAIATrace数据集和Vidur-Agent仿真器,通过迹驱动仿真分析多模型智能体AI系统在通用任务上的行为特征。
Comments 13 pages, 18 figures, 2 tables
捷径通往虚无:揭秘深度虚假回归
发表机构 * University of California, Los Angeles(加州大学洛杉矶分校) ; Rutgers University(罗格斯大学) ; Yang AI Lab(杨人工智能实验室)
AI总结 针对连续预测中的虚假相关性,提出利用标签和特征空间中虚假属性的相似性来校准分布,从而提升模型在分布偏移下的泛化能力。
后确定性分布式系统:可信自主基础设施的新基础
发表机构 * OpenKedge Inc.(OpenKedge公司)
AI总结 本文提出后确定性分布式系统(PDDS)模型,以协调确定性代码、随机模型和自主代理共存的异构环境,并定义了五大架构支柱及新的故障分类。
Comments 8 pages, 1 table
关于带客户端采样的正交化矩阵动量的稳定性注记
发表机构 * University of Chinese Academy of Sciences(中国科学院大学) ; Sun Yat-sen University(中山大学) ; Southern University of Science and Technology(南方科技大学) ; George Washington University(乔治华盛顿大学)
AI总结 研究带客户端采样的分布式矩阵优化中正交化动量更新的有限样本泛化界,通过耦合邻域稳定性递归和加权集中步骤导出上尾保证。
公平微调缓解分布推断攻击
发表机构 * Rakshit Naidu
AI总结 提出公平微调(FFt)方法,通过在等几率约束下对互补分布样本进行微调,将模型公平性指标与分布推断攻击中的对抗优势联系起来,并给出理论界限,实验证明能有效降低攻击成功率。
Comments 16 pages (11 main, 5 appendix)