Trust but Verify: Prover-Verifier Deliberation for Selective LLM Prediction
信任但验证:面向选择性LLM预测的证明者-验证者审议
发表机构 * New York University(纽约大学)
AI总结 提出基于交互式证明理论的证明者-验证者审议协议,通过结构化置信度判定实现选择性预测,在GPQA Diamond上取得约30个百分点的高置信度精确率差距。
信任但验证:面向选择性LLM预测的证明者-验证者审议
发表机构 * New York University(纽约大学)
AI总结 提出基于交互式证明理论的证明者-验证者审议协议,通过结构化置信度判定实现选择性预测,在GPQA Diamond上取得约30个百分点的高置信度精确率差距。
分块吉布斯采样遇上扩散Transformer:约束优化的无监督学习
发表机构 * University of Toronto(多伦多大学) ; Vector Institute(向量研究所)
AI总结 提出分块吉布斯扩散Transformer(BloGDiT),通过分块高斯去噪替代标准联合高斯去噪,解决扩散模型在约束优化中变量子集大规模编辑的需求,在数独、图着色、最大独立集和MaxCut任务上匹配或超越现有方法。
PQDT: 伪查询双Transformer用于鲁棒点云修复
发表机构 * Mercedes-Benz AG(梅赛德斯-奔驰集团) ; University of Bonn(波恩大学) ; Fraunhofer SCAI(弗劳恩霍夫SCAI研究所)
AI总结 提出一种基于伪查询模块和Transformer主干网络的统一3D修复网络,通过两阶段几何变换增强结构清晰度和局部细节,在多种退化场景下超越现有方法。
Comments To be published in The IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) 2026
在基尼度量空间中优化多维缩放
发表机构 * GitHub
AI总结 提出基尼多维缩放(Gini MDS)框架,通过基于值和秩的基尼伪距离,在噪声和异常值数据上优于欧几里得MDS,并利用PyTorch实现GPU加速。
扩散模型的推理时对齐:基于信任区域迭代扭曲序贯蒙特卡洛方法
发表机构 * Duke University(杜克大学) ; Morgan Stanley(摩根大通)
AI总结 提出信任区域迭代扭曲序贯蒙特卡洛(TRI-TSMC)框架,通过迭代学习扭曲函数来改进扩散模型推理时的对齐,在文本生成和文本到图像生成任务上优于现有方法。
Comments 34 pages, 6 figures, and 7 tables
证据关联放射学报告:面向结构化成像智能的人机协同参考架构
发表机构 * Xylemed
AI总结 提出一种人机协同、证据关联的参考架构,通过结合特定检查模板、语音到结构处理、测量与分割捕获、受控AI辅助起草以及基于DICOM、HL7 FHIR等标准的互操作性,将放射学报告从自由文本转化为结构化智能层,支持审阅报告、纵向比较、临床数据重用及系统集成。
Comments Technical report, 27 pages, 2 figures, 12 tables, 1 listing; reference architecture paper; does not report clinical outcomes or validated diagnostic performance
信任感知的联合特征-预测差异用于鲁棒域适应
发表机构 * School of Engineering and Built Environment, Griffith University, Australia(工程与环境学院,格里菲斯大学,澳大利亚)
AI总结 提出信任感知域适应框架,通过联合特征-预测差异(JFPD)结合不确定性信任和语义对齐信任,实现可靠性感知的域差异估计,提升域适应性能。
Comments Research report
Courant:一种具有局部支持和可解释场分解的状态自适应感知器神经代理模型
发表机构 * Pasteur Labs(Pasteur实验室) ; Cornell University(康奈尔大学) ; Institute for Simulation Intelligence(模拟智能研究所)
AI总结 提出基于感知器的编码-处理-解码代理模型Courant,通过状态自适应潜在查询和轻量解码器实现类似自适应hp细化的局部支持与可解释场分解,在稳态/瞬态模拟基准上取得竞争性精度。
重新审视预传播图神经网络:鲁棒扩散算子与隐状态再传播
发表机构 * School of Electrical and Computer Engineering, Cornell University, Ithaca, New York, USA(电气与计算机工程系,康奈尔大学,纽约州伊萨卡市)
AI总结 提出鲁棒图扩散算子和少量隐状态再传播方案,使预传播图神经网络在保持训练效率的同时匹配消息传递图神经网络的精度。
Uncertainty-DTW 用于序列和视觉标记
发表机构 * School of Engineering and Built Environment, Electrical and Electronic Engineering, Griffith University(工程与建筑环境学院,电气与电子工程学院,格里菲斯大学) ; School of Computer Science and Engineering, University of New South Wales(计算机科学与工程学院,新南威尔士大学)
AI总结 提出不确定性感知的动态时间规整(uDTW)框架,通过异方差不确定性建模和最大似然估计实现鲁棒对齐,并推广到视觉标记集,在多个领域取得优于现有方法的结果。
Comments Research report
利用规范自由度学习随机系统的非梯度种群动力学
发表机构 * Courant Institute of Mathematical Sciences, New York University, New York, NY 10012, USA(数学科学学院,纽约大学,纽约,纽约州,10012,美国)
AI总结 针对现有种群动力学推断局限于梯度流的问题,提出非梯度推断流(NGIF)算法,通过连续性方程的弱形式参数化一般向量场并选择非最小动能准则,在低维和高维物理问题中提高了分布精度并更好地捕捉非势输运。
RECTOR: 基于优先级规则的合规感知自动驾驶轨迹选择重排序
发表机构 * TORC Robotics LLC(TORC机器人公司) ; Daimler Truck AG(戴姆勒卡车集团) ; Reynolds & Moore(雷诺兹与摩尔公司) ; MassRobotics(马斯机器人)
AI总结 提出RECTOR,一种后生成重排序层,通过差异化代理和场景条件适用性机制,基于分层规则手册(安全>法律>道路>舒适)对候选轨迹进行评分,并采用确定性ε-词典序规则选择,在无需重新训练预测器的情况下,将安全与法律违规率从28.58%降至20.42%。
进化增强的多智能体强化学习用于协同空战
发表机构 * Institute of Automation, Chinese Academy of Sciences(中国科学院自动化研究所) ; School of Artificial Intelligence, University of Chinese Academy of Sciences(中国科学院大学人工智能学院)
AI总结 针对多机协同空战中现有MARL方法探索效率低、样本利用率低和策略泛化差的问题,提出ACE-MAPPO混合学习框架,融合进化算法与MAPPO,通过遗传软更新、进化优先轨迹回放和对抗进化课程学习机制提升性能。
WorldCraft: 从相机导航到交互式视频世界模型中的物体操控
发表机构 * The Hong Kong University of Science and Technology(香港科学与技术大学) ; AI Technology Center, Tencent Video, Tencent(腾讯视频AI技术中心,腾讯) ; Wuhan University(武汉大学) ; Peking University(北京大学)
AI总结 提出WorldCraft框架,通过轨迹控制管道(NWT、SP-LoRA、TASP)将交互式视频世界模型从相机导航扩展到物体级轨迹操控,实现用户指定路径下的物体运动与相机导航共存。
Comments Project page: https://nevsdev.github.io/WorldCraft/
激光增材制造扫描顺序优化的强化学习:用于奖励和世界模型诊断的双层代理-有限元分析诊断框架
发表机构 * College of Engineering, Design and Physical Sciences, Brunel University London(布鲁内尔大学伦敦工程、设计与物理科学学院) ; Pattern Recognition Laboratory, Institute of Automation, Chinese Academy of Sciences(中国科学院自动化研究所模式识别实验室) ; ISIS Neutron and Muon Source, Science and Technology Facilities Council, Rutherford Appleton Laboratory(Rutherford Appleton实验室,科学与技术设施委员会ISIS中子与μ子源)
AI总结 本文提出一个双层代理-有限元分析诊断框架,通过轻量代理和稀疏有限元模拟,诊断强化学习在激光增材制造扫描顺序优化中的奖励和世界模型保真度问题。
Comments 31 pages, 7 figures, 3 tables
GL-LFGNN:基于Liang-Kleeman信息流的全局-局部双分支因果图神经网络用于脑电情感识别
发表机构 * School of Mathematics (Zhuhai), Sun Yat-sen University, Zhuhai, China(中山大学数学学院(珠海))
AI总结 提出GL-LFGNN模型,利用Liang-Kleeman信息流理论构建有向因果图,通过全局-局部双分支架构整合全脑与区域连接,在MEEG数据集上以少量参数实现高精度情感识别。
Comments 10 pages, 3 figures
忠实性指标并不衡量忠实性:基于真实标签的元评估
发表机构 * Tel Aviv University(特拉维夫大学) ; University of Utah(犹他大学)
AI总结 针对思维链忠实性度量缺乏真实标签验证的问题,构建了包含真实忠实性标签的数据集BonaFide,系统评估现有指标,发现多数指标表现接近随机、存在偏差且计算成本高。
AION:下一代时间序列任务与实用框架
发表机构 * Griffith University(格里菲斯大学) ; Shenzhen University(深圳大学) ; Zhejiang University(浙江大学)
AI总结 针对时间序列研究向结合预测、上下文推理、工具使用和结构化决策支持的现实任务转变,提出AION框架,通过时间锚定、知识推理和可靠性机制(如实验后分析和分层审查)实现更详细的过程追踪和审查步骤。
Comments Project page and code are available at https://github.com/ztxtech/aion
X-DiffVLA:面向视觉-语言-动作模型的跨具身扩散动作头
发表机构 * SKL-MAIS, Institute of Automation, Chinese Academy of Sciences(SKL-MAIS,自动化研究所,中国科学院) ; School of Artificial Intelligence, University of Chinese Academy of Sciences(人工智能学院,中国科学院大学) ; Beijing Academy of Artificial Intelligence(北京人工智能研究院) ; BeingBeyond ; School of Computer Science, Peking University(北京大学计算机学院)
AI总结 针对跨具身数据学习通用策略的挑战,提出X-DiffVLA模型,通过扩散模型和具身强制技术实现异构末端执行器间的知识迁移,在RoboCasa和Isaac Gym上分别提升15.3%和12.5%。
无偏扩散变分反演:基于原则性后验匹配
发表机构 * Peking University(北京大学)
AI总结 提出原则性后验匹配(PPM)框架,通过精确优化KL散度(利用Fisher散度积分)解决逆问题中模式坍塌和不确定性量化不可靠的问题,统一变分推理和摊销推理,在图像修复、超分辨荧光显微和射电干涉成像中实现高保真重建和校准的不确定性估计。
RAMBA: 通过束调整的4D雷达建图
发表机构 * State Key Lab of Info Engineering in Surveying, Mapping and Remote Sensing(信息工程测绘遥感国家重点实验室)
AI总结 提出RAMBA框架,利用束调整联合优化雷达帧状态,结合协方差加权几何残差、IMU预积分因子和雷达自速度约束,实现全局一致的4D雷达建图。
Comments 5 pages, 2 figures, to present in ISPRS2026 Thematic Session 10 on Radar Perception
AstroRAG -- 一种基于PageRank的检索增强生成管道用于天文学问答
发表机构 * Australian National University(澳大利亚国立大学) ; Learning Machines Pty Ltd
AI总结 提出AstroRAG,一种基于PageRank的检索增强生成管道,通过两阶段检索(MMR和PR重排序)在严格token预算下选择紧凑互支持的上下文,无需训练且保护隐私,在天文学QA基准上使Mistral-7B准确率和F1分数达到79.49%,性能近乎翻倍。
Comments Accepted to IEEE CAI 2026
TRACE:一个基于分类学的合成数据集,用于应用行为分析中的教学程序生成和会话解释
发表机构 * Drexel University(德雷塞尔大学) ; Pombo Labs(波莫实验室)
AI总结 提出TRACE数据集,通过分类学驱动的确定性生成器创建2999个合成示例,覆盖教学程序生成和多会话行为解释任务,以解决ABA领域真实数据受隐私保护无法公开的问题。
Comments 11 pages, 3 tables. Dataset: https://huggingface.co/datasets/PomboLabs/TRACE ; code: https://github.com/Pombo-Labs/TRACE
LVLMs中的语言偏差:从深入分析到简单有效的缓解方法
发表机构 * Harbin Institute of Technology, Shenzhen, China(哈尔滨工业大学(深圳))
AI总结 本文系统研究了大视觉语言模型中的语言偏差问题,发现其根源在于训练中的模态未对齐,并提出了两种简单有效的缓解方法:语言偏差正则化(LBR)和语言偏差惩罚(LBP)。
Comments Accepted by ICML 2026
MimirRAG:一种集成元数据的金融数据检索多智能体RAG框架
发表机构 * Copenhagen Business School(哥本哈根商学院)
AI总结 提出MimirRAG多智能体RAG框架,通过元数据集成、表格感知分块和智能体工作流,在金融数据检索中实现89.3%准确率,优于基线。
DA-UCT:用于快速肌肉骨骼声速重建的自监督域自适应超声计算机断层扫描
发表机构 * College of Biomedical Engineering, Fudan University(复旦大学生物医学工程学院)
AI总结 提出SDA-UCT框架,通过自监督域自适应和注意力增强网络,实现快速高分辨率肌肉骨骼超声计算机断层扫描重建,显著提升速度并保持高质量。
D3S2: 扩散引导的语义分割数据集蒸馏
发表机构 * Zhejiang University(浙江大学)
AI总结 针对语义分割数据集蒸馏中的长尾类别不平衡、像素级对齐和高计算成本问题,提出两阶段框架D3S2,通过类别平衡掩码选择和扩散引导图像合成生成紧凑训练集,在极低压缩率下显著提升分割性能。
慢性皮肤病纵向数据检索中的隐私保护本地语言模型:在天疱疮患者中的实施
发表机构 * Division of Systems Medicine, Department of Metabolism, Digestion and Reproduction, Imperial College London(系统医学系,代谢、消化与生殖部,帝国理工学院伦敦分校) ; Department of Dermatology and Venereology, Istanbul Research and Training Hospital(皮肤科与性病科,伊斯坦布尔研究与培训医院) ; Department of Dermatology and Venereology, Istanbul Medeniyet University(皮肤科与性病科,伊斯坦布尔梅德尼yet大学) ; Department of Dermatology and Venereology, Istanbul Medicana Atakoy Hospital(皮肤科与性病科,伊斯坦布尔Medicana阿塔科伊医院)
AI总结 本研究评估了本地部署的隐私保护小型语言模型(SLM)在天疱疮患者长期随访记录中检索结构化临床特征并生成纵向摘要的能力,结果显示SLM在特征检索任务中平均准确率达82.25%,且医生对AI生成摘要的质量、临床准确性和实用性评分较高。
停止去噪你的模糊
发表机构 * Indian Institute of Technology Tirupati, India.(印度泰尔普蒂印度理工学院)
AI总结 提出ConvDiff框架,用卷积替代加性噪声构建模糊退化轨迹,实现基于扩散模型的图像去模糊,弥合模糊数学原理与扩散算法设计的差距。
Comments Accepted at IEEE International Conference on Image Processing (ICIP) 2026. 7 pages, 3 figures
从语义字典中学习:面向统一视觉表示与生成的判别式码本对比学习
发表机构 * Universitat de Barcelona(巴塞罗那大学) ; Barcelona Supercomputing Center (BSC)(巴塞罗那超级计算中心)
AI总结 提出LEASE框架,通过配对生成-判别码本设计,在离散标记空间中联合优化掩码重建损失和码本对比损失,实现统一视觉表示与生成,在ImageNet-1K上达到最先进性能。
Comments Accepted at CVPR'26