Coherence Maximization Improves Pluralistic Alignment
一致性最大化改进多元对齐
发表机构 * George Washington University(乔治·华盛顿大学)
AI总结 提出内部一致性最大化(ICM)方法,通过最大化标签的互可预测性生成个性化示例,无需人工监督即可将模型与目标群体价值观对齐,并证明示例一致性比单独准确性更重要。
一致性最大化改进多元对齐
发表机构 * George Washington University(乔治·华盛顿大学)
AI总结 提出内部一致性最大化(ICM)方法,通过最大化标签的互可预测性生成个性化示例,无需人工监督即可将模型与目标群体价值观对齐,并证明示例一致性比单独准确性更重要。
牙科医疗中的大型AI模型:从通用系统到领域特定基础模型
发表机构 * University of Al Ain, UAE(阿联酋阿恩大学) ; Sharjah University, UAE(阿联酋谢尔杰大学) ; Cornell University, Qatar(卡塔尔康奈尔大学) ; McGill University(麦吉尔大学)
AI总结 本文通过系统综述,提出二维分类框架,比较语言生成模型、判别视觉基础模型和牙科特定基础模型在牙科任务中的表现,发现集成管道优于单一模型,并指出数据不对称、幻觉和缺乏标准化基准等障碍。
用于遮挡鲁棒目标检测的微型协同推理
发表机构 * Imperial College London(帝国理工学院伦敦分校) ; Nottingham Trent University(诺丁汉特伦特大学)
AI总结 针对超低端边缘设备,结合MCUNet骨干网络、YOLOv2检测头和TensorFlow Lite量化,评估决策级融合(WBF)相比特征级融合在遮挡场景下提升mAP达+0.2736,并验证了多视角融合与Wi-Fi对等部署的可行性。
基于经验神经正切核的极端天气预报可扩展不确定性量化
发表机构 * Center for AI Research(人工智能研究中心) ; Department of Education(教育部门) ; Makati Philippines(马卡蒂菲律宾)
AI总结 本文提出基于神经正切核的不确定性量化方法,利用最后一层经验特征,通过方差崩溃机制和分解性能分析,实现无需重训练的极端天气自适应预测区间。
Comments Proceedings of the 32nd ACM SIGKDD Conference on Knowledge Discovery and Data Mining V.2 (KDD '26)
过犹不及:当 sim2real 努力阻碍策略学习(以及如何应对)
发表机构 * Apptronik ; University of Texas at Austin(得克萨斯大学奥斯汀分校)
AI总结 本文指出 sim2real 努力与策略学习之间存在激励错位,导致模拟器锁定和策略探索不足,并提出通过 sim2sim2real 范式仅以机器人运动学为设计约束的潜在解决方案。
ProtoAda: 原型引导的自适应适配器扩展与几何整合用于多模态持续指令微调
发表机构 * School of Artificial Intelligence, Nanjing University, China(南京大学人工智能学院) ; State Key Laboratory of Novel Software Technology, Nanjing University, China(南京大学新型软件技术国家重点实验室)
AI总结 提出ProtoAda框架,通过格式感知任务原型和几何感知参数整合,解决多模态持续指令微调中任务路由错误和梯度干扰问题。
一步生成模型的漂移偏好优化
发表机构 * Westlake University(西湖大学) ; The Chinese University of Hong Kong, Shenzhen(香港中文大学(深圳))
AI总结 提出 DrPO 方法,通过在线采样和排序构建非参数偶极偏好场及参考漂移,实现一步式生成模型的无梯度偏好微调。
Comments 24 pages, 9 figures
AutoForest: 从生物医学研究中自动生成森林图,实现端到端的证据提取与综合
发表机构 * IBM Research(IBM研究院) ; Dublin City University(都柏林城市大学) ; UCL(伦敦大学学院) ; University of Oxford(牛津大学) ; IT:U Interdisciplinary Transformation University Austria(奥地利 interdisciplinary Transformation 大学)
AI总结 提出AutoForest系统,通过端到端的证据提取与统计综合,直接从生物医学论文自动生成可发表的森林图,加速证据综合并降低元分析门槛。
Comments Accepted to ACL2026 (System Demonstrations Track)
EEG-FuseFormer: 一种用于癫痫发作预测的Transformer驱动特征融合框架
发表机构 * National University of Singapore(新加坡国立大学) ; University College Dublin(都柏林大学) ; University of Twente(特文特大学) ; Cardiff University(卡迪夫大学)
AI总结 提出EEG-FuseFormer框架,融合CNN-LSTM和ResNet-18提取的时空特征与频谱特征,利用Transformer编码器进行融合,在CHB-MIT数据集上达到98.85%的平均召回率,优于多数现有方法。
Comments IEEE International Instrumentation and Measurement Technology Conference (I2MTC) 2026
AutoMedBench: 迈向基于智能体AI模型的医学自动研究
发表机构 * University of California, Santa Cruz(加州大学圣克鲁兹分校) ; NVIDIA
AI总结 提出AutoMedBench,一个工作流感知的基准,通过五阶段工作流(计划、设置、验证、推理、提交)评估自主智能体在医学AI研究中的行为,发现验证阶段最弱而设置阶段最强,验证和提交失败占主导。
自适应自动框架:面向开放式任务流的智能体系统部署的持续自我改进
发表机构 * Emory University(埃默里大学) ; Amazon(亚马逊) ; The Pennsylvania State University(宾夕法尼亚州立大学) ; UIUC(伊利诺伊大学香槟分校) ; Northeastern University(东北大学)
AI总结 提出自适应自动框架(Adaptive Auto-Harness),通过状态化多智能体进化器、带求解时路由的框架树和人工引导机制,解决开放式任务流中自动框架性能退化问题,在多个流上超越现有基线。
PhyScene3D:物理一致的交互式3D桌面场景生成
发表机构 * Sun Yat-sen University, China(中山大学) ; Peng Cheng Laboratory(鹏城实验室) ; Guangdong Key Laboratory of Big Data Analysis and Processing(广东省大数据分析与处理重点实验室) ; Huawei(华为)
AI总结 提出PhyScene3D框架,通过认知拓扑推理链和物理感知去噪对齐,解决3D桌面场景生成中的物理一致性问题,显著降低碰撞率。
Comments 23 pages, 5 figures, accepted by ICML 2026
VG²GT: 体素-高斯泼溅视觉几何基础变换器
发表机构 * East China University of Science and Technology(东华大学) ; Shanghai Open University(上海开放大学) ; Shanghai Xiaoyuan Innovation Center(上海小元创新中心)
AI总结 提出VG²GT,利用冻结的视觉基础模型、多尺度可微体素模块和体素特征直接回归高斯原语参数,通过随机实体体渲染监督深度图,实现几何精确的高斯场景重建,在多个数据集上达到最优性能。
PaCX-MAE: 生理增强的胸部X光掩码自编码器
发表机构 * University of California, Berkeley(加州大学伯克利分校) ; University of Tokyo(东京大学) ; University of Michigan(密歇根大学)
AI总结 提出PaCX-MAE跨模态蒸馏框架,通过双对比预测目标将生理先验注入胸部X光编码器,在保持单模态推理的同时提升生理相关任务性能。
Comments Accepted at the ICML 2026 3rd Workshop on Multi-modal Foundation Models and Large Language Models for Life Sciences (FM4LS)
CART: 上下文锚定循环Transformer——一种具有学习稳定性的参数高效架构
发表机构 * Independent Researcher(独立研究员)
AI总结 提出CART,一种通过共享核心块循环和冻结键值张量实现参数高效的语言模型,并引入线性时不变门控保持稳定性,实验表明在参数匹配时性能略低于密集基线。
Comments 31 pages, 4 figures. Code, training scripts, and the full experiment database (results.db) are available at https://github.com/ccapps42/CART
DiscourseFlip: 面向黑盒检索增强生成的非直述式语篇级观点操纵攻击
发表机构 * Wuhan University(武汉大学) ; East China Normal University(华东师范大学) ; Nanyang Technological University(南洋理工大学) ; Worcester Polytechnic Institute(沃思堡理工学院)
AI总结 提出一种基于图引导的代理攻击方法DiscourseFlip,通过语义查询网络中的协同影响在有限预算下最大化语篇级观点偏差,实验证明其有效性和隐蔽性,并揭示现有防御的不足。
地毯制造中用于训练质量控制AI的数据收集
发表机构 * Independent Researcher(独立研究者)
AI总结 针对地毯生产中视觉检测慢、主观且不一致的问题,提出一种在线机器视觉系统设计,通过同步线扫描相机和组合照明实时检测缺陷,并系统收集标注数据以持续训练质量控制模型,最终通过DMAIC方法量化质量改进。
Comments 10 pages, 3 figures
SkyShield:占用作为低空无人机自主飞行的安全接口
发表机构 * Xiamen University(厦门大学) ; Jiangxi Academy of Sciences(江西省科学院)
AI总结 针对低空无人机自主飞行中的三维空间理解问题,提出首个前视单目语义占用基准SkyShield、动态感知度量KAR-mIoU和几何优先基线SkyOcc,将占用作为安全接口。
SHARP: 基于睡眠的分层加速重放用于长程非平稳时间模式识别
发表机构 * Department of Computer Engineering, University of Texas at San Antonio, USA(德克萨斯大学圣安东尼奥分校计算机工程系) ; Department of Computer Science, University of Rochester, USA(罗切斯特大学计算机科学系) ; Department of Psychology, University of Texas at San Antonio, USA(德克萨斯大学圣安东尼奥分校心理学系)
AI总结 提出SHARP框架,通过将时间学习分解为记忆模块和模式识别模块,并引入离线睡眠阶段加速重放时间结构记忆,实现长程非平稳序列模式的高效学习。
自动解释标签的泛化程度:跨语言、文字和改写的受控研究
发表机构 * Columbia University(哥伦比亚大学)
AI总结 通过塞尔维亚双文字系统控制实验,研究稀疏自编码器特征的自然语言标签是否真正泛化到不同语言和文字,发现标签在语义内容匹配上存在显著偏差,且随网络深度增加而加剧。
LastAct: 轨迹引导的最新活动定位用于实时智能家居活动识别
发表机构 * School of Computing, University of Georgia(佐治亚大学计算学院)
AI总结 提出LastAct框架,通过轨迹图像序列和边界定位器解决滑动窗口中的边界污染问题,实现实时智能家居活动识别。
DraDDP:多模态多方对话话语解析数据集
发表机构 * School of Computer Science and Technology, Soochow University(苏州大学计算机科学与技术学院)
AI总结 针对现有研究局限于文本或双方对话的问题,构建了基于美剧的首个公开英文多模态多方对话话语解析数据集DraDDP,并验证了多模态信息在捕捉对话结构和关系类型中的价值。
Journal ref Findings of the Association for Computational Linguistics (ACL 2026)
BenHalluEval:孟加拉语大语言模型的多任务幻觉评估框架
发表机构 * Department of Computer Science and Engineering, Islamic University of Technology(伊斯兰科技大学计算机科学与工程系) ; Department of Computer Science and Engineering, University of California(加州大学计算机科学与工程系)
AI总结 针对孟加拉语大语言模型幻觉评估的空白,提出BenHalluEval框架,涵盖四项任务,构建12000个幻觉候选,并提出双轨校准指标BenHalluScore,揭示模型间幻觉校准的显著差异。
Comments Preprint. Under review
GGT-100K:面向泛化真实世界图像恢复的生成式真实标签
发表机构 * VISUAL COMPUTING LAB POLYU(PolyU视觉计算实验室) ; The Hong Kong Polytechnic University(香港理工大学) ; OPPO Research Institute(OPPO研究院)
AI总结 提出利用生成式多模态基础模型从真实低质量图像合成高质量目标作为真实标签,构建包含10万对数据的GGT-100K数据集,显著提升多种图像恢复模型的真实世界泛化能力。
将人工智能研究扩展到人文学科:一个用于证据基础学术的多智能体框架
发表机构 * Department of Information Management(信息管理系) ; Research Center for Digital Humanities(数字人文研究中心) ; School of Foreign Languages(外国语言学院) ; Institute for Artificial Intelligence(人工智能研究院)
AI总结 提出SPIRE多智能体框架,通过将人文学科操作建模为协作智能体角色,结合多尺度细读检索,实现基于证据的论证,在古典文献基准上优于现有方法。
Comments 28 pages, 3 figures. Code, data catalogues, and reproduction scripts: https://github.com/YatingPan/SPIRE. Lead corresponding author: Jun Wang; corresponding author: Qi Su
群对称下通过流匹配的等变潜在对齐
发表机构 * University of Illinois Urbana-Champaign, Illinois, USA(伊利诺伊大学厄巴纳-香槟分校) ; Seoul National University, Seoul, Korea(首尔国立大学)
AI总结 针对现有方法在潜在空间中存在的等变错位问题,提出基于流的残差潜在流框架,通过纠正错位潜在表示来增强旋转群SO(n)下的等变一致性,提升新视角合成质量。
AI中介的后果性决策中的选择错觉
发表机构 * GitHub
AI总结 基于Ullmann-Margalit的选择概念,揭示当前AI系统造成一种“选择错觉”,即看似有意义的后果性选择实则削弱了主体的真正选择能力,并提出通过存在诚实、生态理性和反事实修复三个规范要义来保护和发展元能力。
Comments 11 pages, 1 figure, 2 tables
图数据上具有差异化网络效应的处理效应估计
发表机构 * Kyoto University(京都大学) ; The Institute of Statistical Mathematics(统计数学研究所) ; Tohoku University(东北大学) ; RIKEN AIP(理化学研究所AIP)
AI总结 针对图数据中个体处理效应估计受邻居干扰且存在差异化网络效应的问题,提出一种结合部分注意力机制和消息放大器的干扰建模方法,以捕获邻居重要性和规模差异,提升估计精度。
Comments Accepted by the research track of the KDD 2026 conference
在不损失对齐的情况下恢复多样性:面向后训练大语言模型的DPO配方
发表机构 * University of Maryland, College Park(马里兰大学 College Park 分校)
AI总结 提出REDIPO数据构建流程,通过离线DPO从基础模型生成中恢复多样性答案,同时保持指令模型的对齐性能。
Comments Under Review. 26 pages, 3 figures, 16 tables
迈向可验证的多模态深度研究:用于交错报告生成的多智能体框架
发表机构 * Gaoling School of Artificial Intelligence, Renmin University of China(中国人民大学北京校区人工智能学院)
AI总结 提出多智能体框架Ptah,通过规划、研究和写作阶段生成交错文本与视觉证据的多模态报告,并引入验证器确保事实准确性和跨模态一致性。
Comments In progress