EpiBench: Verifiable Evaluation of AI Agents on Epigenomics Analysis
EpiBench:人工智能代理在表观基因组学分析中的可验证评估
发表机构 * LatchBio
AI总结 提出EpiBench基准,通过106个评估任务测试AI代理在表观基因组学工作流中的决策能力,发现最佳系统GPT-5.5/Pi通过率仅45%,失败多因缺乏深度科学判断。
EpiBench:人工智能代理在表观基因组学分析中的可验证评估
发表机构 * LatchBio
AI总结 提出EpiBench基准,通过106个评估任务测试AI代理在表观基因组学工作流中的决策能力,发现最佳系统GPT-5.5/Pi通过率仅45%,失败多因缺乏深度科学判断。
MCR-Bionic Hand: 用于灵巧操作的解剖结构先验
发表机构 * University of Salford(索尔福德大学)
AI总结 本文提出MCR-Bionic Hand,一种基于人体手部解剖结构先验的仿生机械手,通过结构智能实现低维控制到灵巧操作的映射,在接触密集型任务中验证了其有效性。
带有聚合置信信号的多智能体协议
发表机构 * University of Illinois Chicago(伊利诺伊大学芝加哥分校)
AI总结 提出三种协议,通过转换原始置信信号并采用软投票或贝叶斯融合,为多智能体系统输出聚合置信度,在保持正确性的同时显著提升判别能力。
单纯形约束的稀疏装袋:集成学习中从均匀先验到稀疏后验的转变
发表机构 * Georgia Institute of Technology(佐治亚理工学院)
AI总结 提出SCSB框架,通过最小化袋外损失在概率单纯形上联合优化集成剪枝与校准,引入凹二次惩罚解决L1单纯形悖论,实现高达96%的压缩并提升校准性能。
EvTexture++: 事件驱动的视频超分辨率纹理增强
发表机构 * MOE Key Laboratory of Brain-Inspired Intelligent Perception and Cognition, University of Science and Technology of China(中国科学技术大学,脑启发智能感知与认知教育部重点实验室) ; Midea Group(美的集团)
AI总结 提出首个事件驱动的视频超分辨率纹理增强框架EvTexture++,利用事件的高频时空细节逐步恢复纹理,并通过时间纹理对齐模块增强帧间一致性,在多个数据集上达到最优性能。
LabVLA:在科学实验室中落地视觉-语言-动作模型
发表机构 * Zhejiang University(浙江大学) ; Shanghai AI Laboratory(上海人工智能实验室) ; Harbin Institute of Technology(哈尔滨工业大学)
AI总结 针对科学实验室中机器人执行协议面临的数据和实体瓶颈,提出模拟数据引擎RoboGenesis和两阶段训练策略LabVLA,在LabUtopia基准上取得最高平均成功率。
与模拟器学习:计算受限世界中的无悔学习
发表机构 * MIT(麻省理工学院) ; Microsoft Research(微软研究院)
AI总结 提出可模拟过程框架,利用模拟器近似任意复杂依赖的数据分布,恢复VC维误差界,并展示条件采样的统计与计算优势。
ArogyaSutra:面向印度语言的多模态医学推理的多智能体框架
发表机构 * Indian Institute of Technology Patna(印度理工学院巴特那分校) ; Indian Institute of Technology Kanpur(印度理工学院坎普尔分校) ; Prasannadeb Women’s College(普拉萨纳德布女子学院)
AI总结 针对印度语言医疗场景中多模态大语言模型性能不足的问题,提出多模态医学问答数据集ArogyaBodha和基于演员-评论家的多智能体框架ArogyaSutra,通过工具接地与双记忆机制提升多语言医学推理准确性。
存在先于价值:时间序列预测中观测存在性与状态演变的联合建模
发表机构 * Ant International(蚂蚁国际)
AI总结 提出Timeflies框架,联合建模未来观测是否发生(存在性)与数值估计,通过观测流和数值流耦合模块提升缺失值时间序列预测性能。
对比信息增强和域对抗训练用于成人到新生儿MR重建泛化
发表机构 * University of Calgary(卡尔加里大学) ; Seaman Family MR Research Centre, Foothills Medical Centre(Seaman家族磁共振研究中心,山麓医疗中心) ; Hotchkiss Brain Institute, University of Calgary(Hotchkiss脑研究所,卡尔加里大学) ; Pediatrics, Division of Neonatology, University of Calgary(卡尔加里大学儿科学系新生儿科) ; Alberta Children’s Hospital Research Institute, University of Calgary(阿尔伯塔儿童医院研究所,卡尔加里大学) ; Radiology and Clinical Neuroscience, University of Calgary(卡尔加里大学放射学与临床神经科学系) ; Electrical and Software Engineering, University of Calgary(卡尔加里大学电气与软件工程系)
AI总结 研究对比信息增强和域对抗训练提升E2E-VarNet从成人到新生儿MR重建的泛化能力,在加速因子R=4和R=8下,混合域对抗训练在SSIM和PSNR指标上表现最优。
编辑比特,差异编码:面向视觉自回归模型的逐比特残差编辑
发表机构 * LMU Munich & Munich Center for Machine Learning (MCML)(慕尼黑大学 & 慕尼黑机器学习中心 (MCML))
AI总结 提出BitResEdit,一种无需训练的视觉自回归图像编辑方法,通过比特级源负引导和残差编码注入,在保持背景的同时实现强文本对齐。
是你还是你的环境?一种用于基因组锚定的个性化生理解释的贝叶斯推理框架
发表机构 * Dots-In
AI总结 提出一种贝叶斯推理框架,利用基因组先验解决个性化健康AI的冷启动问题,通过基因组锚定分离生理信号的体质与环境成分,并随数据积累动态更新。
不确定性感知的混合检索用于长文档RAG
发表机构 * Elmore Family School of Electrical and Computer Engineering, Purdue University(普渡大学埃尔莫尔家族电气与计算机工程学院)
AI总结 提出UMG-RAG,一种无需训练的混合检索框架,通过多粒度分块和不确定性估计融合密集与稀疏检索结果,提升长文档问答质量。
何时混合有帮助?分析多语言稠密检索中的查询嵌入插值
发表机构 * National University of Singapore(新加坡国立大学)
AI总结 通过嵌入级插值构造混合查询,系统研究多语言稠密检索对混合语言查询的敏感性,发现最优混合比在多数情况下优于单语言查询,且英语主导性导致不对称性。
旧法新用:经典降维方法用于高效显著性引导的生物特征攻击检测
发表机构 * University of Notre Dame(圣母大学)
AI总结 提出使用PCA和LDA等经典降维方法直接从训练数据生成显著性图,无需人工标注,在五个生物特征攻击检测领域超越基线甚至达到最优性能。
MaskWAM:统一掩码提示与预测的世界-动作模型
发表机构 * The Hong Kong University of Science and Technology(香港科技大学) ; Tencent Robotics X(腾讯机器人X实验室) ; Tsinghua University(清华大学)
AI总结 提出MaskWAM,通过统一掩码输入与预测的混合Transformer架构,解决世界-动作模型的空间瓶颈,提升策略泛化能力,在LIBERO等任务上显著优于基线。
CloudCons:云资源整合的全面端到端基准测试
发表机构 * Zhejiang University(浙江大学) ; State Street Technology (Zhejiang) Ltd.(道富科技(浙江)有限公司) ; Richoo AI ; Hangzhou High-Tech Zone (Binjiang) Institute of Blockchain and Data Security(杭州高新区(滨江)区块链与数据安全研究院) ; Datadog AI Research
AI总结 提出CloudCons基准,评估云资源整合中预测模型的决策效用,发现基础模型零样本预测准确但决策效用未必更优,并分析预测分位数选择对资源效率与可靠性的权衡。
基于测量校准的多相机融合用于视觉室内定位
发表机构 * Rosenheim Technical University of Applied Sciences(罗森海姆应用技术大学)
AI总结 提出测量校准融合方法,通过显式量化单相机定位误差(单应校准、人体检测、运动跟踪)来优化多相机数据融合,实验表明该方法虽未显著提升绝对精度,但有效降低了轨迹方差并提高了运动平滑性。
利用音频大语言模型过滤语音到语音训练数据
发表机构 * School of Data Science, The Chinese University of Hong Kong, Shenzhen(香港中文大学(深圳)数据科学学院) ; School of Artificial Intelligence, The Chinese University of Hong Kong, Shenzhen(香港中文大学(深圳)人工智能学院)
AI总结 提出Rank-to-Distill策略,训练音频大语言模型直接从语音对判断保留/丢弃,过滤噪声数据,提升端到端语音翻译性能。
异构激光雷达早期融合与学习重排序策略用于非结构化环境中的鲁棒长期地点识别
发表机构 * Miguel Hernández University of Elche(米格尔·埃尔南德斯·德埃尔切大学)
AI总结 提出MinkUNeXt-VINE++方法,通过异构LiDAR数据早期融合和学习重排序策略,在非结构化环境(如葡萄园)中显著提升长期地点识别性能,Recall@1指标提升20%-30%。
SPARC:来自机器人演示的可靠空间标注
发表机构 * Karlsruhe Institute of Technology(卡尔斯鲁厄理工学院) ; NVIDIA(英伟达) ; Robotics Institute Germany(德国机器人研究所)
AI总结 提出SPARC框架,利用机器人任务的时空结构生成可靠性评分,自动标注演示中的空间信息,减少噪声标签并保留更多有用样本,在物体定位基准上优于纯检测基线。
预算约束的步骤级扩散缓存
发表机构 * Westlake-AGI-Lab(西湖大学AGI实验室)
AI总结 提出BudCache方法,通过离线搜索(模拟退火+爬山)在固定计算预算下优化缓存策略,并引入缓存感知调度对齐,以提升扩散模型生成质量。
NavWAM:用于目标条件视觉导航的导航世界动作模型
发表机构 * The University of Tokyo(东京大学) ; National Institute of Informatics(国立信息学研究所) ; AIRoA ; ATR
AI总结 提出NavWAM,一种扩散变换器策略,通过联合学习未来观测、目标进度值和动作块,将导航世界模型预测直接转化为可执行动作,在离线基准和真实机器人部署中优于基于规划的世界模型基线。
面向计算机辅助手术中部分到完整点云配准的点级几何感知Transformer
发表机构 * The Chair for Computer Aided Medical Procedures, Technical University of Munich(慕尼黑工业大学计算机辅助医疗程序教席) ; The University of Hong Kong(香港大学)
AI总结 提出GAPR-Net,一种结合卷积与Transformer的粗到细框架,通过交叉注意力融合局部与全局信息,并设计变换不变的点级几何特征,在四个骨骼数据集上实现94.2%配准召回率、1.992mm RMSE。
CRAFTIIF:用于多元时间序列异常检测的跨分辨率分析四类型可解释孤立森林
发表机构 * Avathon
AI总结 提出CRAFTIIF无监督框架,通过四种小波特征和五个孤立森林同时检测点、分布、时间和集体四类异常,在mTSBench基准上达到平均F1=0.228,VUS-PR比先前最佳提升40.7%。
SupraBench: 超分子化学基准
发表机构 * University of Notre Dame(圣母大学) ; University of Connecticut(康涅狄格大学)
AI总结 为评估大语言模型在超分子化学推理中的能力,与领域专家合作发布了首个超分子基准SupraBench,包含四个基本任务和一个辅助视觉任务,并提供了16M令牌的语料库SupraPMC。
MaxProof: 通过生成-验证器强化学习与群体级测试时扩展实现数学证明规模化
发表机构 * MiniMax ; The Chinese University of Hong Kong(香港中文大学) ; Fudan University(复旦大学) ; Peking University(北京大学) ; Tsinghua University(清华大学)
AI总结 提出MaxProof框架,结合生成-验证器强化学习与群体级测试时扩展,在MiniMax-M3系列上实现竞赛级数学证明,在IMO 2025和USAMO 2026上超越人类金牌阈值。
本体记忆增强的ASR校正用于长文本-语音交错对话
发表机构 * Institute of Computing and Intelligence, Harbin Institute of Technology (Shenzhen), China(哈尔滨工业大学(深圳)计算与智能研究所) ; Shenzhen Loop Area Institute (SLAI), China(深圳环域研究所)
AI总结 提出本体记忆增强的ASR校正框架,通过动态更新本体记忆存储实体、术语、变体、混淆和语义关系,解决长文本-语音交错对话中的上下文校正问题,在RAMC-Corr数据集上优于直接校正。
VISA: VLM引导的实例语义审计用于3D占据世界模型
发表机构 * University of Maryland College Park(马里兰大学帕克分校) ; Nanjing University of Posts and Telecommunications(南京邮电大学) ; Stanford University(斯坦福大学) ; Motional AD Inc.(Motional AD公司)
AI总结 提出VISA方法,利用离线VLM对每个物理对象实例进行结构化语义审计,并通过可靠性加权损失蒸馏到3D占据模型中,无需VLM推理即可提升封闭集占据mIoU。
使用图神经网络和自学习的节点属性网络聚类
发表机构 * Systems Engineering and Computer Science (PESC), Federal University of Rio de Janeiro (UFRJ)(里约热内卢联邦大学系统工程与计算机科学系)
AI总结 提出一种基于图神经网络和自学习的无监督图聚类框架,通过多轮自学习交替优化节点表示和聚类,利用上下文图提升性能,在合成和真实数据上表现优异。