CompactQE: Interpretable Translation Quality Estimation via Small Open-Weight LLMs
CompactQE: 通过小规模开源大语言模型实现可解释的翻译质量估计
AI总结 本文提出CompactQE,利用小规模开源大语言模型实现翻译质量估计,生成质量评分、错误标注、修正建议和完整润色,其性能优于传统指标和人类标注。
CompactQE: 通过小规模开源大语言模型实现可解释的翻译质量估计
AI总结 本文提出CompactQE,利用小规模开源大语言模型实现翻译质量估计,生成质量评分、错误标注、修正建议和完整润色,其性能优于传统指标和人类标注。
用于分析排行榜稳定性和操纵的统一扰动框架
AI总结 本文提出统一扰动框架分析Bradley-Terry排行榜在结构数据修改下的鲁棒性,研究Drop、Add、Flip等扰动对排行榜稳定性的影响,揭示现代排行榜在三个目标上的非鲁棒性,并提供评估工具。
Learn2Splat: 扩展学得3DGS优化的视野
AI总结 本文提出了一种学得优化器,通过元学习方案扩展优化视野,提升稀疏和密集视角下的重建质量与稳定性,实现零样本泛化。
基于属性的选型推理用于艺术品情感理解的多模态大语言模型
AI总结 本文提出基于属性的选型推理方法,通过多模态大语言模型实现艺术品情感理解,通过引入属性瓶颈引导框架提升情感预测精度和解释简洁性。
层次化和整体化的开放词汇功能3D场景图用于室内空间
AI总结 本文提出一种开放词汇管道,结合2D视觉定位和3D图优化,解决小规模密集相似实例的场景图推理问题,通过时间图优化和全局层次塑造提升室内空间的功能3D场景图生成能力。
BARRIER:基于鲁棒信息擦除的有界激活区域
AI总结 BARRIER通过动态隐藏层激活几何结构,利用区间算术保护中性概念,实现稳定的信息擦除,同时保持其他表示的完整性。
BiomedAP: 一种基于视觉的双锚框架与门控跨模态融合用于鲁棒的医学视觉-语言适应
AI总结 BiomedAP通过门控跨模态融合和双锚约束机制,提升医学视觉-语言模型在提示变化下的鲁棒性,实验显示其在多个基准上均优于基线方法。
Comments CVPR2026 Workshop
我们能否信任AI推断的用户状态。一种用于验证由LLMs在操作环境中对用户状态分类的可靠性的人格测量框架
AI总结 本文通过实证测试检验了使用大语言模型评估用户状态的假设,探讨了AI测量在人格测量中的可靠性问题,并提出可复制的评估框架以提高适应性系统的AI设计可靠性。
Comments Full survey article with data tables for futher possible replicabilty and comparison
DecomPose:解耦跨类优化冲突以实现类别级6D物体姿态估计
AI总结 本文提出DecomPose框架,通过数据驱动的难度代理和不对称分支策略,解耦跨类优化冲突,提升类别级6D姿态估计性能。
走出舒适区:为RLVR的高效策略引导探索
AI总结 本文提出NudgeRL框架,通过策略引导实现结构化和多样性探索,提升RLVR在数学基准上的表现,相比标准GRPO和oracle引导方法更高效。
Comments 28 pages, 7 figures
DiLA:解耦的潜在动作世界模型
AI总结 DiLA通过内容-结构解耦解决动作抽象与生成保真度的平衡问题,实现高质量视频生成和动作迁移。
Comments Project Page: http://disentangled-latent-action-world-models.github.io
GOMA:从图信号平滑视角迈向结构驱动的多模态对齐
AI总结 GOMA通过统一设计解决多模态对齐中的拓扑障碍、平滑控制与信息保留问题,在七个多模态图基准上取得最佳检索性能并保持稳定性。
双向融合引导心脏模式用于半监督ECG分割
AI总结 本文提出CardioMix框架,通过心脏模式引导的双向CutMix策略提升ECG分割性能,实验表明其在多种数据集和标注比例下均优于现有方法。
Comments 11 pages, 6 figures, 6 tables
上下文作为推荐:面向上下文工程的进化式协同过滤
AI总结 本文提出将上下文工程视为推荐问题,通过Neural Collaborative Context Engineering框架,实现动态实例级路由,提升LLM上下文工程的个性化性能。
Semi-MedRef:基于跨模态对齐的半监督医学指引用图像分割
AI总结 本文提出Semi-MedRef框架,通过三个组件维持医学图像与位置语言的一致性,实验显示其在低标签条件下优于其他方法。
学习动态抓取与放置用于四足机械臂
AI总结 本文提出一种分层强化学习框架,用于四足机械臂的动态抓取与放置任务,通过模拟和现实实验验证了其在不同负载和工作空间下的高成功率。
Comments Accepted to IEEE Robotics and Automation Letters 2026
EntropyScan: 向通过视觉注意力熵实现LVLMs的模型级后门检测
AI总结 本文提出EntropyScan,一种轻量且不依赖触发器的模型级后门检测方法,通过量化视觉注意力分布的结构扭曲来检测后门模型,实验显示其在两个LVLM架构和三种高级攻击场景中达到98.5%的F1分数和96.6%的AUC。
Comments 20 pages, 6 figures, 8tables
SMMBench:一种用于源分布多模态智能体记忆的基准测试
AI总结 SMMBench旨在评估智能体在多源分布证据下进行多模态推理、冲突解决和行动预测的能力,揭示当前系统在处理碎片化异构数据时的不足。
基于视角依赖空间关系的3D分割
AI总结 本文提出一个包含22万样本的3D参照分割数据集,通过密集视角采样扩展至数千万样本,研究视角依赖空间关系对3D大模型的影响,提升分割精度并提高mIoU至0.47。
反馈世界模型使扩散策略获得精准指导
AI总结 本文提出反馈世界模型,通过实时反馈修正预测误差,提升机器人决策性能,实验显示在分布偏移下预测准确率和策略表现显著提升。
Comments 21 pages, 9 figures
H-Mem: 一种通过混合结构进化和检索智能体记忆的新型记忆机制
AI总结 H-Mem通过混合结构有效建模智能体记忆的长期演化并高效检索记忆数据,提升问答任务性能。
AGOP-IxG:一种用于表格数据局部特征归因的梯度协方差滤波器,配有受控基准
AI总结 本文提出AGOP-IxG,一种用于表格分类器的快速样本归因方法,通过预乘样本梯度与Top-K秩截断的平均梯度外积矩阵,对比四个常用基线方法,在为AutoML从业者设计的受控表格基准上进行评估。
Comments 12 pages, 2 figures, 3 tables. Submitted to AutoML Conference 2026 (ABCD Track)
更紧的基于上下文动作集强化学习的遗憾界
AI总结 本文研究了具有固定奖励和转移函数的回合制强化学习,但每个回合的动作集依赖于回合。通过MVP算法,建立了对抗性和随机性情境下的更紧遗憾界,并推导了样本复杂度和间隙依赖的遗憾界。
如何为细粒度图像识别选择教师
AI总结 本文提出Ratio 1-2指标,通过分析实验数据提升教师选择效果,使小模型在细粒度图像识别中获得17%的准确率提升。
Comments Accepted to The 13th Workshop on Fine-Grained Visual Categorization (FGVC13) @ CVPR 2026. Main: 6 pages, 3 figures, 4 tables
ElasticDiT:通过弹性架构和稀疏注意力实现高效扩散变换器,用于移动设备上的高分辨率图像生成
AI总结 本文提出ElasticDiT,通过弹性架构和稀疏注意力机制,在移动设备上实现高效扩散变换器,平衡图像质量和计算效率,同时减少内存占用。
DreamSR:通过增强感受野的扩散变换器实现超高清图像超分辨率
AI总结 DreamSR通过双分支MM-ControlNet和增强感受野策略,解决超分辨率中局部过生成和细节合成问题,实现高质量细节恢复。
少样本大语言模型在在线患者咨询可操作分诊中的应用
AI总结 本文研究少样本条件下大语言模型在在线患者咨询分诊中的应用,通过构建不同数据集比较TF-IDF和BioBERT与六个LLM在0-shot、4-shot和12-shot条件下的表现,发现Claude Haiku 4.5在12-shot条件下达到0.475的宏F1值,优于监督基线模型。
Comments 4 figures, 19 tables, 23 pages (including appendix and reference)
VCG-Bench:迈向统一的视觉导向基准,用于结构化生成与编辑
AI总结 本文提出VCG-Bench,一个统一的视觉导向mxGraph任务基准,通过符号逻辑和XML实现精确的图表生成与编辑,解决现有方法在结构化任务中的局限性。
Comments Accepted by ICML2026, 37 pages, 10 figures
扩散语言模型的动态分块
AI总结 本文提出动态分块扩散模型,通过内容定义语义分块替代固定位置分块,提升序列结构利用效率,在参数规模达1.5B的下游任务中表现更优。
群体属性中的交互感知影响函数
AI总结 本文提出交互感知影响函数,通过考虑样本间相互作用来改进群体属性评估,实验显示其在多个任务中优于传统方法。