2606.08719
2026-06-09
cs.CV
新提交
Thinking Without Images: Internalizing Visual Manipulation with On-Policy Self-Distillation
无图像思考:通过在线自我蒸馏内化视觉操作
Yishuo Cai, Jiahui Liu, Yuanxin Liu, Haobo Deng, Linli Yao, Yuhao Zheng, Kun Ouyang, Zhimo Li, Ziyue Wang, Xu Sun, Haoli Bai, Xiaohui Li
发表机构
*
State Key Laboratory of Multimedia Information Processing, School of Computer Science, Peking University(北京大学计算机学院多媒体信息处理国家重点实验室)
;
Central South University(中南大学)
;
University of Science and Technology of China(中国科学技术大学)
;
Peking University(北京大学)
;
Huawei Technologies(华为技术有限公司)
AI总结
提出Imagine-OPD框架,通过在线自我蒸馏将“用图像思考”的视觉推理能力内化为“用想象思考”,在不调用外部工具的情况下生成内部视觉线索,在保持性能的同时显著降低推理开销。