TerraMind: Large-Scale Generative Multimodality for Earth Observation
TerraMind:面向地球观测的大规模生成式多模态模型
发表机构 * IBM Research – Europe(IBM欧洲研究院) ; ETH Zurich(苏黎世联邦理工学院) ; Forschungszentrum Jülich(尤利希研究中心) ; European Space Agency(欧洲航天局) ; Φ \Phi -Lab(Φ实验室) ; NASA IMPACT ; University of Iceland(爱沙尼亚大学)
专题命中 图文多模态 :提出任意到任意多模态基础模型,覆盖九种地理空间模态。
AI总结 提出首个任意到任意生成式多模态基础模型TerraMind,通过双尺度表示(token级和像素级)预训练,实现零样本/少样本应用,并引入“模态思考”能力,在PANGAEA等基准上达到领先性能。
Comments Accepted at ICCV'25