Post

SkySense A Multi-Modal Remote Sensing Foundation Model Towards Universal Interpretation for Earth Observation Imagery

  • 论文名称: SkySense: A Multi-Modal Remote Sensing Foundation Model Towards Universal Interpretation for Earth Observation Imagery
  • Link: https://arxiv.org/pdf/2312.10115
  • Published in: CVPR 2024
  • Type: Pretrain
  • Code/Project: —
  • 备注: 自监督多粒度对比学习,关注多模态和区域上下文
  • Short Summary: 通用的十亿级模型,在包含 2150 万个时间序列的多模态遥感图像 (RSI) 数据集上进行了预训练。通过多粒度对比学习对分解后的编码器进行预训练,从不同的模态和空间粒度构造特征。此外,我们提出了地理环境原型学习,从给定地理位置的RSI特征生成区域原型。该方法通过利用隐藏在大量未标记RSI中的区域上下文线索来增强多模态时空表征学习。
This post is licensed under CC BY 4.0 by the author.