基于预训练方法的视觉-语言模型(VLMs)

本文从视觉-语言模型(Vision-Language Models, VLMs)的发展背景、基本原理与训练方法、训练/评估数据集、模型性能以及未来发展路径几个方面叙述探讨基于预训练的VLMs技术。