BLIP-2视觉语言预训练模型指南:图像描述、视觉问答与多模态AI应用 | SkillsMD