LLaVA 开源视觉语言模型:图像理解与多模态对话助手,支持视觉问答和图像描述 | SkillsMD