多模态大语言模型集成指南:图像分析、语音处理与AI视频生成(Kling/Sora/Veo/Runway) | SkillsMD