videoagent-video-studio by pexoai/pexo-skills
npx skills add https://github.com/pexoai/pexo-skills --skill videoagent-video-studio使用场景: 当用户要求生成视频、从文本创建视频、让图片动起来、制作短视频或生成 AI 视频时。
使用 7 种后端生成简短的 AI 视频。此技能会选择合适的模式(文生视频或图生视频),优化提示词以获得最佳效果,并返回视频 URL。
| 用户意图 | 模式 | 典型时长 |
|---|---|---|
| "制作一个...的视频"(无图片) | text-to-video | 4–10 秒 |
| "让这张图片动起来" / "让它动起来" | image-to-video | 4–6 秒 |
| "把这个变成视频,并加上..." | image-to-video | 4–6 秒 |
| 电影感、故事、广告 | 推荐使用 text-to-video 并配合详细提示词 | 5–10 秒 |
Use when: User asks to generate a video, create a video from text, animate an image, make a short clip, or produce AI video.
Generate short AI videos with 7 backends. This skill picks the right mode (text-to-video or image-to-video), enhances the prompt for best results, and returns the video URL.
| User Intent | Mode | Typical Duration |
|---|---|---|
| "Make a video of..." (no image) | text-to-video | 4–10 s |
| "Animate this image" / "Make this move" | image-to-video | 4–6 s |
| "Turn this into a video with..." | image-to-video | 4–6 s |
| Cinematic, story, ad |
广告位招租
在这里展示您的产品或服务
触达数万 AI 开发者,精准高效
暂无相关 Skills
| 模式 | 描述 | 模型 |
|---|---|---|
| text-to-video | 仅文本提示词 → 视频 | minimax, kling, veo, hunyuan, grok, seedance |
| image-to-video | 单张图片 + 提示词 → 动态片段 | minimax, kling, veo, pixverse, grok, seedance |
| reference-based | 参考图片/视频 → 风格一致的输出 | minimax, kling, veo, hunyuan, grok, seedance |
--model <id>)| 模型 ID | T2V | I2V | 参考 | 备注 |
|---|---|---|---|---|
minimax | ✅ | ✅ | ✅ | 主体参考图片,角色一致性 |
kling | ✅ | ✅ | ✅ | 多元素 / 角色 / 关键帧 (O3) |
veo | ✅ | ✅ | ✅ | Google Veo 3.1,多张参考图片 |
hunyuan | ✅ | — | ✅ | 视频到视频风格迁移 |
pixverse | — | ✅ | — | 风格化图生视频 |
grok | ✅ | ✅ | ✅ | 通过参考视频进行视频编辑 |
seedance | ✅ | ✅ | ✅ | Seedance 1.5 Pro,同步音频,4–12 秒 |
完整的模型详情和端点参考:references/models.md。
文生视频:
node {baseDir}/tools/generate.js \
--mode text-to-video \
--prompt "<优化后的提示词>" \
--duration <秒数> \
--aspect-ratio <比例>
图生视频:
node {baseDir}/tools/generate.js \
--mode image-to-video \
--prompt "<运动描述>" \
--image-url "<公开图片 URL>" \
--duration <秒数> \
--aspect-ratio <比例>
参数:
| 参数 | 默认值 | 描述 |
|---|---|---|
--mode | text-to-video | text-to-video 或 image-to-video |
--prompt | (必填) | 场景或运动描述 |
--image-url | — | image-to-video 模式必填;公开图片 URL |
--duration | 5 | 时长(秒),通常为 4–10 |
--aspect-ratio | 16:9 | 16:9, 9:16, 1:1, 4:3, 3:4 |
--model | auto | 模型 ID(例如 kling, veo, grok, seedance);auto = 由代理选择 |
其他命令:
| 命令 | 描述 |
|---|---|
node tools/generate.js --list-models | 列出代理中可用的模型 |
node tools/generate.js --status --job-id <id> | 检查异步任务状态 |
脚本返回 JSON:
{
"success": true,
"mode": "text-to-video",
"videoUrl": "https://...",
"duration": 5,
"aspectRatio": "16:9"
}
将 videoUrl 发送给用户。
用户: "生成一个猫在雨中行走的短视频,要有电影感。"
node {baseDir}/tools/generate.js \
--mode text-to-video \
--prompt "一只猫在雨中行走,湿漉漉的街道,霓虹灯倒影,电影感灯光,慢动作,4K" \
--duration 5 \
--aspect-ratio 16:9
用户: "让这张照片动起来" (用户上传了一张风景照)
node {baseDir}/tools/generate.js \
--mode image-to-video \
--prompt "云朵在天空中缓缓飘动,草叶轻微摇曳,电影感氛围" \
--image-url "https://..." \
--duration 5 \
--aspect-ratio 16:9
用户: "制作一个 10 秒的竖屏视频,内容是倒咖啡,慢动作。"
node {baseDir}/tools/generate.js \
--mode text-to-video \
--prompt "咖啡倒入白色杯子的特写,慢动作,蒸汽升起,柔和光线,产品展示" \
--duration 10 \
--aspect-ratio 9:16
用户: "使用 Google Veo 制作一个电影感镜头。"
node {baseDir}/tools/generate.js \
--mode text-to-video \
--model veo \
--prompt "一条龙在云层中飞翔,电影感灯光,8秒" \
--duration 8 \
--aspect-ratio 16:9
用户: "让这张人像动起来。"
node {baseDir}/tools/generate.js \
--mode image-to-video \
--model grok \
--prompt "温和的微笑,轻微的转头" \
--image-url "https://..." \
--duration 5
默认无需 API 密钥。 请求通过托管的代理发送。如需使用自定义代理或令牌,请设置以下变量:
| 变量 | 是否必需 | 描述 |
|---|---|---|
VIDEO_STUDIO_PROXY_URL | 否 | 代理基础 URL |
VIDEO_STUDIO_TOKEN | 否 | 如果代理需要,则提供认证令牌 |
每周安装量
6.9K
仓库
GitHub 星标数
89
首次出现
2 天前
安全审计
安装于
openclaw5.0K
claude-code5.0K
cline2.4K
codex2.4K
kimi-cli2.3K
cursor2.3K
Prefer text-to-video with detailed prompt |
| 5–10 s |
| Mode | Description | Models |
|---|---|---|
| text-to-video | Text prompt only → video | minimax, kling, veo, hunyuan, grok, seedance |
| image-to-video | Single image + prompt → animated clip | minimax, kling, veo, pixverse, grok, seedance |
| reference-based | Reference images/video → consistent output | minimax, kling, veo, hunyuan, grok, seedance |
--model <id>)| Model ID | T2V | I2V | Reference | Notes |
|---|---|---|---|---|
minimax | ✅ | ✅ | ✅ | Subject reference image, character consistency |
kling | ✅ | ✅ | ✅ | Multi-element / character / keyframe (O3) |
veo | ✅ | ✅ | ✅ | Google Veo 3.1, multiple reference images |
hunyuan | ✅ | — | ✅ | Video-to-video style transfer |
pixverse | — | ✅ | — | Stylized image-to-video |
grok | ✅ | ✅ | ✅ | Video editing via reference video |
seedance | ✅ | ✅ | ✅ | Seedance 1.5 Pro, synchronized audio, 4–12 s |
Full model details and endpoint reference: references/models.md.
Text-to-video:
node {baseDir}/tools/generate.js \
--mode text-to-video \
--prompt "<enhanced prompt>" \
--duration <seconds> \
--aspect-ratio <ratio>
Image-to-video:
node {baseDir}/tools/generate.js \
--mode image-to-video \
--prompt "<motion description>" \
--image-url "<public image URL>" \
--duration <seconds> \
--aspect-ratio <ratio>
Parameters:
| Parameter | Default | Description |
|---|---|---|
--mode | text-to-video | text-to-video or image-to-video |
--prompt | (required) | Scene or motion description |
--image-url | — | Required for image-to-video; public image URL |
--duration | 5 | Length in seconds (typically 4–10) |
--aspect-ratio | 16:9 | 16:9, 9:16, 1:1, 4:3, 3:4 |
--model | auto | Model ID (e.g. kling, veo, grok, seedance); auto = proxy picks |
Other commands:
| Command | Description |
|---|---|
node tools/generate.js --list-models | List available models from the proxy |
node tools/generate.js --status --job-id <id> | Check async job status |
The script returns JSON:
{
"success": true,
"mode": "text-to-video",
"videoUrl": "https://...",
"duration": 5,
"aspectRatio": "16:9"
}
Send videoUrl to the user.
User: "Generate a short video of a cat walking in the rain, cinematic."
node {baseDir}/tools/generate.js \
--mode text-to-video \
--prompt "A cat walking through rain, wet streets, neon reflections, cinematic lighting, slow motion, 4K" \
--duration 5 \
--aspect-ratio 16:9
User: "Animate this photo" (user uploads a landscape)
node {baseDir}/tools/generate.js \
--mode image-to-video \
--prompt "Gentle clouds moving across the sky, subtle grass movement, cinematic atmosphere" \
--image-url "https://..." \
--duration 5 \
--aspect-ratio 16:9
User: "Make a 10-second vertical video of a coffee pour, slow motion."
node {baseDir}/tools/generate.js \
--mode text-to-video \
--prompt "Close-up of coffee pouring into a white cup, slow motion, steam rising, soft lighting, product shot" \
--duration 10 \
--aspect-ratio 9:16
User: "Use Google Veo for a cinematic shot."
node {baseDir}/tools/generate.js \
--mode text-to-video \
--model veo \
--prompt "A dragon flying through cloudy skies, cinematic lighting, 8s" \
--duration 8 \
--aspect-ratio 16:9
User: "Animate this portrait."
node {baseDir}/tools/generate.js \
--mode image-to-video \
--model grok \
--prompt "Gentle smile, subtle head turn" \
--image-url "https://..." \
--duration 5
Zero API keys by default. Requests go through a hosted proxy. Set these for a custom proxy or token:
| Variable | Required | Description |
|---|---|---|
VIDEO_STUDIO_PROXY_URL | No | Proxy base URL |
VIDEO_STUDIO_TOKEN | No | Auth token if the proxy requires it |
Weekly Installs
6.9K
Repository
GitHub Stars
89
First Seen
2 days ago
Security Audits
Installed on
openclaw5.0K
claude-code5.0K
cline2.4K
codex2.4K
kimi-cli2.3K
cursor2.3K