volcengine-video-understanding by freestylefly/canghe-skills
npx skills add https://github.com/freestylefly/canghe-skills --skill volcengine-video-understanding使用字节跳动火山方舟视频理解 API(doubao-seed-2-0-pro-260215 等模型)对视频进行深度理解和分析。
推荐方式 :Files API 上传 + Responses API 分析
需要设置 ARK_API_KEY 环境变量。
cp .canghe-skills/.env.example .canghe-skills/.env
.canghe-skills/.env 文件,填写你的 API Key:ARK_API_KEY=your-actual-api-key-here
广告位招租
在这里展示您的产品或服务
触达数万 AI 开发者,精准高效
export ARK_API_KEY="your-api-key"
process.env).canghe-skills/.env~/.canghe-skills/.envcd ~/.openclaw/workspace/skills/volcengine-video-understanding
python3 scripts/video_understand.py /path/to/video.mp4 "描述这个视频的内容"
python3 scripts/video_understand.py /path/to/video.mp4 "视频中出现了哪些人物?"
python3 scripts/video_understand.py /path/to/video.mp4 "分析视频中人物的情感变化"
python3 scripts/video_understand.py /path/to/video.mp4 "总结视频要点" \
--model doubao-seed-2-0-pro-260215 \
--fps 2
python3 scripts/video_understand.py /path/to/video.mp4 "描述视频" --output result.json
| 参数 | 默认值 | 说明 |
|---|---|---|
video_path | 必填 | 视频文件路径 |
instruction | 必填 | 分析指令/问题 |
--model | doubao-seed-2-0-pro-260215 | 模型 ID |
--fps | 1 | 视频采样帧率(预处理) |
--output | - | 结果输出文件路径 |
doubao-seed-2-0-pro-260215 (默认)doubao-seed-2-0-lite-250728doubao-seed-1-6-251015python3 scripts/video_understand.py ~/Desktop/video.mp4 "详细描述这个视频的内容,包括场景、人物和动作"
python3 scripts/video_understand.py ~/Desktop/video.mp4 "用3句话总结这个视频的要点"
python3 scripts/video_understand.py ~/Desktop/video.mp4 "视频中的人物在做什么动作?按时间顺序描述"
python3 scripts/video_understand.py ~/Desktop/video.mp4 "分析视频中的场景变化和环境特征"
Files API 上传 :
curl https://ark.cn-beijing.volces.com/api/v3/files \
-H "Authorization: Bearer $ARK_API_KEY" \
-F 'purpose=user_data' \
-F 'file=@video.mp4' \
-F 'preprocess_configs[video][fps]=1'
Responses API 分析 :
{
"model": "doubao-seed-2-0-pro-260215",
"input": [
{
"role": "user",
"content": [
{
"type": "input_video",
"file_id": "file-xxxx"
},
{
"type": "input_text",
"text": "用户指令"
}
]
}
]
}
| FPS | 适用场景 |
|---|---|
| 0.3-0.5 | 慢节奏视频、静态场景、节省token |
| 1 | 一般视频分析(默认) |
| 2-3 | 快速动作、细节分析 |
from scripts.video_understand import analyze_video
result = analyze_video(
file_path="/path/to/video.mp4",
instruction="描述视频内容",
model="doubao-seed-2-0-pro-260215",
fps=1
)
# 提取回答
text = ""
for item in result.get("output", []):
if item.get("type") == "message":
for content in item.get("content", []):
if content.get("type") == "output_text":
text = content.get("text", "")
break
print(text)
常见错误及解决方案:
| 错误 | 原因 | 解决方案 |
|---|---|---|
| API Key 错误 | 未设置或错误 | 检查 ARK_API_KEY 环境变量 |
| 文件不存在 | 路径错误 | 检查文件路径 |
| 上传失败 | 文件过大或格式不支持 | 检查文件大小(<512MB)和格式 |
| 处理超时 | 视频过长或复杂 | 缩短视频或降低 FPS |
Weekly Installs
151
Repository
GitHub Stars
183
First Seen
Mar 2, 2026
Security Audits
Installed on
kimi-cli150
codex150
amp150
cline150
opencode150
cursor150
超能力技能使用指南:AI助手技能调用优先级与工作流程详解
52,100 周安装
Microsoft Teams自动化指南:通过Rube MCP实现频道消息、聊天与会议管理
72 周安装
Electrobun 最佳实践:TypeScript + Bun 跨平台桌面应用开发指南
72 周安装
ATXP Memory:AI代理记忆管理工具 - 云端备份与本地向量搜索
72 周安装
Brave Search Spellcheck API:智能拼写检查与查询纠正,提升搜索准确性
72 周安装
Amazon竞品分析器 - 自动化抓取ASIN数据,深度分析竞争对手定价、规格与评论
72 周安装
qa-use:AI驱动开发工作流的端到端测试与浏览器自动化工具
72 周安装