funasr-transcribe by cat-xierluo/legal-skills
npx skills add https://github.com/cat-xierluo/legal-skills --skill funasr-transcribe本 skill 提供本地语音识别服务,将音频或视频文件转换为结构化的 Markdown 文档。
运行安装脚本完成环境配置:
python scripts/setup.py
安装脚本会自动:
~/.cache/modelscope/hub/models/验证安装状态:
python scripts/setup.py --verify
python scripts/server.py
服务默认运行在 http://127.0.0.1:8765
广告位招租
在这里展示您的产品或服务
触达数万 AI 开发者,精准高效
--idle-timeout 参数自定义空闲超时时间(秒)服务生命周期:
重要提示:
Ctrl+C 或等待 10 分钟空闲超时示例 :自定义 30 分钟空闲超时
python scripts/server.py --idle-timeout 1800
使用客户端脚本转录文件:
# 转录单个文件
python scripts/transcribe.py /path/to/audio.mp3
# 指定输出路径
python scripts/transcribe.py /path/to/video.mp4 -o transcript.md
# 启用说话人分离
python scripts/transcribe.py /path/to/meeting.m4a --diarize
# 批量转录目录
python scripts/transcribe.py /path/to/media_folder/
转录完成后,可以生成 AI 智能总结,充分利用 Claude Code 的原生 AI 能力。
工作流程:
使用方法:
# 转录单个文件(会自动提示是否生成总结)
python scripts/transcribe.py /path/to/audio.mp3
# 启用说话人分离并生成总结
python scripts/transcribe.py /path/to/meeting.m4a --diarize --summary
总结内容结构:
提示词特点:
详细文档请查看:<references/api-reference.md>
检查服务状态 :
curl http://127.0.0.1:8765/health
使用 curl 直接调用 API:
curl -X POST http://127.0.0.1:8765/transcribe \
-H "Content-Type: application/json" \
-d '{"file_path": "/path/to/audio.mp3"}'
API 文档(Swagger UI) :
FastAPI 自动生成交互式 API 文档,访问:http://127.0.0.1:8765/docs
可在此页面中:
响应示例 (健康检查):
{
"status": "ok",
"service": "FunASR Transcribe",
"uptime": 300,
"idle_time": 120
}
返回字段说明:
uptime:服务运行时间(秒)idle_time:当前空闲时间(秒)详细的 API 参考文档请查看:<references/api-reference.md>
包含:
| 脚本 | 用途 |
|---|---|
scripts/setup.py | 一键安装依赖和下载模型 |
scripts/server.py | 启动 HTTP API 服务 |
scripts/transcribe.py | 命令行客户端(Claude Code 用) |
scripts/auto_transcribe.py | 自动化转录脚本(推荐) |
本 skill 支持在 OpenClaw 中自动完成转录 + 总结 全流程。
# 自动转录 + 获取总结提示词
python scripts/auto_transcribe.py /path/to/audio.aac
# 自动转录 + 说话人分离
python scripts/auto_transcribe.py /path/to/audio.aac --diarize
# 只获取总结提示词,不生成总结
python scripts/auto_transcribe.py /path/to/audio.aac --prompt-only
curl -X POST http://127.0.0.1:8765/transcribe \
-H "Content-Type: application/json" \
-d '{"file_path": "/path/to/audio.aac"}'
curl -X POST http://127.0.0.1:8765/summary \
-H "Content-Type: application/json" \
-d '{"md_path": "/path/to/audio.md"}'
响应示例:
{
"success": true,
"output_path": "/path/to/audio.md",
"summary_prompt": "你是一位擅长处理口语化中文对话...",
"text_preview": "转录文本前500字..."
}
在 Agent(OpenClaw)中生成总结后,调用:
curl -X POST http://127.0.0.1:8765/inject_summary \
-H "Content-Type: application/json" \
-d '{
"md_path": "/path/to/audio.md",
"summary_content": "## AI 摘要\n\n### 全文总结\n...\n\n### 重点内容\n- ...\n\n### 关键词\n..."
}'
用户:转录这个音频
↓
Agent:
1. curl -X POST /transcribe -d '{"file_path": "xxx.aac"}'
2. curl -X POST /summary -d '{"md_path": "xxx.md"}'
3. 用模型生成总结
4. curl -X POST /inject_summary -d '{"md_path": "xxx.md", "summary_content": "..."}'
↓
用户:收到带总结的 Markdown 文件
| 端点 | 方法 | 功能 |
|---|---|---|
/health | GET | 健康检查 |
/transcribe | POST | 转录音频/视频 |
/batch_transcribe | POST | 批量转录目录 |
/summary | POST | 生成 AI 总结提示词 |
/inject_summary | POST | 将总结注入 Markdown 文件 |
server.py 会自动检测运行环境:
OPENCLAW_SERVICE_MARKER=openclaw 环境变量CLAUDE_API_KEY 或 ANTHROPIC_API_KEY 环境变量| 文件 | 说明 |
|---|---|
assets/models.json | ASR 模型配置清单 |
assets/requirements.txt | Python 依赖清单 |
转录结果保存为 Markdown 文件,包含:
发言人N HH:MM:SS 换行 内容示例格式:
# 转录:filename.mp4
## 转录内容
发言人1 00:00:01
这是第一句话的内容。
发言人2 00:00:05
这是第二句话的内容。
模型存储在 ModelScope 默认缓存目录 ~/.cache/modelscope/hub/models/:
服务启动失败时,运行验证命令检查安装状态:
python scripts/setup.py --verify
重新下载模型:
python scripts/setup.py --skip-deps
Weekly Installs
41
Repository
GitHub Stars
53
First Seen
Feb 20, 2026
Security Audits
Installed on
codex39
gemini-cli39
cursor39
opencode39
github-copilot38
kimi-cli38
GitHub Actions 官方文档查询助手 - 精准解答 CI/CD 工作流问题
45,200 周安装