npx skills add https://github.com/openai/skills --skill transcribe使用 OpenAI 进行音频转录,在需要时可选择说话人分离。建议使用捆绑的 CLI 以获得确定性和可重复的运行结果。
OPENAI_API_KEY 是否已设置。如果缺失,请要求用户在本地设置(不要要求他们粘贴密钥)。transcribe_diarize.py CLI。output/transcribe/ 目录下。gpt-4o-mini-transcribe 和 --response-format text 进行快速转录。--model gpt-4o-transcribe-diarize --response-format diarized_json。--chunking-strategy auto。广告位招租
在这里展示您的产品或服务
触达数万 AI 开发者,精准高效
gpt-4o-transcribe-diarize 不支持提示。output/transcribe/<job-id>/ 目录。--out-dir 以避免覆盖。优先使用 uv 进行依赖管理。
uv pip install openai
如果 uv 不可用:
python3 -m pip install openai
OPENAI_API_KEY。export CODEX_HOME="${CODEX_HOME:-$HOME/.codex}"
export TRANSCRIBE_CLI="$CODEX_HOME/skills/transcribe/scripts/transcribe_diarize.py"
用户范围的技能安装在 $CODEX_HOME/skills 下(默认:~/.codex/skills)。
单个文件(快速文本默认):
python3 "$TRANSCRIBE_CLI" \
path/to/audio.wav \
--out transcript.txt
使用已知说话人进行分离(最多 4 个):
python3 "$TRANSCRIBE_CLI" \
meeting.m4a \
--model gpt-4o-transcribe-diarize \
--known-speaker "Alice=refs/alice.wav" \
--known-speaker "Bob=refs/bob.wav" \
--response-format diarized_json \
--out-dir output/transcribe/meeting
纯文本输出(显式指定):
python3 "$TRANSCRIBE_CLI" \
interview.mp3 \
--response-format text \
--out interview.txt
references/api.md:支持的格式、限制、响应格式和已知说话人说明。每周安装次数
488
仓库
GitHub 星标
15.3K
首次出现
2026年2月1日
安全审计
已安装于
codex437
opencode417
gemini-cli410
github-copilot397
cursor391
kimi-cli388
Transcribe audio using OpenAI, with optional speaker diarization when requested. Prefer the bundled CLI for deterministic, repeatable runs.
OPENAI_API_KEY is set. If missing, ask the user to set it locally (do not ask them to paste the key).transcribe_diarize.py CLI with sensible defaults (fast text transcription).output/transcribe/ when working in this repo.gpt-4o-mini-transcribe with --response-format text for fast transcription.--model gpt-4o-transcribe-diarize --response-format diarized_json.--chunking-strategy auto.gpt-4o-transcribe-diarize.output/transcribe/<job-id>/ for evaluation runs.--out-dir for multiple files to avoid overwriting.Prefer uv for dependency management.
uv pip install openai
If uv is unavailable:
python3 -m pip install openai
OPENAI_API_KEY must be set for live API calls.export CODEX_HOME="${CODEX_HOME:-$HOME/.codex}"
export TRANSCRIBE_CLI="$CODEX_HOME/skills/transcribe/scripts/transcribe_diarize.py"
User-scoped skills install under $CODEX_HOME/skills (default: ~/.codex/skills).
Single file (fast text default):
python3 "$TRANSCRIBE_CLI" \
path/to/audio.wav \
--out transcript.txt
Diarization with known speakers (up to 4):
python3 "$TRANSCRIBE_CLI" \
meeting.m4a \
--model gpt-4o-transcribe-diarize \
--known-speaker "Alice=refs/alice.wav" \
--known-speaker "Bob=refs/bob.wav" \
--response-format diarized_json \
--out-dir output/transcribe/meeting
Plain text output (explicit):
python3 "$TRANSCRIBE_CLI" \
interview.mp3 \
--response-format text \
--out interview.txt
references/api.md: supported formats, limits, response formats, and known-speaker notes.Weekly Installs
488
Repository
GitHub Stars
15.3K
First Seen
Feb 1, 2026
Security Audits
Gen Agent Trust HubPassSocketPassSnykPass
Installed on
codex437
opencode417
gemini-cli410
github-copilot397
cursor391
kimi-cli388
AI 代码实施计划编写技能 | 自动化开发任务分解与 TDD 流程规划工具
41,400 周安装
50+ AI智能体专家集合 | 适用于Claude Code、Cursor、Copilot等开发工具的专业人格
464 周安装
Playwriter:AI代理浏览器自动化工具,连接真实Chrome会话,保留登录状态
464 周安装
TanStack Query 中文指南:React 服务器状态管理与数据缓存库
464 周安装
React前端开发模式实战:组件组合、复合组件与渲染属性模式详解
464 周安装
Mermaid 可视化工具 - 自动生成专业图表,优化文档与演示,兼容 Obsidian/GitHub
465 周安装
OpenAI API 完整指南:GPT-5、GPT-4o、DALL-E 3、Whisper 集成与Node.js/JavaScript开发
465 周安装