transcript-fixer by daymade/claude-code-skills
npx skills add https://github.com/daymade/claude-code-skills --skill transcript-fixer通过基于词典的规则、AI驱动的修正和自动模式检测,纠正语音转文本的转录错误。构建一个从每次修正中学习的个性化知识库。
Python 执行必须使用 uv - 切勿直接使用系统 Python。
如果未安装 uv:
# macOS/Linux
curl -LsSf https://astral.sh/uv/install.sh | sh
# Windows PowerShell
powershell -ExecutionPolicy ByPass -c "irm https://astral.sh/uv/install.ps1 | iex"
推荐:使用增强包装器(自动检测 API 密钥,打开 HTML 差异对比):
# 首次使用:初始化数据库
uv run scripts/fix_transcription.py --init
# 使用增强用户体验处理转录稿
uv run scripts/fix_transcript_enhanced.py input.md --output ./corrected
增强包装器自动执行以下操作:
广告位招租
在这里展示您的产品或服务
触达数万 AI 开发者,精准高效
ANTHROPIC_BASE_URL 附近的行)备选方案:直接使用核心脚本:
# 1. 设置 API 密钥(如果未自动检测到)
export GLM_API_KEY="<api-key>" # 来自 https://open.bigmodel.cn/
# 2. 添加常见修正(5-10 个术语)
uv run scripts/fix_transcription.py --add "错误词" "正确词" --domain general
# 3. 运行完整修正流程
uv run scripts/fix_transcription.py --input meeting.md --stage 3
# 4. 运行 3-5 次后,查看学习到的模式
uv run scripts/fix_transcription.py --review-learned
输出文件:
*_stage1.md - 应用词典修正后的版本*_stage2.md - 应用 AI 修正后的版本(最终版本)*_对比.html - 可视化差异对比(在浏览器中打开以获得最佳体验)生成词级差异对比(推荐用于审查修正):
uv run scripts/generate_word_diff.py original.md corrected.md output.html
这将创建一个 HTML 文件,清晰地高亮显示逐词差异:
japanese 3 pro → 🟢 Gemini 3 Pro(完整的单词替换)输入转录稿 (meeting.md):
今天我们讨论了巨升智能的最新进展。
股价系统需要优化,目前性能不够好。
第一阶段后 (meeting_stage1.md):
今天我们讨论了具身智能的最新进展。 ← "巨升"→"具身" 已修正
股价系统需要优化,目前性能不够好。 ← 未更改(不在词典中)
第二阶段后 (meeting_stage2.md):
今天我们讨论了具身智能的最新进展。
框架系统需要优化,目前性能不够好。 ← "股价"→"框架" 由 AI 修正
检测到学习到的模式:
✓ 检测到: "股价" → "框架" (置信度: 85%, 计数: 1)
再出现 2 次后运行 --review-learned 以批准
三阶段流程将修正存储在 ~/.transcript-fixer/corrections.db 中:
uv run scripts/fix_transcription.py --init--add "错误词" "正确词" --domain <domain>--input file.md --stage 3--review-learned 和 --approve 高置信度建议阶段:词典(即时,免费)→ 通过 GLM API 的 AI(并行)→ 完整流程
领域:general、embodied_ai、finance、medical,或包含中文的自定义名称(例如 火星加速器、具身智能)
学习:出现次数 ≥3 次且置信度 ≥80% 的模式将从 AI 修正转移到词典修正
有关详细工作流程,请参阅 references/workflow_guide.md;有关完整的 CLI 参考,请参阅 references/script_parameters.md;有关协作模式,请参阅 references/team_collaboration.md。
每次修正后必须保存修正。 这是此技能的核心价值。
手动修正错误后,立即保存到词典:
uv run scripts/fix_transcription.py --add "错误词" "正确词" --domain general
有关包含检查清单的完整迭代指南,请参阅 references/iteration_workflow.md。
当 GLM API 不可用时(503,网络问题),脚本会输出 [CLAUDE_FALLBACK] 标记。
然后 Claude Code 应:
--add 将修正保存到词典任何数据库操作前必须阅读 references/database_schema.md。
快速参考:
# 查看所有修正
sqlite3 ~/.transcript-fixer/corrections.db "SELECT * FROM active_corrections;"
# 检查模式版本
sqlite3 ~/.transcript-fixer/corrections.db "SELECT value FROM system_config WHERE key='schema_version';"
| 阶段 | 描述 | 速度 | 成本 |
|---|---|---|---|
| 1 | 仅词典 | 即时 | 免费 |
| 2 | 仅 AI | ~10秒 | API 调用 |
| 3 | 完整流程 | ~10秒 | API 调用 |
脚本:
ensure_deps.py - 初始化共享虚拟环境(运行一次,可选)fix_transcript_enhanced.py - 增强包装器(推荐用于交互式使用)fix_transcription.py - 核心 CLI(用于自动化)generate_word_diff.py - 生成用于审查修正的词级差异对比 HTMLexamples/bulk_import.py - 批量导入示例参考资料(按需加载):
database_schema.md(数据库操作前必读)、iteration_workflow.md(词典迭代最佳实践)installation_setup.md、glm_api_setup.md、workflow_guide.mdquick_reference.md、script_parameters.md、dictionary_guide.mdsql_queries.md、file_formats.md、architecture.md、best_practices.mdtroubleshooting.md、team_collaboration.md使用 uv run scripts/fix_transcription.py --validate 验证设置健康状况。常见问题:
--initexport GLM_API_KEY="<key>"(从 https://open.bigmodel.cn/ 获取)~/.transcript-fixer/ 的所有权有关详细的错误解决方法,请参阅 references/troubleshooting.md;有关 API 配置,请参阅 references/glm_api_setup.md。
每周安装次数
86
代码仓库
GitHub 星标数
636
首次出现
2026年1月21日
安全审计
安装于
claude-code69
opencode62
codex60
gemini-cli59
cursor53
github-copilot50
Skills CLI 使用指南:AI Agent 技能包管理器安装与管理教程
40,000 周安装