transcript-fixer：AI驱动的语音转录修正工具，自动纠正中英文同音词错误

transcript-fixer by daymade/claude-code-skills

163 周安装量

775 GitHub Stars

GitHub

安装命令

npx skills add https://github.com/daymade/claude-code-skills --skill transcript-fixer

自动化音频处理自然语言处理

🇨🇳中文介绍

转录修正器

通过基于词典的规则、AI驱动的修正和自动模式检测，纠正语音转文本的转录错误。构建一个从每次修正中学习的个性化知识库。

何时使用此技能

纠正会议记录、讲座或访谈中的 ASR/STT 错误
构建特定领域的修正词典
修复中英文同音词错误或技术术语
在共享的修正知识库上进行协作

前提条件

Python 执行必须使用 uv - 切勿直接使用系统 Python。

如果未安装 uv：

# macOS/Linux
curl -LsSf https://astral.sh/uv/install.sh | sh

# Windows PowerShell
powershell -ExecutionPolicy ByPass -c "irm https://astral.sh/uv/install.ps1 | iex"

快速开始

推荐：使用增强包装器（自动检测 API 密钥，打开 HTML 差异对比）：

# 首次使用：初始化数据库
uv run scripts/fix_transcription.py --init

# 使用增强用户体验处理转录稿
uv run scripts/fix_transcript_enhanced.py input.md --output ./corrected

增强包装器自动执行以下操作：

广告位招租

在这里展示您的产品或服务

触达数万 AI 开发者，精准高效

联系我们

相关 Skills

FlyClaw：零登录航班聚合查询工具，Python实现多源航班信息与价格搜索

4,000,000 周安装

Azure RBAC 权限管理工具：查找最小角色、创建自定义角色与自动化分配

131,500 周安装

GitHub Actions 官方文档查询助手 - 精准解答 CI/CD 工作流问题

40,500 周安装

通过 LiteLLM 代理让 Claude Code 对接 GitHub Copilot 运行 | 高级变通方案指南

40,000 周安装

从 shell 配置中检测 GLM API 密钥（检查 ANTHROPIC_BASE_URL 附近的行）
将输出文件移动到指定目录
在浏览器中打开 HTML 可视化差异对比，以便立即获得反馈

备选方案：直接使用核心脚本：

# 1. 设置 API 密钥（如果未自动检测到）
export GLM_API_KEY="<api-key>"  # 来自 https://open.bigmodel.cn/

# 2. 添加常见修正（5-10 个术语）
uv run scripts/fix_transcription.py --add "错误词" "正确词" --domain general

# 3. 运行完整修正流程
uv run scripts/fix_transcription.py --input meeting.md --stage 3

# 4. 运行 3-5 次后，查看学习到的模式
uv run scripts/fix_transcription.py --review-learned

*_stage1.md - 应用词典修正后的版本
*_stage2.md - 应用 AI 修正后的版本（最终版本）
*_对比.html - 可视化差异对比（在浏览器中打开以获得最佳体验）

生成词级差异对比（推荐用于审查修正）：

uv run scripts/generate_word_diff.py original.md corrected.md output.html

这将创建一个 HTML 文件，清晰地高亮显示逐词差异：

🔴 japanese 3 pro → 🟢 Gemini 3 Pro（完整的单词替换）
无需关注字符级噪音，即可轻松发现具体更改内容

输入转录稿 (meeting.md)：

今天我们讨论了巨升智能的最新进展。
股价系统需要优化，目前性能不够好。

第一阶段后 (meeting_stage1.md)：

今天我们讨论了具身智能的最新进展。  ← "巨升"→"具身" 已修正
股价系统需要优化,目前性能不够好。  ← 未更改（不在词典中）

第二阶段后 (meeting_stage2.md)：

今天我们讨论了具身智能的最新进展。
框架系统需要优化，目前性能不够好。  ← "股价"→"框架" 由 AI 修正

检测到学习到的模式：

✓ 检测到: "股价" → "框架" (置信度: 85%, 计数: 1)
  再出现 2 次后运行 --review-learned 以批准

三阶段流程将修正存储在 ~/.transcript-fixer/corrections.db 中：

初始化（首次使用）：uv run scripts/fix_transcription.py --init
添加领域修正：--add "错误词" "正确词" --domain <domain>
处理转录稿：--input file.md --stage 3
查看学习到的模式：--review-learned 和 --approve 高置信度建议

阶段：词典（即时，免费）→ 通过 GLM API 的 AI（并行）→ 完整流程领域：general、embodied_ai、finance、medical，或包含中文的自定义名称（例如 火星加速器、具身智能）学习：出现次数 ≥3 次且置信度 ≥80% 的模式将从 AI 修正转移到词典修正

有关详细工作流程，请参阅 references/workflow_guide.md；有关完整的 CLI 参考，请参阅 references/script_parameters.md；有关协作模式，请参阅 references/team_collaboration.md。

关键工作流程：词典迭代

每次修正后必须保存修正。 这是此技能的核心价值。

手动修正错误后，立即保存到词典：

uv run scripts/fix_transcription.py --add "错误词" "正确词" --domain general

有关包含检查清单的完整迭代指南，请参阅 references/iteration_workflow.md。

当 GLM API 不可用时（503，网络问题），脚本会输出 [CLAUDE_FALLBACK] 标记。

然后 Claude Code 应：

直接分析文本中的 ASR 错误
使用编辑工具进行修正
必须使用 --add 将修正保存到词典

任何数据库操作前必须阅读 references/database_schema.md。

# 查看所有修正
sqlite3 ~/.transcript-fixer/corrections.db "SELECT * FROM active_corrections;"

# 检查模式版本
sqlite3 ~/.transcript-fixer/corrections.db "SELECT value FROM system_config WHERE key='schema_version';"

阶段	描述	速度	成本
1	仅词典	即时	免费
2	仅 AI	~10秒	API 调用
3	完整流程	~10秒	API 调用

ensure_deps.py - 初始化共享虚拟环境（运行一次，可选）
fix_transcript_enhanced.py - 增强包装器（推荐用于交互式使用）
fix_transcription.py - 核心 CLI（用于自动化）
generate_word_diff.py - 生成用于审查修正的词级差异对比 HTML
examples/bulk_import.py - 批量导入示例

参考资料（按需加载）：

关键：database_schema.md（数据库操作前必读）、iteration_workflow.md（词典迭代最佳实践）
入门：installation_setup.md、glm_api_setup.md、workflow_guide.md
日常使用：quick_reference.md、script_parameters.md、dictionary_guide.md
高级：sql_queries.md、file_formats.md、architecture.md、best_practices.md
运维：troubleshooting.md、team_collaboration.md

使用 uv run scripts/fix_transcription.py --validate 验证设置健康状况。常见问题：

缺少数据库 → 运行 --init
缺少 API 密钥 → export GLM_API_KEY="<key>"（从 https://open.bigmodel.cn/ 获取）
权限错误 → 检查 ~/.transcript-fixer/ 的所有权

有关详细的错误解决方法，请参阅 references/troubleshooting.md；有关 API 配置，请参阅 references/glm_api_setup.md。

Skills CLI 使用指南：AI Agent 技能包管理器安装与管理教程

40,000 周安装

transcript-fixer：AI驱动的语音转录修正工具，自动纠正中英文同音词错误

🇨🇳中文介绍

转录修正器

何时使用此技能

前提条件

快速开始

相关 Skills

示例会话

核心工作流程

关键工作流程：词典迭代

AI 备用策略

数据库操作

阶段

捆绑资源

故障排除

最新 Skills