subtitle-correction by sugarforever/01coder-agent-skills
npx skills add https://github.com/sugarforever/01coder-agent-skills --skill subtitle-correction此技能用于修正字幕文件中的语音识别错误,同时严格保持时间轴信息不变。
重要提示:在开始任何修正之前,始终向用户询问领域特定术语。
向用户提示:
在开始修正之前,请提供一些关键术语,帮助我更准确地识别和修正语音识别错误:
1. **专有名词**:人名、品牌名、产品名等(如:Anthropic、Claude)
2. **技术术语**:框架、库、工具名称(如:LangChain、OpenAI、PyTorch)
3. **领域词汇**:行业特定词汇(如:checkpointer、middleware、runtime)
4. **其他关键词**:视频中频繁出现的重要词汇
请用逗号分隔,例如:`LangChain, Agent, OpenAI, checkpointer`
对于英文用户:
Before I begin correction, please provide key terms to help me accurately identify speech recognition errors:
1. **Proper nouns**: Names, brands, products (e.g., Anthropic, Claude)
2. **Technical terms**: Frameworks, libraries, tools (e.g., LangChain, PyTorch)
3. **Domain vocabulary**: Industry-specific terms (e.g., checkpointer, middleware)
4. **Other keywords**: Important words that appear frequently
Please separate with commas, e.g.: `LangChain, Agent, OpenAI, checkpointer`
收到术语后,通过以下方式确认:
广告位招租
在这里展示您的产品或服务
触达数万 AI 开发者,精准高效
示例回复:
收到以下术语:
- 技术框架:LangChain, LangGraph, OpenAI
- 技术概念:Agent, checkpointer, runtime
看起来这是一个 LangChain 智能体开发的教程视频。
还有其他需要补充的术语吗?如果没有,我将开始修正字幕。
使用提供的术语来:
如果用户说“没有”/“no”/“直接开始”:
00:00:00,000 --> 00:00:00,000 行完全不变中文语音识别中常见:
语音识别经常在以下方面出错:
将口头描述转换为正确的格式:
当用户提供术语列表时,将其作为修正的主要参考:
用户提供的术语:LangChain,Agent,OpenAI,LangGraph
这些术语指示:
view_range 参数分块处理输出前:
| 错误 | 修正 | 上下文 |
|---|---|---|
| 蓝犬/蓝卷/Lantern | LangChain | 框架名称 |
| 绘画 | 会话 | 会话/对话 |
| 拖/tour | tool | 工具概念 |
| checkpoint组件 | checkpointer组件 | 记忆组件 |
| 源数据 | 元数据 | 元数据 |
| 大约模型 | 大模型 | 大模型 |
| 中间键 | 中间件 | 中间件 |
| 口头表达 | 书面形式 |
|---|---|
| user underscore 001 | user_001 |
| thread underscore id | thread_id |
| create underscore agent | create_agent |
| runtime dot state | runtime.state |
保存时,使用 -corrected 后缀:
filename.srtfilename-corrected.srt使用 scripts/subtitle_tool.py 来验证和分析字幕文件:
# 验证修正后的文件保持结构
python scripts/subtitle_tool.py validate original.srt corrected.srt
# 显示带颜色输出的词级差异(默认,仅显示更改)
python scripts/subtitle_tool.py diff original.srt corrected.srt
# 在终端显示所有条目(已更改和未更改)
python scripts/subtitle_tool.py diff original.srt corrected.srt --all
# 生成 HTML 差异报告(推荐用于审查)
python scripts/subtitle_tool.py diff original.srt corrected.srt --html report.html
# 显示简单的基于行的差异(原始/修正行)
python scripts/subtitle_tool.py diff original.srt corrected.srt --simple
# 禁用颜色以便输出到文件
python scripts/subtitle_tool.py diff original.srt corrected.srt --no-color
# 分析文件以查找潜在的语音识别错误
python scripts/subtitle_tool.py analyze input.srt --terms "LangChain,OpenAI"
显示带颜色的词级更改:
[1] 00:00:01,500 --> 00:00:04,500
今天我们来学习[-Luncheon-]{+LangChain+}框架
[3] 00:00:08,000 --> 00:00:12,500
我们可以用它来创建[-绘画-]{+会话+}应用程序
[-deleted-] - 删除的文本(在终端中显示为红色){+added+} - 添加的文本(在终端中显示为绿色)--all 也显示未更改的条目生成完整的比较报告,包含:
所有条目(已更改和未更改)
并排列:原始 | 修正 | 差异视图
视觉高亮:删除部分红色删除线,添加部分绿色
摘要统计:总条目数、更改数、未更改数
跳转链接:快速导航到已更改的条目
更改指示器:黄色圆点标记已更改的行
python scripts/subtitle_tool.py diff original.srt corrected.srt --html diff_report.html
然后在浏览器中打开 diff_report.html。
analyze 以识别潜在错误validate 以确保结构完整性diff --html report.html 生成可视化比较报告用户:帮我修正这个字幕文件
Claude:
在开始修正之前,请提供一些关键术语,帮助我更准确地识别语音识别错误:
1. **专有名词**:人名、品牌名、产品名
2. **技术术语**:框架、库、工具名称
3. **领域词汇**:行业特定词汇
4. **其他关键词**:视频中频繁出现的重要词汇
请用逗号分隔,例如:`LangChain, Agent, OpenAI`
用户:LangChain, Agent, OpenAI, LangGraph, checkpointer
Claude:
收到以下术语:
- 技术框架:LangChain, LangGraph, OpenAI
- 技术概念:Agent, checkpointer
这是一个 LangChain 相关的技术教程。还有补充吗?
用户:没有了,开始吧
Claude:[继续执行修正工作流程]
用户:帮我修正字幕,术语:LangChain, OpenAI, Agent
Claude:[确认术语,然后直接继续]
analyze 以识别潜在错误validate 以确认结构完整性-corrected 后缀保存修正后的文件输出:提供已做修正的分类摘要。
完成后,提示用户:
修正完成!我可以生成一个 HTML 差异报告,方便您在浏览器中查看所有修改。
需要生成 HTML 报告吗?
Correction complete! I can generate an HTML diff report for easier review in your browser.
Would you like me to generate the HTML report?
每周安装次数
107
代码仓库
GitHub 星标数
80
首次出现
2026年1月28日
安全审计
安装于
opencode94
codex92
gemini-cli90
cursor89
github-copilot85
cline80
AI 代码实施计划编写技能 | 自动化开发任务分解与 TDD 流程规划工具
49,000 周安装