docx-format-replicator by iamzhihuix/happy-claude-skills
npx skills add https://github.com/iamzhihuix/happy-claude-skills --skill docx-format-replicator从现有的 Word 文档 (.docx) 中提取格式信息,并使用它来生成具有相同格式但内容不同的新文档。此技能支持创建文档模板、跨多个文档保持一致的格式,以及复制复杂的 Word 文档结构。
当用户:
从现有的 Word 文档中提取格式信息,以创建可重用的格式配置。
python scripts/extract_format.py <template.docx> <output.json>
示例:
python scripts/extract_format.py "HY研制任务书.docx" format_template.json
提取的内容:
输出:包含所有格式信息的 JSON 文件(详情请参阅 references/format_config_schema.md)
广告位招租
在这里展示您的产品或服务
触达数万 AI 开发者,精准高效
创建一个 JSON 文件,其中包含新文档的实际内容。内容必须遵循 references/content_data_schema.md 中定义的结构。
内容结构:
{
"metadata": {
"title": "Document Title",
"author": "Author Name",
"version": "1.0",
"date": "2025-01-15"
},
"sections": [
{
"type": "heading",
"content": "Section Title",
"level": 1,
"number": "1"
},
{
"type": "paragraph",
"content": "Paragraph text content."
},
{
"type": "table",
"rows": 3,
"cells": [
["Header 1", "Header 2"],
["Data 1", "Data 2"]
]
}
]
}
支持的章节类型:
heading - 带可选编号的标题paragraph - 文本段落table - 可配置行和列的表格page_break - 分页符完整示例请参阅 assets/example_content.json。
使用提取的格式和准备好的内容生成新的 Word 文档。
python scripts/generate_document.py <format.json> <content.json> <output.docx>
示例:
python scripts/generate_document.py format_template.json new_content.json output_document.docx
结果:一个新的 .docx 文件,其中模板的格式已应用于新内容。
用户提问:“我有一个研究任务文档。我需要再创建 5 个具有相同格式但内容不同的文档。”
python scripts/extract_format.py research_task_template.docx template_format.json
为每个新文档创建内容文件(content1.json, content2.json 等)
生成文档:
python scripts/generate_document.py template_format.json content1.json document1.docx
python scripts/generate_document.py template_format.json content2.json document2.docx
# ... 对所有文档重复此操作
从公司模板中提取格式,并生成具有一致品牌标识的报告、提案或规范。
# 一次性:提取公司模板
python scripts/extract_format.py "Company Template.docx" company_format.json
# 对于每个新文档:
python scripts/generate_document.py company_format.json new_report.json "Monthly Report.docx"
创建具有相同格式的多个技术文档(规范、测试计划、手册)。
# 从规范模板中提取
python scripts/extract_format.py spec_template.docx spec_format.json
# 生成多个规范
python scripts/generate_document.py spec_format.json product_a_spec.json "Product A Spec.docx"
python scripts/generate_document.py spec_format.json product_b_spec.json "Product B Spec.docx"
包含的示例模板 (assets/hy_template_format.json) 展示了一个完整的研究任务文档格式,包含:
可将其用作类似技术文档的起点。
修改 scripts/extract_format.py 以提取默认未涵盖的额外属性:
在 scripts/generate_document.py 中添加新的章节类型:
扩展指南请参阅 references/content_data_schema.md。
创建一个包装脚本来生成多个文档:
import json
import subprocess
format_file = "template_format.json"
content_files = ["content1.json", "content2.json", "content3.json"]
for i, content_file in enumerate(content_files, 1):
output = f"document_{i}.docx"
subprocess.run([
"python", "scripts/generate_document.py",
format_file, content_file, output
])
脚本需要:
python-docx 库:pip install python-docx核心功能无需额外的依赖项。
两个脚本都包含内置帮助:
python scripts/extract_format.py --help
python scripts/generate_document.py --help
有关文件结构和可用选项的详细信息,请阅读这些文档。
创建自己的格式和内容文件时,可将这些作为参考。
输出中缺少样式:确保内容数据中的样式 ID 与格式配置中的样式 ID 匹配。检查 format.json 中可用的样式 ID。
表格格式问题:验证内容数据和格式配置之间的表格维度(行/列)是否匹配。表格结构请参阅 format_config_schema.md。
字体显示不正确:某些字体可能无法在所有系统上使用。请检查引用的字体是否已安装。
缺少依赖项:安装所需的 Python 包:
pip install python-docx
首先使用示例进行测试:在提取自己的格式之前,使用附带的 hy_template_format.json 和 example_content.json 来理解工作流程。
从简单开始:从基本的标题和段落开始,然后添加表格和复杂的格式。
验证 JSON:在生成文档之前,使用 JSON 验证器检查内容数据文件。
保留格式配置:存储提取的格式配置,以便在多个项目中重复使用。
版本控制:在版本控制中跟踪格式配置和内容数据,以实现可重复的文档生成。
每周安装次数
129
仓库
GitHub 星标数
269
首次出现
2026年1月20日
安全审计
安装于
opencode111
codex102
gemini-cli99
cursor94
claude-code87
github-copilot84
通过 LiteLLM 代理让 Claude Code 对接 GitHub Copilot 运行 | 高级变通方案指南
36,300 周安装