document-illustrator by op7418/document-illustrator-skill
npx skills add https://github.com/op7418/document-illustrator-skill --skill document-illustrator基于 AI 智能分析的文档配图生成工具。无需依赖特定格式,自动理解内容并生成专业配图。
帮我为这个文档生成配图:/path/to/document.md
或者:
我想为这篇文章生成一些配图
当你请求生成配图时,Claude 会:
无需担心文档格式 :
Claude 会询问你的偏好:
广告位招租
在这里展示您的产品或服务
触达数万 AI 开发者,精准高效
请选择图片比例:
1. 16:9 (横屏) - 适合演示文稿、幻灯片、横屏展示
2. 3:4 (竖屏) - 适合社交媒体、手机查看、海报
请选择 (1/2):
是否生成封面图?
封面图将概括文档的所有核心信息,作为系列配图的引导。
1. 是 - 生成封面图 + 内容配图
2. 否 - 仅生成内容配图
请选择 (1/2):
期望生成多少张内容配图?
建议范围:3-10 张
根据文档内容,推荐生成 6 张
请输入数字:
根据你指定的数量,Claude 会智能归纳文档,然后展示给你确认:
📋 内容归纳完成
📄 封面图内容:(如果选择生成)
"AI 编程工具概念演化:从 Rules 到 Skills"
- 核心概念:静态上下文 vs 动态上下文
- 演化路径:Rules → Commands → MCP → Modes → Skills
- 最佳实践:简化为两个核心工具
📚 内容配图(共 6 张):
1. Rules 的诞生与演化
包含:早期模型幻觉问题、rules 文件的作用、静态上下文概念
2. Commands 和工作流打包
包含:固定工作流的出现、slash command、团队分享
3. MCP Servers 带来动态能力
包含:第三方工具集成、OAuth 认证、上下文膨胀问题
4. Modes 和 Subagents 的登场
包含:人设提示词、系统提示词修改、可靠性设计、Hooks 确定性
5. Skills 统一动态上下文
包含:Skills 概念、动态加载、编程工具优化
6. 最佳实践与未来展望
包含:Rules 使用建议、Skills 探索、核心理念总结
✓ 所有内容已覆盖,无遗漏
确认开始生成配图吗?(Y/N)
关键保证 :
确认后,Claude 调用 Python 脚本生成图片:
🖼️ 开始生成配图...
正在生成封面图...
✓ 已保存: /path/to/document/images/cover.png
正在生成第 1/6 张...
标题: Rules 的诞生与演化
✓ 已保存: /path/to/document/images/illustration-01.png
正在生成第 2/6 张...
标题: Commands 和工作流打包
✓ 已保存: /path/to/document/images/illustration-02.png
...
✨ 完成!共生成 7 张配图(1 张封面 + 6 张内容)
输出位置 :文档所在目录下的 images/ 文件夹
/path/to/your/document/
└── images/
├── cover.png # 封面图(如果选择生成)
├── illustration-01.png # 第 1 张内容配图
├── illustration-02.png # 第 2 张内容配图
├── illustration-03.png
├── illustration-04.png
├── illustration-05.png
└── illustration-06.png
特点 :
适用场景 :
特点 :
适用场景 :
特点 :
适用场景 :
用户: 帮我为 ~/blog/ai-tools.md 生成配图,用票据风格
Claude: 好的,让我先读取这个文档...
[读取文档,分析内容]
检测到文档长度约 3000 字,内容涉及 AI 工具演化。
请选择图片比例:
1. 16:9 (横屏)
2. 3:4 (竖屏)
用户: 1
Claude: 是否生成封面图?
1. 是
2. 否
用户: 是
Claude: 期望生成多少张内容配图?
建议范围:3-10 张
根据文档内容,推荐生成 5 张
用户: 5
Claude: [展示归纳的 5 个主题]
确认开始生成配图吗?
用户: Y
Claude: [调用 Python 脚本生成 6 张图片]
✨ 完成!配图已保存到 ~/blog/images/
用户: 为这个纯文本笔记生成配图
Claude: [读取笔记,即使没有任何标题也能理解内容]
[智能识别 3 个核心主题]
[询问配置、展示归纳、生成配图]
用户: 我想要 8 张图,竖屏的,不要封面
Claude: 好的,16:9 竖屏,不生成封面,8 张内容配图。
[将文档归纳为 8 个主题]
[展示归纳结果,用户确认后生成]
| 比例 | 分辨率 | 适用场景 |
|---|---|---|
| 16:9 | 2560x1440 (2K) | 演示文稿、横屏展示 |
| 3:4 | 1920x2560 | 社交媒体、竖屏查看 |
可选 4K 分辨率:
必需 :
pip install google-genai pillow python-dotenv
API 密钥 :
~/.claude/skills/document-illustrator/.env 中配置GEMINI_API_KEYClaude 归纳内容时遵循以下原则:
错误信息 :
Error: Invalid API key
解决方案 :
.env 文件中的 GEMINI_API_KEY问题 :归纳的主题不符合预期
解决方案 :
可能原因 :
解决方案 :
| 图片数量 | API 调用次数 | 预估成本 |
|---|---|---|
| 无封面 + 3 张 | 3 次 | 低 |
| 有封面 + 5 张 | 6 次 | 中 |
| 有封面 + 10 张 | 11 次 | 较高 |
建议 :
太少 :
太多 :
推荐 :
16:9 适合 :
3:4 适合 :
建议生成封面图的场景 :
可以不生成的场景 :
技术文档 → 渐变玻璃卡片风格 数据报告 → 票据风格 教程故事 → 矢量插画风格 产品介绍 → 渐变玻璃卡片风格
[代码] 读取文档 → 识别 ## ### 标题 → 机械切分
↓
依赖特定格式
容易遗漏内容
不够智能
[Claude] 读取文档 → AI 理解内容 → 智能归纳主题
↓
格式无关
内容完整
用户可控
核心区别 :
| 功能 | Document Illustrator | 传统 PPT 工具 | AI 图片生成器 |
|---|---|---|---|
| 理解文档内容 | ✅ AI 智能理解 | ❌ 需要手动 | ❌ 需要手动输入 |
| 格式依赖 | ✅ 格式无关 | ❌ 依赖特定格式 | ✅ 无依赖 |
| 内容完整性 | ✅ 自动验证 | ⚠️ 手动确保 | ❌ 无法保证 |
| 批量生成 | ✅ 一次生成多张 | ❌ 逐张制作 | ⚠️ 需要多次输入 |
| 风格一致性 | ✅ 自动保持 | ⚠️ 手动调整 | ⚠️ 需要重复提示词 |
如有问题或建议:
~/.claude/plans/shimmering-tickling-seahorse.md~/.claude/skills/document-illustrator/让 AI 帮你理解和归纳内容,生成专业配图! ✨
Weekly Installs
397
Repository
GitHub Stars
297
First Seen
Jan 21, 2026
Security Audits
Installed on
opencode334
gemini-cli318
cursor292
claude-code286
codex284
github-copilot207
基于 AI 智能分析的文档配图生成工具。无需依赖特定格式,自动理解内容并生成专业配图。
帮我为这个文档生成配图:/path/to/document.md
或者:
我想为这篇文章生成一些配图
当你请求生成配图时,Claude 会:
无需担心文档格式 :
Claude 会询问你的偏好:
请选择图片比例:
1. 16:9 (横屏) - 适合演示文稿、幻灯片、横屏展示
2. 3:4 (竖屏) - 适合社交媒体、手机查看、海报
请选择 (1/2):
是否生成封面图?
封面图将概括文档的所有核心信息,作为系列配图的引导。
1. 是 - 生成封面图 + 内容配图
2. 否 - 仅生成内容配图
请选择 (1/2):
期望生成多少张内容配图?
建议范围:3-10 张
根据文档内容,推荐生成 6 张
请输入数字:
根据你指定的数量,Claude 会智能归纳文档,然后展示给你确认:
📋 内容归纳完成
📄 封面图内容:(如果选择生成)
"AI 编程工具概念演化:从 Rules 到 Skills"
- 核心概念:静态上下文 vs 动态上下文
- 演化路径:Rules → Commands → MCP → Modes → Skills
- 最佳实践:简化为两个核心工具
📚 内容配图(共 6 张):
1. Rules 的诞生与演化
包含:早期模型幻觉问题、rules 文件的作用、静态上下文概念
2. Commands 和工作流打包
包含:固定工作流的出现、slash command、团队分享
3. MCP Servers 带来动态能力
包含:第三方工具集成、OAuth 认证、上下文膨胀问题
4. Modes 和 Subagents 的登场
包含:人设提示词、系统提示词修改、可靠性设计、Hooks 确定性
5. Skills 统一动态上下文
包含:Skills 概念、动态加载、编程工具优化
6. 最佳实践与未来展望
包含:Rules 使用建议、Skills 探索、核心理念总结
✓ 所有内容已覆盖,无遗漏
确认开始生成配图吗?(Y/N)
关键保证 :
确认后,Claude 调用 Python 脚本生成图片:
🖼️ 开始生成配图...
正在生成封面图...
✓ 已保存: /path/to/document/images/cover.png
正在生成第 1/6 张...
标题: Rules 的诞生与演化
✓ 已保存: /path/to/document/images/illustration-01.png
正在生成第 2/6 张...
标题: Commands 和工作流打包
✓ 已保存: /path/to/document/images/illustration-02.png
...
✨ 完成!共生成 7 张配图(1 张封面 + 6 张内容)
输出位置 :文档所在目录下的 images/ 文件夹
/path/to/your/document/
└── images/
├── cover.png # 封面图(如果选择生成)
├── illustration-01.png # 第 1 张内容配图
├── illustration-02.png # 第 2 张内容配图
├── illustration-03.png
├── illustration-04.png
├── illustration-05.png
└── illustration-06.png
特点 :
适用场景 :
特点 :
适用场景 :
特点 :
适用场景 :
用户: 帮我为 ~/blog/ai-tools.md 生成配图,用票据风格
Claude: 好的,让我先读取这个文档...
[读取文档,分析内容]
检测到文档长度约 3000 字,内容涉及 AI 工具演化。
请选择图片比例:
1. 16:9 (横屏)
2. 3:4 (竖屏)
用户: 1
Claude: 是否生成封面图?
1. 是
2. 否
用户: 是
Claude: 期望生成多少张内容配图?
建议范围:3-10 张
根据文档内容,推荐生成 5 张
用户: 5
Claude: [展示归纳的 5 个主题]
确认开始生成配图吗?
用户: Y
Claude: [调用 Python 脚本生成 6 张图片]
✨ 完成!配图已保存到 ~/blog/images/
用户: 为这个纯文本笔记生成配图
Claude: [读取笔记,即使没有任何标题也能理解内容]
[智能识别 3 个核心主题]
[询问配置、展示归纳、生成配图]
用户: 我想要 8 张图,竖屏的,不要封面
Claude: 好的,16:9 竖屏,不生成封面,8 张内容配图。
[将文档归纳为 8 个主题]
[展示归纳结果,用户确认后生成]
| 比例 | 分辨率 | 适用场景 |
|---|---|---|
| 16:9 | 2560x1440 (2K) | 演示文稿、横屏展示 |
| 3:4 | 1920x2560 | 社交媒体、竖屏查看 |
可选 4K 分辨率:
必需 :
pip install google-genai pillow python-dotenv
API 密钥 :
~/.claude/skills/document-illustrator/.env 中配置GEMINI_API_KEYClaude 归纳内容时遵循以下原则:
错误信息 :
Error: Invalid API key
解决方案 :
.env 文件中的 GEMINI_API_KEY问题 :归纳的主题不符合预期
解决方案 :
可能原因 :
解决方案 :
| 图片数量 | API 调用次数 | 预估成本 |
|---|---|---|
| 无封面 + 3 张 | 3 次 | 低 |
| 有封面 + 5 张 | 6 次 | 中 |
| 有封面 + 10 张 | 11 次 | 较高 |
建议 :
太少 :
太多 :
推荐 :
16:9 适合 :
3:4 适合 :
建议生成封面图的场景 :
可以不生成的场景 :
技术文档 → 渐变玻璃卡片风格 数据报告 → 票据风格 教程故事 → 矢量插画风格 产品介绍 → 渐变玻璃卡片风格
[代码] 读取文档 → 识别 ## ### 标题 → 机械切分
↓
依赖特定格式
容易遗漏内容
不够智能
[Claude] 读取文档 → AI 理解内容 → 智能归纳主题
↓
格式无关
内容完整
用户可控
核心区别 :
| 功能 | Document Illustrator | 传统 PPT 工具 | AI 图片生成器 |
|---|---|---|---|
| 理解文档内容 | ✅ AI 智能理解 | ❌ 需要手动 | ❌ 需要手动输入 |
| 格式依赖 | ✅ 格式无关 | ❌ 依赖特定格式 | ✅ 无依赖 |
| 内容完整性 | ✅ 自动验证 | ⚠️ 手动确保 | ❌ 无法保证 |
| 批量生成 | ✅ 一次生成多张 | ❌ 逐张制作 | ⚠️ 需要多次输入 |
| 风格一致性 | ✅ 自动保持 | ⚠️ 手动调整 | ⚠️ 需要重复提示词 |
如有问题或建议:
~/.claude/plans/shimmering-tickling-seahorse.md~/.claude/skills/document-illustrator/让 AI 帮你理解和归纳内容,生成专业配图! ✨
Weekly Installs
397
Repository
GitHub Stars
297
First Seen
Jan 21, 2026
Security Audits
Gen Agent Trust HubPassSocketPassSnykPass
Installed on
opencode334
gemini-cli318
cursor292
claude-code286
codex284
github-copilot207
AI Elements:基于shadcn/ui的AI原生应用组件库,快速构建对话界面
56,200 周安装