pdf-vision-reader by childbamboo/claude-code-marketplace-sample
npx skills add https://github.com/childbamboo/claude-code-marketplace-sample --skill pdf-vision-reader这是一个将包含大量图表的 PDF 文件转换为图像,并利用 Claude 的 vision 功能分析内容并转换为 Markdown 的技能。
# 1. 将 PDF 转换为图像
wsl python3 scripts/pdf_to_images.py "/mnt/c/path/to/file.pdf"
# 2. 使用 Read 工具读取并分析每个图像
# 3. 汇总为 Markdown 格式
所需软件包:
# Python 包
wsl pip3 install pdf2image Pillow
# 系统包 (poppler)
wsl sudo apt-get update
wsl sudo apt-get install -y poppler-utils
wsl python3 scripts/pdf_to_images.py "/mnt/c/path/to/document.pdf"
这将创建 document_pages/ 目录,并将每个页面保存为图像:
page_001.pngpage_002.png广告位招租
在这里展示您的产品或服务
触达数万 AI 开发者,精准高效
page_003.png使用 Read 工具依次读取每个图像并分析其内容。
分析时的指令示例:
请详细描述此图像的内容:
- 标题或标题
- 正文文本
- 图表说明
- 图表或图形的数据
- 关键要点
整合所有页面的分析结果,创建一个 Markdown 文件。
User: "使用 vision 分析 presentation.pdf 并转换为 Markdown"
Assistant:
1. 使用 scripts/pdf_to_images.py 将 PDF 转换为图像
2. 使用 Read 工具读取每个图像
3. 分析每个页面的内容(标题、图表、文本)
4. 整合所有页面的分析结果
5. 使用 Write 工具保存为 Markdown 文件
User: "仅分析 document.pdf 的第 5-10 页"
Assistant:
1. 将 PDF 转换为图像(所有页面)
2. 仅使用 Read 工具读取 page_005.png 到 page_010.png
3. 将相关页面的内容转换为 Markdown
从每个页面图像中提取以下内容:
文本信息
图表
图形/图表
表格
布局/结构
# [PDF标题]
**分析日期:** YYYY-MM-DD
**总页数:** N
---
## 第 1 页: [页面标题]
### 概要
[页面概要说明]
### 主要内容
- [要点1]
- [要点2]
### 图表
**图1: [图表标题]**
[图表说明]
### 文本内容
[页面内的文本]
---
## 第 2 页: [页面标题]
...
功能:
用法:
python scripts/pdf_to_images.py <pdf_path> [output_dir] [dpi]
# 示例
python scripts/pdf_to_images.py document.pdf ./images 300
输出:
[pdf_name]_pages/page_001.png[pdf_name]_pages/page_002.png| PDF 类型 | 推荐技能 |
|---|---|
| 以文本为中心的文档 | pdf-reader |
| 演示文稿资料 | pdf-vision-reader |
| 包含大量图表/图形的资料 | pdf-vision-reader |
| 技术图纸/设计文档 | pdf-vision-reader |
| 论文(包含图表) | pdf-vision-reader |
| 简单的文本 PDF | pdf-reader |
wsl pip3 install pdf2image
wsl sudo apt-get update
wsl sudo apt-get install -y poppler-utils
提高 DPI(推荐 300)
python scripts/pdf_to_images.py document.pdf ./images 300
检查原始 PDF 的画质
| 页数 | 图像转换 | 分析(Claude vision) | 总计 |
|---|---|---|---|
| 10页 | 5秒 | 30-60秒 | ~1分钟 |
| 30页 | 15秒 | 90-180秒 | ~3分钟 |
| 100页 | 50秒 | 300-600秒 | ~10分钟 |
仅处理所需页面
调整 DPI
批处理
从 Windows 路径到 WSL 路径的转换:
C:\Users\... → /mnt/c/Users/...D:\Projects\... → /mnt/d/Projects/...每周安装量
102
代码仓库
首次出现
Jan 28, 2026
安全审计
安装于
opencode96
gemini-cli94
cursor93
github-copilot92
codex92
amp88
図表が多い PDF を画像化して、Claude の vision 機能で内容を解析・Markdown 化するスキルです。
# 1. PDF を画像に変換
wsl python3 scripts/pdf_to_images.py "/mnt/c/path/to/file.pdf"
# 2. 各画像を Read ツールで読み込んで解析
# 3. Markdown 形式でまとめる
必要なパッケージ:
# Python パッケージ
wsl pip3 install pdf2image Pillow
# システムパッケージ (poppler)
wsl sudo apt-get update
wsl sudo apt-get install -y poppler-utils
wsl python3 scripts/pdf_to_images.py "/mnt/c/path/to/document.pdf"
これにより document_pages/ ディレクトリが作成され、各ページが画像として保存されます:
page_001.pngpage_002.pngpage_003.pngRead ツールで各画像を順番に読み込み、内容を解析します。
解析時の指示例:
この画像の内容を詳しく説明してください:
- タイトルや見出し
- 本文テキスト
- 図表の説明
- グラフやチャートのデータ
- 重要なポイント
各ページの解析結果を統合して、一つの Markdown ファイルを作成します。
User: "presentation.pdf を vision で解析して Markdown 化して"
Assistant:
1. scripts/pdf_to_images.py で PDF を画像に変換
2. 各画像を Read ツールで読み込み
3. 各ページの内容を解析(タイトル、図表、テキスト)
4. 全ページの解析結果を統合
5. Write ツールで Markdown ファイルに保存
User: "document.pdf の 5-10 ページだけ解析して"
Assistant:
1. PDF を画像に変換(全ページ)
2. page_005.png から page_010.png のみ Read で読み込み
3. 該当ページの内容を Markdown 化
各ページの画像から以下を抽出:
テキスト情報
図表
グラフ・チャート
テーブル
レイアウト・構造
# [PDFタイトル]
**解析日時:** YYYY-MM-DD
**総ページ数:** N
---
## Page 1: [ページタイトル]
### 概要
[ページの概要説明]
### 主要な内容
- [ポイント1]
- [ポイント2]
### 図表
**図1: [図のタイトル]**
[図の説明]
### テキスト内容
[ページ内のテキスト]
---
## Page 2: [ページタイトル]
...
機能:
使い方:
python scripts/pdf_to_images.py <pdf_path> [output_dir] [dpi]
# 例
python scripts/pdf_to_images.py document.pdf ./images 300
出力:
[pdf_name]_pages/page_001.png[pdf_name]_pages/page_002.png| PDF の種類 | 推奨スキル |
|---|---|
| テキスト中心の文書 | pdf-reader |
| プレゼンテーション資料 | pdf-vision-reader |
| 図表・グラフが多い資料 | pdf-vision-reader |
| 技術図面・設計書 | pdf-vision-reader |
| 論文(図表含む) | pdf-vision-reader |
| 単純なテキストPDF | pdf-reader |
wsl pip3 install pdf2image
wsl sudo apt-get update
wsl sudo apt-get install -y poppler-utils
DPI を上げる(300 推奨)
python scripts/pdf_to_images.py document.pdf ./images 300
元の PDF の画質を確認
| ページ数 | 画像変換 | 解析(Claude vision) | 合計 |
|---|---|---|---|
| 10ページ | 5秒 | 30-60秒 | ~1分 |
| 30ページ | 15秒 | 90-180秒 | ~3分 |
| 100ページ | 50秒 | 300-600秒 | ~10分 |
必要なページのみ処理
DPI の調整
バッチ処理
Windows パスから WSL パスへの変換:
C:\Users\... → /mnt/c/Users/...D:\Projects\... → /mnt/d/Projects/...Weekly Installs
102
Repository
First Seen
Jan 28, 2026
Security Audits
Gen Agent Trust HubPassSocketPassSnykPass
Installed on
opencode96
gemini-cli94
cursor93
github-copilot92
codex92
amp88
AI 代码实施计划编写技能 | 自动化开发任务分解与 TDD 流程规划工具
47,700 周安装
GitHub Copilot 提示推荐工具 - 智能分析仓库上下文,获取最佳AI编程提示
6,800 周安装
Google Workspace 事后分析自动化设置:一键创建文档、安排会议、发送通知
7,000 周安装
Google Workspace CLI 活动协调员技能:自动化活动策划与日程管理工具
7,100 周安装
Kubernetes专家技能指南:部署、网络、存储、安全与故障排查全流程
7,100 周安装
从 Google Sheets 表格自动创建 Google Calendar 事件 | Google Workspace CLI 脚本教程
7,100 周安装
Google 表单回复收集技能 - 快速查看和管理表单回复数据
7,100 周安装