pdf-reader by childbamboo/claude-code-marketplace-sample
npx skills add https://github.com/childbamboo/claude-code-marketplace-sample --skill pdf-reader这是一个将 PDF 文件提取文本并转换为 Markdown 格式的技能。
# 在 WSL 环境中运行 Python 脚本
wsl python3 scripts/read_pdf.py "/mnt/c/path/to/file.pdf"
需要 pdfplumber 包:
wsl pip3 install pdfplumber
User: "读取 C:\Users\keita\repos\guideline.pdf"
Assistant:
1. 将 Windows 路径转换为 WSL 路径: /mnt/c/Users/keita/repos/guideline.pdf
2. 执行 wsl python3 scripts/read_pdf.py
3. 以 Markdown 格式显示提取的文本
User: "将 指南.pdf 转换为 Markdown 并保存"
Assistant:
1. 使用 scripts/read_pdf.py 提取文本
2. 以 Markdown 格式结构化(每页包含标题,也包括表格)
3. 使用 Write 工具保存到 指南.md
4. 报告保存完成
PDF ファイルをテキスト抽出して Markdown 形式に変換するスキルです。
# WSL環境でPythonスクリプトを実行
wsl python3 scripts/read_pdf.py "/mnt/c/path/to/file.pdf"
pdfplumber パッケージが必要です:
wsl pip3 install pdfplumber
User: "C:\Users\keita\repos\guideline.pdf を読み込んで"
Assistant:
1. Windowsパスを WSL パスに変換: /mnt/c/Users/keita/repos/guideline.pdf
2. wsl python3 scripts/read_pdf.py を実行
3. 抽出されたテキストを Markdown 形式で表示
User: "ガイドライン.pdf を Markdown に変換して保存"
Assistant:
1. scripts/read_pdf.py でテキスト抽出
2. Markdown形式で構造化(ページごとに見出し、テーブルも含む)
3. Write ツールで ガイドライン.md に保存
4. 保存完了を報告
广告位招租
在这里展示您的产品或服务
触达数万 AI 开发者,精准高效
C:\ → /mnt/c/)wsl python3 scripts/read_pdf.py# [PDF文件名]
**总页数:** 10
---
## 第 1 页
[第 1 页的文本内容]
### 表格
**表格 1:**
| 列1 | 列2 | 列3 |
| --- | --- | --- |
| 数据1 | 数据2 | 数据3 |
---
## 第 2 页
[第 2 页的文本内容]
---
Python 脚本位于 scripts/read_pdf.py。
主要功能:
用法:
python scripts/read_pdf.py <file_path>
wsl pip3 install pdfplumber
# 确认日语支持
wsl locale
# 确认包含 UTF-8
对于大型 PDF 文件,请考虑分页处理。
从 Windows 路径到 WSL 路径的转换:
C:\Users\... → /mnt/c/Users/...D:\Projects\... → /mnt/d/Projects/...\ 转换为斜杠 /可以修改脚本,使用切片如 pdf.pages[0:5]。
仅使用脚本中的 extract_tables() 部分。
结合使用 pytesseract 和 pdf2image(建议创建为单独技能)。
Weekly Installs
41
Repository
First Seen
Jan 28, 2026
Security Audits
Installed on
opencode39
cursor38
gemini-cli37
github-copilot37
codex37
kimi-cli36
C:\ → /mnt/c/)wsl python3 scripts/read_pdf.py を実行# [PDFファイル名]
**Total Pages:** 10
---
## Page 1
[ページ1のテキスト内容]
### Tables
**Table 1:**
| 列1 | 列2 | 列3 |
| --- | --- | --- |
| データ1 | データ2 | データ3 |
---
## Page 2
[ページ2のテキスト内容]
---
Python スクリプトは scripts/read_pdf.py に配置されています。
主な機能:
使い方:
python scripts/read_pdf.py <file_path>
wsl pip3 install pdfplumber
# 日本語対応の確認
wsl locale
# UTF-8 が含まれていることを確認
大きな PDF ファイルの場合、ページごとに分割して処理することを検討してください。
Windows パスから WSL パスへの変換:
C:\Users\... → /mnt/c/Users/...D:\Projects\... → /mnt/d/Projects/...\ をスラッシュ / に変換スクリプトを修正して pdf.pages[0:5] のようにスライスを使用できます。
スクリプト内の extract_tables() 部分のみを使用します。
pytesseract と pdf2image を組み合わせて使用します(別スキルとして作成推奨)。
Weekly Installs
41
Repository
First Seen
Jan 28, 2026
Security Audits
Installed on
opencode39
cursor38
gemini-cli37
github-copilot37
codex37
kimi-cli36
Apify Actor 输出模式生成工具 - 自动化创建 dataset_schema.json 与 output_schema.json
1,300 周安装