PDF Converter by claude-office-skills/skills
npx skills add https://github.com/claude-office-skills/skills --skill 'PDF Converter'将 PDF 文件转换为多种格式,或从其他格式转换为 PDF,同时保留格式。
此技能可帮助您:
| 目标格式 | 最适合 | 质量 |
|---|---|---|
| Word (.docx) | 文字密集型文档 | ⭐⭐⭐⭐ |
| Excel (.xlsx) | 表格和数据 | ⭐⭐⭐⭐ |
| PowerPoint (.pptx) | 演示文稿 | ⭐⭐⭐ |
| Images (.png/.jpg) | 视觉快照 | ⭐⭐⭐⭐⭐ |
| Text (.txt) | 纯文本提取 | ⭐⭐⭐⭐ |
广告位招租
在这里展示您的产品或服务
触达数万 AI 开发者,精准高效
| HTML | 网页内容 | ⭐⭐⭐ |
| Markdown (.md) | 结构化文本 | ⭐⭐⭐ |
| 源格式 | 质量说明 |
|---|---|
| Word (.docx) | 格式保留极佳 |
| Excel (.xlsx) | 良好,需检查分页符 |
| PowerPoint (.pptx) | 极佳,动画将被扁平化 |
| Images | 取决于分辨率 |
| HTML | 效果不一,CSS 可能不同 |
| Text (.txt) | 完美,但格式简单 |
"Convert this PDF to Word"
"Save this document as PDF"
"Extract this PDF as images"
"Convert PDF to Word, preserve exact formatting"
"Export PDF pages 1-5 as PNG images at 300 DPI"
"Convert Excel to PDF, fit all columns on one page"
"Convert all PDFs in this folder to Word documents"
"Create PDFs from these 10 Word files"
## PDF 转 Word 转换
### 最佳实践
1. **检查源 PDF 类型**:
- 原生 PDF(来自 Word 等):效果最佳
- 扫描的 PDF:先使用 OCR
- 基于图像的 PDF:准确性有限
2. **格式注意事项**:
- 复杂布局可能移位
- 字体未安装则会被替换
- 表格可能需要调整
- 页眉/页脚需要检查
### 质量设置
| 设置 | 结果 |
|---------|--------|
| **Exact** | 精确匹配布局,较难编辑 |
| **Editable** | 为编辑优化,布局可能移位 |
| **Text only** | 纯文本,无格式 |
### 常见问题
| 问题 | 解决方案 |
|-------|----------|
| 文本显示为图像 | 转换前运行 OCR |
| 缺少字体 | 嵌入或替换字体 |
| 表格损坏 | 在 Word 中手动调整 |
| 颜色丢失 | 检查颜色配置文件设置 |
## PDF 转 Excel 转换
### 理想源文件
- 具有清晰表格结构的 PDF
- 财务报表
- 数据报告
- 包含明细项目的发票
### 提取方法
| 方法 | 适用场景 |
|--------|----------|
| **Auto-detect tables** | 表格边框清晰 |
| **Select area** | 表格无边框 |
| **Full page** | 整个页面都是数据 |
### 质量提示
1. 确保 PDF 具有可选文本(非扫描件)
2. 清晰的表格边框有助于检测
3. 合并单元格可能导致问题
4. 跨页表格需要手动合并
### 数据清理
转换后,检查:
- [ ] 列对齐
- [ ] 数字格式
- [ ] 日期格式
- [ ] 合并单元格处理
- [ ] 标题行检测
## PDF 转图像转换
### 分辨率设置
| DPI | 使用场景 | 文件大小 |
|-----|----------|-----------|
| 72 | 屏幕查看 | 小 |
| 150 | 电子邮件/网页 | 中等 |
| 300 | 打印质量 | 大 |
| 600 | 高质量打印 | 非常大 |
### 格式选择
| 格式 | 最适合 |
|--------|----------|
| **PNG** | 文本、图形、透明度 |
| **JPG** | 照片、文件较小 |
| **TIFF** | 印刷制作 |
| **WebP** | 网页优化 |
### 输出选项
- 所有页面 → 单独的图像
- 特定页面 → 选定的图像
- 页面范围 → 批量导出
## 转换为 PDF
### 从 Word 转换
**设置**:
- [ ] 嵌入字体
- [ ] 包含书签
- [ ] 设置为 PDF/A 用于存档
- [ ] 压缩图像(可选)
### 从 Excel 转换
**设置**:
- [ ] 定义打印区域
- [ ] 设置分页符
- [ ] 选择方向
- [ ] 适应页面选项
### 从 PowerPoint 转换
**设置**:
- [ ] 幻灯片范围
- [ ] 包含备注(可选)
- [ ] 质量级别
- [ ] 讲义格式(可选)
### 通用提示
1. 先在打印预览中检查
2. 检查分页符
3. 确保字体已嵌入
4. 验证超链接是否有效
## 批量转换任务
**源文件**:[文件夹路径]
**目标格式**:[格式]
**输出文件夹**:[路径]
### 待转换文件
| 文件 | 页面 | 状态 |
|------|-------|--------|
| document1.pdf | All | ✅ 完成 |
| document2.pdf | All | ✅ 完成 |
| document3.pdf | 1-5 | ⏳ 处理中 |
### 应用的设置
- 分辨率:[X] DPI
- 质量:[High/Medium/Low]
- 命名:[原始名称]_converted.[ext]
### 摘要
- 总文件数:[X]
- 成功数:[Y]
- 失败数:[Z]
| 问题 | 原因 | 解决方案 |
|---|---|---|
| 文本不可选 | 扫描的 PDF | 先应用 OCR |
| 字符缺失 | 字体问题 | 嵌入字体或转换 |
| 图像质量差 | DPI 过低 | 使用更高分辨率 |
| 文件体积大 | 未压缩 | 应用压缩 |
| 格式丢失 | 布局复杂 | 使用 "exact" 模式 |
转换后,请验证:
每周安装次数
0
仓库
GitHub 星标数
5
首次出现时间
1970年1月1日
安全审计
Convert PDF files to various formats and vice versa while preserving formatting.
This skill helps you:
| Target Format | Best For | Quality |
|---|---|---|
| Word (.docx) | Text-heavy documents | ⭐⭐⭐⭐ |
| Excel (.xlsx) | Tables and data | ⭐⭐⭐⭐ |
| PowerPoint (.pptx) | Presentations | ⭐⭐⭐ |
| Images (.png/.jpg) | Visual snapshots | ⭐⭐⭐⭐⭐ |
| Text (.txt) | Plain text extraction | ⭐⭐⭐⭐ |
| HTML | Web content | ⭐⭐⭐ |
| Markdown (.md) | Structured text | ⭐⭐⭐ |
| Source Format | Quality Notes |
|---|---|
| Word (.docx) | Excellent preservation |
| Excel (.xlsx) | Good, check page breaks |
| PowerPoint (.pptx) | Excellent with animations flat |
| Images | Depends on resolution |
| HTML | Variable, CSS may differ |
| Text (.txt) | Perfect, but basic |
"Convert this PDF to Word"
"Save this document as PDF"
"Extract this PDF as images"
"Convert PDF to Word, preserve exact formatting"
"Export PDF pages 1-5 as PNG images at 300 DPI"
"Convert Excel to PDF, fit all columns on one page"
"Convert all PDFs in this folder to Word documents"
"Create PDFs from these 10 Word files"
## PDF to Word Conversion
### Best Practices
1. **Check source PDF type**:
- Native PDF (from Word/etc): Best results
- Scanned PDF: Use OCR first
- Image-based: Limited accuracy
2. **Formatting considerations**:
- Complex layouts may shift
- Fonts substitute if not installed
- Tables may need adjustment
- Headers/footers require review
### Quality Settings
| Setting | Result |
|---------|--------|
| **Exact** | Matches layout precisely, harder to edit |
| **Editable** | Optimized for editing, may shift layout |
| **Text only** | Plain text, no formatting |
### Common Issues
| Issue | Solution |
|-------|----------|
| Text as image | Run OCR before converting |
| Missing fonts | Embed or substitute fonts |
| Broken tables | Manually adjust in Word |
| Lost colors | Check color profile settings |
## PDF to Excel Conversion
### Ideal Sources
- PDF with clear table structure
- Financial statements
- Data reports
- Invoices with line items
### Extraction Methods
| Method | Use When |
|--------|----------|
| **Auto-detect tables** | Clear table borders |
| **Select area** | Tables without borders |
| **Full page** | Entire page is data |
### Quality Tips
1. Ensure PDF has selectable text (not scanned)
2. Clean table borders help detection
3. Merged cells may cause issues
4. Multi-page tables need manual merge
### Data Cleanup
After conversion, check:
- [ ] Column alignment
- [ ] Number formatting
- [ ] Date formats
- [ ] Merged cell handling
- [ ] Header row detection
## PDF to Image Conversion
### Resolution Settings
| DPI | Use Case | File Size |
|-----|----------|-----------|
| 72 | Screen viewing | Small |
| 150 | Email/web | Medium |
| 300 | Print quality | Large |
| 600 | High-quality print | Very large |
### Format Selection
| Format | Best For |
|--------|----------|
| **PNG** | Text, graphics, transparency |
| **JPG** | Photos, smaller files |
| **TIFF** | Print production |
| **WebP** | Web optimization |
### Output Options
- All pages → separate images
- Specific pages → selected images
- Page range → batch export
## Converting to PDF
### From Word
**Settings**:
- [ ] Embed fonts
- [ ] Include bookmarks
- [ ] Set PDF/A for archival
- [ ] Compress images (optional)
### From Excel
**Settings**:
- [ ] Define print area
- [ ] Set page breaks
- [ ] Choose orientation
- [ ] Fit to page options
### From PowerPoint
**Settings**:
- [ ] Slide range
- [ ] Include notes (optional)
- [ ] Quality level
- [ ] Handout format (optional)
### Universal Tips
1. Review in print preview first
2. Check page breaks
3. Ensure fonts are embedded
4. Verify hyperlinks work
## Batch Conversion Job
**Source**: [Folder path]
**Target Format**: [Format]
**Output Folder**: [Path]
### Files to Convert
| File | Pages | Status |
|------|-------|--------|
| document1.pdf | All | ✅ Complete |
| document2.pdf | All | ✅ Complete |
| document3.pdf | 1-5 | ⏳ Processing |
### Settings Applied
- Resolution: [X] DPI
- Quality: [High/Medium/Low]
- Naming: [Original name]_converted.[ext]
### Summary
- Total files: [X]
- Successful: [Y]
- Failed: [Z]
| Problem | Cause | Solution |
|---|---|---|
| Text not selectable | Scanned PDF | Apply OCR first |
| Missing characters | Font issues | Embed fonts or convert |
| Poor image quality | Low DPI | Use higher resolution |
| Large file size | Uncompressed | Apply compression |
| Lost formatting | Complex layout | Use "exact" mode |
After conversion, verify:
Weekly Installs
0
Repository
GitHub Stars
5
First Seen
Jan 1, 1970
Security Audits
Python PDF处理教程:合并拆分、提取文本表格、创建PDF文件
58,600 周安装