csv-data-wrangler by 404kidwiz/claude-supercode-skills
npx skills add https://github.com/404kidwiz/claude-supercode-skills --skill csv-data-wrangler提供高效的 CSV 文件处理、数据清洗和转换的专业知识。处理大型文件、编码问题、格式错误的数据,并为表格数据工作流进行性能优化。
在以下情况调用此技能:
在以下情况不要调用:
工具选择(按文件大小):
├── < 100MB → pandas
├── 100MB - 1GB → pandas 分块处理或 polars
├── 1GB - 10GB → DuckDB 或 polars
├── > 10GB → DuckDB、Spark 或流式处理
└── 快速探索 → csvkit 或 xsv 命令行工具
处理类型:
├── 类 SQL 查询 → DuckDB
├── 复杂转换 → pandas/polars
├── 简单过滤 → csvkit/xsv
└── 流式处理 → Python csv 模块
广告位招租
在这里展示您的产品或服务
触达数万 AI 开发者,精准高效
| 反面模式 | 问题 | 正确方法 |
|---|---|---|
| 全部加载到内存 | 大文件导致内存不足 | 使用分块或流式处理 |
| 猜测编码 | 字符损坏 | 先用 chardet 检测 |
| 忽略引号 | 字段解析错误 | 使用正确的 CSV 解析器 |
| 不进行验证 | 数据静默损坏 | 验证行/列计数 |
| 手动字符串分割 | 在边界情况下出错 | 使用 csv 模块或 pandas |
每周安装次数
119
代码仓库
GitHub 星标数
43
首次出现
2026年1月24日
安全审计
安装于
opencode98
codex94
gemini-cli94
cursor83
claude-code83
github-copilot81
Provides expertise in efficient CSV file processing, data cleaning, and transformation. Handles large files, encoding issues, malformed data, and performance optimization for tabular data workflows.
Invoke this skill when:
Do NOT invoke when:
Tool Selection by File Size:
├── < 100MB → pandas
├── 100MB - 1GB → pandas with chunking or polars
├── 1GB - 10GB → DuckDB or polars
├── > 10GB → DuckDB, Spark, or streaming
└── Quick exploration → csvkit or xsv CLI
Processing Type:
├── SQL-like queries → DuckDB
├── Complex transforms → pandas/polars
├── Simple filtering → csvkit/xsv
└── Streaming → Python csv module
| Anti-Pattern | Problem | Correct Approach |
|---|---|---|
| Loading all to memory | OOM on large files | Use chunking or streaming |
| Guessing encoding | Corrupted characters | Detect with chardet first |
| Ignoring quoting | Broken field parsing | Use proper CSV parser |
| No validation | Silent data corruption | Validate row/column counts |
| Manual string splitting | Breaks on edge cases | Use csv module or pandas |
Weekly Installs
119
Repository
GitHub Stars
43
First Seen
Jan 24, 2026
Security Audits
Gen Agent Trust HubPassSocketPassSnykPass
Installed on
opencode98
codex94
gemini-cli94
cursor83
claude-code83
github-copilot81
Python PDF处理教程:合并拆分、提取文本表格、创建PDF文件
62,000 周安装