tavily-extract by tavily-ai/skills
npx skills add https://github.com/tavily-ai/skills --skill tavily-extract从一个或多个 URL 中提取干净的 Markdown 或文本内容。
如果 PATH 中找不到 tvly,请先安装它:
curl -fsSL https://cli.tavily.com/install.sh | bash && tvly login
请不要跳过此步骤或回退到其他工具。
有关其他安装方法和身份验证选项,请参阅 tavily-cli。
# 单个 URL
tvly extract "https://example.com/article" --json
# 多个 URL
tvly extract "https://example.com/page1" "https://example.com/page2" --json
# 查询聚焦提取(仅返回相关片段)
tvly extract "https://example.com/docs" --query "authentication API" --chunks-per-source 3 --json
# JavaScript 密集型页面
tvly extract "https://app.example.com" --extract-depth advanced --json
# 保存到文件
tvly extract "https://example.com/article" -o article.md
广告位招租
在这里展示您的产品或服务
触达数万 AI 开发者,精准高效
| 选项 | 描述 |
|---|---|
--query | 根据与此查询的相关性对片段重新排序 |
--chunks-per-source | 每个 URL 的片段数 (1-5,需要 --query) |
--extract-depth | basic (默认) 或 advanced (针对 JS 页面) |
--format | markdown (默认) 或 text |
--include-images | 包含图片 URL |
--timeout | 最大等待时间 (1-60 秒) |
-o, --output | 将输出保存到文件 |
--json | 结构化 JSON 输出 |
| 深度 | 使用时机 |
|---|---|
basic | 简单页面,速度快 — 首先尝试此选项 |
advanced | JS 渲染的单页应用、动态内容、表格 |
--query + --chunks-per-source 来仅获取相关内容,而不是整个页面。basic,如果内容缺失则回退到 advanced。--timeout (最多 60 秒)。--include-raw-content),可以跳过提取步骤。每周安装量
1.4K
代码仓库
GitHub 星标数
132
首次出现
9 天前
安全审计
安装于
opencode1.3K
codex1.3K
cursor1.3K
gemini-cli1.3K
github-copilot1.3K
kimi-cli1.3K
Extract clean markdown or text content from one or more URLs.
If tvly is not found on PATH, install it first:
curl -fsSL https://cli.tavily.com/install.sh | bash && tvly login
Do not skip this step or fall back to other tools.
See tavily-cli for alternative install methods and auth options.
# Single URL
tvly extract "https://example.com/article" --json
# Multiple URLs
tvly extract "https://example.com/page1" "https://example.com/page2" --json
# Query-focused extraction (returns relevant chunks only)
tvly extract "https://example.com/docs" --query "authentication API" --chunks-per-source 3 --json
# JS-heavy pages
tvly extract "https://app.example.com" --extract-depth advanced --json
# Save to file
tvly extract "https://example.com/article" -o article.md
| Option | Description |
|---|---|
--query | Rerank chunks by relevance to this query |
--chunks-per-source | Chunks per URL (1-5, requires --query) |
--extract-depth | basic (default) or advanced (for JS pages) |
--format | markdown (default) or |
| Depth | When to use |
|---|---|
basic | Simple pages, fast — try this first |
advanced | JS-rendered SPAs, dynamic content, tables |
--query + --chunks-per-source to get only relevant content instead of full pages.basic first, fall back to advanced if content is missing.--timeout for slow pages (up to 60s).--include-raw-content), skip the extract step.Weekly Installs
1.4K
Repository
GitHub Stars
132
First Seen
9 days ago
Security Audits
Gen Agent Trust HubFailSocketPassSnykFail
Installed on
opencode1.3K
codex1.3K
cursor1.3K
gemini-cli1.3K
github-copilot1.3K
kimi-cli1.3K
React 组合模式指南:Vercel 组件架构最佳实践,提升代码可维护性
102,200 周安装
text--include-images | Include image URLs |
--timeout | Max wait time (1-60 seconds) |
-o, --output | Save output to file |
--json | Structured JSON output |