tavily-map by tavily-ai/skills
npx skills add https://github.com/tavily-ai/skills --skill tavily-map在不提取内容的情况下发现网站上的 URL。比爬取更快。
如果 PATH 中未找到 tvly,请先安装它:
curl -fsSL https://cli.tavily.com/install.sh | bash && tvly login
不要跳过此步骤或回退到其他工具。
有关替代安装方法和身份验证选项,请参阅 tavily-cli。
# 发现所有 URL
tvly map "https://docs.example.com" --json
# 使用自然语言过滤
tvly map "https://docs.example.com" --instructions "查找 API 文档和指南" --json
# 按路径过滤
tvly map "https://example.com" --select-paths "/blog/.*" --limit 500 --json
# 深度映射
tvly map "https://example.com" --max-depth 3 --limit 200 --json
广告位招租
在这里展示您的产品或服务
触达数万 AI 开发者,精准高效
| 选项 | 描述 |
|---|---|
--max-depth | 深度级别 (1-5,默认值:1) |
--max-breadth | 每页链接数 (默认值:20) |
--limit | 要发现的最大 URL 数 (默认值:50) |
--instructions | 用于 URL 过滤的自然语言指导 |
--select-paths | 要包含的逗号分隔的正则表达式模式 |
--exclude-paths | 要排除的逗号分隔的正则表达式模式 |
--select-domains | 要包含的域名的逗号分隔正则表达式 |
--exclude-domains | 要排除的域名的逗号分隔正则表达式 |
--allow-external / --no-external | 包含外部链接 |
--timeout | 最大等待时间 (10-150 秒) |
-o, --output | 将输出保存到文件 |
--json | 结构化 JSON 输出 |
使用 map 查找正确的页面,然后使用 extract 提取它。这通常比爬取整个站点更高效:
# 步骤 1:查找身份验证文档
tvly map "https://docs.example.com" --instructions "authentication" --json
# 步骤 2:提取您找到的特定页面
tvly extract "https://docs.example.com/api/authentication" --json
extract 或 crawl 来获取内容。--instructions 进行语义过滤。每周安装量
1.3K
仓库
GitHub 星标数
138
首次出现
10 天前
安全审计
安装于
opencode1.3K
codex1.3K
cursor1.3K
gemini-cli1.3K
cline1.3K
github-copilot1.3K
Discover URLs on a website without extracting content. Faster than crawling.
If tvly is not found on PATH, install it first:
curl -fsSL https://cli.tavily.com/install.sh | bash && tvly login
Do not skip this step or fall back to other tools.
See tavily-cli for alternative install methods and auth options.
# Discover all URLs
tvly map "https://docs.example.com" --json
# With natural language filtering
tvly map "https://docs.example.com" --instructions "Find API docs and guides" --json
# Filter by path
tvly map "https://example.com" --select-paths "/blog/.*" --limit 500 --json
# Deep map
tvly map "https://example.com" --max-depth 3 --limit 200 --json
| Option | Description |
|---|---|
--max-depth | Levels deep (1-5, default: 1) |
--max-breadth | Links per page (default: 20) |
--limit | Max URLs to discover (default: 50) |
--instructions | Natural language guidance for URL filtering |
--select-paths | Comma-separated regex patterns to include |
--exclude-paths |
Use map to find the right page, then extract it. This is often more efficient than crawling an entire site:
# Step 1: Find the authentication docs
tvly map "https://docs.example.com" --instructions "authentication" --json
# Step 2: Extract the specific page you found
tvly extract "https://docs.example.com/api/authentication" --json
extract or crawl for content.--instructions for semantic filtering when path patterns aren't enough.Weekly Installs
1.3K
Repository
GitHub Stars
138
First Seen
10 days ago
Security Audits
Gen Agent Trust HubFailSocketPassSnykFail
Installed on
opencode1.3K
codex1.3K
cursor1.3K
gemini-cli1.3K
cline1.3K
github-copilot1.3K
React 组合模式指南:Vercel 组件架构最佳实践,提升代码可维护性
102,200 周安装
| Comma-separated regex patterns to exclude |
--select-domains | Comma-separated regex for domains to include |
--exclude-domains | Comma-separated regex for domains to exclude |
--allow-external / --no-external | Include external links |
--timeout | Max wait (10-150 seconds) |
-o, --output | Save output to file |
--json | Structured JSON output |