web-research-workflow by yonatangross/orchestkit
npx skills add https://github.com/yonatangross/orchestkit --skill web-research-workflow统一处理网络内容研究的方案,能自动为每种情况选择最合适的工具。
URL to research
│
▼
┌─────────────────┐
│ 1. 尝试 WebFetch │ ← 快速、免费、无开销
│ (始终尝试) │
└─────────────────┘
│
内容正常? ──是──► 解析并返回
│
否 (空/部分/<500 字符)
│
▼
┌───────────────────────┐
│ 2. 设置了 TAVILY_API_KEY?│
└───────────────────────┘
│ │
是 否 ──► 跳至步骤 3
│
▼
┌───────────────────────────┐
│ Tavily 搜索/提取/ │ ← 原始 markdown,批量 URL
│ 爬取/研究 │
└───────────────────────────┘
│
内容正常? ──是──► 解析并返回
│
否 (JS渲染/需要认证)
│
▼
┌─────────────────────┐
│ 3. 使用 agent-browser │ ← 完整浏览器,最后手段
└─────────────────────┘
│
├─ SPA (react/vue/angular) ──► wait --load networkidle
├─ 需要登录 ──► 认证流程 + 状态保存
├─ 动态内容 ──► wait --text "预期内容"
└─ 多页面 ──► 爬取模式
当设置了 TAVILY_API_KEY 时,Tavily 在 WebFetch 和 agent-browser 之间提供了一个强大的中间层。它返回原始 markdown 内容,支持批量 URL 提取,并提供带有相关性评分的语义搜索。如果未设置 TAVILY_API_KEY,三层决策树会自动退化为两层(WebFetch → agent-browser)。
广告位招租
在这里展示您的产品或服务
触达数万 AI 开发者,精准高效
加载详情:Read("${CLAUDE_SKILL_DIR}/rules/tool-selection.md") 以获取何时使用何种工具的表格、升级启发式方法、SPA 检测模式和成本意识。
加载详情:Read("${CLAUDE_SKILL_DIR}/references/tavily-api.md") 以获取搜索、提取、映射、爬取和研究端点的示例和选项。
对于需要 JavaScript 渲染、身份验证或多页面爬取的内容,回退到 agent-browser。
加载详情:Read("${CLAUDE_SKILL_DIR}/rules/browser-patterns.md") 以获取自动回退、身份验证流程、多页面研究模式、最佳实践和故障排除。
跟踪竞争对手网站在定价、功能、定位和内容方面的变化。
加载详情:Read("${CLAUDE_SKILL_DIR}/rules/monitoring-competitor.md") 以获取快照捕获、结构化数据提取和变更分类。
加载详情:Read("${CLAUDE_SKILL_DIR}/rules/monitoring-change-detection.md") 以获取差异检测、结构化比较、Tavily 站点发现和 CI 自动化。
| 严重性 | 示例 | 操作 |
|---|---|---|
| 严重 | 价格上涨/下降,主要功能变更 | 立即告警 |
| 高 | 新增功能,功能移除 | 需要审查 |
| 中 | 文案更改,定位调整 | 记录以供分析 |
| 低 | 拼写错误,次要样式调整 | 仅记录 |
此技能被以下智能体使用:
web-research-analyst - 主要用户market-intelligence - 竞争对手研究product-strategist - 深度竞争分析browser-content-capture - 详细的浏览器模式agent-browser - CLI 参考版本: 1.3.0 (2026年2月)
每周安装数
86
代码仓库
GitHub 星标数
132
首次出现
2026年2月6日
安全审计
安装于
gemini-cli82
opencode82
github-copilot81
codex80
cursor79
amp76
Unified approach for web content research that automatically selects the right tool for each situation.
URL to research
│
▼
┌─────────────────┐
│ 1. Try WebFetch │ ← Fast, free, no overhead
│ (always try) │
└─────────────────┘
│
Content OK? ──Yes──► Parse and return
│
No (empty/partial/<500 chars)
│
▼
┌───────────────────────┐
│ 2. TAVILY_API_KEY set?│
└───────────────────────┘
│ │
Yes No ──► Skip to step 3
│
▼
┌───────────────────────────┐
│ Tavily search/extract/ │ ← Raw markdown, batch URLs
│ crawl/research │
└───────────────────────────┘
│
Content OK? ──Yes──► Parse and return
│
No (JS-rendered/auth-required)
│
▼
┌─────────────────────┐
│ 3. Use agent-browser │ ← Full browser, last resort
└─────────────────────┘
│
├─ SPA (react/vue/angular) ──► wait --load networkidle
├─ Login required ──► auth flow + state save
├─ Dynamic content ──► wait --text "Expected"
└─ Multi-page ──► crawl pattern
When TAVILY_API_KEY is set, Tavily provides a powerful middle tier between WebFetch and agent-browser. It returns raw markdown content, supports batch URL extraction, and offers semantic search with relevance scoring. If TAVILY_API_KEY is not set, the 3-tier tree collapses to 2-tier (WebFetch → agent-browser) automatically.
Load details: Read("${CLAUDE_SKILL_DIR}/rules/tool-selection.md") for when-to-use-what tables, escalation heuristics, SPA detection patterns, and cost awareness.
Load details: Read("${CLAUDE_SKILL_DIR}/references/tavily-api.md") for Search, Extract, Map, Crawl, and Research endpoint examples and options.
For content requiring JavaScript rendering, authentication, or multi-page crawling, fall back to agent-browser.
Load details: Read("${CLAUDE_SKILL_DIR}/rules/browser-patterns.md") for auto-fallback, authentication flow, multi-page research patterns, best practices, and troubleshooting.
Track competitor websites for changes in pricing, features, positioning, and content.
Load details: Read("${CLAUDE_SKILL_DIR}/rules/monitoring-competitor.md") for snapshot capture, structured data extraction, and change classification.
Load details: Read("${CLAUDE_SKILL_DIR}/rules/monitoring-change-detection.md") for diff detection, structured comparison, Tavily site discovery, and CI automation.
| Severity | Examples | Action |
|---|---|---|
| Critical | Price increase/decrease, major feature change | Immediate alert |
| High | New feature added, feature removed | Review required |
| Medium | Copy changes, positioning shift | Note for analysis |
| Low | Typos, minor styling | Log only |
This skill is used by:
web-research-analyst - Primary usermarket-intelligence - Competitor researchproduct-strategist - Deep competitive analysisbrowser-content-capture - Detailed browser patternsagent-browser - CLI referenceVersion: 1.3.0 (February 2026)
Weekly Installs
86
Repository
GitHub Stars
132
First Seen
Feb 6, 2026
Security Audits
Gen Agent Trust HubPassSocketPassSnykWarn
Installed on
gemini-cli82
opencode82
github-copilot81
codex80
cursor79
amp76
README 国际化工具:自动化翻译与多语言文档管理 | readme-i18n
46,000 周安装
AWS 成本优化与运维监控技能 - 集成 MCP 服务器实现成本估算、分析、监控与安全审计
213 周安装
Umbraco Playwright 测试助手 - 官方 E2E 测试工具包 | 自动化测试
72 周安装
Reddit信息获取工具:使用Gemini CLI和Reddit JSON API抓取数据教程
215 周安装
TypeScript最佳实践指南:AI代理代码规范、类型安全与架构模式
217 周安装
Linux系统管理命令大全:系统信息、资源监控、服务管理与故障排除实战指南
213 周安装
Imagen AI图像生成技能 - 使用Google Gemini模型一键生成图片,支持前端开发、文档插图
216 周安装