xiaohongshu-search-summarizer by piekill/xiaohongshu-summarizer-skill
npx skills add https://github.com/piekill/xiaohongshu-summarizer-skill --skill xiaohongshu-search-summarizer此技能自动化从小红书提取高质量多模态内容(文本 + 图片)的过程,并主动协助您为用户生成一份深度整合、分析性的最终报告。由于小红书具有激进的防爬虫机制,直接发送 HTTP 请求或简单的爬取通常会导致 404 错误或被封禁。此技能通过在有头浏览器窗口中模拟真实用户使用 playwright-cli,原生地绕过了这些限制。
它分两个不同的阶段运行:
[关键词]_raw_data.md)。[关键词]_raw_data.md 文件。playwright-cli(必须在路径中可用)广告位招租
在这里展示您的产品或服务
触达数万 AI 开发者,精准高效
python3(需要用于下载图片和拼接原始数据 Markdown)requests Python 包(pip install requests)—— 被 parse.py 用于下载图片执行 scripts/run.sh 中的包装脚本。它接受以下参数:
/bin/bash <skill_dir>/scripts/run.sh "YOUR KEYWORD" <MAX_POSTS> <OUTPUT_DIRECTORY>
YOUR KEYWORD : 要在小红书上查找的搜索词。<MAX_POSTS>: (可选,默认值 = 10)要扫描的热门帖子数量。<OUTPUT_DIRECTORY>: (可选,默认值 = ./)保存原始数据和图片的目录。执行示例:
/bin/bash ~/.claude/skills/xiaohongshu-search-summarizer/scripts/run.sh "openclaw使用场景" 10 "./xhs_report_openclaw_scenarios"
一旦 bash 脚本成功完成,导航到 OUTPUT_DIRECTORY 并使用您的文件读取能力来摄取生成的 [关键词]_raw_data.md 文件。
在此文件中,您将找到描述、评论以及指向 post_X_img_Y.webp 或 post_X_img_Y.jpg 的文件路径。
这是最关键的一步。 不要只是将原始的 Markdown 文件返回给用户。相反,请撰写一份经过润色的综合性 Markdown 报告,以逻辑方式重新组织信息,同时保留高水平的细节。
遵循以下严格的汇编规则:
.webp 或 .jpg 图片文件使用您的文件读取和视觉能力,以解读其内容。<OUTPUT_DIRECTORY> 中(例如,<OUTPUT_DIRECTORY>/[关键词]_synthesis.md),并将路径提供给用户。如果在浏览器调用期间遇到 404 Not Found 或"元素不可见"错误:
playwright-cli 浏览器窗口并手动执行必要的身份验证,然后重试脚本。每周安装数
115
代码仓库
GitHub 星标数
1
首次出现
2026年3月4日
安全审计
安装于
opencode113
kimi-cli112
gemini-cli112
amp112
cline112
github-copilot112
Python PDF处理教程:合并拆分、提取文本表格、创建PDF文件
65,000 周安装