back
loading skill details...
爬取抖音爆款视频和文案数据。当用户用自然语言说"搜索一下XX视频"、"帮我搜抖音XX"、"抖音上找XX"等意图时,自动提取关键词并执行搜索。也支持获取热榜。
--- name: douyin-scraper description: 爬取抖音爆款视频和文案数据。当用户用自然语言说"搜索一下XX视频"、"帮我搜抖音XX"、"抖音上找XX"等意图时,自动提取关键词并执行搜索。也支持获取热榜。 --- # 抖音爆款爬虫 Skill ## 何时触发 当用户的消息包含以下意图时,使用本 skill: - **搜索视频**:「搜索一下海鲜视频」「帮我搜抖音上的美食」「抖音搜小龙虾」「找一下XX相关的视频」 - **获取热榜**:「抖音热榜」「看看抖音热门」「今天抖音什么火」 - **关键词提取**:从自然语言中提取核心搜索词 ## 关键词提取规则 1. 去掉「搜索一下」「帮我搜」「找一下」「抖音上」等意图词 2. 去掉「视频」「相关」「的」等冗余词 3. 保留核心名词/短语作为 keyword 4. 示例: - 「搜索一下海鲜视频」→ `海鲜` - 「帮我搜抖音上卖海鲜的」→ `卖海鲜` - 「找一下小龙虾做法」→ `小龙虾做法` ## 搜索流程 ### Step 1: 运行脚本 ```bash cd /root/.openclaw/workspace/douyin-scraper && python scripts/scraper.py search --keyword "<关键词>" --limit 10 ``` ### Step 2: 检查结果 - 如果输出包含 `✅ 获取到` → 真实数据,直接展示给用户 - 如果输出包含 `示例数据` → Playwright 被抖音反爬拦截,进入 Step 3 ### Step 3: web_search 降级(重要!) 当脚本返回 mock 数据时,**必须**使用 `web_search` 工具作为降级方案: ``` web_search: query="site:douyin.com <关键词>" count=10 ``` 从搜索结果中提取: - `title` → 视频标题 - `url` → 视频链接(必须是 douyin.com 域名) - `description` → 视频描述/摘要 然后以统一格式展示给用户。 ### Step 4: 展示结果 无论数据来源,统一按以下格式展示: ``` 🔍 抖音搜索:<关键词> 共找到 N 条结果 1. **视频标题** 作者: xxx | 👍 点赞数 | 🔗 链接 2. ... ``` ## 热榜流程 同理,先运行脚本,失败则用 `web_search: query="抖音热榜"` 降级。 ## 注意事项 - Playwright + Chromium 已预装,但抖音有反爬机制,headless 模式大概率被拦截 - web_search 降级是主要可用路径,务必执行 - 仅供学习研究使用
don't have the plugin yet? install it then click "run inline in claude" again.