back
loading skill details...
自动提取抖音分享文案中的视频链接,极速转录视频语音并结构化总结核心内容。
# 抖音视频文案提取与总结 Workflow ## 📋 概述 本 Skill 用于从抖音分享文案中自动提取视频链接,利用云端大模型极速转录视频语音,并对文案进行结构化总结。 **适用场景:** 用户发送包含抖音短网址(如 `v.douyin.com/...`)的杂乱分享文案,希望快速获取视频核心内容。 **默认行为:** 自动正则提取链接 -> 下载视频 -> 调用硅基流动极速提取文案 -> 直接总结。如用户明确要求只输出完整文案则只输出原文。 --- ## 🔧 前置条件与 Agent 约束 (🚨 必读) ### 1. 脚本位置与寻址指令 本 Skill 目录下的 `douyin_skill.py`(始终与你正在阅读的 `SKILL.md` 同目录)。 > 🚨 Agent 寻址约束: > 在执行任何 Python 命令前,你必须先通过 `cd` 命令切换到当前这份 `SKILL.md` 所在的绝对路径(在 OpenClaw 环境下通常为 `~/.openclaw/workspace/skills/douyin_extractor/`)。 ### 2. 环境依赖与安装策略 运行脚本需要以下 Python 包: ``` requests yt-dlp ``` > 🚨 Agent 依赖安装约束: > 绝对不要在每次执行前主动安装依赖! > 只有当你运行 `douyin_skill.py` 时明确遇到了 `ModuleNotFoundError` 报错,你才被允许执行以下安装命令并重试: > `pip install requests yt-dlp --target=/tmp/pylibs` ### 3. 环境变量 音频极速转录依赖的 API 密钥需由人类开发者在 `~/.openclaw/.env` 中配置: ```bash SF_API_KEY=sk-你的硅基流动API密钥 ``` --- ## 🚀 标准执行流程 ### Step 1:提取与转录 确保已 `cd` 到本技能目录后,直接将用户发送的**整段原始分享文案**作为参数传入执行。 命令模板 (Agent 严格遵守): > 注意:命令会自动尝试加载系统的 .env 文件获取真实密钥。你绝不能在命令中自行捏造或填写 `SF_API_KEY=sk-xxx` 这样的明文参数。 ```bash # 自动寻找并加载环境变量,然后使用相对路径执行脚本 if [ -f ~/.openclaw/.env ]; then source ~/.openclaw/.env; fi && PYTHONPATH=/tmp/pylibs python3 douyin_skill.py "<包含链接的整段分享文案>" ``` 执行时长预估: 5秒~15秒(取决于视频长度和网络下载速度) ### Step 2:自动总结(默认行为) 提取文案完成后(读取终端中返回的 `【视频标题】` 和 `【原始转录文案】` 纯文本),默认进行总结,使用以下提示词自我要求: ``` 你是一个高效的信息处理和投资/知识提炼助手,阅读这段转录文本,精准总结核心思想。排版要清晰,直击要点。 要求: 1. 核心观点:用一句话高度概括。 2. 关键要点:提取视频里的核心论点或事实(使用列表说明)。 3. 高光金句:提取最具价值的一句话(如段永平的投资建议等)。 4. 滤除杂音:忽略视频中可能存在的无意义语气词或片头片尾口播。 ``` ### Step 3:用户要求完整内容时 仅当用户明确要求"完整输出"、"不要总结"、"给我原始文案"时,才完整输出转录内容,不做任何总结。 提示词: ``` 请完整输出上方提取的视频标题和原始转录文案,不要做任何总结或删减。 ``` --- ## ⚠️ 注意事项 ### 1. 链接自动提取 脚本内部已包含针对混乱文案的正则表达式,Agent **无需**自己去抠链接,直接把用户发的原话(如 `5.10 复制打开抖音,看看... https://v.douyin.com/... QkC:/ f@O.KW`)用双引号包裹传给脚本即可。 ### 2. 环境变量问题 (Agent 注意) 绝对不要在命令中显式传入你瞎猜的 API Key。如果脚本返回 `执行失败:系统未配置硅基流动 API Key`,说明开发者未正确配置,请直接按照下方的"故障排查"回复用户。 ### 3. 视频下载与清理 * 脚本采取极轻量级方案,直接下载 `.mp4` 原文件并提交给硅基流动,不使用 FFmpeg 进行音视频分离。 * 提取完成后,脚本会自动删除 `./temp_douyin` 目录下的临时视频。 * 如发现异常残留,Agent 可通过命令清理: ```bash rm -rf ./temp_douyin/*.mp4 ``` --- ## 📝 总结模板示例 ```markdown # 🎬 视频总结:[视频标题] ## 🎯 核心观点 > [一句话概括视频想表达的核心思想] ## 📝 关键要点提炼 - [提取关键点 1] - [提取关键点 2] - [提取关键点 3] ## 💡 高光金句 [提取视频中最具启发性、最核心的一句话,或你作为专家的总结陈词] --- *附:原视频链接* [提取出的纯净 URL] ``` --- ## 🔄 完整对话流程示例 ``` 用户:帮我看看这个 5.10 复制打开抖音,看看【段永平投资之道】... [https://v.douyin.com/LlSh03J3OIY/](https://v.douyin.com/LlSh03J3OIY/) QkC:/ f@O.KW 助手: [定位到技能目录并完整传入文案执行脚本] [等待脚本下载并返回纯文本] [自动排版并总结核心投资观点] 用户:请给我这段视频完整的原话,不要总结。 助手: [直接完整输出带有【原始转录文案】标记的纯文本,不做任何附加说明] ``` --- ## 🛠️ 故障排查与应急话术 (Agent 必读) 遇到以下错误时,Agent 应立即停止重试,并向用户反馈对应的话术: | 错误表现 / 终端日志 | 解决方案与 Agent 话术 | | --- | --- | | `ModuleNotFoundError: No module named 'yt_dlp'` | Agent 自行执行 `pip install yt-dlp requests --target=/tmp/pylibs` 然后重试。 | | `执行失败:系统未配置硅基流动 API Key` | 告知用户:"系统缺少 API 密钥,请检查 `~/.openclaw/.env` 配置文件中是否已正确写入 `SF_API_KEY`。" | | `执行失败:未在您的输入中检测到有效的 http/https 链接` | 告知用户无法提取,提示其检查发送的文案中是否包含完整的网址。 | | `API识别报错: 401 / 403 / 429` | 告知用户:"硅基流动 API 额度不足或 Key 无效,请检查账号状态。" | | `临时视频文件残留` | Agent 自行执行 `rm -rf ./temp_douyin/*.mp4` 进行清理。 |
don't have the plugin yet? install it then click "run inline in claude" again.