将文章、论文、报告等文本内容自动转换为科普视频脚本的完整工作流。整合文章解析、脚本生成、分镜设计三步,支持短视频(抖音/TikTok 30-60s)和长视频(B站知识区 8-15min)两种模式,提供真人出镜和纯AI制作两种分镜方案。输出包含视频脚本、逐镜分镜表、画面提示词、字幕标注、剪辑指南,供用户在剪映等工具...
---
name: article-to-science-video
description: "将文章、论文、报告等文本内容自动转换为科普视频脚本的完整工作流。整合文章解析、脚本生成、分镜设计三步,支持短视频(抖音/TikTok 30-60s)和长视频(B站知识区 8-15min)两种模式,提供真人出镜和纯AI制作两种分镜方案。输出包含视频脚本、逐镜分镜表、画面提示词、字幕标注、剪辑指南,供用户在剪映等工具中自行合成。当用户说'把这篇文章做成科普视频脚本'、'将文章转为视频脚本'、'基于这篇文章生成视频脚本'、'文章生成视频脚本'等需求时触发。"
---
# Article to Science Video — 文章转科普视频脚本工作流
将任意文章/论文/报告自动转化为完整科普视频脚本的三步工作流:文章解析 → 视频脚本 → 分镜设计。
本工作流**只生成视频脚本和分镜方案**,不生成实际的视频/图片/音频素材。用户可根据脚本自行在剪映等工具中完成最终合成。
支持两种制作模式:
- **真人出镜模式**:真人讲解为主,画面提示词侧重辅助素材
- **纯AI制作模式**:无真人出镜,画面提示词侧重信息可视化(图形/表格/动画)
## Quick Start
用户只需提供:
1. **文章来源**:文章链接、本地文件路径,或粘贴文章内容
2. **视频平台**:短视频(抖音/TikTok/视频号)或长视频(B站知识区/科技区)
3. **制作模式**(可选):真人出镜(默认)或纯AI制作
4. **目标时长**(可选):短视频默认 45s,B站长视频默认 10min
> 若用户要求"不用真人"、"AI配音"、"不要实拍"、"纯动画/图表"等,自动切换为**纯AI制作模式**。
---
## 制作模式选择
在 Phase 2 开始前,确认用户的制作模式偏好:
| 模式 | 特点 | 适用场景 | 画面构成建议 |
|------|------|---------|------------|
| **真人出镜**(默认) | 真人讲解 + 辅助素材 | 需要人设/IP/信任感 | 主讲人 60% + 信息可视化 40% |
| **纯AI制作** | 纯信息可视化 + AI配音 | 追求效率/无人设需求 | 信息可视化 100%(动画/图表/图形) |
**纯AI模式触发条件**:用户提及"不要真人"、"AI配音"、"不用出镜"、"纯动画"、"图表视频"、"信息可视化"等。
### 纯AI制作模式要点
- **配音**:建议使用 AI TTS 生成旁白,替代真人录音
- **画面**:以信息可视化为主,包括:
- 动态信息图表(数据可视化动画)
- 3D概念演示/过程动画
- 科学示意图(细胞/大脑/分子等)
- 抽象几何动画表达概念
- 纯文字排版动画(大字报风格)
- **无真人元素**:画面中不出现任何真人面部/身体/手势
---
## Phase 1: 文章解析 — 提取核心知识点
### 1.1 读取文章内容
根据用户提供的方式选择读取方法:
| 输入方式 | 读取方法 |
|---------|---------|
| 文章链接 | 使用 browser_visit 打开并提取正文 |
| 本地文件 | 使用 read_file 读取(支持 PDF/Word/Markdown/TXT) |
| 直接粘贴 | 直接使用用户提供的内容 |
### 1.2 内容提取与结构化
对文章内容进行深度解析,提取以下要素:
```
📋 文章解析报告
- 文章标题:[原标题]
- 核心主题:[一句话概括]
- 目标受众:[适合的知识水平群体]
- 核心知识点(3-7个):
1. [知识点1] — [一句话解释]
2. [知识点2] — [一句话解释]
...
- 关键数据/案例:[列出文章中可视觉化的数据或案例]
- 有趣冷知识/反常识点:[适合作为 Hook 的亮点]
- 难度评级:[简单/中等/硬核]
```
**提取原则**:
- 保留专业准确性,但将术语转化为通俗表达
- 识别最适合视觉化的内容(数据、流程、对比、现象)
- 标记情感共鸣点(好奇心、惊讶感、危机感)
- 短视频保留 **1-2个** 核心知识点,长视频保留 **3-5个**
---
## Phase 2: 视频策划 — 平台选择与脚本生成
### 2.1 平台选择
根据用户需求确定输出格式:
| 平台 | 时长 | 触发词 | 参考模板 |
|------|------|--------|---------|
| 短视频 | 30-60s | 抖音、TikTok、视频号、短视频 | references/short-video-template.md |
| 长视频 | 8-15min | B站、知识区、科技区、长视频 | references/bili-long-video-template.md |
如果用户未指定,询问其目标平台。若用户不确定,默认推荐短视频模式。
### 2.2 生成视频脚本
读取对应参考模板后,按模板结构生成完整脚本。脚本必须基于 Phase 1 提取的核心知识点,不能脱离原文内容凭空创作。
**脚本生成原则**:
- 短视频:单点突破,一个核心知识点讲透,追求"啊哈"时刻
- 长视频:体系化梳理,3-5个知识点递进,追求"看完就懂"的满足感
- 所有口播文案必须标注预估时长,总时长误差控制在 ±10% 以内
- 中文口播语速:正常 4-5字/秒,快速 5-7字/秒,慢速 3-4字/秒
---
## Phase 3: 分镜设计 — 逐镜画面规划与提示词
### 3.1 生成分镜表
基于脚本,为每个镜头生成详细分镜描述。分镜表必须包含:
| 字段 | 说明 |
|------|------|
| 镜号 | 镜头序号 |
| 时间 | 起止时间区间 |
| 段落 | Hook/铺垫/知识点/高潮/CTA |
| 景别 | 特写/近景/中景/全景 |
| 画面内容 | 详细画面描述 |
| 配音文案 | 对应口播文字 |
| 字幕标注 | 需显示的字幕内容 |
| 画面提示词 | 用于后续素材制作的英文描述 |
**分镜设计原则**:
- Hook 镜头:视觉冲击或概念动画特写,前3秒必须有强吸引力
- 知识讲解镜头:数据可视化、动画演示、图文排版
- 过渡镜头:平滑转场,保持节奏感
- 结尾镜头:总结画面 + 互动引导元素
**纯AI模式分镜原则**:
- 以**信息可视化**为核心:动态图表、3D演示、概念动画、数据可视化
- 禁止出现任何真人形象:无面部、无身体、无手势
- 每个镜头必须配有英文画面生成提示词,供用户后续生成素材时参考
### 3.2 素材建议(不实际生成)
根据分镜表,为每个镜头提供素材获取建议:
| 素材类型 | 获取方式 | 适用场景 |
|---------|---------|---------|
| 动态视频 | AI文生视频工具(如可灵、即梦、Vidu等)| 粒子动画、流体运动、过程演示 |
| 静态图片 | AI文生图工具(如 Midjourney、即梦等)| 数据图表、概念图解、封面 |
| 网络素材 | 免费图库(Unsplash、Pexels、Pixabay)| 真实照片、场景图片 |
| 配音音频 | AI TTS 工具(如 ElevenLabs、剪映朗读)| 旁白配音 |
**画面提示词撰写规范**:
- 使用英文描述,包含:主体、动作、场景、风格、镜头角度
- 科普视频风格:干净、明亮、教育感
- 纯AI模式:**不含任何人物面部/身体**,以物体、图表、粒子、几何图形为主
- 示例:*Abstract particle animation forming human brain connections, neural network visualization, blue and white color scheme, clean scientific aesthetic, smooth fluid motion, educational documentary style*
### 3.3 输出完整脚本包
将以下所有内容打包输出(不含实际素材文件):
```
📦 科普视频脚本包
├── 📄 01-文章解析报告.md
├── 📄 02-视频脚本.md(完整脚本含时长标注)
└── 📝 03-制作备忘.md
├── 分镜表(逐镜分镜 + 画面提示词)
├── 字幕标注(时间点/内容/样式)
├── 素材获取建议(各镜头推荐获取方式)
├── BGM分段推荐
├── 配音文案汇总
└── 剪映合成指南
```
---
## Phase 4: 后期合成参考(用户自行完成)
脚本包中包含剪映合成参考指南,用户可根据此指南在剪映(CapCut)中完成最终视频。详见 `references/post-production-guide.md`。
---
## 输出规范
### 脚本必须包含
- [ ] 每段口播标注时间区间和预估字数
- [ ] Hook 文案在前3秒内完成(≤20字)
- [ ] 核心知识点与原文一致,不虚构数据
- [ ] CTA 有明确的行动指令
### 分镜表必须包含
- [ ] 每个镜头标注景别(特写/近景/中景/全景)
- [ ] 每个镜头配有英文画面生成提示词
- [ ] 每个镜头标注推荐素材获取方式
- [ ] 总时长与目标时长误差 ≤10%
- [ ] 镜号连续、时间无重叠
### 制作备忘必须包含
- [ ] 完整分镜表(含时间、画面描述、提示词、素材建议)
- [ ] 字幕标注(时间点/内容/样式建议)
- [ ] 配音文案汇总(可直接复制用于TTS生成)
- [ ] BGM分段推荐(风格/情绪/搜索关键词)
- [ ] 剪映合成简要步骤
---
## 参考文件导航
| 文件 | 内容 | 何时读取 |
|------|------|---------|
| references/short-video-template.md | 短视频(30-60s)完整脚本模板、分镜表模板、黄金结构说明 | 用户选择短视频平台时 |
| references/bili-long-video-template.md | B站长视频(8-15min)完整大纲模板、弹幕设计、三连引导 | 用户选择B站长视频时 |
| references/shot-list-guide.md | 分镜设计指南、景别说明、画面提示词撰写规范、素材类型建议 | Phase 3 设计分镜时 |
| references/post-production-guide.md | 剪映(CapCut)合成操作指南、字幕样式模板、BGM推荐库、导出设置 | 制作备忘中引用 |
don't have the plugin yet? install it then click "run inline in claude" again.