clawhub

视频自动生成器

Item: 视频自动生成器
Rating: 3.2
Author: Implexa

【2026增强版】基于AI自动生成视频内容。支持文本转视频、图文转视频、脚本自动生成+配音+字幕+剪辑全流程。集成edge-tts配音、ffmpeg自动化剪辑。当用户说"生成视频"、"制作视频"、"自动剪辑"、"批量生产视频"、"AI视频生成"、"做个短视频"时触发此技能。

view source

installs

stars

karma

SkillRank score ↗

3.2/ 10

evaluated by implexa, claude-haiku-4-5 · 2026-06-30

video-auto-generator claims end-to-end video production from script to output, integrating edge-tts and ffmpeg. however, the document conflates aspirational features with implemented ones, lacks executable procedures, and provides no failure modes or recovery logic.

structure

2.0

trigger phrases

7.0

procedure

3.0

edge cases

1.0

documentation

4.0

strengths

SKILL.md

---
name: video-auto-generator
description: 【2026增强版】基于AI自动生成视频内容。支持文本转视频、图文转视频、脚本自动生成+配音+字幕+剪辑全流程。集成edge-tts配音、ffmpeg自动化剪辑。当用户说"生成视频"、"制作视频"、"自动剪辑"、"批量生产视频"、"AI视频生成"、"做个短视频"时触发此技能。
---

# Video Auto Generator - 2026增强版

## 概述

本技能提供端到端的AI视频自动生成能力，从脚本撰写到最终渲染输出，全流程自动化。支持多种视频生成模式，适配抖音、小红书、B站、YouTube等平台。

### 2026年新特性
- **多模态输入**：支持文本、图片、音频、文档等多种输入源
- **AI脚本生成**：使用当前平台模型（如 Claude Fable 5 / Opus 4.8）生成专业视频脚本
- **智能配音**：集成edge-tts，支持多种语言和声音风格
- **自动字幕**：AI识别语音+自动时间轴对齐
- **智能剪辑**：基于内容节奏自动剪辑、转场、配乐
- **批量生产**：支持模板化批量生成（适合自媒体矩阵）
- **剪映AI联动**：支持「营销成片」批量生成带货短视频、「AI文字成片」一键成剧
- **可灵AI 3.0 Omni集成**：全模态原生引擎，角色特征提取+跨视频一致性
- **全自动流水线**：新增 `full_pipeline.py`，一键生成脚本→配音→分镜图→合成视频（92秒1080×1920竖屏）

### 🚀 快速开始（推荐）

```bash
# 一键生成推广视频
cd skills/video-auto-generator/scripts
python full_pipeline.py --topic "你的选题" --duration 90 --voice zh-CN-XiaoxiaoNeural
```

输出：`Desktop/video_<选题>/final_promo.mp4`（竖屏1080×1920）

参数说明：
- `--topic`：视频主题/标题
- `--duration`：时长（秒，默认90）
- `--voice`：配音音色（zh-CN-XiaoxiaoNeural/YunxiNeural/XiaoyiNeural）
- `--output`：自定义输出目录

## 使用场景

- 自媒体批量生产短视频内容
- 企业宣传视频快速制作
- 教育培训视频自动化生成
- 产品介绍视频批量制作
- 个人Vlog快速剪辑

## 核心工作流

本技能采用**任务导向结构**，根据不同需求提供差异化的工作流。

### 任务1：文本转视频（AI虚拟主播）

**适用场景**：新闻播报、知识科普、产品介绍

**工作流程**：

1. **脚本生成**（使用当前session模型）：
   ```
   输入：主题/关键词/参考文档
   输出：分镜脚本（包含：画面描述、配音文案、时长建议）
   ```

2. **AI配音**（使用edge-tts）：
   ```bash
   # 示例：生成配音
   edge-tts --text "欢迎来到我的频道" --voice zh-CN-XiaoxiaoNeural --write-media output.mp3
   ```

3. **画面生成**（可选）：
   - 使用AI绘画工具生成背景图
   - 或使用库存视频素材
   - 或使用虚拟主播形象（HeyGen、D-ID等）

4. **视频合成**（使用ffmpeg）：
   ```bash
   # 示例：配音+字幕+背景视频合成
   ffmpeg -i background.mp4 -i voice.mp3 -vf "subtitles=subtitle.srt" -c:v libx264 -c:a aac output.mp4
   ```

### 任务2：图文转视频（小红书/抖音风格）

**适用场景**：图文笔记转视频、产品展示、教程演示

**工作流程**：

1. **图片序列处理**：
   - 输入：多张图片 + 文案
   - 处理：统一尺寸、添加过渡动画、添加背景音乐

2. **自动配音**（基于文案）：
   ```python
   # 使用edge-tts批量生成配音
   import subprocess
   
   def generate_voice(text, output_file):
       cmd = f"edge-tts --text '{text}' --voice zh-CN-XiaoxiaoNeural --write-media {output_file}"
       subprocess.run(cmd, shell=True)
   ```

3. **视频合成**：
   - 每张图片展示时长自动匹配配音时长
   - 添加转场效果（淡入淡出、滑动等）
   - 添加背景音乐（自动音量调节）

### 任务3：长视频自动剪辑（Vlog/教程）

**适用场景**：直播回放剪辑、课程视频制作、Vlog快速成片

**工作流程**：

1. **智能分段**（使用AI）：
   - 输入：长视频文件
   - 分析：语音识别 + 场景切换检测
   - 输出：精彩片段时间戳列表

2. **AI生成标题和封面**：
   - 使用当前平台模型根据内容生成吸引眼球的标题
   - 使用AI提取关键帧作为封面

3. **自动剪辑**：
   ```bash
   # 示例：根据时间戳列表剪辑精彩片段
   ffmpeg -i input.mp4 -ss 00:01:23 -t 00:00:45 -c copy output_part1.mp4
   ```

4. **批量渲染**：
   - 支持同时处理多个视频
   - 自动添加片头片尾、水印、字幕

### 任务4：模板化批量生产（自媒体矩阵）

**适用场景**：同一内容适配多个平台、多语言版本、A/B测试

**工作流程**：

1. **创建视频模板**：
   - 定义：分辨率、帧率、转场效果、配乐
   - 预留：文本占位符、图片占位符、配音占位符

2. **批量填充内容**：
   ```python
   # 示例：批量生成10个变体视频
   for i in range(10):
       script = generate_script_variant(topic, style=i%3)
       voice = generate_voice(script)
       video = render_video(template, script, voice)
       save(video, f"output_v{i}.mp4")
   ```

3. **平台自适应**：
   - 自动调整分辨率（抖音9:16、B站16:9、小红书3:4）
   - 自动生成平台定制化标题和标签

## 技术栈

### 环境安装（必须先执行）

**必须工具安装**（如果未安装，请先调用 `qclaw-env` skill）：

```powershell
# 1. 安装 ffmpeg (Windows)
winget install ffmpeg
# 验证：ffmpeg -version

# 2. 安装 edge-tts (Python包)
pip install edge-tts
# 验证：edge-tts --list-voices | Select-String "zh-CN"

# 3. 安装 whisper (可选，用于语音识别)
pip install openai-whisper
# 验证：whisper --help

# 4. 安装 ffmpeg-python (Python绑定)
pip install ffmpeg-python
```

**可灵AI 3.0 API配置**（推荐）：

1. 访问 https://klingai.com/ 注册开发者账号
2. 申请API Key（进入「开发者中心」→「API管理」）
3. 配置环境变量：
```powershell
$env:KLING_API_KEY="your_api_key_here"
```
4. 测试API调用：
```python
import requests

def test_kling_api():
    api_url = "https://api.klingai.com/v3/images/generations"
    headers = {"Authorization": f"Bearer {$env:KLING_API_KEY}"}
    payload = {
        "model": "kling-3.0",
        "prompt": "一个AI机器人正在制作视频",
        "aspect_ratio": "16:9"
    }
    response = requests.post(api_url, json=payload, headers=headers)
    print(response.json())
```

### 核心工具

| 工具 | 用途 | 安装命令 | 实用建议 |
|------|------|----------|---------------|
| **ffmpeg** | 视频处理引擎 | `winget install ffmpeg` | 硬件加速（NVENC/QSV）提升渲染速度 |
| **edge-tts** | AI配音 | `pip install edge-tts` | 优先zh-CN-XiaoxiaoNeural，支持多种声音 |
| **当前session模型** | 脚本生成 | 内置 | model route自动选最优，无需硬编码 |
| **whisper** | 语音识别 | `pip install openai-whisper` | 使用large-v3模型提升准确率 |
| **可灵AI 3.0 API** | AI视频生成 | 申请API Key | 全模态引擎，角色一致性保持 |
| **剪映「营销成片」** | 批量带货视频 | 安装剪映专业版 | 参考抖音爆款自动生成 |
| **Seedance 2.0** | AI视频生成 | 等待2.5版本 | 字节跳动，短视频数据优势 |

### Python脚本示例

#### 脚本1：自动生成视频脚本

创建 `scripts/generate_script.py`：

```python
import json

def generate_video_script(topic, duration=60, style="knowledge"):
    """
    使用当前平台模型生成视频脚本
    
    Args:
        topic: 视频主题
        duration: 目标时长（秒）
        style: 风格（knowledge/entertainment/story）
    
    Returns:
        脚本字典，包含分镜、配音文案、画面描述
    """
    prompt = f"""
    请为以下主题生成一个{duration}秒的视频脚本：
    
    主题：{topic}
    风格：{style}
    
    要求：
    1. 开头3秒必须有强hook（悬念/反转/痛点）
    2. 每个分镜标注时长
    3. 配音文案要口语化，适合配音
    4. 画面描述要具体，方便后续制作
    
    输出格式（JSON）：
    {{
        "title": "视频标题",
        "hooks": ["hook1", "hook2", "hook3"],
        "scenes": [
            {{
                "timestamp": "00:00:00",
                "duration": 3,
                "voiceover": "配音文案",
                "visual": "画面描述",
                "transition": "转场效果"
            }}
        ],
        "bgm_suggestion": "背景音乐风格建议",
        "tags": ["标签1", "标签2"]
    }}
    """
    
    # 由当前 session 模型处理（model route 自动选择最优）
    # 此处仅返回 prompt 供调用方使用
    return {"prompt": prompt, "topic": topic, "duration": duration, "style": style}

if __name__ == '__main__':
    # 示例用法
    script = generate_video_script("AI工具推荐", duration=60, style="knowledge")
    print(json.dumps(script, ensure_ascii=False, indent=2))
```

#### 脚本2：批量视频渲染

创建 `scripts/batch_render.py`：

```python
import subprocess
import json
from pathlib import Path

def render_video(script_file, output_file):
    """
    根据脚本JSON文件渲染视频
    
    Args:
        script_file: 脚本JSON文件路径
        output_file: 输出视频文件路径
    """
    with open(script_file, 'r', encoding='utf-8') as f:
        script = json.load(f)
    
    # 1. 生成配音
    voice_file = "temp_voice.mp3"
    subprocess.run([
        "edge-tts",
        "--text", script['scenes'][0]['voiceover'],
        "--voice", "zh-CN-XiaoxiaoNeural",
        "--write-media", voice_file
    ])
    
    # 2. 合成视频（简化示例，实际应该遍历所有scenes）
    cmd = [
        "ffmpeg",
        "-f", "concat", "-i", "input_list.txt",
        "-i", voice_file,
        "-c:v", "libx264",
        "-c:a", "aac",
        "-shortest",
        output_file
    ]
    subprocess.run(cmd)
    
    print(f"✅ 视频已生成：{output_file}")

def batch_render(script_folder, output_folder):
    """
    批量渲染视频
    
    Args:
        script_folder: 脚本文件夹
        output_folder: 输出文件夹
    """
    scripts = Path(script_folder).glob("*.json")
    for script_file in scripts:
        output_file = Path(output_folder) / f"{script_file.stem}.mp4"
        render_video(script_file, output_file)

if __name__ == '__main__':
    batch_render("scripts/", "outputs/")
```

## 定时自动化

配合 `qclaw-cron-skill` 实现定期视频生产：

### 方案A：每日热点视频自动生成

**实际配置**（请先读取 qclaw-cron-skill 获取最新格式）：

- 名称：每日热点视频生成
- 时间：每天 10:00
- 消息：基于今日热点选题TOP3，各生成1个60秒短视频。生成后保存到桌面输出文件夹。

### 方案B：批量内容生产（每周）

**实际配置**：

- 名称：每周内容批量生产
- 时间：每周一 9:00
- 消息：批量生成10个短视频（3个主题，每个3-4个变体）。保存到桌面输出文件夹，生成发布计划表。

## 资源文件

### scripts/

可执行代码，用于视频处理自动化：

- `generate_script.py`：AI脚本生成
- `batch_render.py`：批量视频渲染
- `add_subtitles.py`：自动字幕生成和嵌入
- `smart_clip.py`：智能剪辑（识别精彩片段）
- `platform_adapter.py`：平台格式自适应

### references/

参考文档，加载到上下文以指导视频制作：

- `video_formats.md`：各平台视频格式规范（分辨率、码率、时长限制）
- `script_templates.md`：常见视频类型的脚本模板（开箱即用）
- `tts_voices.md`：edge-tts声音风格指南（适合不同场景的声音选择）
- `editing_tips.md`：视频剪辑技巧（转场、配乐、节奏控制）
- `ai_models_guide.md`：AI模型使用指南（由 model route 自动选择最优模型）

### assets/

模板文件，用于视频输出：

- `templates/`：视频模板目录
  - `tpl_douyin_9_16/`：抖音竖屏模板
  - `tpl_bilibili_16_9/`：B站横屏模板
  - `tpl_xiaohongshu_3_4/`：小红书方屏模板
- `intros/`：片头模板
- `outros/`：片尾模板
- `bgm/`： background music库（无版权音乐）

## 高级技巧

### 1. 使用虚拟主播（HeyGen API）

```python
# 集成HeyGen API实现真人形象播报
import requests

def generate_avatar_video(script, avatar_id="default"):
    """
    使用HeyGen生成虚拟主播视频
    
    Args:
        script: 配音文案
        avatar_id: 虚拟主播ID
    """
    api_url = "https://api.heygen.com/v2/video/generate"
    payload = {
        "video_inputs": [{
            "character": {
                "type": "avatar",
                "avatar_id": avatar_id,
                "avatar_style": "normal"
            },
            "voice": {
                "type": "text",
                "input_text": script,
                "voice_id": "zh-CN-XiaoxiaoNeural"
            }
        }],
        "dimension": {
            "width": 720,
            "height": 1280
        }
    }
    
    response = requests.post(api_url, json=payload, headers={"X-Api-Key": "YOUR_API_KEY"})
    return response.json()['video_id']
```

### 2. 智能配乐推荐

```python
# 根据视频情感自动推荐BGM
def recommend_bgm(emotion="happy", tempo="medium"):
    """
    推荐背景音乐
    
    Args:
        emotion: 情感（happy/sad/exciting/calm）
        tempo: 节奏（slow/medium/fast）
    """
    bgm_library = {
        "happy_medium": "bgm/happy_upbeat.mp3",
        "sad_slow": "bgm/melancholy_piano.mp3",
        "exciting_fast": "bgm/epic_orchestra.mp3",
        # ... 更多组合
    }
    return bgm_library.get(f"{emotion}_{tempo}", "bgm/default.mp3")
```

### 3. A/B测试自动化

```python
# 自动生成多个标题/封面变体进行A/B测试
def generate_ab_test_variants(video_script):
    """
    生成A/B测试变体
    
    Returns:
        变体列表，每个变体有不同的标题、封面、开头hook
    """
    variants = []
    
    # 变体1：悬念式开头
    variants.append({
        "title": f"没想到{topic}竟然...",
        "hook": "你绝对不知道的真相",
        "thumbnail_style": "mysterious"
    })
    
    # 变体2：干货式开头
    variants.append({
        "title": f"{topic}完整攻略",
        "hook": "今天教你3个技巧",
        "thumbnail_style": "educational"
    })
    
    # 变体3：故事式开头
    variants.append({
        "title": f"我是如何用{topic}改变人生的",
        "hook": "去年这个时候我还...",
        "thumbnail_style": "storytelling"
    })
    
    return variants
```

## 常见问题

### Q1: 渲染速度太慢怎么办？

**A**: 
1. 使用硬件加速：`ffmpeg -hwaccel cuda -i input.mp4 ...`
2. 降低预览质量（最终渲染再用高质量）
3. 使用当前平台模型批量处理（性价比最优）

### Q2: 配音声音不自然？

**A**: 
1. 在文案中加入标点符号和停顿标记（如：逗号、句号、省略号）
2. 使用SSML标签控制语速和语调：`<break time="500ms"/>`
3. 切换不同的edge-tts声音风格

### Q3: 如何避免版权问题？

**A**: 
1. 使用无版权音乐库（YouTube Audio Library、Epidemic Sound）
2. 使用AI生成背景音乐（如：Mubert、AIVA）
3. 图片素材使用Unsplash、Pexels等无版权图库

---

**实用检查清单**：
- [ ] edge-tts已安装且可用？
- [ ] ffmpeg已安装且可用？
- [ ] 剪映v20.2+已安装？（营销成片/AI文字成片功能）
- [ ] 已创建视频输出目录？
- [ ] 已测试至少1个完整视频生成流程？
- [ ] 定时任务参考qclaw-cron-skill最新格式？
- [ ] 可灵AI API Key已申请？（如需使用可灵3.0能力）

**下一步优化方向**：
1. ✅ 集成文生视频工具（可灵3.0 API + Seedance 2.0）+ 已列入技术栈
2. 建立本地视频模板库（抖音9:16、B站16:9、小红书3:4）
3. ✅ edge-tts + ffmpeg 流水线已建立（见任务1/2/3工作流）
4. 添加视频质量自动检查（分辨率、码率、时长）
5. 集成剪映「AI文字成片」一键成剧功能
6. 实现即梦AI网页版自动化操作（利用免费积分）
7. 自动化字幕+特效流水线

related skills

semantically similar in the cross-vendor index

clawhub

82% match

Ai Video Script Generator

AI视频脚本生成器。输入主题和平台（抖音/小红书/B站），自动生成完整视频脚本，包括开场钩子、分镜设计、台词文案、BGM建议、封面文案。支持多种风格（干货/故事/测评/教程），记忆用户写作偏好并持续优化。当用户说"生成脚本"、"写视频文案"、"脚本模板"、"视频脚本"时触发此技能。

don't have the plugin yet? install it then click "run inline in claude" again.