Name: AI产品经理全流程助手
Availability: InStock
AI产品经理全流程助手。覆盖需求洞察→竞品分析→PRD方案设计→AI能力设计(Prompt/Agent/RAG)→上线评估→迭代优化6大阶段。融合模型边界管理、Prompt工程、Agent编排、RAG数据工程、AI评估五大核心能力。触发词: AI产品经理, AI PM, 写PRD, 竞品分析, Prompt设计,...
SKILL.md

---
name: ai-pm
description: "AI产品经理全流程助手。覆盖需求洞察→竞品分析→PRD方案设计→AI能力设计(Prompt/Agent/RAG)→上线评估→迭代优化6大阶段。融合模型边界管理、Prompt工程、Agent编排、RAG数据工程、AI评估五大核心能力。触发词: AI产品经理, AI PM, 写PRD, 竞品分析, Prompt设计, Agent工作流, RAG设计, AI评估, 需求分析, 产品方案, 模型选型, AI功能设计, ai product manager, PRD生成, 技术可行性评估, AI产品设计。"
version: "1.0.0"
agent_created: true
metadata:
  emoji: "🧠"
  tags: ["ai", "product-management", "pm", "prompt-engineering", "agent-design", "rag", "evaluation"]
  category: "productivity"
---
# AI PM — AI产品经理全流程助手

> 覆盖从需求洞察到迭代优化的完整 AI 产品管理链路，融合模型边界管理、Prompt 工程、Agent 编排、RAG 数据工程、AI 评估五大 AI PM 核心能力。

---

## 概述

AI PM Skill 是一个面向 AI 产品经理的全流程助手，覆盖 6 大阶段、18 个关键动作。当用户提出任何与 AI 产品管理相关的任务时，自动匹配对应阶段并引导执行。

### 核心定位

- **传统 PM 任务增强**: PRD 生成、竞品分析、需求分析 → AI 加持的结构化产出
- **AI PM 专属能力**: Prompt 模板设计、Agent 工作流编排、RAG 方案设计、模型选型与成本估算
- **全流程串联**: 从需求到迭代的 6 阶段闭环，支持逐阶段推进或单点切入

---

## 六大阶段工作流

```
①需求洞察 → ②竞品分析 → ③方案设计 → ④AI能力设计 → ⑤上线评估 → ⑥迭代优化
  4动作        3动作        4动作         4动作           2动作         3动作
```

---

## 阶段一：需求洞察 (Requirement Discovery)

**触发**: 用户描述产品想法、用户痛点、业务需求

### 执行流程

1. **用户痛点挖掘**
   - 引导用户描述目标用户画像和核心场景
   - 使用用户旅程地图 (User Journey Map) 框架梳理痛点
   - 区分"真实需求"与"技术噱头"

2. **AI 适配性判断** (AI PM 核心能力)
   - 判断该需求是否适合用 AI/LLM 解决
   - 决策框架:
     | 适合 AI | 不适合 AI |
     |---------|-----------|
     | 生成、总结、推理、分类 | 精确计算、合规检查、确定性逻辑 |
     | 非结构化数据处理 | 结构化 CRUD |
     | 需要上下文理解 | 确定性规则引擎即可满足 |
   - 输出: 每个需求的 AI 适配度评分 (1-5)

3. **ROI 初步估算**
   - Token 成本预估 (按日活 * 平均调用次数 * 平均Token消耗)
   - 标注成本 (如需微调)
   - 预期收益量化 (效率提升 % / 成本降低 % / 体验提升指标)

4. **干系人与约束分析**
   - 识别关键干系人 (业务方、算法团队、工程团队、合规)
   - 列出技术约束 (延迟要求、准确率门槛、合规要求)

### 产出模板

```markdown
# 需求分析报告

## 1. 用户与场景
- 目标用户: 
- 核心场景: 
- 痛点列表 (优先级排序):

## 2. AI 适配性评估
| 需求 | AI适配度(1-5) | 推荐方案 | 理由 |
|------|:-----------:|---------|------|

## 3. ROI 估算
- 预估日活: 
- Token 消耗/次: 
- 日成本: 
- 预期收益:

## 4. 约束与风险
- 技术约束:
- 合规要求:
- 关键干系人:
```

---

## 阶段二：竞品分析 (Competitor Analysis)

**触发**: 用户要求分析竞品、了解市场格局、寻找差异化定位

### 执行流程

1. **竞品情报搜集**
   - 联网搜索直接竞品和间接竞品
   - 识别三类竞争对手:
     - **显性竞品**: 同赛道直接竞争产品
     - **跨界竞品**: 从其他领域切入的竞争者
     - **替代方案**: 用户当前使用的非产品方案 (Excel、人工等)

2. **AI 竞品深度分析** (三维视野)
   - **功能层**: 功能矩阵对比 (是否用 AI? 用了什么模型? 效果如何?)
   - **模型层**: 底层模型能力对比 (基座模型、微调策略、数据飞轮)
   - **体验层**: AI 交互模式对比 (对话式/嵌入式和/Agent式)

3. **差异化定位建议**
   - 基于竞品分析输出差异化方向
   - SWOT 分析 (聚焦 AI 能力差异)

### 产出模板

```markdown
# 竞品分析报告

## 1. 竞品全景图
| 竞品 | 类型 | 核心AI能力 | 目标用户 | 优势 | 劣势 |
|------|------|-----------|---------|------|------|

## 2. 功能矩阵对比
| 功能维度 | 我方 | 竞品A | 竞品B | 竞品C |
|---------|------|-------|-------|-------|

## 3. AI 能力对比
| 维度 | 竞品A | 竞品B | 竞品C |
|------|-------|-------|-------|
| 基座模型 | | | |
| Prompt策略 | | | |
| RAG方案 | | | |
| 评估体系 | | | |

## 4. SWOT + 差异化建议
- 可切入的差异化点:
- AI 层面的独特优势:
```

---

## 阶段三：方案设计 (Solution Design / PRD)

**触发**: 用户要求写 PRD、设计方案、规划功能

### 执行流程

1. **PRD 结构化生成**
   - 背景与目标
   - 用户故事 (User Stories)
   - 功能详情 (含 AI 功能描述)
   - 非功能需求 (性能、安全、合规)
   - 验收标准
   - 上线计划

2. **AI 降级方案设计** (AI PM 特有)
   - 设计多级降级策略:
     ```
     模型输出 → 置信度检查 → [≥阈值] 直接输出
                            → [<阈值] 知识库兜底
                            → [知识库无匹配] 人工接管
     ```
   - 对每个 AI 功能点，明确: 正常路径、降级路径、熔断条件

3. **人机协同 (Human-in-the-Loop) 流程设计**
   - 标识需要人工介入的关键决策点
   - 设计审核流程与权限

4. **数据闭环设计**
   - 定义需要收集的用户反馈信号 (点赞/踩/修改/忽略)
   - 设计数据飞轮: 反馈 → 标注 → 微调 → 效果提升

### 产出模板

```markdown
# PRD: [产品/功能名称]

## 1. 背景与目标
## 2. 用户故事
## 3. 功能详情
### 3.1 AI 功能说明
- 模型调用链路:
- Prompt 策略:
- 降级方案:

## 4. 非功能需求
- 延迟要求: < X ms
- 准确率目标: > X%
- 合规要求:

## 5. 人机协同流程
## 6. 数据闭环设计
## 7. 验收标准
## 8. 上线与灰度计划
```

---

## 阶段四：AI 能力设计 (AI Capability Design)

**这是 AI PM 区别于传统 PM 的核心能力层。**

### 4.1 Prompt 模板工程

**触发**: 用户需要设计 Prompt、优化提示词

#### 设计框架

```
Prompt 模板 = 角色设定 + 任务拆解 + 约束条件 + Few-Shot示例 + 输出Schema
```

#### 执行步骤

1. **角色设定**: 明确 AI 的角色身份和专业领域
2. **任务拆解**: 将复杂任务分解为子任务步骤
3. **约束条件**: 定义格式要求、禁止行为、安全边界
4. **Few-Shot 示例**: 提供 2-3 个输入→输出范例
5. **输出 Schema**: 定义 JSON/XML 输出结构 (便于程序解析)
6. **动态变量**: 标识需要动态注入的变量 (用户画像、上下文等)

#### 产出格式

```markdown
## Prompt 模板: [模板名称]

### 角色设定
你是 [角色描述]

### 任务
[任务步骤，分步描述]

### 约束
- [约束1]
- [约束2]

### Few-Shot 示例
输入: 
输出: 

### 输出格式
{json schema}

### 动态变量
- {{user_profile}}: 用户画像
- {{context}}: 上下文
```

### 4.2 Agent 工作流编排

**触发**: 用户需要设计多 Agent 协作、自动化工作流

#### 设计框架

```
用户目标 → 任务拆解 → Agent/工具分配 → 执行编排 → 结果聚合 → 人机回环
```

#### 执行步骤

1. **目标分解**: 将用户模糊目标拆解为可执行的子任务链
2. **Agent 角色定义**: 为每个子任务定义 Agent 角色和能力
3. **工具链设计**: 定义 Agent 可调用的工具 (搜索/计算/API等)
4. **执行编排**:
   - 串行/并行决策
   - 条件分支 (if-else)
   - 循环迭代
   - 错误重试策略
5. **人机回环 (HITL) 设计**: 在关键决策点插入人工确认

#### 产出格式

```markdown
## Agent 工作流: [工作流名称]

### 用户意图
[描述用户输入和目标]

### 任务拆解
Step 1: [子任务] → Agent: [角色] → 工具: [工具列表]
Step 2: [子任务] → Agent: [角色] → 工具: [工具列表]
...

### 执行流程
flowchart TD
    A[用户输入] → B[Agent1: 任务识别]
    B → C{条件判断}
    C →|路径A| D[Agent2]
    C →|路径B| E[Agent3]
    ...

### HITL 检查点
- [检查点1]: 条件 + 人工确认内容
- [检查点2]: 条件 + 人工确认内容
```

### 4.3 RAG 方案设计

**触发**: 用户需要设计知识库问答、企业数据检索增强

#### 设计框架

```
数据准备 → 切片(Chunking) → 向量化(Embedding) → 检索(Recall) → 重排序(Rerank) → 生成
```

#### 执行步骤

1. **数据源分析**: 识别需要接入的数据类型 (文档/数据库/API)
2. **切片策略设计**:
   - 分块大小 (Chunk Size): 根据内容类型选择 (代码 500 token, 文档 1000 token)
   - 重叠策略 (Overlap): 建议 10-20%
   - 元数据保留: 标题、来源、时间戳
3. **向量化方案**:
   - Embedding 模型选型 (效果 vs 成本 vs 延迟)
   - 多模态支持 (文本 + 图片)
4. **检索策略**:
   - 混合检索 (向量 + 关键词)
   - 多路召回 + 融合排序
5. **重排序 (Rerank)**: 选择 Rerank 模型提升精度
6. **生成策略**: Prompt 中如何引用检索结果

#### 产出格式

```markdown
## RAG 方案: [方案名称]

### 数据源
| 数据类型 | 格式 | 更新频率 | 数据量级 |
|---------|------|---------|---------|

### 切片策略
- Chunk Size: 
- Overlap: 
- 分隔符: 
- 元数据:

### Embedding 方案
- 模型: 
- 维度: 
- 预估成本:

### 检索链路
1. Query 改写/扩展
2. 向量检索 (Top-K: )
3. 关键词检索 (BM25)
4. 融合排序 (RRF/加权)
5. Rerank (Top-N: )

### 生成 Prompt
{包含检索结果的 Prompt 模板}
```

### 4.4 模型选型与成本估算

**触发**: 用户需要选择模型、估算成本

#### 执行步骤

1. **能力需求匹配**: 根据任务类型推荐模型
   | 任务类型 | 推荐模型 | 理由 |
   |---------|---------|------|
   | 简单分类/抽取 | 轻量模型 (Qwen-7B, GPT-4o-mini) | 低成本、低延迟 |
   | 复杂推理/生成 | 强模型 (DeepSeek-R1, GPT-4o) | 高准确性 |
   | 多模态 (图+文) | GPT-4o, Qwen-VL | 视觉理解能力 |
   | 代码生成 | DeepSeek-Coder, Claude | 代码能力强 |

2. **Token 成本计算**:
   ```
   日成本 = DAU × 平均调用次数 × (输入Token × 输入单价 + 输出Token × 输出单价)
   ```

3. **缓存策略设计**:
   - 语义缓存: 相似问题直接返回缓存结果
   - 精确缓存: 相同问题命中缓存
   - 预估缓存命中率及成本节省

---

## 阶段五：上线评估 (Launch & Evaluation)

**触发**: 用户需要设计评估方案、A/B测试、上线策略

### 执行流程

1. **AI 评估体系搭建** (Eval Framework)
   - 构建 Golden Dataset (标准测试集)
   - 五维评估指标:
     | 维度 | 指标 | 测量方式 |
     |------|------|---------|
     | 准确性 | 正确率/精确率/召回率/F1 | 人工标注 + 自动对比 |
     | 相关性 | NDCG/MRR | 排序质量评估 |
     | 安全性 | 违规率/拒答率 | 安全测试集 |
     | 延迟 | P50/P95/P99 延迟 | 监控埋点 |
     | 成本 | 单次调用成本 | Token 计数 |

2. **A/B 测试设计**
   - 实验组 vs 对照组定义
   - 分流比例与样本量计算
   - 核心指标 (OEC) 定义
   - 统计显著性判断标准 (p < 0.05)

3. **灰度发布策略**
   - 阶段一: 内部员工 1%
   - 阶段二: 外部用户 5% → 观察 24h
   - 阶段三: 10% → 50% → 100%
   - 每个阶段的观测指标和回滚条件

### 产出

```markdown
# AI 评估报告

## 1. Eval 体系
### Golden Dataset 概况
- 样本数:
- 覆盖场景:

### 评估结果
| 维度 | 指标 | 当前值 | 目标值 | 达标 |
|------|------|--------|--------|:----:|

## 2. Bad Case 分析
| ID | 输入 | 期望输出 | 实际输出 | 根因 | 修复方案 |
|----|------|---------|---------|------|---------|

## 3. 上线决策
- A/B 结论:
- 是否全量:
```

---

## 阶段六：迭代优化 (Iteration)

**触发**: 用户需要分析线上问题、优化模型效果

### 执行流程

1. **Bad Case 驱动迭代**
   - 收集线上 Bad Case
   - 归类根因: Prompt 问题 / 知识库缺失 / 模型能力不足 / 数据质量问题
   - 针对性优化: 改 Prompt → 补知识库 → 考虑微调

2. **数据飞轮运转**
   - 检查数据闭环是否生效
   - 反馈数据量是否达到微调阈值
   - 设计微调数据构造方案

3. **ROI 复盘**
   - 实际成本 vs 预估成本对比
   - 业务指标变化 (效率/留存/GMV)
   - 下一迭代周期优先级排序

### 产出

```markdown
# 迭代优化报告

## Bad Case Top-N
## 根因分布
- Prompt 问题: X%
- 知识库缺失: X%
- 模型能力不足: X%

## 优化措施
| 优先级 | 措施 | 预期提升 | 工作量 |
|--------|------|---------|--------|

## 下次迭代计划
```

---

## 使用模式

### 快捷模式 (单阶段切入)

用户提出具体任务，直接匹配对应阶段:

- `帮我分析这个需求的 AI 适配性` → 阶段一
- `分析XX产品的竞品` → 阶段二
- `帮我写一份PRD` → 阶段三
- `设计一个客服Agent的Prompt` → 阶段四.1
- `设计一个多Agent协作流程` → 阶段四.2
- `设计一个企业知识库RAG方案` → 阶段四.3
- `帮我选一个合适的模型并估算成本` → 阶段四.4
- `搭建AI评估体系` → 阶段五
- `分析Bad Case并给迭代建议` → 阶段六

### 全流程模式

用户说"帮我完整设计一个AI产品方案"时，按顺序执行六个阶段。

### 输出偏好

- 所有产出使用 Markdown 格式
- 表格优先于纯文本描述
- 每个阶段输出后确认是否继续下一阶段
- 关键技术决策需要说明理由和 trade-off

---

## 核心原则

1. **AI 适配优先**: 不是所有问题都需要 AI，先判断再设计
2. **成本意识**: 每个 AI 方案必须附带成本估算
3. **降级必有**: 每个 AI 功能必须有非 AI 的降级路径
4. **数据闭环**: 设计方案时必须内置数据飞轮机制
5. **评估先行**: 上线前必须先定义好评估指标和标准
AI产品经理全流程助手

SKILL.md

related skills