AI产品经理全流程助手。覆盖需求洞察→竞品分析→PRD方案设计→AI能力设计(Prompt/Agent/RAG)→上线评估→迭代优化6大阶段。融合模型边界管理、Prompt工程、Agent编排、RAG数据工程、AI评估五大核心能力。触发词: AI产品经理, AI PM, 写PRD, 竞品分析, Prompt设计,...
---
name: ai-pm
description: "AI产品经理全流程助手。覆盖需求洞察→竞品分析→PRD方案设计→AI能力设计(Prompt/Agent/RAG)→上线评估→迭代优化6大阶段。融合模型边界管理、Prompt工程、Agent编排、RAG数据工程、AI评估五大核心能力。触发词: AI产品经理, AI PM, 写PRD, 竞品分析, Prompt设计, Agent工作流, RAG设计, AI评估, 需求分析, 产品方案, 模型选型, AI功能设计, ai product manager, PRD生成, 技术可行性评估, AI产品设计。"
version: "1.0.0"
agent_created: true
metadata:
emoji: "🧠"
tags: ["ai", "product-management", "pm", "prompt-engineering", "agent-design", "rag", "evaluation"]
category: "productivity"
---
# AI PM — AI产品经理全流程助手
> 覆盖从需求洞察到迭代优化的完整 AI 产品管理链路,融合模型边界管理、Prompt 工程、Agent 编排、RAG 数据工程、AI 评估五大 AI PM 核心能力。
---
## 概述
AI PM Skill 是一个面向 AI 产品经理的全流程助手,覆盖 6 大阶段、18 个关键动作。当用户提出任何与 AI 产品管理相关的任务时,自动匹配对应阶段并引导执行。
### 核心定位
- **传统 PM 任务增强**: PRD 生成、竞品分析、需求分析 → AI 加持的结构化产出
- **AI PM 专属能力**: Prompt 模板设计、Agent 工作流编排、RAG 方案设计、模型选型与成本估算
- **全流程串联**: 从需求到迭代的 6 阶段闭环,支持逐阶段推进或单点切入
---
## 六大阶段工作流
```
①需求洞察 → ②竞品分析 → ③方案设计 → ④AI能力设计 → ⑤上线评估 → ⑥迭代优化
4动作 3动作 4动作 4动作 2动作 3动作
```
---
## 阶段一:需求洞察 (Requirement Discovery)
**触发**: 用户描述产品想法、用户痛点、业务需求
### 执行流程
1. **用户痛点挖掘**
- 引导用户描述目标用户画像和核心场景
- 使用用户旅程地图 (User Journey Map) 框架梳理痛点
- 区分"真实需求"与"技术噱头"
2. **AI 适配性判断** (AI PM 核心能力)
- 判断该需求是否适合用 AI/LLM 解决
- 决策框架:
| 适合 AI | 不适合 AI |
|---------|-----------|
| 生成、总结、推理、分类 | 精确计算、合规检查、确定性逻辑 |
| 非结构化数据处理 | 结构化 CRUD |
| 需要上下文理解 | 确定性规则引擎即可满足 |
- 输出: 每个需求的 AI 适配度评分 (1-5)
3. **ROI 初步估算**
- Token 成本预估 (按日活 * 平均调用次数 * 平均Token消耗)
- 标注成本 (如需微调)
- 预期收益量化 (效率提升 % / 成本降低 % / 体验提升指标)
4. **干系人与约束分析**
- 识别关键干系人 (业务方、算法团队、工程团队、合规)
- 列出技术约束 (延迟要求、准确率门槛、合规要求)
### 产出模板
```markdown
# 需求分析报告
## 1. 用户与场景
- 目标用户:
- 核心场景:
- 痛点列表 (优先级排序):
## 2. AI 适配性评估
| 需求 | AI适配度(1-5) | 推荐方案 | 理由 |
|------|:-----------:|---------|------|
## 3. ROI 估算
- 预估日活:
- Token 消耗/次:
- 日成本:
- 预期收益:
## 4. 约束与风险
- 技术约束:
- 合规要求:
- 关键干系人:
```
---
## 阶段二:竞品分析 (Competitor Analysis)
**触发**: 用户要求分析竞品、了解市场格局、寻找差异化定位
### 执行流程
1. **竞品情报搜集**
- 联网搜索直接竞品和间接竞品
- 识别三类竞争对手:
- **显性竞品**: 同赛道直接竞争产品
- **跨界竞品**: 从其他领域切入的竞争者
- **替代方案**: 用户当前使用的非产品方案 (Excel、人工等)
2. **AI 竞品深度分析** (三维视野)
- **功能层**: 功能矩阵对比 (是否用 AI? 用了什么模型? 效果如何?)
- **模型层**: 底层模型能力对比 (基座模型、微调策略、数据飞轮)
- **体验层**: AI 交互模式对比 (对话式/嵌入式和/Agent式)
3. **差异化定位建议**
- 基于竞品分析输出差异化方向
- SWOT 分析 (聚焦 AI 能力差异)
### 产出模板
```markdown
# 竞品分析报告
## 1. 竞品全景图
| 竞品 | 类型 | 核心AI能力 | 目标用户 | 优势 | 劣势 |
|------|------|-----------|---------|------|------|
## 2. 功能矩阵对比
| 功能维度 | 我方 | 竞品A | 竞品B | 竞品C |
|---------|------|-------|-------|-------|
## 3. AI 能力对比
| 维度 | 竞品A | 竞品B | 竞品C |
|------|-------|-------|-------|
| 基座模型 | | | |
| Prompt策略 | | | |
| RAG方案 | | | |
| 评估体系 | | | |
## 4. SWOT + 差异化建议
- 可切入的差异化点:
- AI 层面的独特优势:
```
---
## 阶段三:方案设计 (Solution Design / PRD)
**触发**: 用户要求写 PRD、设计方案、规划功能
### 执行流程
1. **PRD 结构化生成**
- 背景与目标
- 用户故事 (User Stories)
- 功能详情 (含 AI 功能描述)
- 非功能需求 (性能、安全、合规)
- 验收标准
- 上线计划
2. **AI 降级方案设计** (AI PM 特有)
- 设计多级降级策略:
```
模型输出 → 置信度检查 → [≥阈值] 直接输出
→ [<阈值] 知识库兜底
→ [知识库无匹配] 人工接管
```
- 对每个 AI 功能点,明确: 正常路径、降级路径、熔断条件
3. **人机协同 (Human-in-the-Loop) 流程设计**
- 标识需要人工介入的关键决策点
- 设计审核流程与权限
4. **数据闭环设计**
- 定义需要收集的用户反馈信号 (点赞/踩/修改/忽略)
- 设计数据飞轮: 反馈 → 标注 → 微调 → 效果提升
### 产出模板
```markdown
# PRD: [产品/功能名称]
## 1. 背景与目标
## 2. 用户故事
## 3. 功能详情
### 3.1 AI 功能说明
- 模型调用链路:
- Prompt 策略:
- 降级方案:
## 4. 非功能需求
- 延迟要求: < X ms
- 准确率目标: > X%
- 合规要求:
## 5. 人机协同流程
## 6. 数据闭环设计
## 7. 验收标准
## 8. 上线与灰度计划
```
---
## 阶段四:AI 能力设计 (AI Capability Design)
**这是 AI PM 区别于传统 PM 的核心能力层。**
### 4.1 Prompt 模板工程
**触发**: 用户需要设计 Prompt、优化提示词
#### 设计框架
```
Prompt 模板 = 角色设定 + 任务拆解 + 约束条件 + Few-Shot示例 + 输出Schema
```
#### 执行步骤
1. **角色设定**: 明确 AI 的角色身份和专业领域
2. **任务拆解**: 将复杂任务分解为子任务步骤
3. **约束条件**: 定义格式要求、禁止行为、安全边界
4. **Few-Shot 示例**: 提供 2-3 个输入→输出范例
5. **输出 Schema**: 定义 JSON/XML 输出结构 (便于程序解析)
6. **动态变量**: 标识需要动态注入的变量 (用户画像、上下文等)
#### 产出格式
```markdown
## Prompt 模板: [模板名称]
### 角色设定
你是 [角色描述]
### 任务
[任务步骤,分步描述]
### 约束
- [约束1]
- [约束2]
### Few-Shot 示例
输入:
输出:
### 输出格式
{json schema}
### 动态变量
- {{user_profile}}: 用户画像
- {{context}}: 上下文
```
### 4.2 Agent 工作流编排
**触发**: 用户需要设计多 Agent 协作、自动化工作流
#### 设计框架
```
用户目标 → 任务拆解 → Agent/工具分配 → 执行编排 → 结果聚合 → 人机回环
```
#### 执行步骤
1. **目标分解**: 将用户模糊目标拆解为可执行的子任务链
2. **Agent 角色定义**: 为每个子任务定义 Agent 角色和能力
3. **工具链设计**: 定义 Agent 可调用的工具 (搜索/计算/API等)
4. **执行编排**:
- 串行/并行决策
- 条件分支 (if-else)
- 循环迭代
- 错误重试策略
5. **人机回环 (HITL) 设计**: 在关键决策点插入人工确认
#### 产出格式
```markdown
## Agent 工作流: [工作流名称]
### 用户意图
[描述用户输入和目标]
### 任务拆解
Step 1: [子任务] → Agent: [角色] → 工具: [工具列表]
Step 2: [子任务] → Agent: [角色] → 工具: [工具列表]
...
### 执行流程
flowchart TD
A[用户输入] → B[Agent1: 任务识别]
B → C{条件判断}
C →|路径A| D[Agent2]
C →|路径B| E[Agent3]
...
### HITL 检查点
- [检查点1]: 条件 + 人工确认内容
- [检查点2]: 条件 + 人工确认内容
```
### 4.3 RAG 方案设计
**触发**: 用户需要设计知识库问答、企业数据检索增强
#### 设计框架
```
数据准备 → 切片(Chunking) → 向量化(Embedding) → 检索(Recall) → 重排序(Rerank) → 生成
```
#### 执行步骤
1. **数据源分析**: 识别需要接入的数据类型 (文档/数据库/API)
2. **切片策略设计**:
- 分块大小 (Chunk Size): 根据内容类型选择 (代码 500 token, 文档 1000 token)
- 重叠策略 (Overlap): 建议 10-20%
- 元数据保留: 标题、来源、时间戳
3. **向量化方案**:
- Embedding 模型选型 (效果 vs 成本 vs 延迟)
- 多模态支持 (文本 + 图片)
4. **检索策略**:
- 混合检索 (向量 + 关键词)
- 多路召回 + 融合排序
5. **重排序 (Rerank)**: 选择 Rerank 模型提升精度
6. **生成策略**: Prompt 中如何引用检索结果
#### 产出格式
```markdown
## RAG 方案: [方案名称]
### 数据源
| 数据类型 | 格式 | 更新频率 | 数据量级 |
|---------|------|---------|---------|
### 切片策略
- Chunk Size:
- Overlap:
- 分隔符:
- 元数据:
### Embedding 方案
- 模型:
- 维度:
- 预估成本:
### 检索链路
1. Query 改写/扩展
2. 向量检索 (Top-K: )
3. 关键词检索 (BM25)
4. 融合排序 (RRF/加权)
5. Rerank (Top-N: )
### 生成 Prompt
{包含检索结果的 Prompt 模板}
```
### 4.4 模型选型与成本估算
**触发**: 用户需要选择模型、估算成本
#### 执行步骤
1. **能力需求匹配**: 根据任务类型推荐模型
| 任务类型 | 推荐模型 | 理由 |
|---------|---------|------|
| 简单分类/抽取 | 轻量模型 (Qwen-7B, GPT-4o-mini) | 低成本、低延迟 |
| 复杂推理/生成 | 强模型 (DeepSeek-R1, GPT-4o) | 高准确性 |
| 多模态 (图+文) | GPT-4o, Qwen-VL | 视觉理解能力 |
| 代码生成 | DeepSeek-Coder, Claude | 代码能力强 |
2. **Token 成本计算**:
```
日成本 = DAU × 平均调用次数 × (输入Token × 输入单价 + 输出Token × 输出单价)
```
3. **缓存策略设计**:
- 语义缓存: 相似问题直接返回缓存结果
- 精确缓存: 相同问题命中缓存
- 预估缓存命中率及成本节省
---
## 阶段五:上线评估 (Launch & Evaluation)
**触发**: 用户需要设计评估方案、A/B测试、上线策略
### 执行流程
1. **AI 评估体系搭建** (Eval Framework)
- 构建 Golden Dataset (标准测试集)
- 五维评估指标:
| 维度 | 指标 | 测量方式 |
|------|------|---------|
| 准确性 | 正确率/精确率/召回率/F1 | 人工标注 + 自动对比 |
| 相关性 | NDCG/MRR | 排序质量评估 |
| 安全性 | 违规率/拒答率 | 安全测试集 |
| 延迟 | P50/P95/P99 延迟 | 监控埋点 |
| 成本 | 单次调用成本 | Token 计数 |
2. **A/B 测试设计**
- 实验组 vs 对照组定义
- 分流比例与样本量计算
- 核心指标 (OEC) 定义
- 统计显著性判断标准 (p < 0.05)
3. **灰度发布策略**
- 阶段一: 内部员工 1%
- 阶段二: 外部用户 5% → 观察 24h
- 阶段三: 10% → 50% → 100%
- 每个阶段的观测指标和回滚条件
### 产出
```markdown
# AI 评估报告
## 1. Eval 体系
### Golden Dataset 概况
- 样本数:
- 覆盖场景:
### 评估结果
| 维度 | 指标 | 当前值 | 目标值 | 达标 |
|------|------|--------|--------|:----:|
## 2. Bad Case 分析
| ID | 输入 | 期望输出 | 实际输出 | 根因 | 修复方案 |
|----|------|---------|---------|------|---------|
## 3. 上线决策
- A/B 结论:
- 是否全量:
```
---
## 阶段六:迭代优化 (Iteration)
**触发**: 用户需要分析线上问题、优化模型效果
### 执行流程
1. **Bad Case 驱动迭代**
- 收集线上 Bad Case
- 归类根因: Prompt 问题 / 知识库缺失 / 模型能力不足 / 数据质量问题
- 针对性优化: 改 Prompt → 补知识库 → 考虑微调
2. **数据飞轮运转**
- 检查数据闭环是否生效
- 反馈数据量是否达到微调阈值
- 设计微调数据构造方案
3. **ROI 复盘**
- 实际成本 vs 预估成本对比
- 业务指标变化 (效率/留存/GMV)
- 下一迭代周期优先级排序
### 产出
```markdown
# 迭代优化报告
## Bad Case Top-N
## 根因分布
- Prompt 问题: X%
- 知识库缺失: X%
- 模型能力不足: X%
## 优化措施
| 优先级 | 措施 | 预期提升 | 工作量 |
|--------|------|---------|--------|
## 下次迭代计划
```
---
## 使用模式
### 快捷模式 (单阶段切入)
用户提出具体任务,直接匹配对应阶段:
- `帮我分析这个需求的 AI 适配性` → 阶段一
- `分析XX产品的竞品` → 阶段二
- `帮我写一份PRD` → 阶段三
- `设计一个客服Agent的Prompt` → 阶段四.1
- `设计一个多Agent协作流程` → 阶段四.2
- `设计一个企业知识库RAG方案` → 阶段四.3
- `帮我选一个合适的模型并估算成本` → 阶段四.4
- `搭建AI评估体系` → 阶段五
- `分析Bad Case并给迭代建议` → 阶段六
### 全流程模式
用户说"帮我完整设计一个AI产品方案"时,按顺序执行六个阶段。
### 输出偏好
- 所有产出使用 Markdown 格式
- 表格优先于纯文本描述
- 每个阶段输出后确认是否继续下一阶段
- 关键技术决策需要说明理由和 trade-off
---
## 核心原则
1. **AI 适配优先**: 不是所有问题都需要 AI,先判断再设计
2. **成本意识**: 每个 AI 方案必须附带成本估算
3. **降级必有**: 每个 AI 功能必须有非 AI 的降级路径
4. **数据闭环**: 设计方案时必须内置数据飞轮机制
5. **评估先行**: 上线前必须先定义好评估指标和标准
don't have the plugin yet? install it then click "run inline in claude" again.