back
loading skill details...
Skill工厂,AI作为规划层循环迭代生产新Skill(需求对齐→选档→设计→生成→测试→对比→迭代→交付),支持手动/半自动/全自动三档模式
--- name: skill-factory description: "Skill工厂,AI作为规划层循环迭代生产新Skill(需求对齐→选档→设计→生成→测试→对比→迭代→交付),支持手动/半自动/全自动三档模式" --- # Skill Factory(Skill 工厂) AI 作为规划层和验收层,通过迭代循环生产新的 Skill。支持可插拔的外部 AI 作为执行层,也可以由 AI 自身完成全部流程。 ## 触发词 用户说以下任一内容时启动本 skill: - "帮我做一个新 skill" / "创建 skill" - "skill 工厂" / "造个 skill" - "帮我迭代这个 skill" / "改进 skill" - "把这个步骤拆成独立 skill" ## 使用方式 - 直接说"帮我做一个 XX skill",我会从需求对齐开始引导你 - 说"帮我迭代已有的 XX skill",我会在已有基础上改进 - 说"把 XX skill 的 YY 步骤拆成独立 skill",我会执行子 skill 分裂流程 --- ## 一、概述 Skill Factory 是一个 meta-skill——造 skill 的 skill。 **核心能力**: - 接收用户需求,设计并生成一个完整的 Skill - 执行层可插拔:根据任务性质选择不同 AI(如 GPT、Gemini、Claude 等) - 三档迭代测试:手动/半自动/全自动 - 对标驱动:全自动档通过对比参考成品来判断质量 - 先整后分:初版保持单体,稳定后再按需拆出子 skill **角色分工**: - **AI(规划层)**:规划、设计、验收、迭代决策 - **外部 AI(执行层)**:内容生成、草稿撰写、代码编写等执行性工作 - **用户**:需求输入、档位选择、最终验收 --- ## 二、前置条件 - 如需调用外部 AI,需配置至少一个可用的 AI API(参见 `tech-library.md` 模板) - 如需智能选择执行层 AI,需配置场景-AI 对照表(参见 `call-guide.md` 模板) - **最小可用配置**:即使没有外部 AI API,AI 自身也可以作为唯一执行层完成全部流程 --- ## 三、执行流程 ### 第零步:请求分流 在进入正式流程前,先判断请求类型: - **"我要一个新的 XX skill"** → 创建模式:走完整第一步到第九步 - **"帮我改进/迭代已有的 XX skill"** → 迭代模式:跳到第二步(选档),第三步加载已有 skill 为基础 - **"帮我把 XX skill 的 YY 步骤拆成独立 skill"** → 分裂模式:走子 Skill 分裂流程(见第七章) - **不是 skill 相关的请求** → 告知用户此 skill 专用于创建/迭代 skill **迭代模式特殊规则**: - 已有 skill 自动成为"骨架参考"(跳过第三步的选择环节) - 用户可以同时提供对标成品用于全自动档对比 - 修改基于已有内容,不生成全新文件 --- ### 第一步:需求对齐 1. 用户提出需求:"我要一个 XX skill" 2. AI 与用户反复讨论,直到完全理解: - **Skill 要解决什么问题**:核心使用场景 - **触发方式**:什么时候调用这个 skill - **输入和输出**:用户给什么、skill 产出什么 - **质量标准**:什么样的输出算"好" - **参考对标**:有没有现成的成品可以作为目标 3. AI 复述需求给用户确认 4. 用户确认后才进入下一步 5. **禁止跳过此步**:需求不清就开始设计 = 浪费迭代次数 --- ### 第二步:选档 向用户确认迭代模式: | 档位 | 人机比例 | 适用场景 | |------|---------|---------| | 手动档 | 用户100% | 用户只需要初版,自己改 | | 半自动档 | 用户在关键节点介入 | 需要用户判断质量方向 | | 全自动档 | 用户提供参考,AI 自动迭代 | 有明确对标成品 | **全自动档额外参数**: - **循环上限**:用户设定最大迭代次数(建议 3-8 次) - **对标材料**:用户提供参考成品 --- ### 第三步:选参考 1. **模板参考**:列出所有现有 skill,让用户选择一个结构最接近的作为骨架参考 2. 如果没有合适的,使用通用 skill 骨架(见附录 A) 3. **对标成品**(全自动档必须提供): - 一个或多个期望输出的样本 - AI 分析成品的结构、风格、深度 - 提取评价维度,用于后续对比 --- ### 第四步:分析设计 1. **拆解步骤**:将 skill 的工作流拆成具体步骤 2. **选择 AI**:根据场景-AI 对照表,为每个步骤选择最合适的 AI 3. **粗判子 skill 潜力**:标记可能独立的步骤为 `[潜在子skill]`,但不拆分 4. **生成设计文档**:展示给用户确认 设计文档格式: ``` ## Skill 设计:<skill名称> ### 步骤拆解 1. <步骤名> → 执行AI: <AI名称> → [潜在子skill](如适用) 2. <步骤名> → 执行AI: <AI名称> ### 输出格式 <预期的 Skill 结构大纲> ### 参考来源 - 骨架参考:<已有skill名称> - 对标成品:<成品描述> ``` --- ### 第五步:生成初版 Skill 1. 根据设计文档,生成完整的 Skill 内容 2. 包含标准前置元数据(name + description) 3. 包含完整的工作流程、模板、规则 4. 对需要调用外部 AI 的步骤,写入具体的调用指引 **生成规则**: - 参考骨架 skill 的结构和风格 - 每个步骤必须可独立执行,有明确的输入输出 - 包含"与其他 skill 的配合"部分 **手动档**:生成后直接交付用户,流程结束(跳到第九步)。 --- ### 第六步:测试运行 用真实输入运行刚生成的 skill,验证是否可用。 **测试方式**: 1. 模拟调用这个 skill 的完整流程 2. 对需要外部 AI 的步骤,实际调用 API 获取输出 3. 记录每个步骤的输入、输出、耗时 4. 记录异常和失败点 **测试输出**: ``` ## 测试报告 - 第N轮 ### 执行摘要 - 测试输入:<描述> - 总步骤数:X - 成功步骤:Y - 失败步骤:Z ### 逐步结果 | 步骤 | 状态 | 执行AI | 输出摘要 | 问题 | |------|------|--------|---------|------| ### 最终输出 <skill 产出的完整结果> ``` --- ### 第七步:对比反馈(质量门) 将测试输出与参考成品进行对比,产出明确的质量判定。 **评分维度**(每项 0-10 分): | 维度 | 说明 | |------|------| | 结构完整度 | 是否包含所有必要部分 | | 内容深度 | 内容是否足够详细和专业 | | 风格匹配度 | 语气、表达方式是否与参考一致 | | 可执行性 | 步骤是否清晰到可以直接执行 | | 输出质量 | 最终产出是否达到参考水准 | **质量判定(Quality Gate)**: - **PASS**(总分 >= 40/50)→ 质量达标,直接进入交付 - **CONCERNS**(总分 35-39/50)→ 半自动档展示报告由用户决定;全自动档自动继续迭代 - **FAIL**(总分 < 35/50)→ 进入迭代修改 - **收敛**(连续两轮总分变化 <= 1)→ 质量已稳定,退出迭代 **对比报告格式**: ``` ## 对比报告 - 第N轮 ### 质量判定:PASS / CONCERNS / FAIL ### 评分 | 维度 | 分数 | 上轮 | 变化 | |------|------|------|------| | 结构完整度 | X/10 | Y/10 | +Z | | 内容深度 | X/10 | Y/10 | +Z | | 风格匹配度 | X/10 | Y/10 | +Z | | 可执行性 | X/10 | Y/10 | +Z | | 输出质量 | X/10 | Y/10 | +Z | | **总分** | **XX/50** | **YY/50** | **+ZZ** | ### 差距分析 1. <具体问题> ### 修改建议(仅 CONCERNS/FAIL 时生成) 1. <具体修改建议> ``` --- ### 第八步:迭代修改 根据对比报告的修改建议,修改 Skill 内容。 **迭代规则**: 1. 逐条执行修改建议 2. 修改后回到第六步重新测试 3. 循环直到满足退出条件 **退出条件**(满足任一即退出): - **收敛**:连续两轮总分变化 <= 1 分 - **达标**:总分 >= 40/50(80%) - **到限**:达到用户设定的循环上限 - **用户中断**:用户主动喊停(半自动档) **每轮迭代记录**: ``` ### 迭代记录 - 第N轮 - 修改项:<改了什么> - 测试结果:<通过/失败> - 总分变化:XX → YY - 状态:继续迭代 / 收敛退出 / 达标退出 / 到限退出 ``` --- ### 第九步:交付部署 1. 整理最终版 Skill 2. 生成交付报告: ``` ## Skill Factory 交付报告 ### 基本信息 - Skill 名称:<name> - 迭代轮次:N 轮 - 最终评分:XX/50 - 退出原因:收敛 / 达标 / 到限 / 手动 ### 迭代历程 | 轮次 | 总分 | 主要修改 | |------|------|---------| ### 子 Skill 潜力标记 - [潜在子skill] <步骤名>:<独立的理由> ### 后续建议 - <建议1> - <建议2> ``` 3. 用户决定部署位置 --- ## 四、三档模式详细规则 ### 手动档 ``` 第一步 → 第二步 → 第三步 → 第四步 → 第五步 → 第九步(直接交付) ``` - 跳过测试、对比、迭代 - 用户拿到初版后自行修改和测试 ### 半自动档 ``` 第一步 → 第二步 → 第三步 → 第四步 → 第五步 → 第六步 → 第七步 → [用户确认] → 第八步 → 回到第六步 → ... → 用户满意 → 第九步 ``` - 每轮迭代后展示对比报告,等用户确认方向 ### 全自动档 ``` 第一步 → 第二步 → 第三步 → 第四步 → 第五步 → 第六步 → 第七步 → 第八步 → 回到第六步 → ... → 满足退出条件 → 第九步 ``` - 用户只在前三步参与,后续完全自动循环 - 靠收敛/达标/到限三个条件自动退出 --- ## 五、AI 调用规范 ### 选择执行层 AI 根据场景-AI 对照表(`call-guide.md`)判断: - 该步骤是否需要调用外部 AI - **评审验收必须由规划层 AI 自身执行,不可外包** - 需要外部 AI 时,走三级降级链:主用 AI → 备用 AI → AI 自身 ### 降级规则 | 规则 | 说明 | |------|------| | 失败判定 | 同一 AI 连续失败 2 次才触发降级 | | 失败类型 | HTTP 错误、超时、空响应、解析失败 | | 记录日志 | 每次降级记录:日期、AI、失败原因、降级到谁 | | 下次重试 | 降级不是永久的——下一个新任务仍先尝试主用 AI | ### 调用方式 所有第三方 API 统一使用 **OpenAI 兼容格式**调用。具体的 API 配置参见 `tech-library.md`,调用模板参见 `call-guide.md`。 --- ## 六、对比验收机制 ### 评分维度 | 维度 | 权重 | 评分标准 | |------|------|---------| | 结构完整度 | 20% | 是否包含所有必要章节和步骤 | | 内容深度 | 25% | 知识密度、专业性、细节程度 | | 风格匹配度 | 15% | 与参考成品的语气、表达一致性 | | 可执行性 | 25% | 步骤能否直接执行、是否有歧义 | | 输出质量 | 15% | 最终产出的整体质量感受 | ### 收敛判断 - 连续两轮总分变化 <= 1 → 收敛退出 - 总分 >= 40 → 达标退出 - 当前轮次 >= 循环上限 → 到限退出 - 否则 → 继续迭代 ### 无参考成品时 - 跳过"风格匹配度"维度 - 用 skill 规范(结构完整、步骤可执行、无遗漏)作为评判标准 --- ## 七、子 Skill 分裂规则 ### 设计阶段:粗判标记 **标记条件**(满足 2 条以上): - 该步骤逻辑完整,可独立运行 - 该步骤在其他 skill 中也可能被复用 - 该步骤足够复杂,值得单独维护 - 该步骤使用的 AI 和其他步骤不同 ### 迭代阶段:细调分裂 **触发时机**:主 skill 基础功能稳定后,用户主动提出。 **分裂流程**: 1. 从主 skill 中提取目标步骤 2. 用 skill-factory 自身为该步骤生成独立 skill 3. 在主 skill 中将该步骤替换为子 skill 调用指引 4. 测试主 skill + 子 skill 的衔接 --- ## 八、核心规则 1. **需求不清不动手**:第一步必须完成,复述确认后才继续 2. **档位即承诺**:选了全自动就不中途随意切半自动(除非用户主动要求) 3. **先整后分**:初版 skill 保持单体,不提前拆分子 skill 4. **迭代有限**:全自动档必须设循环上限,防止空转 5. **降级可用**:任何外部 AI 不可用时,AI 自身顶上 6. **记录透明**:每轮迭代的修改、评分、决策全部记录 --- ## 示例 **用户**:帮我做一个"会议纪要"skill **小龙虾**:好的,我来帮你创建一个会议纪要 skill。先确认几个问题: 1. 这个 skill 要解决什么问题?(比如:自动从对话中提取会议要点) 2. 用户会怎么触发?(比如:说"整理会议纪要") 3. 输入是什么?(比如:一段会议聊天记录) 4. 输出要什么格式?(比如:标题+参会人+决议+待办) 5. 有没有参考样本? **用户**:就是整理群里的讨论,输出待办和结论就行,半自动档 **小龙虾**:明白了。我来复述确认:……(进入完整流程) --- ## 与其他 Skill 的配合 - **知识蒸馏类 skill**:skill 开发过程中的经验可写入知识库 - **SOP 生成器**:如果某个 skill 的生产过程值得复用,可生成 SOP - **版本管理类 skill**:skill 正式部署后,可记录版本日志 --- ## 附录 A:通用 Skill 骨架 当没有合适的现有 skill 作为参考时,使用此骨架: ```markdown --- name: <skill-name> description: "<一句话描述>" --- # <Skill 名称> <一句话概述> ## 触发词 用户说以下任一内容时启动本 skill: - "<触发词1>" - "<触发词2>" ## 使用方式 - 直接说"<触发词>",我会引导你完成 - 或者说"<触发词> + 具体内容"直接执行 ## 执行流程 1. **<步骤名>** - <步骤内容> 2. **<步骤名>** - <步骤内容> ## 核心规则 1. <规则1> 2. <规则2> ## 与其他 Skill 的配合 - **<skill名>**:<配合方式> ``` --- ## 附录 B:流程上下文变量 skill-factory 运行时维护以下上下文变量: | 变量 | 设定时机 | 用途 | |------|---------|------| | `target_skill_name` | 第一步 | 目标 skill 名称 | | `mode` | 第二步 | 手动/半自动/全自动 | | `max_iterations` | 第二步 | 全自动档循环上限 | | `reference_skill` | 第三步 | 骨架参考 skill | | `benchmark_material` | 第三步 | 对标成品 | | `current_iteration` | 第六步起 | 当前迭代轮次 | | `scores_history` | 第七步起 | 历次评分记录 | --- ## 参考文档 - 技术库模板:[tech-library.md](tech-library.md) — AI API 配置参考 - 调用指南模板:[call-guide.md](call-guide.md) — 场景-AI 对照与调用方式
don't have the plugin yet? install it then click "run inline in claude" again.