AI测试工程师全生命周期技能集合。覆盖需求分析→测试设计→AI协作→自动化→执行监控→质量度量→专项测试7大阶段共48个专家级测试技能模块,使初级测试人员输出专家级测试用例。触发词:测试用例、测试设计、测试策略、测试分析、测试报告、接口测试、性能测试、安全测试、自动化测试、AI测试、质量度量、缺陷分析、回归测试、...
--- name: ai-test-engineer description: AI测试工程师全生命周期技能集合。覆盖需求分析→测试设计→AI协作→自动化→执行监控→质量度量→专项测试7大阶段共48个专家级测试技能模块,使初级测试人员输出专家级测试用例。触发词:测试用例、测试设计、测试策略、测试分析、测试报告、接口测试、性能测试、安全测试、自动化测试、AI测试、质量度量、缺陷分析、回归测试、兼容性测试、测试评审、测试估算、探索性测试、CI/CD测试、测试数据、测试环境、测试覆盖率、测试效率、质量模型、测试ROI。 agent_created: true --- # AI测试工程师 — 48模块全生命周期测试技能集 ## 概述 本Skill将一名初级测试工程师的日常操作注入专家级知识体系,覆盖测试全生命周期的7大阶段48个核心技能模块。每个模块包含核心方法论、专家操作流程、关键检查点、常见陷阱、产出模板和AI增强技巧。 ## 触发指南 当用户提出以下意图时加载本Skill: - 编写/设计/评审测试用例 - 制定测试策略/计划 - 分析需求可测性 - 执行测试设计(等价类、边界值、状态迁移等) - AI辅助测试(生成用例、分析缺陷、智能回归) - 搭建自动化测试框架 - 测试执行监控与缺陷管理 - 质量度量、效率分析、ROI评估 - 专项测试(性能、安全、兼容性、易用性) ## 架构总览:7阶段 × 48模块 ``` Phase 1: 需求分析与测试策略 (6模块) → references/phase1-requirements.md Phase 2: 测试设计方法 (8模块) → references/phase2-design-methods.md Phase 3: 测试用例工程 (8模块) → references/phase3-testcase-engineering.md Phase 4: AI协作测试 (8模块) → references/phase4-ai-collaboration.md Phase 5: 自动化测试 (6模块) → references/phase5-automation.md Phase 6: 测试执行与监控 (6模块) → references/phase6-execution.md Phase 7: 质量度量与分析 (6模块) → references/phase7-quality-metrics.md ``` ## 使用方式 ### 交互式导航 当用户提出测试相关问题时,按以下步骤响应: 1. **识别阶段**:根据用户意图匹配对应的Phase 2. **加载参考**:Read对应的 `references/phaseX-xxx.md` 文件 3. **定位模块**:在参考文件中找到精确匹配的技能模块 4. **执行专家流程**:严格按照模块中定义的方法论、检查点、模板执行 5. **输出专家级产物**:生成结构化的测试用例/策略/报告 ### 模块选择决策树 ``` 用户意图 ├─ 涉及需求/策略/计划 → Phase 1 ├─ 涉及测试方法/设计技巧 → Phase 2 ├─ 涉及具体用例编写 → Phase 3 ├─ 涉及AI辅助/智能化 → Phase 4 ├─ 涉及自动化/CI/CD → Phase 5 ├─ 涉及执行/缺陷/环境 → Phase 6 └─ 涉及度量/效率/ROI → Phase 7 ``` ### 跨阶段组合 对于复杂请求(如"为这个API设计完整的测试方案"),按顺序加载多个Phase: 1. Phase 1 → 分析需求可测性,制定测试策略 2. Phase 2 → 选择测试设计方法(等价类+边界值+判定表) 3. Phase 3 → 编写具体测试用例 4. Phase 5 → 设计自动化测试方案(如适用) 5. Phase 7 → 定义质量度量标准 ## 快速索引:48模块一览 | 编号 | 模块名称 | 阶段 | 核心价值 | |------|---------|------|---------| | M01 | 需求可测性分析 | P1 | 判断需求是否可测,识别测试盲区 | | M02 | 测试策略制定 | P1 | 选择最优测试方法和资源分配方案 | | M03 | 测试范围与优先级 | P1 | 基于风险的测试范围裁剪 | | M04 | 风险识别与评估 | P1 | FMEA风险矩阵,预防性测试 | | M05 | 测试估算与资源规划 | P1 | 工作量估算、人力和环境规划 | | M06 | 需求评审检查清单 | P1 | 结构化需求评审,减少返工 | | M07 | 等价类划分法 | P2 | 用最少用例覆盖最多场景 | | M08 | 边界值分析法 | P2 | 精准捕获边界缺陷 | | M09 | 判定表与因果图 | P2 | 复杂业务规则的逻辑化测试 | | M10 | 状态迁移测试 | P2 | 全覆盖状态机和状态转换 | | M11 | 正交实验设计 | P2 | 多因素组合的最小用例集 | | M12 | 场景法测试设计 | P2 | 端到端用户场景覆盖 | | M13 | 组合测试设计 | P2 | Pairwise/N-wise组合覆盖 | | M14 | 错误推测法 | P2 | 基于经验的缺陷预测 | | M15 | 功能测试用例编写 | P3 | 8要素标准功能用例模板 | | M16 | 接口测试用例编写 | P3 | REST/GraphQL/gRPC全覆盖 | | M17 | 性能测试用例设计 | P3 | 负载/压力/稳定性/峰值场景 | | M18 | 安全测试用例设计 | P3 | OWASP Top 10全覆盖 | | M19 | 兼容性测试用例 | P3 | 多端多浏览器多分辨率矩阵 | | M20 | 易用性测试用例 | P3 | Nielsen十大可用性原则驱动 | | M21 | 测试数据构造 | P3 | 等价类数据+边界数据+异常数据 | | M22 | 测试用例评审与优化 | P3 | 7维度评审,去除冗余 | | M23 | AI生成测试用例 | P4 | Prompt工程驱动的高质量用例生成 | | M24 | AI辅助测试脚本 | P4 | 自然语言→自动化脚本 | | M25 | AI缺陷分析 | P4 | 智能分类、根因分析、模式识别 | | M26 | 智能回归测试选择 | P4 | 基于代码变更的精准回归 | | M27 | AI测试数据生成 | P4 | 智能造数,覆盖边界和异常 | | M28 | 自然语言用例转换 | P4 | 人类语言→结构化用例 | | M29 | AI测试覆盖率分析 | P4 | 智能识别未覆盖路径 | | M30 | AI辅助测试报告 | P4 | 自动汇总、趋势分析、洞察生成 | | M31 | 自动化框架搭建 | P5 | 选型→架构→脚手架→CI集成 | | M32 | UI自动化测试 | P5 | Page Object + 智能等待 + 截图 | | M33 | 接口自动化测试 | P5 | 契约测试+数据驱动+断言链 | | M34 | CI/CD测试集成 | P5 | Pipeline设计+质量门禁+并行策略 | | M35 | 自动化脚本维护 | P5 | 自愈定位器+参数化+模块化 | | M36 | 自动化执行与调度 | P5 | 分布式执行+重试机制+资源管理 | | M37 | 测试环境管理 | P6 | 环境配置即代码+数据隔离+健康检查 | | M38 | 探索性测试 | P6 | SBTM+测程+Charter驱动的专家探索 | | M39 | 测试进度跟踪 | P6 | 燃尽图+进度偏差+风险预警 | | M40 | 缺陷生命周期管理 | P6 | 提交→确认→修复→验证→关闭 | | M41 | 回归测试策略 | P6 | 全量/选择/优先级三级回归 | | M42 | 测试执行风险监控 | P6 | 实时风险信号+预案触发 | | M43 | 测试覆盖率度量 | P7 | 代码/需求/风险/业务四维覆盖率 | | M44 | 缺陷密度与趋势分析 | P7 | DDP/缺陷注入率/收敛趋势 | | M45 | 测试效率度量 | P7 | 用例生产率/执行效率/自动化ROI | | M46 | 质量模型评估 | P7 | ISO 25010八维质量特性评估 | | M47 | 测试ROI分析 | P7 | 缺陷预防价值/自动化节省/投入产出比 | | M48 | 质量仪表盘设计 | P7 | 实时可视化+趋势预测+决策建议 | ## 专家级核心原则 ### 测试用例8要素标准 每个测试用例必须包含: 1. 用例编号(分层编号:模块-场景-序号) 2. 测试标题(动词开头,明确验证点) 3. 前置条件(数据+环境+权限+状态) 4. 测试步骤(操作→预期反应,一步一验证) 5. 预期结果(可量化、可验证、不含歧义) 6. 测试数据(具体值,非"有效数据") 7. 优先级(P0阻塞/P1高/P2中/P3低) 8. 关联需求(需求ID+版本) ### 测试设计五问法(5-Why for Testing) 每个测试设计决策自问: 1. 为什么这个场景需要测?(业务影响) 2. 为什么选择这个方法?(方法适配性) 3. 为什么不测其他场景?(风险可接受性) 4. 为什么这个数据?(数据代表性) 5. 为什么这个优先级?(失败后果评估) ### AI增强三原则 1. **AI是加速器,不是替代者**:AI生成后必须人工审查关键业务逻辑 2. **Prompt决定质量**:输入越结构化,输出越精准 3. **增量验证**:不要一次性让AI生成全部,分批验证后迭代 ## 技能使用脚本 ### testcase_generator.py 自动生成标准化测试用例模板。 ### quality_dashboard.html 交互式质量仪表盘模板。
don't have the plugin yet? install it then click "run inline in claude" again.