提供基于13问三层结构与自动触发的元认知质量保障,支持文档、代码、决策等多场景质量检查与管控。
run this clawhubskill inside any MCP-capable agent (Claude Code, Codex, or Cursor). paste the command below and Implexa's MCP server recognizes it, applying the SKILL.md inline via the apply_recommended_skilltool call — the skill executes in your session, no separate install step. you can also invoke it by name in natural language (e.g. "implexa, run 3q-quality-system").
implexa run clawhub/3q-quality-system
---
name: 3q-quality-system
version: v7.11.0
triggers:
- "3Q 检查"
- "质量检查"
- "3Q一下"
- "3Q check"
- "quality check"
- "预检"
- "快速3Q"
- "深度3Q"
- "盲审"
- "六问"
- "自审"
scenarios:
- "AI 输出交付前的质量检查"
- "重大决策的多视角审视"
- "突破 AI 的自我视角局限"
- "复杂任务的质量门禁"
- "用日检模板做每日 3Q 自查"
---
# 3Q 质量系统 — 突破 AI 的自我视角局限
> **做什么**:让你的 AI(Claude、GPT、Codex、Cursor)在输出前停下来想一想。六个认知透镜 + 三维空间意识 + 独立盲审。
> **快速上手**:
> - **执行前**:三问预检——什么可能出错?影响谁?怎么发现?
> - **子任务后**(10 秒):三步快速检查——做全了吗?做对了吗?有反常吗?
> - **深度检查**:7 个维度 1-10 分打分,不通过重做。
> - **自修正**:同类失败 ≥ 3 次 → 系统自动添加防犯规则。
---
## Layer 0:预审 + 实时护栏
### 执行前三问
| # | 问题 | 目的 |
|---|------|------|
| **Q1** | 这次执行最可能出什么错? | 预判风险 |
| **Q2** | 如果出错,影响什么/谁? | 范围评估 |
| **Q3** | 怎么在执行中发现它出错? | 检测手段 |
**规则**:答不出 → 先补信息再执行。禁止跳过。
### 事中修正三信号
| 信号 | 触发条件 | 修正方式 |
|------|---------|---------|
| **S1** 产出偏离 | 产出与预期差距 > 30% | 暂停 → 回溯目标 → 重写 |
| **S2** 遗漏上下文 | 关键信息未读 | 暂停 → 补充 → 继续 |
| **S3** 前后矛盾 | 前后声明不一致 | 暂停 → 统一 → 继续 |
### 自动触发(直接升级到深度 3Q)
| 条件 | 动作 |
|------|------|
| 同类问题出现 ≥ 3 次 | 自动触发深度 3Q |
| 输出中出现自相矛盾 | 强制深度 3Q |
| 复杂多步骤任务完成 | 自动深度 3Q 后交付 |
---
## Layer 0.5:快速 3Q(10 秒)
每次子任务返回后执行:
| # | 问题 | 通过标准 |
|---|------|---------|
| ① 做全了吗? | 步骤完整,无缺失 | 全部完成 |
| ② 做对了吗? | 数据准确 | 偏差 ≤ 2% |
| ③ 有反常的吗? | 反向证据已检查 | 无未确认的异常 |
**流程**:全部通过 → ✅ 交付。任一不通过 → ⚠️ 升级到深度 3Q。
**输出格式**:
```
📋 快速3Q:步骤 X/Y ✅ | 数据 ✅/⚠️{偏差}% | 逻辑 ✅/❌矛盾
```
### Grill 模式(挑战 Q 不走过场)
> 从"列出质疑→全部通过"改为**逐条拷问+强制反面证据。至少 1 条 🔴,全绿 = 没认真审。**
**纪律**:
- 每个"通"必须配一个"不通会怎样"
- 🔴 标红的维度必须先处理再继续
---
## Layer 1:六个认知透镜
| 透镜 | 问题 | 突破什么局限 |
|------|------|-------------|
| **元认知 Q** | 我的任务理解对吗? | "我以为他要什么"的陷阱 |
| **标杆 Q** | 领域顶尖 1% 怎么做? | 自我满足的低标准 |
| **挑战 Q** | 如果我的假设全错了? | 默认正确的偏见 |
| **逻辑 Q** | 论证自洽吗? | 跳跃式结论 |
| **用户 Q** | 用户价值清晰吗? | 自我中心的思维 |
| **竞争 Q** | 差异化在哪? | 盲目跟风 |
六个问题不是"质量检查清单"——它们是六个不同的**认知透镜**,每次执行强制切换一次视角。
### 标杆 Q 前置步骤:分群
> 不分群就谈标杆,是在用不知道哪个流派的标尺量东西。
| 步骤 | 做什么 | 为什么 |
|------|--------|--------|
| **分群** | 识别核心打法/风格/流派 | 不知道有哪些流派,就没法对标 |
| **标杆** | 每个流派下顶尖 1% 怎么看 | 分群后标杆才有意义 |
| **冲突** | 流派之间的分歧点在哪? | 分歧才是超额收益/突破口的来源 |
**跨领域示例**:
| 领域 | 分群示例 | 冲突即信号 |
|------|---------|-----------|
| 投资 | 价值/动量/事件驱动/宏观对冲 | 不同流派看同一事件方向相反→大机会 |
| 写作 | 爽文/严肃文学/非虚构 | 评价标准完全不同 |
| 产品 | 增长驱动/体验驱动/生态驱动 | top 1% 做的事不一样 |
| 科研 | 实验派/理论派/计算派 | 好研究的定义不同 |
### 三追问(深度检查)
| 追问 | 问题 | 目的 |
|------|------|------|
| **副作用检查** | 这个修复会不会带来新问题? | 防止矫枉过正 |
| **重启条件** | 什么时候该承认判断失效? | 防止错误持续生效 |
| **地基递归** | 支撑当前逻辑的最深层假设是什么? | 防止地基歪了 |
### 三维扩展
六问检查的是**质量**,三维检查的是**范围**——你在正确层级、正确时间跨度、正确竞争位上思考问题吗?
| 维度 | 检查点 | 典型问题 |
|------|--------|---------|
| **逻辑 + 阶维** 🏛️ | 层级匹配 | 执行层问题→执行层方案,不跳跃到战略层 |
| **用户 + 纵维** ⏳ | 时间演变 | 需求从哪来?现在怎样?未来趋势? |
| **竞争 + 横维** 🌐 | 生态位 | 直接/间接/替代竞品在哪?差异化支点在哪? |
**使用建议**:
- 日常检查:六问
- 深度分析:六问 + 三追问
- **重大决策:六问 + 三维 + 三追问 + 盲审**
---
## 量化评分体系
7 个维度,每个 1-10 分。满分 70,≥ 70 通过。
| 维度 | 1-3 分 | 4-6 分 | 7-9 分 | 10 分 |
|------|--------|--------|--------|-------|
| **元认知 Q** | 方向偏了 | 方向对但浅 | 理解准确 | 发现隐性需求 |
| **标杆 Q** | 没搜 | 搜了没分群 | 分群+对标 | 分群+对标+冲突 |
| **挑战 Q** | 没质疑 | 质疑了没推翻 | 找到盲点 | 推翻重建更好 |
| **逻辑 Q** | 有矛盾 | 自洽但粗糙 | 严谨 | 有反证 |
| **用户 Q** | 价值不清 | 有价值但不聚焦 | 聚焦可衡量 | 用户直接感知提升 |
| **竞争 Q** | 没差异 | 有差异但脆弱 | 可持续 | 差异化是壁垒 |
| **效果验证** | 没测 | 测了没基线 | 基线确认提升 | 量化+置信 |
**必填规则**:
- 每次深度 3Q 必须打分,无分数 = 无效审查
- 效果验证必须跑 A/B 测试(有 skill vs 无 skill)
- 总分 ≤ 60 → 驳回;61-69 → 盲审验证后决定
---
## 独立盲审
**为什么需要**:SkillLens 论文实证,AI 自审准确率仅 **46.4%**——因为"我知道为什么这么写"的解释器偏差。
3Q 的解决方案:
```
交付文件 → 启动盲审 agent(裸读,无上下文)
→ 独立 7 维度打分
→ 主 agent 对比自有评分 + 盲审评分
→ 偏差 > 2 分 → 按低分处理
```
**评分收敛规则**:
- 盲审分 ≈ 主 agent 分(偏差 ≤ 1)→ ✅ 已收敛
- 盲审分明显更低(偏差 > 2)→ ⚠️ 强制审查该维度,按低分处理
- 盲审分明显更高 → 🟡 检查盲审是否遗漏问题
---
## 自修正(从错误中学习)
> 3Q 不是静态的——它从自己的检查结果中学习,自动更新规则。
| 触发条件 | 发生什么 | 输出 |
|---------|---------|------|
| 同类失败 ≥ 3 次被 3Q 捕获 | 系统添加一条新规则来防范 | 更新后的内部规则 |
| 用户反复纠正同一类问题 | 系统添加一个禁用模式 | 更新后的禁用清单 |
| 外部新范式出现 | 系统触发全框架审查 | 更新后的方法论 |
用得越多,越能精准抓住你特有的失败模式。
---
## Meta-3Q:质疑框架本身
3Q 捕获后还是出同样的问题?外部出现了更好的质量范式?
**操作**:扫描行业最新的质量实践。差距足够大 → 触发框架重构。
---
## 首次使用:装好后做什么
1. 说 **"用 3Q 检查一下你上次生成的内容"** — 看它实际怎么工作
2. 说 **"开始下一个任务之前,先做一个预检"** — 养成习惯
3. 用 3-5 次后回顾:**"3Q 捕获了哪些失败?它漏掉了什么?"**
4. 每日练习用 **[日检模板](references/daily-check-template.md)**
5. 重大决策用 **[决策检查清单](references/decision-checklist.md)**
---
## 延伸阅读
3Q 系统附带了配套参考文件:
| 文件 | 内容 | 什么场景用 |
|------|------|-----------|
| `references/three-dimensions.md` | 三维扩展深度详解(阶纵/纵横/横维) | 复杂问题需要空间意识时 |
| `references/daily-check-template.md` | 每日 5 分钟 3Q 自查模板 | 每天开始或结束时 |
| `references/decision-checklist.md` | 12 个决策检查点 + 三阶段 3Q | 重大决策前 |
---
## 技能淘汰
**公式**:`retirement_score = utility × log(use_count)`
| 分数 | 判定 |
|------|------|
| > 0.5 | 保留 |
| ≤ 0.5 | 审查是否退役 |
| 长期未用 | 直接退役 |
don't have the plugin yet? install it then click "run inline in claude" again.