SKILL.md

---
name: semantic-split
description: 语义拆分与智能规划技能。将自然语言拆分为结构化需求块，基于5W2H维度提取与约束标注增强语义理解，双视角推理整合为单一执行步骤，支持自增强json沉淀机制。
version: "2.5.0"
author: wUwproject
tags:
  - semantic-split
  - task-planning
  - json-accumulation
  - progressive-loading
  - 5w2h
  - constraint-annotation
---

# semantic-split — 语义拆分与智能规划

将自然语言拆分为结构化需求块，基于 5W2H 维度提取与约束标注增强语义理解，双视角推理整合为单一执行步骤。

## 触发场景

- 用户提出任务请求："帮我做..."、"我需要..."、"交给你了..."
- 用户描述问题寻求帮助、表达需求、委托工作
- 简单问答和闲聊无需拆分

## 核心能力

| # | 功能 | 说明 |
|---|------|------|
| 1 | **语义拆分** | 识别主语 → 划分块 → 提取目的/行为/动机 |
| 2 | **5W2H维度提取** | 自动抽取7维度 + 缺失维度填默认值（按任务类型映射表） |
| 3 | **约束强度标注** | 硬约束🔴/软约束🟡/无约束⚪ 三级标注 + 注意力锚定 |
| 4 | **双视角推理** | 聚焦（保守）+ 发散（创新）内部推理 → 整合为单一执行步骤 |
| 5 | **结构化输出** | 统一格式输出拆分结果（含约束标注），含确认询问 |
| 6 | **渐进式加载** | 规则级/能力级 json 渐进匹配，未命中时模型思考 |
| 7 | **自增强闭环** | 一次使用 → 沉淀 json → 下次复用 |
| 8 | **json 管理工具** | `json_manager.py` CLI 统一管理能力级/规则级 json |

## 快速开始

```bash
python scripts/json_manager.py scan --keywords 制作 PPT 产品    # 扫描匹配
python scripts/json_manager.py categorize --threshold 5        # 归类统计
python scripts/json_manager.py create --type capability --name my_task_v1  # 创建
python scripts/json_manager.py generalize --input <path> --params "具体值=[占位符]"  # 通用化
```

> 知识库 JSON 存放于 `skills/.standardization/semantic-split/data/`（铁律4：产出物不嵌入技能目录）

## 工作流程

### 语义拆分规则（摘要）

> 详细规则见 `references/split_rules.md`

**核心流程**：识别主语 → 划分块 → 提取目的/行为/动机 → 5W2H维度 + 约束强度标注

| 主语类型 | 块标记 | 块内元素 |
|---------|--------|---------|
| 用户（"我"） | `块1：用户` | 目的 / 行为(诉求) / 动机 |
| AI助手（"你"） | `块2：执行者` | 同上 |
| 第三方 | `块3：第三方-N` | 同上 |

**边界情况速查**：

| 关键情况 | 处理 |
|---------|------|
| 约束强度冲突 | 按最高强度处理（🔴>🟡🔴>🟡>⚪） |
| 举例内容干扰 | 「比如/例如」后内容 → [EXAMPLE]，不作为核心约束 |
| json 库为空 | 跳过①②，直接进入③模型思考 |

### 完整执行流程

**步骤 1-2**：接收输入 → 识别主语 & 划分块

接收用户原文 → 扫描识别主语代词（我/你/他/她/它/名称），每个独立主语 = 一个块

**步骤 2.5**：任务类型识别与 5W2H 初始化

> 内部执行，不输出。首次执行时读取 `references/task_type_defaults.md` + `references/constraint_annotation.md`

1. **任务类型识别**：制作PPT / 填写周报 / 安排行程 / 写邮件 / 策划活动 / 其他
2. **5W2H 维度初始化**：按任务类型从默认映射表填入默认值
3. **约束强度预标注**：🔴硬约束 / 🟡软约束 / ⚪无约束

**步骤 3**：提取块内元素（增强版）

**注意力锚定**（内部执行，不输出，详见 `references/constraint_annotation.md` 第三节）：
1. `[CRITICAL]` — 硬约束，后续不可违反
2. `[CORE]` — 核心目标（动词+宾语）
3. `[ENTITY]` — 数字、时间、人名
4. `[EXAMPLE]` — 举例内容，降权不作为约束
5. `[RESISTANCE]` — 「但是/担心/难」后内容
6. 核心句重构：「[主语] 要 [CORE] 于 [时间/场景]」（≤20字）

逐句提取目的/行为/动机 + 5W2H维度 + 约束强度（详见 `references/split_rules.md` 第五节）

**步骤 4**：结构化输出（增强版）

```
【拆分结果】

## 块 N：[主语名称]
  角色：[用户/执行者/第三方]
  目的：[核心目标]
  诉求：
    1. [核心交付物] 🔴  2. [支撑信息] 🟡  3. [附加要求] ⚪
  动机：[背景/原因/情绪]
  5W2H：Why/What/Who/Where/When/How/How much — [值] 🔴/🟡/⚪
  阻力：[描述]（如有）
  📌 核心句：[主语] 要 [CORE] 于 [时间/场景]

【确认询问】拆分是否完整准确？
```

**步骤 4.5**：自我反查（内部执行，不输出）

> 展示前强制执行（详见 `references/constraint_annotation.md` 第三节）：

| 反查 | 检查内容 | 修正 |
|------|---------|------|
| 1 | 硬约束遗漏：`[CRITICAL]` 是否全在结果中？ | 补充 |
| 2 | 约束误判：🟡 词被标为 🔴？ | 修正 |
| 2b | 隐式升级：🟡 约束属组织规范/法律/安全？→ 🟡🔴 或 🔴 | 升级 |
| 3 | 举例干扰：`[EXAMPLE]` 被当核心诉求？ | 降级 |
| 4 | 5W2H 缺失：有明显可推断维度？ | 补充 `[推断]` |

**步骤 5**：用户确认

- 如有遗漏 → 用户补充 → 更新结构
- 如全部正确 → 进入步骤 6

**步骤 6**：渐进加载与规划生成（增强版）

> 加载：`references/loading_decision_tree.md`（必须）+ `references/planning_rules.md` + `references/constraint_annotation.md` + `references/json_schema.md`（按需）

按决策树执行：
1. 扫描规则级 json → 命中则加载并展示
2. 不命中则扫描能力级 json → 命中则加载并展示
3. 均不命中则**模型思考**（需加载 `planning_rules.md`）
4. 展示规划 → 询问用户是否执行

**【模型思考：双视角推理→整合】**（详见 `references/planning_rules.md` 第六节，不输出双方案）

a) **聚焦方案**（内部）：5W2H取最窄值；守🔴硬约束；已验证方法；步骤≤30min
b) **发散方案**（内部）：5W2H取最宽值；🔴可轻微突破（标注风险）；引入非惯用工具
c) **整合**（输出）：聚焦为骨架 + 发散创新点→🌟增强步骤 → **单一执行步骤** + 工作包分解

展示给用户的规划格式（详细规则见 `references/planning_rules.md` 第六节）：

```
📌 任务：[名称] ｜🔴 硬约束：[列表] ｜🟡 软约束：[列表]

执行步骤：
  步骤 N: [名称] ── serial ── milestone: ✅/❌
    action: [操作] | depends_on: [依赖] | constraint_level: 🔴/🟡/⚪
  步骤 N🌟: [名称]（增强：来自发散方案）
    ⚠️ 风险：[说明]（如涉及🔴突破）

工作包：WP1: [描述](耗时, 前置) → 📍 检查点：[里程碑]
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
来源：[规则级json / 能力级json / 模型思考（双视角整合）]
```

**步骤 7**：执行与 json 生成

- 用户确认执行 → 执行任务
- 分支③（不命中+确认执行）→ 完成后生成通用化能力级 json（加载 `json_schema.md`）
- 其他分支 → 不生成新 json（除非用户主动要求）

## 注意事项

1. **双方案是内部推理，不输出给用户**：聚焦+发散仅在模型内部执行，最终整合为单一执行步骤
2. **约束强度不能只看关键词**：需上下文推断（如"尽量用公司模板"属组织规范，应升级为🟡🔴）
3. **注意力锚定在步骤3前强制执行**：[CRITICAL]/[CORE]/[ENTITY]/[EXAMPLE]/[RESISTANCE] 标记不可跳过
4. **自我反查在展示前强制执行**：4项检查+反查2b（隐式约束升级），全部通过才进入用户确认

## 脚本工具

`json_manager.py` — 管理能力级/规则级 json 的 CLI 工具（零外部依赖）

| 子命令 | 功能 |
|--------|------|
| `scan` / `categorize` | 按关键词扫描 / 按 tags 归类统计 |
| `create` / `validate` | 创建 json 骨架 / 验证格式 |
| `generalize` / `rule-gen` | 字段通用化 / 从能力级生成规则级 |
| `list` / `info` | 列出所有 json / 显示详情 |

## 参考文档（渐进加载）

| 文件 | 加载时机 |
|------|---------|
| `split_rules.md` | 步骤 2、3 首次 |
| `loading_decision_tree.md` | 步骤 6 **必须** |
| `planning_rules.md` | 模型思考时 |
| `json_schema.md` | 生成 json 时 |
| `constraint_annotation.md` | 步骤 2.5 / 3 / 6 |
| `task_type_defaults.md` | 步骤 2.5 首次 |
| `examples.md` | 参考格式时 |

**v2.5.0** — 5W2H维度提取 · 约束强度标注(🔴🟡⚪) · 注意力锚定 · 双视角推理整合 · 工作包分解
semantic-split

SKILL.md

related skills