任务调度中枢。所有对话先调用此技能，由它决定任务分类、复杂度评估、执行路由、技能匹配和收尾检查。当收到任何用户消息时自动激活，判断任务类型、复杂度，选择执行方式（主会话/spawn/cron），匹配对应技能，执行收尾检查。
SKILL.md

---
name: daily-agent
description: "任务调度中枢。所有对话先调用此技能，由它决定任务分类、复杂度评估、执行路由、技能匹配和收尾检查。当收到任何用户消息时自动激活，判断任务类型、复杂度，选择执行方式（主会话/spawn/cron），匹配对应技能，执行收尾检查。"
version: 2.4.0
---

# Daily Agent — 任务调度中枢 v2.4.0

**所有对话先调用 daily-agent**，由它决定执行路径。

**职责**：任务调度中枢 — 负责任务分类、路由、技能匹配与执行监控，不直接操作工具或数据。

## 核心职责

```
用户消息 → daily-agent（第一条操作）
  ├─ Step 1: 任务分类（什么类型？）
  ├─ Step 2: 复杂度评估（短链/长链？）
  ├─ Step 3: 执行路由（主会话/spawn/cron？）
  ├─ Step 4: 技能匹配（需要哪个skill？由daily-agent决定）
  ├─ Step 5: 委派执行与状态监控
  ├─ Step 5.5: 异常处理与降级
  └─ Step 6: 收尾检查（浏览器/学习/git/记忆）
```

---

## Step 0: 模式触发检查（v2.4.0 新增）

在任务分类前，先检测是否触发内置模式：

| 模式 | 触发关键词 |
|------|-----------|
| caveman（压缩沟通） | 简单说、太长了、省点token |
| zoom-out（全局理解） | 看看整体结构、给我个地图、架构 |
| grill-me（方案审视） | 帮我审视、grill、压力测试 |
| ToT（多路径探索） | 有哪些思路、多方案、tot |

**若命中**：
1. 设置全局模式变量：`set_context("mode", mode_name)`
2. 后续所有回复遵循该模式规范
3. 模式期间仍可调用其他子技能

**若未命中**：继续 Step 1 任务分类

---

## Step 1: 任务分类（v2.4.0 重构为三级判断）

### 第一级：触发方式判断

```
收到消息
    │
    ├─ cron/定时触发 ──→ 直接匹配 cron 专用技能
    │   （关键词：每天/每周/定时/提醒/周期）
    │
    └─ 手动/事件触发 ──→ 继续第二级
```

### 第二级：领域分类

| 领域 | 典型场景 | 特征 |
|------|---------|------|
| **通信** | 发消息、发邮件、发通知 | 匹配 mx-im/outlook 技能 |
| **记忆** | "记住XX"、更新规则、知识录入 | 匹配 self-improving/ontology |
| **文件** | 做 PPT/Word/Excel/PDF/HTML | 匹配对应文件技能 |
| **编码** | 写代码、调试、重构、测试 | 匹配编码类技能 |
| **搜索** | 搜资料、搜新闻、技术调研 | 多引擎搜索，交叉验证 |
| **查询** | 查消息、查天气、查文件、查状态 | 1-3 次工具调用，即时返回 |
| **对话** | 闲聊、问答、讨论、建议 | 无需工具调用，或 ≤2 次 |

### 第三级：复杂度评估

在领域分类后，评估任务复杂度，决定执行环境（主会话/spawn）。

### 决策矩阵

| 触发方式 | 领域 | 复杂度 | 执行策略 |
|---------|------|--------|---------|
| cron | * | * | cron 专用技能 |
| manual | memory | * | memory 技能 + 主会话 |
| manual | comm | * | 通信技能 + 主会话 |
| manual | file/code/search | long | 匹配技能 + spawn |
| manual | file/code/search | short | 匹配技能 + 主会话 |
| manual | query/chat | * | 主会话直接回复 |

### 分类优先级（当任务跨多领域时）

1. **通信** — 涉及"发送给/发到群里/通知"
2. **记忆** — 涉及"记住/记一下/更新规则"
3. **文件** — 涉及具体文件格式
4. **编码** — 涉及代码/调试/测试
5. **搜索** — 涉及"搜/查/找"
6. **查询** — 简单查询
7. **对话** — 默认

---

## Step 2: 复杂度评估（v2.4.0 增强）

### 评估方法：加权成本计算（v2.4.0 新增）

**工具类型权重表**：

| 工具类型 | 权重 | 说明 |
|---------|------|------|
| browser | 8 | 最耗时，涉及页面渲染 |
| exec | 5 | 命令执行，可能耗时 |
| web_fetch | 4 | 网络请求 |
| web_search | 2 | API 调用，较快 |
| read | 1 | 本地文件读取 |
| write/edit | 2 | 本地文件写入 |

**复杂度评估公式**：

```
总成本 = Σ (工具类型权重 × 调用次数)

soft_limit = 20   # 预警
hard_limit = 40   # 强制 spawn

if 总成本 > hard_limit:
    → 长链，必须 spawn
elif 总成本 > soft_limit:
    → 预警，建议 spawn，但允许主会话执行
else:
    → 短链，主会话执行
```

**保留原规则作为兜底**：
- 工具调用次数 ≥ 10 → 长链
- 涉及数据源 ≥ 3 → 长链

### 短链任务

- 在主会话直接执行
- 工具调用上限：5次
- 超过5次 → 立即转spawn

### 长链任务

- 必须spawn子代理执行
- 主会话只负责：接收结果、汇报用户
- 禁止在主会话"先做几步"再spawn

---

## Step 3: 执行路由

根据任务类型和复杂度，选择执行方式：

| 条件 | 执行方式 | 说明 |
|------|---------|------|
| 短链 + 对话/查询 | 主会话直接回复 | 最简单路径 |
| 短链 + 搜索/文件/编码 | 主会话 + 匹配skill | 加载对应SKILL.md |
| 长链 | spawn子代理 | 后台执行，完成后汇报 |
| 定时任务 | cron | 创建/触发cron job |
| 通信任务 | mx-im/outlook | 直接调用通信技能 |

### spawn子代理时的规则

1. **必须提供完整上下文**：任务描述、输入文件、期望输出
2. **设置合理超时**：简单300s，中等600s，复杂900s+
3. **可选：创建监控任务**：对于超长任务，创建一次性at监控

---

## Step 4: 技能匹配（v2.4.0 增强）

### 匹配规则（关键词 → 技能映射）

#### 文件类

| 关键词 | 匹配技能 | 优先级 |
|--------|---------|--------|
| PPT/演示/幻灯片/pptx | pptx | 唯一 |
| Word/文档/报告/docx | docx | 唯一 |
| Excel/表格/数据表/xlsx | xlsx | 唯一 |
| PDF/合并/拆分/pdf | pdf | 唯一 |
| HTML/页面/网页/web | html-report-generator → frontend-design → web-artifacts-builder | 按顺序尝试 |

#### 编码类

| 关键词 | 匹配技能 | 说明 |
|--------|---------|------|
| 编程/写代码/实现/开发 | coding-framework | **统一编程框架（推荐入口）** |
| 调试/排错/bug/修复 | diagnose | 6阶段排错方法论 |
| 测试/TDD/单元测试 | tdd | Red-Green-Refactor循环 |
| 原型/demo/验证/试一下 | prototype | 原型构建规则 |
| 审查/review/代码审查 | code-review-visualizer | 可视化审查 |
| 理解/调用链路/代码走读 | code-walkthrough | 调用链路追踪 |
| 多代理/并行审查 | multi-agent-review | 6代理并行审查 |
| 迭代/循环改进 | iterative-loop | 自动迭代改进 |
| 精简/YAGNI/代码瘦身 | ponytail | YAGNI决策阶梯 |

#### 通信类

| 关键词 | 匹配技能 | 说明 |
|--------|---------|------|
| 发消息/发送/通知/美信 | mx-im | 美信IM发送 |
| 邮件/outlook/email | outlook-automation | Outlook自动化 |

#### 记忆/知识类

| 关键词 | 匹配技能 | 说明 |
|--------|---------|------|
| 失败/纠正/错误/学到 | self-improving | 记录到.learnings/ |
| 记住/记一下/更新规则/知识 | ontology + self-improving | 知识图谱录入 |
| 查记忆/搜索记忆 | memory_search 工具 | 主记忆搜索（工具，非技能） |

#### 搜索类

| 关键词 | 匹配技能 | 说明 |
|--------|---------|------|
| 新闻/日报/资讯 | daily-news | 每日新闻聚合 |
| 股票/投研/基金/沪深300 | stock-research / fund-analysis | 金融投研分析 |
| 翻译/translate | translation | 多平台翻译 |

#### 专门领域

| 关键词 | 匹配技能 | 说明 |
|--------|---------|------|
| 论文/学位论文/评审 | thesis-review | 学位论文评审意见生成 |
| 数据分析/SQL/报表 | data-analysis | SQL/Python/报表 |
| 桌面控制/操作电脑 | desktop-control-win | Windows桌面自动化 |

### 兜底策略（v2.4.0 新增）

```
匹配失败时的处理流程：
1. 检查是否有关键词部分匹配 → 使用最接近的技能
2. 无匹配 → 回退到通用对话能力
3. 禁止猜测执行高风险技能（如 exec、browser）
4. 向用户确认："我需要哪个技能？"或"请指明方向"
```

**铁律第 8 条（v2.4.0 新增）**：
> **技能匹配失败时，路由至通用对话能力，并提示用户指明方向，禁止猜测执行。**

---

## 内置模式（轻量级，不需要加载外部skill）

### 模式A：压缩沟通（原caveman）

**触发条件**：
- 用户说"简单说"/"太长了"/"省点token"/"caveman"
- 用户连续表现出不耐烦

**行为规则**：
- 去掉：冠词(a/an/the)、填充词(just/really/basically)、客套话(sure/certainly)
- 用短句：`[东西] [动作] [原因]. [下一步].`
- 技术术语保持精确，代码块不变
- 用箭头表示因果：X -> Y

**示例**：
- 问："为什么React组件重新渲染？"
- 答："Inline obj prop -> new ref -> re-render. `useMemo`."

**退出条件**：用户说"stop caveman"/"正常说"/"normal mode"

### 模式B：全局理解（原zoom-out）

**触发条件**：
- 用户说"看看整体结构"/"这个模块是什么"/"给我个地图"
- 面对陌生代码库，需要高层次理解

**行为规则**：
- 先列出所有相关模块和调用关系
- 用项目的领域术语（参考domain glossary）
- 画架构图（ASCII或描述）
- 不深入细节，只给全景

### 模式C：方案审视（原grill-me）

**触发条件**：
- 用户提出方案/计划/设计思路
- 用户说"帮我审视一下"/"grill me"/"压力测试这个方案"

**行为规则**：
- 逐个追问方案的每个分支
- 每个问题给出推荐答案
- 一次只问一个问题
- 如果能从代码库找到答案，先查代码再问

### 模式D：多路径探索（Tree-of-Thought）

**触发条件**：
- 复杂规划/决策问题，存在多种可行路径
- 用户说"帮我分析几种方案"/"有哪些思路"/"ToT"
- 任务类型：架构设计、技术选型、方案对比、创意发散

**行为规则**：
1. **生成分支**：先提出 3 个不同思路/方案（不要雷同，要有差异化）
2. **逐分支评价**：对每个方案从可行性、成本、风险、效果四个维度打分
3. **淘汰+深入**：淘汰最弱的 1 个，对剩余 2 个深入展开（具体步骤、关键决策点）
4. **推荐**：给出最终推荐方案及理由
5. **输出格式**：

```
## 方案对比

| 维度 | 方案A | 方案B | 方案C |
|------|-------|-------|-------|
| 可行性 | ⭐⭐⭐ | ⭐⭐ | ⭐⭐⭐⭐ |
| 成本 | 中 | 低 | 高 |
| 风险 | 中 | 高 | 低 |
| 效果 | 好 | 一般 | 最好 |

## 淘汰：方案B（原因：...）

## 深入对比：A vs C
...

## 推荐：方案C（理由：...）
```

**与方案审视(grill-me)的区别**：
- grill-me：针对用户已有的方案追问漏洞
- ToT：用户还没有方案时，主动生成多路径并评估

---

## Step 4.5: 并行工具评估（v2.3 新增）

当任务涉及多个独立查询时，评估是否可并行执行：

### 并行判断规则

```
满足以下全部条件 → 并行执行：
  □ 所有工具 ∈ 只读安全集（web_search/web_fetch/read/memory_search等）
  □ 无路径重叠（不涉及同一目录树下的多个文件操作）
  □ 工具调用数 ≥ 2

任一不满足 → 串行执行
```

### 只读安全工具清单

| 工具 | 资源类型 | 最大并发 |
|------|----------|----------|
| web_search | API | 8 |
| web_fetch | NETWORK | 6 |
| read | FILE | 4 |
| memory_search | API | 8 |
| session_status | API | 8 |
| cron_list | API | 8 |
| sessions_list | API | 8 |

### 不可并行的工具

write / edit / exec / browser — 有副作用或状态依赖

### 执行方式

- **评估脚本**: `python scripts/parallel_tool_executor.py`
- **分层策略**: API(8线程) > 文件(4线程) > 数据库(串行)
- **超时熔断**: 每个分支独立超时，互不影响
- **路径检测**: 规范化后检测重叠，有疑虑就串行

### 典型并行场景

- 多引擎搜索（web_search × 3 同时发出）
- 多文件同时读取（read × N 无路径重叠）
- 多会话状态查询（session_status + sessions_list）

### 典型非并行场景

- 搜索结果 → 基于结果再搜索（有依赖）
- 读文件 → 编辑文件（有写入）
- 浏览器操作序列（有状态）

---

## Step 5: 委派执行与状态监控（v2.4.0 重构）

**职责**：负责任务编排与监控，所有具体操作委托给子技能/代理。

### 5.1 构建委派指令

根据技能匹配结果，构建完整的委派指令：

```
委派指令包含：
- skill_name: 匹配的技能名称
- task_description: 任务描述
- input_context: 输入上下文（用户消息、相关文件路径等）
- expected_output: 期望输出格式
- timeout: 预估超时时间
```

### 5.2 调用执行环境

根据复杂度评估结果，选择执行环境：

**短链任务（主会话执行）**：
- 按技能指引直接调用工具
- 先评估并行可能性（Step 4.5）
- 工具调用计数，接近 5 次时提醒

**长链任务（spawn 子代理）**：
- 调用 `sessions_spawn` 创建子代理
- 传入完整上下文：skill_name、task_description、input_context
- 设置合理超时：简单 300s，中等 600s，复杂 900s+

**spawn 调用格式**：
```
sessions_spawn(
    task="任务描述",
    label="daily-task-{timestamp}-{domain}",
    skill="{matched_skill}",
    timeoutSeconds=600
)
```

### 5.3 状态监控

**主会话执行**：
- 实时汇报进度（如果 >30 秒）
- 监控工具调用次数

**spawn 子代理执行**：
- 子代理后台执行
- 主会话告知用户："已启动后台任务【{task_id}】，预计 {eta} 完成。稍后通知您。"
- 子代理完成后自动汇报

**长任务进度反馈（v2.4.0 新增）**：

若任务预计耗时 > 30 秒：
1. spawn 后立即回复用户进度信息
2. 将 task_id 与用户会话绑定
3. 子代理在关键里程碑时通知中枢
4. 用户可发送"查看任务状态"触发查询
5. 子代理完成后自动发送摘要消息

**ETA 估算表**：

| 任务类型 | 预估耗时 |
|---------|---------|
| 搜索 + 整理 | 30-60 秒 |
| 文件生成（PPT/Word） | 60-120 秒 |
| 报告生成 | 120-300 秒 |
| 批量处理 | 300-600 秒 |

**监控规则**：
- 长任务 spawn 时，可选创建一次性 at 监控任务
- 监控时间 = 预估完成时间
- 监控任务 prompt："检查子代理 XXX 是否完成，如未完成汇报状态"

---

## Step 5.5: 异常处理与降级（v2.4.0 新增）

### 异常处理流程

```
5.1 发起执行
5.2 状态监控
5.3 若失败:
    ├─ retries < 3 → 重试（指数退避：1s, 2s, 4s）
    └─ retries >= 3 →
        ├─ 记录错误到 .learnings/YYYY-MM-DD-task-{id}-error.md
        ├─ 尝试降级（见降级策略表）
        └─ 调用 self-improving 记录失败模式
```

### 降级策略表

| 失败类型 | 降级策略 |
|---------|---------|
| spawn 子代理失败 | 回退到主会话执行（如果任务允许） |
| 技能脚本不存在 | 使用内置工具直接完成（如 web_search） |
| 工具调用超时 3 次 | 跳过该工具，记录错误，继续其他步骤 |
| 浏览器操作失败 | 回退到 web_fetch（如果能获取内容） |
| 文件操作失败 | 向用户报告，请求手动处理 |

### 错误记录格式

```markdown
## 任务失败记录

- **时间**: YYYY-MM-DD HH:MM:SS
- **任务ID**: daily-task-{timestamp}-{domain}
- **失败类型**: {failure_type}
- **错误信息**: {error_message}
- **重试次数**: {retries}
- **降级策略**: {fallback_strategy}
- **用户通知**: 是/否
```

### 铁律第 7 条（v2.4.0 新增）

> **任务异常必须优雅降级，不得无限重试或静默失败。**

---

## Step 6: 收尾检查（v2.4.0 增强）

任务完成后，逐项检查：

```
□ 浏览器是否打开？ → browser stop 关闭
□ 是否有失败/纠正？ → 记录到 .learnings/ (self-improving)
□ 是否有知识目录修改？ → git add + git commit（限定目录）
□ 是否产生新知识？ → 更新 memory/ 或 ontology
□ 是否生成了文件？ → 确认文件路径，告知用户
□ 是否可复用流程？ → 评估是否创建 skill（v2.3 新增）
□ 是否涉及用户事实？ → 提取到画像观察（v2.3 新增）
```

### 收尾优先级

1. **关闭浏览器** — 最容易被遗忘，资源消耗最大
2. **记录学习** — 如果有失败或纠正
3. **评估技能创建** — 如果任务步骤≥3且可能复用（v2.3）
4. **提取用户画像** — 如果对话中包含用户偏好/状态信息（v2.3）
5. **git commit** — 如果有知识目录修改（v2.4.0 限定目录）
6. **更新记忆** — 如果产生了新知识

### Git 提交规则（v2.4.0 修改）

**仅暂存以下知识目录**：
- `memory/`
- `skills/`
- `.learnings/`
- `ontology/`
- `docs/`

**禁止提交**：
- 临时文件（*.tmp, *.bak）
- 大文件（>10MB）
- 敏感文件（*.key, *.pem）

**提交流程**：
```bash
# 1. 仅暂存知识目录
git add memory/ skills/ .learnings/ ontology/ docs/

# 2. 展示变更统计
git diff --cached --stat

# 3. 提交
git commit -m "daily: {task_description}"
```

### 技能创建触发（v2.4.0 修改）

任务完成后，如果出现以下情况，提醒用户是否保存为 skill：

```
触发条件（满足全部）：
  1. 同一 (domain, matched_skill) 路径执行次数 ≥ 3
  2. 最近 3 次执行的步骤摘要相似度 > 80%
  3. 任务步骤 ≥ 3 步
  4. 非一次性查询（有可复用逻辑）

执行：
  python scripts/skill_creator.py analyze <对话文件>
  → 生成草稿到 skills/_drafts/
  → 用户确认后移到 skills/
```

### 用户画像提取（v2.3 新增）

对话中如果包含用户显式表达的事实，自动提取：

```
提取目标：
  - 偏好："我喜欢..." / "我习惯..."
  - 技能："我会..." / "我在学..."
  - 状态："我现在..." / "我最近..."
  - 事实："我是..." / "我有..."

执行：
  python scripts/profile_observer.py extract <对话文件>
  → 存入 memory/user_observations.json
  → 定期更新到 USER.md 的"近期观察"区域

新会话提示（被动摘要）：
  python scripts/profile_observer.py hint
  → 检查最近7天画像变化
  → 一句话提示用户（如有变化）
```

### 工具分组标签（v2.3 新增）

轻量版 toolset，用扁平分组替代复杂继承体系：

```
查看分组：
  python scripts/tool_groups.py list

获取 skill 需要的工具：
  python scripts/tool_groups.py show <group_name>

使用统计：
  python scripts/tool_groups.py stats

高频组合分析：
  python scripts/tool_groups.py combos
```

### 方案间联动（v2.3 新增）

三个工具的数据互通：

```
分析联动数据：
  python scripts/integration_hub.py analyze

生成推荐：
  python scripts/integration_hub.py recommend

联动逻辑：
  - 并行日志 → 高频模式 → 推荐 skill 化
  - skill 复用 → 用户偏好信号 → 喂给画像
  - 工具分组使用频率 → 能力组合需求 → 反哺 skill 推荐
```

---

## 铁律规则

### 规则1：长链任务必须spawn

- 满足长链标准 → 第一条工具调用必须是 `sessions_spawn`
- 禁止"先做几步"再spawn
- 违反 = 失职

### 规则2：短链任务上限5次调用

- 主会话执行短链任务，工具调用≤5次
- 超过5次 → 立即转spawn
- 不要"再做一次就完了"

### 规则3：搜索必须多引擎

- 中文搜索：web_search(bocha/baidu) → 验证
- 英文搜索：web_search(volc/ali) → 验证
- 交叉比对，标注可信度

### 规则4：不认识就先搜

- 遇到训练截止后的新名词 → 先搜索确认
- 禁止编造
- 知道系列≠知道新作品

### 规则5：浏览器智能关闭（v2.4.0 修改）

浏览器操作完成后，检查任务计划中后续是否仍有浏览器步骤：
- 若后续 2 步内无浏览器操作 → 立即关闭
- 若后续仍有浏览器操作 → 保留至当前阶段结束
- 收尾检查时，若浏览器还开着 → 强制关闭

**判断逻辑**：
```
if "browser" not in predicted_remaining_tools(next_2_steps):
    browser.stop()
```

### 规则6：任务失败要记录

- 失败/纠正 → 调用 self-improving 记录
- 写入 .learnings/ 对应文件

### 规则7：任务异常必须优雅降级（v2.4.0 新增）

- 任务异常 → 重试 3 次 → 降级策略 → 记录错误
- 不得无限重试或静默失败
- 详见 Step 5.5 异常处理与降级

### 规则8：技能匹配失败时路由至通用对话（v2.4.0 新增）

- 技能匹配失败 → 回退到通用对话能力
- 向用户确认："我需要哪个技能？"
- 禁止猜测执行高风险技能（如 exec、browser）
- 详见 Step 4 兜底策略

---

## 快速决策流程图（v2.4.0 修复）

```
收到消息
    │
    ▼
┌─────────────────────────────────┐
│ 模式触发检查（v2.4.0 新增）      │
│ 检测 caveman/zoom-out/grill-me  │
│ 若命中 → 设置全局模式 → 继续    │
└─────────────────────────────────┘
    │
    ▼
触发方式判断
    │
    ├─ cron/定时 ──→ cron 处理
    │
    ▼
领域分类（通信/记忆/文件/编码/搜索/查询/对话）
    │
    ▼
技能匹配（调用技能匹配表）
    │
    ▼
复杂度评估
    │
    ├─ 长链 ──→ spawn(技能名, 任务上下文)
    │
    └─ 短链 ──→ 主会话执行(技能)
```

**spawn 调用格式**：
```
sessions_spawn(
    task="任务描述",
    label="daily-task-{timestamp}-{domain}",
    skill="{matched_skill}",
    timeoutSeconds=600
)
```

---

## 与子技能的关系

daily-agent是调度器，不直接执行具体工作。具体工作由对应技能执行：

| 保留的独立子技能 | 用途 | 何时加载 |
|-----------------|------|---------|
| `diagnose` | 6阶段排错方法论 | 排错/调试/bug |
| `tdd` | Red-Green-Refactor循环 | 测试驱动开发 |
| `prototype` | 原型构建规则 | 验证想法/做demo |
| `thesis-review` | 论文评审意见生成 | 论文评审 |

| 内联到daily-agent的模式 | 用途 | 触发方式 |
|------------------------|------|---------|
| 压缩沟通（caveman） | 省token回复 | 用户要求/不耐烦 |
| 全局理解（zoom-out） | 看架构/模块关系 | 用户问"整体结构" |
| 方案审视（grill-me） | 追问已有方案漏洞 | 用户提出方案 |
| 多路径探索（ToT） | 生成多方案并评估 | 复杂规划/无明确方案 |

---

## 环境要求（v2.4.0 新增）

### Python 版本
- Python 3.9+（推荐 3.10+）

### 依赖脚本

| 脚本 | 用途 | 依赖 |
|------|------|------|
| scripts/parallel_tool_executor.py | 并行工具执行 | 无（纯标准库） |
| scripts/skill_creator.py | 技能自动创建 | 无 |
| scripts/profile_observer.py | 用户画像提取 | 无 |
| scripts/tool_groups.py | 工具分组标签 | 无 |
| scripts/integration_hub.py | 方案间联动 | 无 |

### 验证脚本可用性

```bash
python scripts/parallel_tool_executor.py --help
python scripts/skill_creator.py --help
python scripts/profile_observer.py --help
```

### 脚本特性

- **parallel_tool_executor.py**: 支持超时重试（默认 2 次）、分层并行策略、路径重叠检测
- **skill_creator.py**: 支持冷静期检测（3 次执行后建议）、技能草稿生成
- **profile_observer.py**: 支持多层置信度、衰减机制、被动摘要

---

## 版本历史

- **v2.4.0** (2026-06-29): 整合 DeepSeek 12 条建议 + 审核报告
  - P0: 修复快速决策图（长链后保留技能匹配）、增加错误处理与回退机制（Step 5.5）、Step 5 重命名为"委派执行与状态监控"
  - P1: 三级任务分类（触发方式→领域→复杂度）、技能匹配规则与兜底策略、Git 提交限定目录、长任务进度反馈
  - P2: 工具类型权重表、模式触发检查、超时重试机制、环境要求章节、浏览器智能关闭策略
  - 新增铁律第 7 条：任务异常必须优雅降级
  - 新增铁律第 8 条：技能匹配失败时路由至通用对话能力
- **v2.3.0** (2026-06-28): 集成 Hermes 改进三件套
  - 新增 Step 4.5：并行工具评估（分层并行策略 + 路径重叠检测）
  - 收尾检查新增：技能创建触发 + 用户画像提取
  - 集成脚本：parallel_tool_executor.py / skill_creator.py / profile_observer.py
- **v2.2.0** (2026-06-26): 集成编程 Skill 套件（Phase 1+2）
  - 新增编码类技能：coding-agent / multi-agent-review / iterative-loop / ponytail
  - 新增安全/守卫类技能：hook-engine / skill-bundle
  - 借鉴来源：Claude Code / Claude Plugins Official / OpenAI Codex / Ponytail
- **v2.1.1** (2026-06-20): 规则更新 — 所有对话先调用 daily-agent
  - SOUL.md 铁律规则1 更新：移除"日常对话不加载 skill"，改为"所有对话先调用 daily-agent"
  - AGENTS.md 同步更新：明确 daily-agent 是每条消息的第一条操作
  - daily-agent 根据任务类型决定是否需要加载其他 skill（如 docx/pptx/pdf/outlook 等）
- **v2.1.0** (2026-06-20): 内联 Tree-of-Thought 多路径探索模式
  - 新增模式D：多路径探索（ToT），用于复杂规划/方案对比场景
  - 与方案审视(grill-me)的区别：grill-me追问已有方案，ToT主动生成多方案
- **v2.0.0** (2026-06-20): 从"技能路由器"重构为"任务调度中枢"
  - 新增：任务分类、复杂度评估、执行路由、收尾检查
  - 内联：caveman/zoom-out/grill-me为内置模式
  - 保留：diagnose/tdd/prototype/thesis-review为独立技能
- **v1.0.0**: 初始版本，仅作为7个子技能的路由器
Daily Agent

SKILL.md

related skills