任务调度中枢。所有对话先调用此技能,由它决定任务分类、复杂度评估、执行路由、技能匹配和收尾检查。当收到任何用户消息时自动激活,判断任务类型、复杂度,选择执行方式(主会话/spawn/cron),匹配对应技能,执行收尾检查。
---
name: daily-agent
description: "任务调度中枢。所有对话先调用此技能,由它决定任务分类、复杂度评估、执行路由、技能匹配和收尾检查。当收到任何用户消息时自动激活,判断任务类型、复杂度,选择执行方式(主会话/spawn/cron),匹配对应技能,执行收尾检查。"
version: 2.4.0
---
# Daily Agent — 任务调度中枢 v2.4.0
**所有对话先调用 daily-agent**,由它决定执行路径。
**职责**:任务调度中枢 — 负责任务分类、路由、技能匹配与执行监控,不直接操作工具或数据。
## 核心职责
```
用户消息 → daily-agent(第一条操作)
├─ Step 1: 任务分类(什么类型?)
├─ Step 2: 复杂度评估(短链/长链?)
├─ Step 3: 执行路由(主会话/spawn/cron?)
├─ Step 4: 技能匹配(需要哪个skill?由daily-agent决定)
├─ Step 5: 委派执行与状态监控
├─ Step 5.5: 异常处理与降级
└─ Step 6: 收尾检查(浏览器/学习/git/记忆)
```
---
## Step 0: 模式触发检查(v2.4.0 新增)
在任务分类前,先检测是否触发内置模式:
| 模式 | 触发关键词 |
|------|-----------|
| caveman(压缩沟通) | 简单说、太长了、省点token |
| zoom-out(全局理解) | 看看整体结构、给我个地图、架构 |
| grill-me(方案审视) | 帮我审视、grill、压力测试 |
| ToT(多路径探索) | 有哪些思路、多方案、tot |
**若命中**:
1. 设置全局模式变量:`set_context("mode", mode_name)`
2. 后续所有回复遵循该模式规范
3. 模式期间仍可调用其他子技能
**若未命中**:继续 Step 1 任务分类
---
## Step 1: 任务分类(v2.4.0 重构为三级判断)
### 第一级:触发方式判断
```
收到消息
│
├─ cron/定时触发 ──→ 直接匹配 cron 专用技能
│ (关键词:每天/每周/定时/提醒/周期)
│
└─ 手动/事件触发 ──→ 继续第二级
```
### 第二级:领域分类
| 领域 | 典型场景 | 特征 |
|------|---------|------|
| **通信** | 发消息、发邮件、发通知 | 匹配 mx-im/outlook 技能 |
| **记忆** | "记住XX"、更新规则、知识录入 | 匹配 self-improving/ontology |
| **文件** | 做 PPT/Word/Excel/PDF/HTML | 匹配对应文件技能 |
| **编码** | 写代码、调试、重构、测试 | 匹配编码类技能 |
| **搜索** | 搜资料、搜新闻、技术调研 | 多引擎搜索,交叉验证 |
| **查询** | 查消息、查天气、查文件、查状态 | 1-3 次工具调用,即时返回 |
| **对话** | 闲聊、问答、讨论、建议 | 无需工具调用,或 ≤2 次 |
### 第三级:复杂度评估
在领域分类后,评估任务复杂度,决定执行环境(主会话/spawn)。
### 决策矩阵
| 触发方式 | 领域 | 复杂度 | 执行策略 |
|---------|------|--------|---------|
| cron | * | * | cron 专用技能 |
| manual | memory | * | memory 技能 + 主会话 |
| manual | comm | * | 通信技能 + 主会话 |
| manual | file/code/search | long | 匹配技能 + spawn |
| manual | file/code/search | short | 匹配技能 + 主会话 |
| manual | query/chat | * | 主会话直接回复 |
### 分类优先级(当任务跨多领域时)
1. **通信** — 涉及"发送给/发到群里/通知"
2. **记忆** — 涉及"记住/记一下/更新规则"
3. **文件** — 涉及具体文件格式
4. **编码** — 涉及代码/调试/测试
5. **搜索** — 涉及"搜/查/找"
6. **查询** — 简单查询
7. **对话** — 默认
---
## Step 2: 复杂度评估(v2.4.0 增强)
### 评估方法:加权成本计算(v2.4.0 新增)
**工具类型权重表**:
| 工具类型 | 权重 | 说明 |
|---------|------|------|
| browser | 8 | 最耗时,涉及页面渲染 |
| exec | 5 | 命令执行,可能耗时 |
| web_fetch | 4 | 网络请求 |
| web_search | 2 | API 调用,较快 |
| read | 1 | 本地文件读取 |
| write/edit | 2 | 本地文件写入 |
**复杂度评估公式**:
```
总成本 = Σ (工具类型权重 × 调用次数)
soft_limit = 20 # 预警
hard_limit = 40 # 强制 spawn
if 总成本 > hard_limit:
→ 长链,必须 spawn
elif 总成本 > soft_limit:
→ 预警,建议 spawn,但允许主会话执行
else:
→ 短链,主会话执行
```
**保留原规则作为兜底**:
- 工具调用次数 ≥ 10 → 长链
- 涉及数据源 ≥ 3 → 长链
### 短链任务
- 在主会话直接执行
- 工具调用上限:5次
- 超过5次 → 立即转spawn
### 长链任务
- 必须spawn子代理执行
- 主会话只负责:接收结果、汇报用户
- 禁止在主会话"先做几步"再spawn
---
## Step 3: 执行路由
根据任务类型和复杂度,选择执行方式:
| 条件 | 执行方式 | 说明 |
|------|---------|------|
| 短链 + 对话/查询 | 主会话直接回复 | 最简单路径 |
| 短链 + 搜索/文件/编码 | 主会话 + 匹配skill | 加载对应SKILL.md |
| 长链 | spawn子代理 | 后台执行,完成后汇报 |
| 定时任务 | cron | 创建/触发cron job |
| 通信任务 | mx-im/outlook | 直接调用通信技能 |
### spawn子代理时的规则
1. **必须提供完整上下文**:任务描述、输入文件、期望输出
2. **设置合理超时**:简单300s,中等600s,复杂900s+
3. **可选:创建监控任务**:对于超长任务,创建一次性at监控
---
## Step 4: 技能匹配(v2.4.0 增强)
### 匹配规则(关键词 → 技能映射)
#### 文件类
| 关键词 | 匹配技能 | 优先级 |
|--------|---------|--------|
| PPT/演示/幻灯片/pptx | pptx | 唯一 |
| Word/文档/报告/docx | docx | 唯一 |
| Excel/表格/数据表/xlsx | xlsx | 唯一 |
| PDF/合并/拆分/pdf | pdf | 唯一 |
| HTML/页面/网页/web | html-report-generator → frontend-design → web-artifacts-builder | 按顺序尝试 |
#### 编码类
| 关键词 | 匹配技能 | 说明 |
|--------|---------|------|
| 编程/写代码/实现/开发 | coding-framework | **统一编程框架(推荐入口)** |
| 调试/排错/bug/修复 | diagnose | 6阶段排错方法论 |
| 测试/TDD/单元测试 | tdd | Red-Green-Refactor循环 |
| 原型/demo/验证/试一下 | prototype | 原型构建规则 |
| 审查/review/代码审查 | code-review-visualizer | 可视化审查 |
| 理解/调用链路/代码走读 | code-walkthrough | 调用链路追踪 |
| 多代理/并行审查 | multi-agent-review | 6代理并行审查 |
| 迭代/循环改进 | iterative-loop | 自动迭代改进 |
| 精简/YAGNI/代码瘦身 | ponytail | YAGNI决策阶梯 |
#### 通信类
| 关键词 | 匹配技能 | 说明 |
|--------|---------|------|
| 发消息/发送/通知/美信 | mx-im | 美信IM发送 |
| 邮件/outlook/email | outlook-automation | Outlook自动化 |
#### 记忆/知识类
| 关键词 | 匹配技能 | 说明 |
|--------|---------|------|
| 失败/纠正/错误/学到 | self-improving | 记录到.learnings/ |
| 记住/记一下/更新规则/知识 | ontology + self-improving | 知识图谱录入 |
| 查记忆/搜索记忆 | memory_search 工具 | 主记忆搜索(工具,非技能) |
#### 搜索类
| 关键词 | 匹配技能 | 说明 |
|--------|---------|------|
| 新闻/日报/资讯 | daily-news | 每日新闻聚合 |
| 股票/投研/基金/沪深300 | stock-research / fund-analysis | 金融投研分析 |
| 翻译/translate | translation | 多平台翻译 |
#### 专门领域
| 关键词 | 匹配技能 | 说明 |
|--------|---------|------|
| 论文/学位论文/评审 | thesis-review | 学位论文评审意见生成 |
| 数据分析/SQL/报表 | data-analysis | SQL/Python/报表 |
| 桌面控制/操作电脑 | desktop-control-win | Windows桌面自动化 |
### 兜底策略(v2.4.0 新增)
```
匹配失败时的处理流程:
1. 检查是否有关键词部分匹配 → 使用最接近的技能
2. 无匹配 → 回退到通用对话能力
3. 禁止猜测执行高风险技能(如 exec、browser)
4. 向用户确认:"我需要哪个技能?"或"请指明方向"
```
**铁律第 8 条(v2.4.0 新增)**:
> **技能匹配失败时,路由至通用对话能力,并提示用户指明方向,禁止猜测执行。**
---
## 内置模式(轻量级,不需要加载外部skill)
### 模式A:压缩沟通(原caveman)
**触发条件**:
- 用户说"简单说"/"太长了"/"省点token"/"caveman"
- 用户连续表现出不耐烦
**行为规则**:
- 去掉:冠词(a/an/the)、填充词(just/really/basically)、客套话(sure/certainly)
- 用短句:`[东西] [动作] [原因]. [下一步].`
- 技术术语保持精确,代码块不变
- 用箭头表示因果:X -> Y
**示例**:
- 问:"为什么React组件重新渲染?"
- 答:"Inline obj prop -> new ref -> re-render. `useMemo`."
**退出条件**:用户说"stop caveman"/"正常说"/"normal mode"
### 模式B:全局理解(原zoom-out)
**触发条件**:
- 用户说"看看整体结构"/"这个模块是什么"/"给我个地图"
- 面对陌生代码库,需要高层次理解
**行为规则**:
- 先列出所有相关模块和调用关系
- 用项目的领域术语(参考domain glossary)
- 画架构图(ASCII或描述)
- 不深入细节,只给全景
### 模式C:方案审视(原grill-me)
**触发条件**:
- 用户提出方案/计划/设计思路
- 用户说"帮我审视一下"/"grill me"/"压力测试这个方案"
**行为规则**:
- 逐个追问方案的每个分支
- 每个问题给出推荐答案
- 一次只问一个问题
- 如果能从代码库找到答案,先查代码再问
### 模式D:多路径探索(Tree-of-Thought)
**触发条件**:
- 复杂规划/决策问题,存在多种可行路径
- 用户说"帮我分析几种方案"/"有哪些思路"/"ToT"
- 任务类型:架构设计、技术选型、方案对比、创意发散
**行为规则**:
1. **生成分支**:先提出 3 个不同思路/方案(不要雷同,要有差异化)
2. **逐分支评价**:对每个方案从可行性、成本、风险、效果四个维度打分
3. **淘汰+深入**:淘汰最弱的 1 个,对剩余 2 个深入展开(具体步骤、关键决策点)
4. **推荐**:给出最终推荐方案及理由
5. **输出格式**:
```
## 方案对比
| 维度 | 方案A | 方案B | 方案C |
|------|-------|-------|-------|
| 可行性 | ⭐⭐⭐ | ⭐⭐ | ⭐⭐⭐⭐ |
| 成本 | 中 | 低 | 高 |
| 风险 | 中 | 高 | 低 |
| 效果 | 好 | 一般 | 最好 |
## 淘汰:方案B(原因:...)
## 深入对比:A vs C
...
## 推荐:方案C(理由:...)
```
**与方案审视(grill-me)的区别**:
- grill-me:针对用户已有的方案追问漏洞
- ToT:用户还没有方案时,主动生成多路径并评估
---
## Step 4.5: 并行工具评估(v2.3 新增)
当任务涉及多个独立查询时,评估是否可并行执行:
### 并行判断规则
```
满足以下全部条件 → 并行执行:
□ 所有工具 ∈ 只读安全集(web_search/web_fetch/read/memory_search等)
□ 无路径重叠(不涉及同一目录树下的多个文件操作)
□ 工具调用数 ≥ 2
任一不满足 → 串行执行
```
### 只读安全工具清单
| 工具 | 资源类型 | 最大并发 |
|------|----------|----------|
| web_search | API | 8 |
| web_fetch | NETWORK | 6 |
| read | FILE | 4 |
| memory_search | API | 8 |
| session_status | API | 8 |
| cron_list | API | 8 |
| sessions_list | API | 8 |
### 不可并行的工具
write / edit / exec / browser — 有副作用或状态依赖
### 执行方式
- **评估脚本**: `python scripts/parallel_tool_executor.py`
- **分层策略**: API(8线程) > 文件(4线程) > 数据库(串行)
- **超时熔断**: 每个分支独立超时,互不影响
- **路径检测**: 规范化后检测重叠,有疑虑就串行
### 典型并行场景
- 多引擎搜索(web_search × 3 同时发出)
- 多文件同时读取(read × N 无路径重叠)
- 多会话状态查询(session_status + sessions_list)
### 典型非并行场景
- 搜索结果 → 基于结果再搜索(有依赖)
- 读文件 → 编辑文件(有写入)
- 浏览器操作序列(有状态)
---
## Step 5: 委派执行与状态监控(v2.4.0 重构)
**职责**:负责任务编排与监控,所有具体操作委托给子技能/代理。
### 5.1 构建委派指令
根据技能匹配结果,构建完整的委派指令:
```
委派指令包含:
- skill_name: 匹配的技能名称
- task_description: 任务描述
- input_context: 输入上下文(用户消息、相关文件路径等)
- expected_output: 期望输出格式
- timeout: 预估超时时间
```
### 5.2 调用执行环境
根据复杂度评估结果,选择执行环境:
**短链任务(主会话执行)**:
- 按技能指引直接调用工具
- 先评估并行可能性(Step 4.5)
- 工具调用计数,接近 5 次时提醒
**长链任务(spawn 子代理)**:
- 调用 `sessions_spawn` 创建子代理
- 传入完整上下文:skill_name、task_description、input_context
- 设置合理超时:简单 300s,中等 600s,复杂 900s+
**spawn 调用格式**:
```
sessions_spawn(
task="任务描述",
label="daily-task-{timestamp}-{domain}",
skill="{matched_skill}",
timeoutSeconds=600
)
```
### 5.3 状态监控
**主会话执行**:
- 实时汇报进度(如果 >30 秒)
- 监控工具调用次数
**spawn 子代理执行**:
- 子代理后台执行
- 主会话告知用户:"已启动后台任务【{task_id}】,预计 {eta} 完成。稍后通知您。"
- 子代理完成后自动汇报
**长任务进度反馈(v2.4.0 新增)**:
若任务预计耗时 > 30 秒:
1. spawn 后立即回复用户进度信息
2. 将 task_id 与用户会话绑定
3. 子代理在关键里程碑时通知中枢
4. 用户可发送"查看任务状态"触发查询
5. 子代理完成后自动发送摘要消息
**ETA 估算表**:
| 任务类型 | 预估耗时 |
|---------|---------|
| 搜索 + 整理 | 30-60 秒 |
| 文件生成(PPT/Word) | 60-120 秒 |
| 报告生成 | 120-300 秒 |
| 批量处理 | 300-600 秒 |
**监控规则**:
- 长任务 spawn 时,可选创建一次性 at 监控任务
- 监控时间 = 预估完成时间
- 监控任务 prompt:"检查子代理 XXX 是否完成,如未完成汇报状态"
---
## Step 5.5: 异常处理与降级(v2.4.0 新增)
### 异常处理流程
```
5.1 发起执行
5.2 状态监控
5.3 若失败:
├─ retries < 3 → 重试(指数退避:1s, 2s, 4s)
└─ retries >= 3 →
├─ 记录错误到 .learnings/YYYY-MM-DD-task-{id}-error.md
├─ 尝试降级(见降级策略表)
└─ 调用 self-improving 记录失败模式
```
### 降级策略表
| 失败类型 | 降级策略 |
|---------|---------|
| spawn 子代理失败 | 回退到主会话执行(如果任务允许) |
| 技能脚本不存在 | 使用内置工具直接完成(如 web_search) |
| 工具调用超时 3 次 | 跳过该工具,记录错误,继续其他步骤 |
| 浏览器操作失败 | 回退到 web_fetch(如果能获取内容) |
| 文件操作失败 | 向用户报告,请求手动处理 |
### 错误记录格式
```markdown
## 任务失败记录
- **时间**: YYYY-MM-DD HH:MM:SS
- **任务ID**: daily-task-{timestamp}-{domain}
- **失败类型**: {failure_type}
- **错误信息**: {error_message}
- **重试次数**: {retries}
- **降级策略**: {fallback_strategy}
- **用户通知**: 是/否
```
### 铁律第 7 条(v2.4.0 新增)
> **任务异常必须优雅降级,不得无限重试或静默失败。**
---
## Step 6: 收尾检查(v2.4.0 增强)
任务完成后,逐项检查:
```
□ 浏览器是否打开? → browser stop 关闭
□ 是否有失败/纠正? → 记录到 .learnings/ (self-improving)
□ 是否有知识目录修改? → git add + git commit(限定目录)
□ 是否产生新知识? → 更新 memory/ 或 ontology
□ 是否生成了文件? → 确认文件路径,告知用户
□ 是否可复用流程? → 评估是否创建 skill(v2.3 新增)
□ 是否涉及用户事实? → 提取到画像观察(v2.3 新增)
```
### 收尾优先级
1. **关闭浏览器** — 最容易被遗忘,资源消耗最大
2. **记录学习** — 如果有失败或纠正
3. **评估技能创建** — 如果任务步骤≥3且可能复用(v2.3)
4. **提取用户画像** — 如果对话中包含用户偏好/状态信息(v2.3)
5. **git commit** — 如果有知识目录修改(v2.4.0 限定目录)
6. **更新记忆** — 如果产生了新知识
### Git 提交规则(v2.4.0 修改)
**仅暂存以下知识目录**:
- `memory/`
- `skills/`
- `.learnings/`
- `ontology/`
- `docs/`
**禁止提交**:
- 临时文件(*.tmp, *.bak)
- 大文件(>10MB)
- 敏感文件(*.key, *.pem)
**提交流程**:
```bash
# 1. 仅暂存知识目录
git add memory/ skills/ .learnings/ ontology/ docs/
# 2. 展示变更统计
git diff --cached --stat
# 3. 提交
git commit -m "daily: {task_description}"
```
### 技能创建触发(v2.4.0 修改)
任务完成后,如果出现以下情况,提醒用户是否保存为 skill:
```
触发条件(满足全部):
1. 同一 (domain, matched_skill) 路径执行次数 ≥ 3
2. 最近 3 次执行的步骤摘要相似度 > 80%
3. 任务步骤 ≥ 3 步
4. 非一次性查询(有可复用逻辑)
执行:
python scripts/skill_creator.py analyze <对话文件>
→ 生成草稿到 skills/_drafts/
→ 用户确认后移到 skills/
```
### 用户画像提取(v2.3 新增)
对话中如果包含用户显式表达的事实,自动提取:
```
提取目标:
- 偏好:"我喜欢..." / "我习惯..."
- 技能:"我会..." / "我在学..."
- 状态:"我现在..." / "我最近..."
- 事实:"我是..." / "我有..."
执行:
python scripts/profile_observer.py extract <对话文件>
→ 存入 memory/user_observations.json
→ 定期更新到 USER.md 的"近期观察"区域
新会话提示(被动摘要):
python scripts/profile_observer.py hint
→ 检查最近7天画像变化
→ 一句话提示用户(如有变化)
```
### 工具分组标签(v2.3 新增)
轻量版 toolset,用扁平分组替代复杂继承体系:
```
查看分组:
python scripts/tool_groups.py list
获取 skill 需要的工具:
python scripts/tool_groups.py show <group_name>
使用统计:
python scripts/tool_groups.py stats
高频组合分析:
python scripts/tool_groups.py combos
```
### 方案间联动(v2.3 新增)
三个工具的数据互通:
```
分析联动数据:
python scripts/integration_hub.py analyze
生成推荐:
python scripts/integration_hub.py recommend
联动逻辑:
- 并行日志 → 高频模式 → 推荐 skill 化
- skill 复用 → 用户偏好信号 → 喂给画像
- 工具分组使用频率 → 能力组合需求 → 反哺 skill 推荐
```
---
## 铁律规则
### 规则1:长链任务必须spawn
- 满足长链标准 → 第一条工具调用必须是 `sessions_spawn`
- 禁止"先做几步"再spawn
- 违反 = 失职
### 规则2:短链任务上限5次调用
- 主会话执行短链任务,工具调用≤5次
- 超过5次 → 立即转spawn
- 不要"再做一次就完了"
### 规则3:搜索必须多引擎
- 中文搜索:web_search(bocha/baidu) → 验证
- 英文搜索:web_search(volc/ali) → 验证
- 交叉比对,标注可信度
### 规则4:不认识就先搜
- 遇到训练截止后的新名词 → 先搜索确认
- 禁止编造
- 知道系列≠知道新作品
### 规则5:浏览器智能关闭(v2.4.0 修改)
浏览器操作完成后,检查任务计划中后续是否仍有浏览器步骤:
- 若后续 2 步内无浏览器操作 → 立即关闭
- 若后续仍有浏览器操作 → 保留至当前阶段结束
- 收尾检查时,若浏览器还开着 → 强制关闭
**判断逻辑**:
```
if "browser" not in predicted_remaining_tools(next_2_steps):
browser.stop()
```
### 规则6:任务失败要记录
- 失败/纠正 → 调用 self-improving 记录
- 写入 .learnings/ 对应文件
### 规则7:任务异常必须优雅降级(v2.4.0 新增)
- 任务异常 → 重试 3 次 → 降级策略 → 记录错误
- 不得无限重试或静默失败
- 详见 Step 5.5 异常处理与降级
### 规则8:技能匹配失败时路由至通用对话(v2.4.0 新增)
- 技能匹配失败 → 回退到通用对话能力
- 向用户确认:"我需要哪个技能?"
- 禁止猜测执行高风险技能(如 exec、browser)
- 详见 Step 4 兜底策略
---
## 快速决策流程图(v2.4.0 修复)
```
收到消息
│
▼
┌─────────────────────────────────┐
│ 模式触发检查(v2.4.0 新增) │
│ 检测 caveman/zoom-out/grill-me │
│ 若命中 → 设置全局模式 → 继续 │
└─────────────────────────────────┘
│
▼
触发方式判断
│
├─ cron/定时 ──→ cron 处理
│
▼
领域分类(通信/记忆/文件/编码/搜索/查询/对话)
│
▼
技能匹配(调用技能匹配表)
│
▼
复杂度评估
│
├─ 长链 ──→ spawn(技能名, 任务上下文)
│
└─ 短链 ──→ 主会话执行(技能)
```
**spawn 调用格式**:
```
sessions_spawn(
task="任务描述",
label="daily-task-{timestamp}-{domain}",
skill="{matched_skill}",
timeoutSeconds=600
)
```
---
## 与子技能的关系
daily-agent是调度器,不直接执行具体工作。具体工作由对应技能执行:
| 保留的独立子技能 | 用途 | 何时加载 |
|-----------------|------|---------|
| `diagnose` | 6阶段排错方法论 | 排错/调试/bug |
| `tdd` | Red-Green-Refactor循环 | 测试驱动开发 |
| `prototype` | 原型构建规则 | 验证想法/做demo |
| `thesis-review` | 论文评审意见生成 | 论文评审 |
| 内联到daily-agent的模式 | 用途 | 触发方式 |
|------------------------|------|---------|
| 压缩沟通(caveman) | 省token回复 | 用户要求/不耐烦 |
| 全局理解(zoom-out) | 看架构/模块关系 | 用户问"整体结构" |
| 方案审视(grill-me) | 追问已有方案漏洞 | 用户提出方案 |
| 多路径探索(ToT) | 生成多方案并评估 | 复杂规划/无明确方案 |
---
## 环境要求(v2.4.0 新增)
### Python 版本
- Python 3.9+(推荐 3.10+)
### 依赖脚本
| 脚本 | 用途 | 依赖 |
|------|------|------|
| scripts/parallel_tool_executor.py | 并行工具执行 | 无(纯标准库) |
| scripts/skill_creator.py | 技能自动创建 | 无 |
| scripts/profile_observer.py | 用户画像提取 | 无 |
| scripts/tool_groups.py | 工具分组标签 | 无 |
| scripts/integration_hub.py | 方案间联动 | 无 |
### 验证脚本可用性
```bash
python scripts/parallel_tool_executor.py --help
python scripts/skill_creator.py --help
python scripts/profile_observer.py --help
```
### 脚本特性
- **parallel_tool_executor.py**: 支持超时重试(默认 2 次)、分层并行策略、路径重叠检测
- **skill_creator.py**: 支持冷静期检测(3 次执行后建议)、技能草稿生成
- **profile_observer.py**: 支持多层置信度、衰减机制、被动摘要
---
## 版本历史
- **v2.4.0** (2026-06-29): 整合 DeepSeek 12 条建议 + 审核报告
- P0: 修复快速决策图(长链后保留技能匹配)、增加错误处理与回退机制(Step 5.5)、Step 5 重命名为"委派执行与状态监控"
- P1: 三级任务分类(触发方式→领域→复杂度)、技能匹配规则与兜底策略、Git 提交限定目录、长任务进度反馈
- P2: 工具类型权重表、模式触发检查、超时重试机制、环境要求章节、浏览器智能关闭策略
- 新增铁律第 7 条:任务异常必须优雅降级
- 新增铁律第 8 条:技能匹配失败时路由至通用对话能力
- **v2.3.0** (2026-06-28): 集成 Hermes 改进三件套
- 新增 Step 4.5:并行工具评估(分层并行策略 + 路径重叠检测)
- 收尾检查新增:技能创建触发 + 用户画像提取
- 集成脚本:parallel_tool_executor.py / skill_creator.py / profile_observer.py
- **v2.2.0** (2026-06-26): 集成编程 Skill 套件(Phase 1+2)
- 新增编码类技能:coding-agent / multi-agent-review / iterative-loop / ponytail
- 新增安全/守卫类技能:hook-engine / skill-bundle
- 借鉴来源:Claude Code / Claude Plugins Official / OpenAI Codex / Ponytail
- **v2.1.1** (2026-06-20): 规则更新 — 所有对话先调用 daily-agent
- SOUL.md 铁律规则1 更新:移除"日常对话不加载 skill",改为"所有对话先调用 daily-agent"
- AGENTS.md 同步更新:明确 daily-agent 是每条消息的第一条操作
- daily-agent 根据任务类型决定是否需要加载其他 skill(如 docx/pptx/pdf/outlook 等)
- **v2.1.0** (2026-06-20): 内联 Tree-of-Thought 多路径探索模式
- 新增模式D:多路径探索(ToT),用于复杂规划/方案对比场景
- 与方案审视(grill-me)的区别:grill-me追问已有方案,ToT主动生成多方案
- **v2.0.0** (2026-06-20): 从"技能路由器"重构为"任务调度中枢"
- 新增:任务分类、复杂度评估、执行路由、收尾检查
- 内联:caveman/zoom-out/grill-me为内置模式
- 保留:diagnose/tdd/prototype/thesis-review为独立技能
- **v1.0.0**: 初始版本,仅作为7个子技能的路由器
don't have the plugin yet? install it then click "run inline in claude" again.