Agent自进化机制。三层架构（记忆→技能→规范），三种触发（关键词+踩坑+复盘），用户审批+Darwin评分双重质控。用得越多越懂你。触发词：自进化、进化、evolve、记住、以后、永远、下次、踩坑经验。

SKILL.md

---
name: self-evolve.skill
description: "Agent自进化机制。三层架构（记忆→技能→规范），三种触发（关键词+踩坑+复盘），用户审批+Darwin评分双重质控。用得越多越懂你。触发词：自进化、进化、evolve、记住、以后、永远、下次、踩坑经验。"
version: "2.1.0"
author: "Shike"
license: "MIT-0"
tags: [self-evolution, evolve, memory, skill-optimization, darwin, 自进化, 进化, 记忆优化]
---

# self-evolve.skill — Agent自进化机制

> **教一遍，记一辈子。用得越多，越懂你。**

---

## 核心心智模型

**模型1：遗忘曲线对抗** — Agent每次对话从零开始，进化机制就是"复习系统"。识别值得长期记住的经验→写入持久化文件→下次自动加载。失效条件：用户随口一说不是长期意图。

**模型2：三层沉淀漏斗** — L1轻量偏好放记忆层，L2方法论放技能层，L3全局规则放规范层。越往上审批越严。失效条件：层级判断错误，不确定时宁可放L1等自然升级。

**模型3：审批即训练** — 所有进化需用户审批。批准=正样本，忽略=负样本。频率控制：每日≤5次，每周≤15次，重要内容不受限。

---

## 进化层级协议

### L1：对话记忆层 → MEMORY.md
- **写入条件**：用户偏好、行为模式、经验碎片
- **审批**：重要性≥medium，简单确认
- **格式**：`### 🧬 自进化 [来源] > 经验内容（一句话）`
- **Git**：`🧬 L1进化: <摘要>`

### L2：技能优化层 → SKILL.md
- **写入条件**：踩坑经验、方法论改进、边界补充
- **审批**：需Darwin评分≥70分（调用darwin-skill评估）
- **Fallback**：无法调用Darwin时，Agent干跑3个测试prompt自评，≥75分才允许
- **格式**：`### 🧬 踩坑经验 [日期] > 失败现象/根因/方案/失效条件`
- **Git**：`🧬 L2进化: <skill名> - <摘要>`

### L3：行为规范层 → CLAUDE.md
- **写入条件**：全局行为约束、开发规范、安全边界
- **审批**：重要性high + 双重确认（先确认层级，再确认内容）
- **格式**：`### 🧬 规范进化 [来源] > 规则/范围/生效时间`
- **额外**：通知所有Bot「CLAUDE.md已更新」
- **Git**：`🧬 L3进化: <摘要>`

---

## 触发机制

### 触发器A：关键词识别

| 级别 | 关键词 | 行为 |
|------|--------|------|
| 紧急 | 以后、永远、每次、必须、一定、禁止 | 立即弹出进化卡片 |
| 标准 | 记住、下次、别再、不要再、记得 | 提示进化机会 |
| 温和 | 倾向、偏好、喜欢、习惯 | 记录候选池，批量审批 |

**误触发保护**：引用中/否定句/疑问句不触发或降级。

**混合意图协议**：检测临时状态+长期意图混合时，降级处理，标注"⚠️ 受临时情绪影响"。

**语义模糊追问**：意图不够具体时追问澄清，如"少说点开心的"→具体指减少emoji/正能量/闲聊？

### 触发器B：踩坑检测

| 指标 | 阈值 |
|------|------|
| 工具调用次数 | >5次/对话 |
| 同操作重试 | >3次 |
| 用户纠正 | >2次 |
| Git回滚 | 任何1次 |
| 操作超时 | 任何1次 |

时机：超阈值时内部标记，对话自然结束后统一处理。根因需用户确认后写入。

### 触发器C：定期复盘

每日HEARTBEAT/22:00任务后/用户主动请求时触发。读取记忆→识别重复模式→评估价值→过滤噪音→批量审批。

---

## 进化请求卡片（唯一标准格式）

```
🧬 进化请求 #<编号>

触发：<A/B/C> | 级别：<紧急/标准/温和>
建议记忆：> <一句话精炼表述>
⚠️ <情绪影响/意图模糊/根因待确认>（如有）
目标：L<1/2/3> → <文件路径>
评估：重要性<H/M/L> 复用性<H/M/L> 风险<无/低/中>
→ 「进化」|「进化 L2」|「忽略」|「修改」|「暂缓」
```

---

## 审批命令

| 用户回复 | 行为 |
|---------|------|
| `进化` | 按建议层级写入+Git提交 |
| `进化 L1/L2/L3` | 覆盖层级后写入 |
| `忽略` | 跳过（负样本） |
| `修改 <新内容>` | 替换后重新请求 |
| `暂缓` | 保留到下次复盘 |
| `确认根因` | L2踩坑根因确认 |
| `修正根因 <新>` | 替换根因后继续 |

---

## 冲突检测与解决

写入前搜索现有规则：矛盾→用户选择保留哪个；重复→合并；层级冲突→建议升级。

---

## 安全边界

**永远不能进化写入**：安全约束、系统规则、核心身份、其他Bot专属规则。
**内容限制**：每条≤100字，不含代码/敏感信息。

## 诚实边界

1. 不是真学习（写规则不是改权重），规则越多边际效益递减
2. 噪音无法完全消除，需定期清理
3. 冲突可能漏检（依赖文本搜索）
4. L3风险最高，务必双重确认
5. 过度进化→审批疲劳→质量下降
6. L1/L3效果只能靠主观感受
7. 语义模糊依赖用户澄清
8. 根因分析可能错误

---

## 回答工作流

```
Step 1: 识别 → 扫描关键词/踩坑指标/复盘触发
Step 2: 提炼 → 去触发词，评估层级(L1/L2/L3)，噪音过滤
Step 3: 请求审批 → 弹出卡片，L3双重确认
Step 4: 冲突检测 → 搜索现有规则
Step 5: 执行写入 → L2需Darwin评分，L3通知所有Bot
Step 6: Git提交 → "🧬 L<n>进化: <摘要>"
Step 7: 日志记录 → evolution-log.md + 计数器更新
```

---

*版本：v2.1.0 | 作者：Shike | MIT-0*

Self-Evolve Skill

SKILL.md

related skills