Axiomata 技能评估系统 — OpenClaw 代理通用技能质量评估工具。双评估系统：(1) Axioma 5维框架（结构、清晰度、完整性、一致性、功能性），(2) ISO 25010结构框架（13项自动检查，目标90%+）。自包含：捆绑 evaluator.py 和 eval-skill.py。适用...
SKILL.md

---
name: axiomata-skill-evaluator-zh
description: |
  Axiomata 技能评估系统 — OpenClaw 代理通用技能质量评估工具。
  
  双评估系统：(1) Axioma 5维框架（结构、清晰度、完整性、一致性、功能性），(2) ISO 25010结构框架（13项自动检查，目标90%+）。
  
  自包含：捆绑 evaluator.py 和 eval-skill.py。
  
  适用于：发布前评估技能、根据评估结果改进技能、使用自动分析检查技能质量、进行技能审计、验证技能是否达到生产标准。
---

# Axiomata 技能评估系统 v3.0

通用、非人格化的 OpenClaw 代理技能质量评估工具。

| 信息 | 值 |
|------|-----|
| **版本** | 3.0.0 |
| **类型** | 自包含评估系统 |
| **评估** | 双评估（Axioma 5维 + ISO 25010） |
| **目标** | 70+（Axioma），90%+（ISO 25010） |

---

## 1. 目的和范围

### 目标

使用双评估系统提供完整的技能质量评估：

1. **Axioma 5维框架**（100分）
2. **ISO 25010结构框架**（13项自动检查）

### 设计原则

```
自包含 + 通用 + 非人格化
```

| 原则 | 描述 |
|------|------|
| 自包含 | 所有工具捆绑在技能目录内 |
| 通用 | 适用于任何 OpenClaw 代理 |
| 非人格化 | 无代理特定引用 |

### 使用时机

| 触发词 | 行动 |
|--------|------|
| 评估技能 | 运行双评估 |
| 发布前检查 | 运行完整评估流程 |
| 改进技能 | 分析报告并修复问题 |
| 技能审计 | 执行完整审计 |
| 检查质量 | 运行自动检查 |

---

## 2. 双评估系统

```
╔═══════════════════════════════════════════════════════════╗
║              双评估系统架构                            ║
╠═══════════════════════════════════════════════════════════╣
║                                                           ║
║  ┌─────────────────────────────────────────────────┐      ║
║  │  1. Axioma 5维评估（100分）                      │      ║
║  │                                                 │      ║
║  │  维度：                                         │      ║
║  │  ├─ 结构（Structure）     → 20%                 │      ║
║  │  ├─ 清晰度（Clarity）     → 20%                 │      ║
║  │  ├─ 完整性（Completeness） → 20%               │      ║
║  │  ├─ 一致性（Consistency） → 20%                │      ║
║  │  └─ 功能性（Functionality） → 20%              │      ║
║  │                                                 │      ║
║  │  目标：70+ 分数                                 │      ║
║  └─────────────────────────────────────────────────┘      ║
║                        ↓                                ║
║  ┌─────────────────────────────────────────────────┐      ║
║  │  2. ISO 25010 结构检查（13项）                 │      ║
║  │                                                 │      ║
║  │  类别：8个类别，25项标准                       │      ║
║  │  自动检查：13项测试                            │      ║
║  │                                                 │      ║
║  │  目标：90%+（12/13项通过）                    │      ║
║  └─────────────────────────────────────────────────┘      ║
║                                                           ║
╚═══════════════════════════════════════════════════════════╝
```

### 评估流程

```
[输入] 待评估技能
          ↓
 第一阶段：Axioma 5维评估
          ↓
 第二阶段：ISO 25010结构检查
          ↓
 [输出] 质量报告 + 改进建议
```

---

## 3. 捆绑工具

| 文件 | 系统 | 用途 |
|------|------|------|
| `evaluator.py` | Axioma 5维 | 5维评估，捆绑在此目录 |
| `eval-skill.py` | ISO 25010 | 自动结构检查，捆绑在此目录 |

### 工具路径

```bash
EVAL_PATH="<技能目录>/scripts/"
SKILL_PATH="<待评估技能>"

# Axioma 5维评估
python3 ${EVAL_PATH}evaluator.py <SKILL_PATH> --verbose

# ISO 25010检查
python3 ${EVAL_PATH}eval-skill.py <SKILL_PATH> --verbose
```

---

## 4. Axioma 5维评估

### 4.1 维度分解

| 维度 | 最高分 | 目标 | 检查内容 |
|------|--------|------|----------|
| **结构** | 20 | 14+ | 标题头、章节、格式、元数据 |
| **清晰度** | 20 | 14+ | 描述、命令、示例、约束 |
| **完整性** | 20 | 14+ | 工具、前提条件、错误、边界情况 |
| **一致性** | 20 | 14+ | 命名、格式、结构、风格 |
| **功能性** | 20 | 14+ | 可验证命令、文档化输出 |

### 4.2 分数阈值

| 分数 | 状态 | 行动 |
|------|------|------|
| 90-100 | 优秀 | 可投入生产 |
| 70-89 | 良好 | 可进行小幅改进 |
| 50-69 | 需要改进 | 需要重大改进 |
| <50 | 较差 | 需要重写 |

---

## 5. ISO 25010 结构检查

### 5.1 自动检查（13项）

| 类别 | 检查数 | 验证内容 |
|------|--------|----------|
| **结构** | 6 | 前置matter、标题头、章节、格式 |
| **触发词** | 2 | 描述长度、触发上下文 |
| **文档** | 3 | 正文长度、引用、链接文档 |
| **脚本** | 2 | Python解析、无外部依赖 |

### 5.2 通过阈值

| 结果 | 含义 |
|------|------|
| 13/13 | 完美结构分数 |
| 11-12/13 | 可接受，有轻微警告 |
| <11/13 | 需要结构改进 |

---

## 6. 命令参考

### 6.1 Axioma 5维评估

```bash
# 基本评估
python3 <技能目录>/scripts/evaluator.py <技能路径>

# 详细输出
python3 <技能目录>/scripts/evaluator.py <技能路径> --verbose

# 自动改进建议
python3 <技能目录>/scripts/evaluator.py <技能路径> --verbose --improve

# JSON输出
python3 <技能目录>/scripts/evaluator.py <技能路径> --json
```

### 6.2 ISO 25010检查

```bash
# 基本ISO检查
python3 <技能目录>/scripts/eval-skill.py <技能路径>

# 详细输出
python3 <技能目录>/scripts/eval-skill.py <技能路径> --verbose

# JSON输出
python3 <技能目录>/scripts/eval-skill.py <技能路径> --json
```

### 6.3 评估所有技能

```bash
# 评估父目录中的所有技能
python3 <技能目录>/scripts/evaluator.py --all

# 详细输出所有
python3 <技能目录>/scripts/evaluator.py --all --verbose
```

---

## 7. 输出格式

### 7.1 控制台输出

```
=== 评估结果 ===
结构（STRUCTURE）       20/20 ████████████████████ 100%
清晰度（CLARITY）       17/20 █████████████████░░░ 85%
完整性（COMPLETENESS）  14/20 ████████████░░░░░░░░ 70%
一致性（CONSISTENCY）   10/20 ██████████░░░░░░░░░ 50%
功能性（FUNCTIONALITY） 12/20 ████████████░░░░░░░░ 60%
------------------------------------------------------------
状态：良好（分数 73%）
```

### 7.2 JSON输出

```json
{
  "skill": "example-skill",
  "scores": {
    "structure": 20,
    "clarity": 17,
    "completeness": 14,
    "consistency": 10,
    "functionality": 12
  },
  "total": 73,
  "max": 100,
  "passed": true,
  "recommendations": [
    "[CONSISTENCY] 低分 (50%)",
    "  -> 风格分数: 2/5"
  ]
}
```

---

## 8. 示例

### 示例1：基本评估

```bash
$ python3 evaluator.py /path/to/skill --verbose
读取 /path/to/skill/SKILL.md (2048 字符)
结构（Structure）: 20/20
清晰度（Clarity）: 17/20
完整性（Completeness）: 14/20
一致性（Consistency）: 10/20
功能性（Functionality）: 12/20
============================================================
状态：良好（分数 73%）
```

### 示例2：ISO 25010检查

```bash
$ python3 eval-skill.py /path/to/skill --verbose
【结构】（STRUCTURE）
    通过：5/6
【触发词】（TRIGGER）
    通过：2/2
【文档】（DOCUMENTATION）
    通过：2/3
【脚本】（SCRIPTS）
    通过：2/2
【安全】（SECURITY）
    通过：2/2
==================================================
  通过：13  警告：0  失败：0
  结构分数：100%（13/13项通过）
```

### 示例3：JSON输出

```bash
$ python3 evaluator.py /path/to/skill --json
{
  "skill": "example-skill",
  "scores": {
    "structure": 20,
    "clarity": 17,
    "completeness": 14,
    "consistency": 10,
    "functionality": 12
  },
  "total": 73,
  "max": 100,
  "passed": true,
  "recommendations": []
}
```

---

## 9. 自我评估

技能自动进行自我评估：

```bash
# 自我评估（未提供路径时评估自身目录）
python3 evaluator.py

# v3.0预期输出：
# 分数：85+/100
# 状态：良好到优秀
```

---

## 10. 建议格式

当维度得分低于70%时：

```
[{维度}] 低分 ({百分比}%)
  -> {具体问题}
  -> {具体问题}
```

示例：
```
[一致性] 低分 (50%)
  -> 集群对齐部分：2
  -> 风格：2/5
```

---

## 11. 约束条件

| 约束 | 描述 | 优先级 |
|------|------|--------|
| 70%最低分数 | 技能必须在Axioma 5维上获得70+分 | 高 |
| 90%+结构分数 | ISO 25010检查目标90%+ | 高 |
| 自包含 | 所有工具捆绑，无外部依赖 | 高 |
| 非人格化 | 无代理特定引用 | 高 |

### 质量阈值

| 系统 | 最低 | 目标 |
|------|------|------|
| Axioma 5维 | 70/100 | 90/100 |
| ISO 25010 | 11/13 | 13/13 |
| 结构 | 14/20 | 18/20 |
| 清晰度 | 14/20 | 18/20 |
| 完整性 | 14/20 | 18/20 |
| 一致性 | 14/20 | 18/20 |
| 功能性 | 14/20 | 18/20 |

---

## 12. 错误处理

| 错误 | 原因 | 解决方案 |
|------|------|----------|
| 未找到SKILL.md | 文件缺失 | 先创建SKILL.md |
| 解析错误 | 文件损坏 | 检查文件编码 |
| 模块未找到 | 缺少依赖 | 仅使用捆绑工具 |

---

## 13. 工作流集成

```
╔═══════════════════════════════════════════════════════════╗
║         技能发布工作流                                    ║
╠═══════════════════════════════════════════════════════════╣
║                                                           ║
║  1. 创建技能                                              ║
║      ↓                                                    ║
║  2. 自我评估                                              ║
║      ↓ 70+ → 继续                                        ║
║  3. ISO 25010检查                                        ║
║      ↓ 90%+ → 继续                                       ║
║  4. 如有需要则修复问题                                    ║
║      ↓                                                    ║
║  5. 发布到ClawHub                                        ║
║                                                           ║
║  结果：高质量的生产就绪技能                               ║
║                                                           ║
╚═══════════════════════════════════════════════════════════╝
```

---

_In Altum Per Qualitatem._
🧪 AXIOMATA 技能评估系统 v3.0 — 通用质量系统
Axiomata Skill Evaluator Zh

SKILL.md

related skills