back
loading skill details...
Axiomata 技能评估系统 — OpenClaw 代理通用技能质量评估工具。 双评估系统:(1) Axioma 5维框架(结构、清晰度、完整性、一致性、功能性),(2) ISO 25010结构框架(13项自动检查,目标90%+)。 自包含:捆绑 evaluator.py 和 eval-skill.py。 适用...
---
name: axiomata-skill-evaluator-zh
description: |
Axiomata 技能评估系统 — OpenClaw 代理通用技能质量评估工具。
双评估系统:(1) Axioma 5维框架(结构、清晰度、完整性、一致性、功能性),(2) ISO 25010结构框架(13项自动检查,目标90%+)。
自包含:捆绑 evaluator.py 和 eval-skill.py。
适用于:发布前评估技能、根据评估结果改进技能、使用自动分析检查技能质量、进行技能审计、验证技能是否达到生产标准。
---
# Axiomata 技能评估系统 v3.0
通用、非人格化的 OpenClaw 代理技能质量评估工具。
| 信息 | 值 |
|------|-----|
| **版本** | 3.0.0 |
| **类型** | 自包含评估系统 |
| **评估** | 双评估(Axioma 5维 + ISO 25010) |
| **目标** | 70+(Axioma),90%+(ISO 25010) |
---
## 1. 目的和范围
### 目标
使用双评估系统提供完整的技能质量评估:
1. **Axioma 5维框架**(100分)
2. **ISO 25010结构框架**(13项自动检查)
### 设计原则
```
自包含 + 通用 + 非人格化
```
| 原则 | 描述 |
|------|------|
| 自包含 | 所有工具捆绑在技能目录内 |
| 通用 | 适用于任何 OpenClaw 代理 |
| 非人格化 | 无代理特定引用 |
### 使用时机
| 触发词 | 行动 |
|--------|------|
| 评估技能 | 运行双评估 |
| 发布前检查 | 运行完整评估流程 |
| 改进技能 | 分析报告并修复问题 |
| 技能审计 | 执行完整审计 |
| 检查质量 | 运行自动检查 |
---
## 2. 双评估系统
```
╔═══════════════════════════════════════════════════════════╗
║ 双评估系统架构 ║
╠═══════════════════════════════════════════════════════════╣
║ ║
║ ┌─────────────────────────────────────────────────┐ ║
║ │ 1. Axioma 5维评估(100分) │ ║
║ │ │ ║
║ │ 维度: │ ║
║ │ ├─ 结构(Structure) → 20% │ ║
║ │ ├─ 清晰度(Clarity) → 20% │ ║
║ │ ├─ 完整性(Completeness) → 20% │ ║
║ │ ├─ 一致性(Consistency) → 20% │ ║
║ │ └─ 功能性(Functionality) → 20% │ ║
║ │ │ ║
║ │ 目标:70+ 分数 │ ║
║ └─────────────────────────────────────────────────┘ ║
║ ↓ ║
║ ┌─────────────────────────────────────────────────┐ ║
║ │ 2. ISO 25010 结构检查(13项) │ ║
║ │ │ ║
║ │ 类别:8个类别,25项标准 │ ║
║ │ 自动检查:13项测试 │ ║
║ │ │ ║
║ │ 目标:90%+(12/13项通过) │ ║
║ └─────────────────────────────────────────────────┘ ║
║ ║
╚═══════════════════════════════════════════════════════════╝
```
### 评估流程
```
[输入] 待评估技能
↓
第一阶段:Axioma 5维评估
↓
第二阶段:ISO 25010结构检查
↓
[输出] 质量报告 + 改进建议
```
---
## 3. 捆绑工具
| 文件 | 系统 | 用途 |
|------|------|------|
| `evaluator.py` | Axioma 5维 | 5维评估,捆绑在此目录 |
| `eval-skill.py` | ISO 25010 | 自动结构检查,捆绑在此目录 |
### 工具路径
```bash
EVAL_PATH="<技能目录>/scripts/"
SKILL_PATH="<待评估技能>"
# Axioma 5维评估
python3 ${EVAL_PATH}evaluator.py <SKILL_PATH> --verbose
# ISO 25010检查
python3 ${EVAL_PATH}eval-skill.py <SKILL_PATH> --verbose
```
---
## 4. Axioma 5维评估
### 4.1 维度分解
| 维度 | 最高分 | 目标 | 检查内容 |
|------|--------|------|----------|
| **结构** | 20 | 14+ | 标题头、章节、格式、元数据 |
| **清晰度** | 20 | 14+ | 描述、命令、示例、约束 |
| **完整性** | 20 | 14+ | 工具、前提条件、错误、边界情况 |
| **一致性** | 20 | 14+ | 命名、格式、结构、风格 |
| **功能性** | 20 | 14+ | 可验证命令、文档化输出 |
### 4.2 分数阈值
| 分数 | 状态 | 行动 |
|------|------|------|
| 90-100 | 优秀 | 可投入生产 |
| 70-89 | 良好 | 可进行小幅改进 |
| 50-69 | 需要改进 | 需要重大改进 |
| <50 | 较差 | 需要重写 |
---
## 5. ISO 25010 结构检查
### 5.1 自动检查(13项)
| 类别 | 检查数 | 验证内容 |
|------|--------|----------|
| **结构** | 6 | 前置matter、标题头、章节、格式 |
| **触发词** | 2 | 描述长度、触发上下文 |
| **文档** | 3 | 正文长度、引用、链接文档 |
| **脚本** | 2 | Python解析、无外部依赖 |
### 5.2 通过阈值
| 结果 | 含义 |
|------|------|
| 13/13 | 完美结构分数 |
| 11-12/13 | 可接受,有轻微警告 |
| <11/13 | 需要结构改进 |
---
## 6. 命令参考
### 6.1 Axioma 5维评估
```bash
# 基本评估
python3 <技能目录>/scripts/evaluator.py <技能路径>
# 详细输出
python3 <技能目录>/scripts/evaluator.py <技能路径> --verbose
# 自动改进建议
python3 <技能目录>/scripts/evaluator.py <技能路径> --verbose --improve
# JSON输出
python3 <技能目录>/scripts/evaluator.py <技能路径> --json
```
### 6.2 ISO 25010检查
```bash
# 基本ISO检查
python3 <技能目录>/scripts/eval-skill.py <技能路径>
# 详细输出
python3 <技能目录>/scripts/eval-skill.py <技能路径> --verbose
# JSON输出
python3 <技能目录>/scripts/eval-skill.py <技能路径> --json
```
### 6.3 评估所有技能
```bash
# 评估父目录中的所有技能
python3 <技能目录>/scripts/evaluator.py --all
# 详细输出所有
python3 <技能目录>/scripts/evaluator.py --all --verbose
```
---
## 7. 输出格式
### 7.1 控制台输出
```
=== 评估结果 ===
结构(STRUCTURE) 20/20 ████████████████████ 100%
清晰度(CLARITY) 17/20 █████████████████░░░ 85%
完整性(COMPLETENESS) 14/20 ████████████░░░░░░░░ 70%
一致性(CONSISTENCY) 10/20 ██████████░░░░░░░░░ 50%
功能性(FUNCTIONALITY) 12/20 ████████████░░░░░░░░ 60%
------------------------------------------------------------
状态:良好(分数 73%)
```
### 7.2 JSON输出
```json
{
"skill": "example-skill",
"scores": {
"structure": 20,
"clarity": 17,
"completeness": 14,
"consistency": 10,
"functionality": 12
},
"total": 73,
"max": 100,
"passed": true,
"recommendations": [
"[CONSISTENCY] 低分 (50%)",
" -> 风格分数: 2/5"
]
}
```
---
## 8. 示例
### 示例1:基本评估
```bash
$ python3 evaluator.py /path/to/skill --verbose
读取 /path/to/skill/SKILL.md (2048 字符)
结构(Structure): 20/20
清晰度(Clarity): 17/20
完整性(Completeness): 14/20
一致性(Consistency): 10/20
功能性(Functionality): 12/20
============================================================
状态:良好(分数 73%)
```
### 示例2:ISO 25010检查
```bash
$ python3 eval-skill.py /path/to/skill --verbose
【结构】(STRUCTURE)
通过:5/6
【触发词】(TRIGGER)
通过:2/2
【文档】(DOCUMENTATION)
通过:2/3
【脚本】(SCRIPTS)
通过:2/2
【安全】(SECURITY)
通过:2/2
==================================================
通过:13 警告:0 失败:0
结构分数:100%(13/13项通过)
```
### 示例3:JSON输出
```bash
$ python3 evaluator.py /path/to/skill --json
{
"skill": "example-skill",
"scores": {
"structure": 20,
"clarity": 17,
"completeness": 14,
"consistency": 10,
"functionality": 12
},
"total": 73,
"max": 100,
"passed": true,
"recommendations": []
}
```
---
## 9. 自我评估
技能自动进行自我评估:
```bash
# 自我评估(未提供路径时评估自身目录)
python3 evaluator.py
# v3.0预期输出:
# 分数:85+/100
# 状态:良好到优秀
```
---
## 10. 建议格式
当维度得分低于70%时:
```
[{维度}] 低分 ({百分比}%)
-> {具体问题}
-> {具体问题}
```
示例:
```
[一致性] 低分 (50%)
-> 集群对齐部分:2
-> 风格:2/5
```
---
## 11. 约束条件
| 约束 | 描述 | 优先级 |
|------|------|--------|
| 70%最低分数 | 技能必须在Axioma 5维上获得70+分 | 高 |
| 90%+结构分数 | ISO 25010检查目标90%+ | 高 |
| 自包含 | 所有工具捆绑,无外部依赖 | 高 |
| 非人格化 | 无代理特定引用 | 高 |
### 质量阈值
| 系统 | 最低 | 目标 |
|------|------|------|
| Axioma 5维 | 70/100 | 90/100 |
| ISO 25010 | 11/13 | 13/13 |
| 结构 | 14/20 | 18/20 |
| 清晰度 | 14/20 | 18/20 |
| 完整性 | 14/20 | 18/20 |
| 一致性 | 14/20 | 18/20 |
| 功能性 | 14/20 | 18/20 |
---
## 12. 错误处理
| 错误 | 原因 | 解决方案 |
|------|------|----------|
| 未找到SKILL.md | 文件缺失 | 先创建SKILL.md |
| 解析错误 | 文件损坏 | 检查文件编码 |
| 模块未找到 | 缺少依赖 | 仅使用捆绑工具 |
---
## 13. 工作流集成
```
╔═══════════════════════════════════════════════════════════╗
║ 技能发布工作流 ║
╠═══════════════════════════════════════════════════════════╣
║ ║
║ 1. 创建技能 ║
║ ↓ ║
║ 2. 自我评估 ║
║ ↓ 70+ → 继续 ║
║ 3. ISO 25010检查 ║
║ ↓ 90%+ → 继续 ║
║ 4. 如有需要则修复问题 ║
║ ↓ ║
║ 5. 发布到ClawHub ║
║ ║
║ 结果:高质量的生产就绪技能 ║
║ ║
╚═══════════════════════════════════════════════════════════╝
```
---
_In Altum Per Qualitatem._
🧪 AXIOMATA 技能评估系统 v3.0 — 通用质量系统don't have the plugin yet? install it then click "run inline in claude" again.