back
loading skill details...
集成文本分类、情感分析、关键词提取、摘要、翻译、实体识别、生成、相似度和纠错,覆盖全场景中文NLP任务。
# OpenClaw NLP 自然语言处理超级技能
**Version**: 1.0.0
**Author**: OpenClaw Team
**Category**: NLP自然语言处理
**Release Date**: 2026-05-14
---
## 一、技能介绍
### 1.1 技能定位
OpenClaw NLP Super Skill 是一款集成了9大核心自然语言处理功能的超级技能包,专为OpenClaw生态系统打造。本技能采用业界领先的NLP技术栈,整合了jieba、snownlp、transformers、gensim、scikit-learn等主流开源库,为AI Agent提供一站式的自然语言处理能力。
安装本技能后,AI Agent无需再安装其他NLP相关技能,即可完成文本分类、情感分析、关键词提取、文本摘要、机器翻译、命名实体识别、文本生成、文本相似度计算、文本纠错润色等全场景NLP任务,真正实现"一个技能,搞定所有NLP"。
### 1.2 核心优势
#### 🚀 **功能全覆盖**
- 9大核心NLP功能模块,覆盖80%以上日常NLP应用场景
- 从基础文本处理到高级语义分析,全方位满足需求
- 无需额外安装其他NLP技能,开箱即用
#### ⚡ **高性能轻量化**
- 采用轻量化模型设计,普通PC即可流畅运行
- 智能降级机制,无transformers环境下仍可正常工作
- 懒加载机制,按需加载模型,节省内存资源
#### 🔧 **高度可定制**
- 支持自定义分类体系,灵活适配业务场景
- 多种算法可选,根据需求选择最优方案
- 参数可配置,支持细粒度调优
#### 🎯 **企业级稳定**
- 完整的异常处理机制,确保系统稳定运行
- 完善的错误提示,便于问题定位
- 三端兼容(EXE、Skill、安卓APP)
### 1.3 适用场景
| 场景类型 | 具体应用 | 推荐功能 |
|---------|---------|---------|
| **内容运营** | 文章分类、情感监控、热点发现 | 文本分类、情感分析、关键词提取 |
| **客服质检** | 对话分析、意图识别、质量评分 | 情感分析、命名实体识别、文本相似度 |
| **舆情分析** | 舆情监控、观点挖掘、趋势分析 | 情感分析、关键词提取、文本摘要 |
| **文档处理** | 文档摘要、内容查重、自动分类 | 文本摘要、文本相似度、文本分类 |
| **智能写作** | 内容生成、纠错润色、智能扩写 | 文本生成、纠错润色、关键词提取 |
| **数据标注** | 实体标注、情感标注、分类标注 | NER、情感分析、文本分类 |
| **搜索引擎** | 相关推荐、语义匹配、query理解 | 文本相似度、关键词提取、NER |
| **教育领域** | 作文批改、内容摘要、知识点提取 | 纠错润色、文本摘要、关键词提取 |
---
## 二、功能清单
### 2.1 文本分类 (Text Classification)
**功能描述**:自动将文本归类到预定义的类别中,支持二分类、多分类及自定义分类体系。
**核心能力**:
- ✅ 支持二分类(如:正面/负面、垃圾/正常)
- ✅ 支持多分类(如:新闻分类、产品分类)
- ✅ 支持自定义分类体系,零样本学习
- ✅ 输出置信度分数,可设置阈值过滤
- ✅ 智能降级,无transformers时基于情感分类
**应用场景**:
- 新闻文章自动分类(科技/体育/娱乐/财经)
- 评论内容审核(正常/违规/广告)
- 客服工单自动分派
- 邮件自动分类归档
### 2.2 情感分析 (Sentiment Analysis)
**功能描述**:自动判断文本的情感倾向(正面/负面/中性),支持细粒度情感打分和分句级分析。
**核心能力**:
- ✅ 三分类情感判断(正面/负面/中性)
- ✅ 0-1连续情感分值输出
- ✅ 细粒度分句情感分析
- ✅ 正负情感比例统计
- ✅ 支持长文本批量处理
**应用场景**:
- 产品评论情感监控
- 社交媒体舆情分析
- 客服对话满意度分析
- 品牌口碑监测
### 2.3 关键词提取 (Keyword Extraction)
**功能描述**:自动提取文本中的核心关键词和重要短语,支持TF-IDF和TextRank两种经典算法。
**核心能力**:
- ✅ TF-IDF算法(基于词频-逆文档频率)
- ✅ TextRank算法(基于图模型)
- ✅ 支持词性过滤(名词/动词/地名等)
- ✅ 输出权重分数,可排序筛选
- ✅ 可配置返回关键词数量
**应用场景**:
- 文章标签自动生成
- SEO关键词优化
- 内容主题发现
- 知识图谱构建
### 2.4 文本摘要 (Text Summarization)
**功能描述**:自动生成文本的简洁摘要,支持抽取式摘要和生成式摘要两种模式。
**核心能力**:
- ✅ 抽取式摘要(提取原文关键句)
- ✅ 生成式摘要(AI生成全新摘要)
- ✅ 可配置压缩比例
- ✅ 保留核心信息,去除冗余
- ✅ 支持长文档处理
**应用场景**:
- 新闻文章自动摘要
- 会议记录要点提取
- 论文摘要生成
- 长文档快速浏览
### 2.5 机器翻译 (Machine Translation)
**功能描述**:提供高质量的多语言互译能力,重点支持中英互译。
**核心能力**:
- ✅ 中文 → 英文翻译
- ✅ 英文 → 中文翻译
- ✅ 自动检测源语言
- ✅ 基于Helsinki-NLP开源翻译模型
- ✅ 支持长文本翻译
**应用场景**:
- 外文资料翻译
- 跨语言沟通辅助
- 多语言内容生成
- 国际化产品支持
### 2.6 命名实体识别 (Named Entity Recognition)
**功能描述**:自动识别文本中的命名实体,包括人名、地名、组织机构名等。
**核心能力**:
- ✅ 人名识别 (PER)
- ✅ 地名识别 (LOC)
- ✅ 组织机构识别 (ORG)
- ✅ 其他实体类型支持
- ✅ 输出实体置信度
- ✅ 基于规则+模型双重识别
**应用场景**:
- 知识图谱构建
- 信息抽取
- 简历信息提取
- 地址标准化
### 2.7 文本生成 (Text Generation)
**功能描述**:基于上下文进行智能文本生成,支持文本续写和内容扩写。
**核心能力**:
- ✅ 文本续写(基于前文继续创作)
- ✅ 文本扩写(丰富内容细节)
- ✅ 可配置生成长度
- ✅ 温度参数控制创造性
- ✅ 基于transformers生成模型
**应用场景**:
- 智能写作辅助
- 内容创作灵感
- 营销文案生成
- 故事创作
### 2.8 文本相似度计算 (Text Similarity)
**功能描述**:计算两个文本之间的语义相似度,支持余弦相似度和Jaccard相似度。
**核心能力**:
- ✅ 余弦相似度(基于TF-IDF向量)
- ✅ Jaccard相似度(基于词集)
- ✅ 0-1相似度分数输出
- ✅ 相似度等级自动判定
- ✅ 公共词汇统计
**应用场景**:
- 内容去重
- 抄袭检测
- 相关推荐
- 问答匹配
- 语义检索
### 2.9 纠错润色 (Text Correction & Polishing)
**功能描述**:自动检测并修正文本中的错误,优化表达,提升文本质量。
**核心能力**:
- ✅ 常见错别字纠正
- ✅ 标点符号规范化
- ✅ 格式统一化
- ✅ 冗余表达去除
- ✅ 写作建议输出
**应用场景**:
- 作文批改
- 文案优化
- 邮件润色
- 内容审核
---
## 三、技术栈说明
### 3.1 核心依赖库
| 库名称 | 版本要求 | 用途说明 |
|-------|---------|---------|
| **jieba** | ≥0.42.1 | 中文分词、关键词提取 |
| **snownlp** | ≥0.12.3 | 情感分析、中文处理 |
| **transformers** | ≥4.20.0 | 深度学习NLP模型(分类、NER、生成、翻译) |
| **gensim** | ≥4.0.0 | 主题模型、相似度计算 |
| **scikit-learn** | ≥1.0.0 | TF-IDF、余弦相似度、机器学习 |
| **numpy** | ≥1.21.0 | 数值计算、向量运算 |
### 3.2 技术架构
```
┌─────────────────────────────────────────────────────────┐
│ OpenClaw Skill Interface │
│ (register_skill / handler) │
├─────────────────────────────────────────────────────────┤
│ NLP Super Skill Core │
│ ┌─────────┬─────────┬─────────┬─────────┬─────────┐ │
│ │ 文本分类 │ 情感分析 │ 关键词 │ 文本摘要 │ 机器翻译 │ │
│ ├─────────┼─────────┼─────────┼─────────┼─────────┤ │
│ │ 实体识别 │ 文本生成 │ 相似度 │ 纠错润色 │ │ │
│ └─────────┴─────────┴─────────┴─────────┴─────────┘ │
├─────────────────────────────────────────────────────────┤
│ 基础NLP算法库 │
│ jieba / snownlp / sklearn / gensim / transformers │
└─────────────────────────────────────────────────────────┘
```
### 3.3 模型选择策略
**轻量化优先原则**:
- 默认使用轻量化开源模型
- 优先选择CPU友好型模型
- 支持模型懒加载,按需初始化
- 完善的降级机制,确保可用性
---
## 四、安装说明
### 4.1 环境要求
- Python 3.8+
- 内存 ≥ 4GB(推荐8GB)
- 磁盘空间 ≥ 2GB(模型缓存)
- 操作系统:Windows / Linux / macOS / Android
### 4.2 安装命令
```bash
# 基础依赖安装(必需)
pip install jieba snownlp numpy scikit-learn gensim
# 完整功能安装(推荐,支持AI能力)
pip install jieba snownlp numpy scikit-learn gensim transformers torch sentencepiece
# 国内镜像加速
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple jieba snownlp numpy scikit-learn gensim transformers torch sentencepiece
```
### 4.3 验证安装
```python
# 验证基础功能
import jieba
import snownlp
print("基础依赖安装成功!")
# 验证完整功能(如已安装transformers)
try:
from transformers import pipeline
print("Transformers安装成功,支持完整AI功能!")
except:
print("Transformers未安装,使用基础NLP功能")
```
### 4.4 技能注册
将本技能放置在OpenClaw技能目录下,系统会自动发现并注册:
```
skills/
└── openclaw-nlp-skill/
├── SKILL.md
├── prompt.md
└── main.py
```
---
## 五、使用示例
### 5.1 文本分类示例
```python
# 调用方式
result = handler({
"function": "text_classification",
"params": {
"text": "这款手机拍照效果非常棒,续航也很给力!",
"categories": ["正面评价", "负面评价", "中性评价"]
}
})
# 输出结果
{
"success": true,
"function": "text_classification",
"result": {
"text": "这款手机拍照效果非常棒,续航也很给力!",
"predicted_category": "正面评价",
"confidence": 0.92
}
}
```
### 5.2 情感分析示例
```python
# 调用方式
result = handler({
"function": "sentiment_analysis",
"params": {
"text": "今天天气真好,心情特别愉快!",
"fine_grained": true
}
})
# 输出结果
{
"success": true,
"function": "sentiment_analysis",
"result": {
"text": "今天天气真好,心情特别愉快!",
"sentiment_score": 0.95,
"sentiment_label": "正面",
"fine_grained": {
"positive_ratio": 1.0,
"negative_ratio": 0.0
}
}
}
```
### 5.3 关键词提取示例
```python
# 调用方式
result = handler({
"function": "keyword_extraction",
"params": {
"text": "人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。",
"algorithm": "tfidf",
"top_k": 5
}
})
# 输出结果
{
"success": true,
"function": "keyword_extraction",
"result": {
"algorithm": "tfidf",
"keywords": [
{"word": "人工智能", "weight": 0.85},
{"word": "智能", "weight": 0.72},
{"word": "机器", "weight": 0.58}
]
}
}
```
### 5.4 文本摘要示例
```python
# 调用方式
result = handler({
"function": "text_summarization",
"params": {
"text": "很长的文章内容...",
"method": "extractive",
"ratio": 0.3
}
})
```
### 5.5 机器翻译示例
```python
# 调用方式
result = handler({
"function": "machine_translation",
"params": {
"text": "我爱中国",
"target_lang": "en"
}
})
# 输出结果
{
"success": true,
"result": {
"source_text": "我爱中国",
"target_lang": "en",
"translated_text": "I love China"
}
}
```
### 5.6 命名实体识别示例
```python
# 调用方式
result = handler({
"function": "named_entity_recognition",
"params": {
"text": "张三和李四一起去北京阿里巴巴总部开会"
}
})
# 输出结果
{
"success": true,
"result": {
"entities": {
"PER": [{"text": "张三"}, {"text": "李四"}],
"LOC": [{"text": "北京"}],
"ORG": [{"text": "阿里巴巴"}]
}
}
}
```
### 5.7 文本生成示例
```python
# 调用方式
result = handler({
"function": "text_generation",
"params": {
"prompt": "在一个阳光明媚的早晨",
"max_length": 100,
"task": "continuation"
}
})
```
### 5.8 文本相似度示例
```python
# 调用方式
result = handler({
"function": "text_similarity",
"params": {
"text1": "我爱机器学习",
"text2": "我喜欢深度学习",
"method": "cosine"
}
})
# 输出结果
{
"success": true,
"result": {
"similarity_score": 0.75,
"interpretation": "高度相似"
}
}
```
### 5.9 纠错润色示例
```python
# 调用方式
result = handler({
"function": "text_correction",
"params": {
"text": "今天 天气 真的真的很好!!",
"mode": "full"
}
})
```
---
## 六、触发词列表
本技能支持以下触发词(≥10个):
1. **nlp处理** - 通用NLP处理入口
2. **文本分析** - 综合文本分析
3. **情感分析** - 情感倾向判断
4. **关键词提取** - 提取核心关键词
5. **文本摘要** - 生成内容摘要
6. **机器翻译** - 多语言翻译
7. **命名实体识别** - 实体抽取
8. **文本生成** - 智能写作
9. **文本相似度** - 相似度计算
10. **纠错润色** - 文本优化
11. **文本分类** - 内容分类
12. **ner识别** - 实体识别简写
---
## 七、版本信息
### 当前版本:v1.0.0
**发布日期**:2026-05-14
**主要功能**:
- ✅ 9大NLP核心功能完整实现
- ✅ 支持transformers深度学习模型
- ✅ 完善的降级机制
- ✅ 完整的异常处理
- ✅ 三端兼容支持
### 更新日志
#### v1.0.0 (2026-05-14)
- 初始版本发布
- 实现9大NLP功能模块
- 支持OpenClaw标准接口
- 完成三端兼容适配
---
## 八、注意事项
### 8.1 使用建议
1. **模型下载**:首次使用transformers功能会自动下载模型,建议在网络良好环境下使用
2. **内存优化**:大模型会占用较多内存,建议8GB以上内存使用完整功能
3. **批量处理**:大量文本处理建议分批进行,避免内存溢出
4. **中文优先**:本技能针对中文优化,英文处理建议配合专用模型
### 8.2 常见问题
**Q: 为什么翻译功能输出提示信息?**
A: 未安装transformers时使用基础模式,安装transformers即可获得完整AI翻译能力
**Q: 情感分析准确率如何?**
A: 基础模式准确率约80%,配合transformers可达到90%+
**Q: 支持哪些语言?**
A: 重点支持中文,英文支持基础功能,完整多语言支持需安装transformers
### 8.3 性能指标
| 功能 | 单条处理速度 | 内存占用 | 准确率 |
|-----|-----------|---------|-------|
| 关键词提取 | <10ms | <50MB | 90%+ |
| 情感分析 | <20ms | <50MB | 85%+ |
| 文本相似度 | <15ms | <50MB | 85%+ |
| 纠错润色 | <10ms | <50MB | - |
| transformers功能 | 100-500ms | 500MB+ | 90%+ |
---
## 九、联系方式与支持
- **项目主页**:OpenClaw 生态系统
- **问题反馈**:通过OpenClaw社区提交Issue
- **技术支持**:OpenClaw 开发团队
---
**本技能严格遵循OpenClaw技能开发规范,确保三端兼容、稳定可靠。**
don't have the plugin yet? install it then click "run inline in claude" again.