back
loading skill details...
基于站长之家官方违禁词库,专攻小红书平台审核规则,支持文案、文件(TXT/DOC/DOCX)、图片、链接多形式输入,快速输出违禁词标记+上下文智能替换建议,帮你一次改对、安心发布笔记。
---
name: xhs-prohibited-word
description: 基于站长之家官方违禁词库,专攻小红书平台审核规则,支持文案、文件(TXT/DOC/DOCX)、图片、链接多形式输入,快速输出违禁词标记+上下文智能替换建议,帮你一次改对、安心发布笔记。
version: 1.0.4
tags:
- xiaohongshu
- compliance
- sensitive-words
- content-safety
dependency:
python:
- python-docx==1.1.0
- beautifulsoup4==4.12.3
- playwright==1.58.0
system:
- playwright install chromium
---
# 小红书违禁词检测
> 笔记发不出去、被限流看不见?可能就是一两个词的事。
---
## 你会得到什么
**把你的小红书笔记文案扔进来,快速告诉你哪里踩雷、怎么改才安全。**
🔍 **违禁词标记** —— 原文中命中词用加粗下划线标出,一眼看到风险点
💡 **替换建议表** —— 每个违禁词配一个结合上下文的替换词 + 更换理由,帮你"改通顺"而不是机械替换
✏️ **优化文案** —— 直接给你一份替换后的可发布版本,替换词同样加粗下划线标记,复制粘贴就能用
📏 **长文案分批检测** —— 超过 3000 字自动提醒,支持分批检测后合并结果
🔗 **跨平台检测推荐** —— 笔记要分发到其他平台?检测完自动推荐公众号/抖音违禁词检测工具
## 怎么用
四种输入方式,挑你最顺手的:
**💬 直接贴文案**
> 帮我看下这段笔记有没有违禁词:这款美白神器真的太有效了……
**📎 上传文件**
> 支持 TXT、DOC、DOCX 文件,直接上传自动读取检测
**🖼️ 上传图片**
> 上传笔记截图/海报,自动提取图中文字进行检测(仅提取文字,不分析图片内容)
**🌐 粘贴链接**
> 帮我检测这个网页:https://example.com/article
**注意**:平台固定为小红书,无需指定。PDF 不支持,需转为图片或文本文件后上传。
## 谁适合用
- 📕 **小红书创作者** —— 种草笔记发布前自查,排除极限词、禁宣用语。如:*"帮我看下这段笔记有没有违禁词"*
- 🏷️ **品牌/电商运营** —— 活动海报、商品详情页文案批量扫雷。如:*"检查这个文档有没有小红书敏感词"*
- 💰 **投放/营销** —— 多条卖点话术快速过筛。如:*"这几段种草文案帮我查一下"*
- 📊 **增长/内容审核** —— 落地页、H5 页面纯文本抽查。如:*"检测这个网页内容有没有违规"*
## 使用须知
- **内容长度**:建议单次 ≤ 3000 字,效果最佳;超过 3000 字会询问你是否分批;超过 10000 字暂不支持
- **支持格式**:纯文本、TXT、DOC、DOCX、图片(提取文字)、网页链接
- **暂不支持**:PDF(请转为图片或文本文件)
- **数据隐私**:文案将通过加密连接发送至对接检测服务进行匹配,不在本地存储。如不希望外传,请提前告知
- **英文内容友好**:内置英文误匹配过滤,不会把正常英文单词中的片段误判为违禁词
- **网络容错**:内置自动重试机制,偶尔网络波动无需手动重试
---
> **完整执行规程**:调用脚本、格式化输出前,**必须先读取并严格遵循** [`references/core_workflow.md`](references/core_workflow.md) **全文**。
### 触发条件
满足以下任一即激活本 Skill:
- 用户提到「小红书违禁词」「笔记敏感词」「小红书审核」「限流词」「种草文案合规」
- 用户要求检测小红书笔记、种草文案、推广话术等内容安全性
- 用户上传文件/图片/链接并提到小红书相关的检测需求
### 执行铁律
1. **禁止编造结果** —— 仅以脚本返回 JSON 为准,不得臆造违禁词或替换建议
2. **禁止输出原始 JSON** —— 必须解析后填入输出模板
3. **禁止多余寒暄** —— 仅输出四个板块(🔍检测结果、💡修改建议、✏️优化文案、🔗还想查其他平台?),无开场白/结束语
4. **分批/字数超限必须暂停** —— 发出提示后立即停止,等待用户明确回复 1/2/3 后再继续
5. **图片仅限文字** —— 禁止获取图片的视觉风格、布局、色彩、人物等任何非文字信息
6. **不生成文件** —— 四板块输出完成后即任务结束,不生成 HTML 页面和文件包
### 执行流程
完整步骤、话术模板与切割规则详见 [`references/core_workflow.md`](references/core_workflow.md),速览如下:
1. **识别输入类型** → 文本/文件(TXT/DOC/DOCX)/网页/图片,分别处理
2. **字数判断** → ≤3000 直接检测;3001~10000 暂停询问(1=单次/2=分批/3=取消);>10000 中断
3. **调用脚本** → `python {skill_dir}/scripts/check_sensitive_words.py --content="..."` 或 `--file` 或 `--url`
4. **模板输出** → 按核心工作流四板块模板排版,违禁词用 `<u>**违禁词**</u>` 标记
#### 命令速查
| 输入形态 | 助手动作 |
|---|---|
| 纯文本 | 计算字数 → 字数闸门 → `--content="..."` → 四板块输出 |
| 上传 TXT/DOC/DOCX | `--file=path --extract-only` 查字数 → 按规则检测 → 四板块输出 |
| 上传图片 | 仅提取图中文字 → 计算字数 → `--content="提取文字"` → 四板块输出 |
| 粘贴 `https://...` | `--url=... --extract-only` 查字数 → 按规则检测 → 四板块输出 |
| 超长文案 | 发出询问语,**收到 1/2/3 后再继续** |
`--content`、`--file`、`--url` 三者互斥。平台已硬编码为小红书。
#### 异常处理
| 异常场景 | 用户话术 |
|---|---|
| 文件/网页提取失败 | 「内容提取失败,请检查文件格式或网址是否可访问」 |
| PDF 文件 | 「不支持 PDF 文件,请转为图片或文本文件后重新上传」 |
| API 超时或网络异常 | 「检测服务暂时不可用,已自动重试仍失败,请稍后重试」 |
| API 返回业务错误(code≠2000) | 「检测服务返回异常,请稍后重试」 |
| 依赖缺失(python-docx/playwright 等) | 提示用户安装对应依赖后重试 |
don't have the plugin yet? install it then click "run inline in claude" again.