基于官方违禁词库实时同步,覆盖广告法、医疗美容、金融风险等10+类目,支持文本、文件、图片多形式检测,快速输出违禁词标记+替换建议+优化文案,帮你避开封号限流风险。
---
name: gzh-prohibited-word
description: 基于官方违禁词库实时同步,覆盖广告法、医疗美容、金融风险等10+类目,支持文本、文件、图片多形式检测,快速输出违禁词标记+替换建议+优化文案,帮你避开封号限流风险。
version: 1.0.0
tags:
- wechat-official-account
- compliance
- content-moderation
- python-script
dependency:
python:
- python-docx==1.1.0
- beautifulsoup4==4.12.3
- playwright==1.58.0
system:
- playwright install chromium
---
# 公众号违禁词检测
> 推文发不出去、被删改、被封号?可能就是一两个词踩了线。
---
## 你会得到什么
**把你的公众号文案扔进来,快速告诉你哪里踩线、怎么改才安全。**
🔍 **违禁词标记** —— 原文中命中词直接标红,一眼看到风险点,同时汇总类型与数量
💡 **替换建议表** —— 每个违禁词配一个结合上下文的替换词 + 更换理由,帮你"改通顺"而不是机械替换
✏️ **优化文案** —— 直接给你一份替换后的可发布版本,替换词标蓝标记,复制粘贴就能用
📎 **优化文案文件** —— 自动生成纯文本文件,点击即可下载保存
📏 **长文案分批检测** —— 超过 3000 字自动提醒,支持分批检测后合并结果
## 怎么用
四种输入方式,挑你最顺手的:
**💬 直接贴文案**
> 帮我看下这篇公众号草稿有没有违禁词:这款美白神器真的太有效了……
**📎 上传文件**
> 支持 TXT、DOC、DOCX 文件,直接上传自动读取检测
**🖼️ 上传图片**
> 上传海报截图/推文截图,自动提取图中文字进行检测(仅提取文字,不分析图片内容)
**🌐 粘贴链接**
> 帮我检测这个网页:https://example.com/article
**注意**:平台固定为公众号,无需指定。PDF 不支持,需转为图片或文本文件后上传。
## 谁适合用
- 📢 **公众号运营** —— 推文发布前自查,排除极限词、禁宣用语,避免被删改或封号。如:*"帮我检查这篇推文有没有违规词"*
- ✍️ **新媒体编辑** —— 多篇短文或单篇长文分段合规预审。如:*"这几篇文章帮我批量过一遍"*
- 🛒 **品牌/市场团队** —— 活动落地页、H5 页面文案抽查。如:*"检测这个网页内容有没有违规"*
- 🎨 **设计师协作** —— 海报/推文图上的文字合规检查。如:*"这个海报上的文案帮我查一下"*
## 使用须知
- **覆盖类目广**:广告法极限词、医疗美容、金融风险、教育等 10+ 违禁词类目
- **内容长度**:建议单次 ≤ 3000 字,效果最佳;超过 3000 字会询问你是否分批;超过 10000 字暂不支持
- **支持格式**:纯文本、TXT、DOC、DOCX、图片(提取文字)、网页链接
- **暂不支持**:PDF(请转为图片或文本文件)
- **数据隐私**:文案将通过加密连接发送至对接检测服务进行匹配,不在本地存储。如不希望外传,请提前告知
- **英文内容友好**:内置英文误匹配过滤,不会把正常英文单词中的片段误判为违禁词
- **网络容错**:内置自动重试机制,偶尔网络波动无需手动重试
---
> **完整执行规程**:调用脚本、格式化输出前,**必须先读取并严格遵循** [`references/core_workflow.md`](references/core_workflow.md) **全文**。
### 触发条件
满足以下任一即激活本 Skill:
- 用户提到「公众号违禁词」「公众号敏感词」「推文合规」「广告法违禁词」「封号风险」
- 用户要求检测公众号推文、草稿、活动页、海报文字等内容安全性
- 用户上传文件/图片/链接并提到公众号相关的检测需求
### 执行铁律
1. **禁止编造结果** —— 仅以脚本返回 JSON 为准,不得臆造违禁词或替换建议
2. **禁止输出原始 JSON** —— 必须解析后填入输出模板
3. **禁止多余寒暄** —— 仅输出三个板块(🔍检测结果、💡修改建议、✏️优化文案),无开场白/结束语
4. **分批/字数超限必须暂停** —— 发出提示后立即停止,等待用户明确回复 1/2/3 后再继续
5. **图片仅限文字** —— 禁止获取图片的视觉风格、布局、色彩、人物等任何非文字信息
6. **必须交付文件** —— 三板块输出完成后,必须将纯文本优化文案写入 `./公众号_优化文案_{随机6位数字}.txt` 并以卡片形式发送给用户,禁止省略
### 执行流程
完整步骤、话术模板与切割规则详见 [`references/core_workflow.md`](references/core_workflow.md),速览如下:
1. **识别输入类型** → 文本/文件(TXT/DOC/DOCX)/网页/图片,分别处理
2. **字数判断** → ≤3000 直接检测;3001~10000 暂停询问(1=单次/2=分批/3=取消);>10000 中断
3. **调用脚本** → `python {skill_dir}/scripts/check_sensitive_words.py --content="..."` 或 `--file` 或 `--url`
4. **模板输出** → 按核心工作流三板块模板排版,违禁词用 `<span style="color:red">` 标红,替换词用 `<span style="color:blue">` 标蓝
5. **交付文件** → 写入 `./公众号_优化文案_{随机6位数字}.txt` 并发送文件卡片
#### 命令速查
| 输入形态 | 助手动作 |
|---|---|
| 纯文本 | 计算字数 → 字数闸门 → `--content="..."` → 三板块输出 → 写文件 |
| 上传 TXT/DOC/DOCX | `--file=path --extract-only` 查字数 → 按规则检测 → 三板块输出 → 写文件 |
| 上传图片 | 仅提取图中文字 → 计算字数 → `--content="提取文字"` → 三板块输出 → 写文件 |
| 粘贴 `https://...` | `--url=... --extract-only` 查字数 → 按规则检测 → 三板块输出 → 写文件 |
| 超长文案 | 发出询问语,**收到 1/2/3 后再继续** |
`--content`、`--file`、`--url` 三者互斥。平台已硬编码为公众号。
#### 异常处理
| 异常场景 | 用户话术 |
|---|---|
| 文件/网页提取失败 | 「内容提取失败,请检查文件格式或网址是否可访问」 |
| PDF 文件 | 「不支持 PDF 文件,请转为图片或文本文件后重新上传」 |
| API 超时或网络异常 | 「检测服务暂时不可用,已自动重试仍失败,请稍后重试」 |
| API 返回业务错误(code≠2000) | 「检测服务返回异常,请稍后重试」 |
| 未配置检测接口 | 「检测接口未配置,请设置 GZH_SENSITIVE_WORD_API_HOST 或参考 gzh_sensitive_word_api.example.json 配置」 |
| 依赖缺失(python-docx/playwright 等) | 提示用户安装对应依赖后重试 |
don't have the plugin yet? install it then click "run inline in claude" again.