Get笔记炼金术 — 将Get笔记中的录音笔记(谈案、会议、课堂、电话) 经过隐私审查→内容蒸馏→结构化沉淀→多端归档,转化为可复用的知识数字资产。 适用人群:律师、咨询师、培训师、销售等大量使用录音记录工作的专业人士。 触发条件: (1) 用户说"处理录音""录音转知识库""录音沉淀""消化录音""录音炼金"...
---
name: Get笔记炼金术
description: |
Get笔记炼金术 — 将Get笔记中的录音笔记(谈案、会议、课堂、电话)
经过隐私审查→内容蒸馏→结构化沉淀→多端归档,转化为可复用的知识数字资产。
适用人群:律师、咨询师、培训师、销售等大量使用录音记录工作的专业人士。
触发条件:
(1) 用户说"处理录音""录音转知识库""录音沉淀""消化录音""录音炼金"
(2) 用户说"Get笔记同步飞书""录音归档""录音整理"
(3) 定时任务触发:自动扫描新录音并处理
(4) 用户指定某条录音笔记进行处理
核心能力:隐私保护、内容蒸馏、知识分类、多端沉淀(飞书多维表格+IMA知识库+飞书知识库)
依赖:Get笔记App + OpenClaw + 飞书(可选IMA知识库)
环境变量:GETNOTE_API_KEY、GETNOTE_CLIENT_ID
metadata:
openclaw:
requires:
env:
- GETNOTE_API_KEY
- GETNOTE_CLIENT_ID
optionalEnv:
- IMA_OPENAPI_CLIENTID
- IMA_OPENAPI_APIKEY
homepage: https://biji.com
---
# Get笔记炼金术 — 录音→知识数字资产
> 💡 **一句话说明**:你的Get笔记里躺着几十上百条录音,每条都是"数字垃圾"。
> 这个技能把它们自动变成可搜索、可复用、有隐私保护的知识资产。
## 快速开始
### 30秒上手
1. 确保已安装 [Get笔记App](https://biji.com) 并开通录音转写
2. 配置环境变量:`GETNOTE_API_KEY` 和 `GETNOTE_CLIENT_ID`([获取方式](https://biji.com))
3. 对 Agent 说:**"处理我的录音"** — 首次运行会自动创建飞书多维表格
就这么简单。Agent会自动拉取你的录音 → 隐私审查 → 蒸馏知识 → 写入多维表格。
### 进阶配置(可选)
编辑 `config.json` 解锁更多能力:
- 🧠 IMA知识库同步(语义搜索,问答时自动召回)
- 📚 飞书知识库同步(团队共享文档)
- 🏷️ 自定义分类体系(适配你的行业)
- 🔒 隐私策略调整(脱敏规则、确认超时)
- ⚙️ 处理参数(批量大小、最短时长过滤)
---
## 总览
```
Get笔记录音 → 隐私审查 → 内容蒸馏 → 分类归档 → 多端沉淀
(输入) (Step 1) (Step 2) (Step 3) (Step 4)
```
**一条录音的完整旅程:**
1. Get笔记App录音 → 自动转写+AI摘要
2. OpenClaw拉取录音笔记详情
3. 🔴 **隐私审查**:扫描敏感信息,标记/脱敏/提醒所有者
4. **内容蒸馏**:从转写文本中提炼知识点、案例、法规、数据
5. **分类归档**:按领域自动分类
6. **多端沉淀**:飞书多维表格(结构化检索)+ 可选IMA知识库 + 可选飞书知识库
---
## Step 1:拉取录音笔记
### 1.1 扫描新录音
从Get笔记API拉取录音类型笔记,筛选未处理的:
```
GET https://openapi.biji.com/open/api/v1/resource/note/list?cursor=0
```
**录音类型过滤**(note_type):
- `audio` — 即时录音(谈案、电话)
- `meeting` — 会议录音
- `class_audio` — 课堂录音(培训、讲座)
- `local_audio` — 本地音频文件
- `recorder_audio` — 录音卡长录
- `recorder_flash_audio` — 录音卡闪念
### 1.2 获取笔记详情
```
GET https://openapi.biji.com/open/api/v1/resource/note/detail?id={note_id}
```
**关键字段提取:**
| 字段路径 | 内容 | 用途 |
|---------|------|------|
| `data.note.title` | 标题 | 录音主题 |
| `data.note.content` | AI摘要+正文 | 蒸馏输入 |
| `data.note.audio.transcript` | 完整转写文本 | 蒸馏输入(主要) |
| `data.note.audio.duration` | 时长(秒) | 元数据 |
| `data.note.tags` | 自动标签 | 分类参考 |
| `data.note.created_at` | 创建时间 | 归档时间 |
| `data.note.note_type` | 录音类型 | 场景分类 |
### 1.3 认证配置
```
Headers:
Authorization: $GETNOTE_API_KEY
X-Client-ID: $GETNOTE_CLIENT_ID
```
> ⚠️ 笔记ID是int64,JavaScript中必须当字符串处理,防止精度丢失。
---
## Step 2:🔴 隐私审查(最关键环节)
**铁律:任何录音内容在蒸馏和沉淀之前,必须先过隐私审查。**
### 2.1 敏感信息三级分类
| 级别 | 类型 | 处理方式 |
|------|------|---------|
| 🔴 P0-绝对禁止 | 身份证号、银行卡号、密码、当事人真名+案情 | **自动脱敏,不等确认** |
| 🟡 P1-需确认 | 客户名称、具体金额、商业策略、诉讼策略 | **提醒所有者确认后再入库** |
| 🟢 P2-可入库 | 法律条文、公开案例、行业通用数据、操作流程 | **直接入库** |
### 2.2 审查流程
```
转写文本
↓
自动扫描 → 识别P0/P1/P2内容
↓
P0内容 → 自动脱敏
P1内容 → 生成「隐私确认清单」→ 通知所有者确认
P2内容 → 直接进入蒸馏环节
↓
所有者确认P1(超时默认脱敏)
↓
生成「隐私审查报告」存档
```
详细的隐私审查规则、脱敏方法、审查报告模板见 [references/privacy-rules.md](references/privacy-rules.md)
---
## Step 3:内容蒸馏
**目标:从原始转写文本中提炼出可复用的知识资产,不是存原文。**
### 3.1 蒸馏产出物(7项)
| 产出物 | 说明 |
|--------|------|
| 📋 **录音概要** | 3-5句话概括核心内容 |
| 🎯 **知识要点** | 可复用知识点(3-10条) |
| ⚖️ **法规引用** | 涉及的法律法规条文 |
| 📊 **行业数据** | 提到的数据/统计信息 |
| 📁 **案例素材** | 可复用的实务经验 |
| 🏷️ **标签** | 自动分类标签 |
| ✅ **待办事项** | 录音中的行动项 |
### 3.2 蒸馏提示词
详见 [references/distill-prompts.md](references/distill-prompts.md),包含:
- 通用蒸馏提示词(所有录音)
- 谈案专项提炼(客户画像、服务方案、风险点)
- 课堂专项提炼(知识框架、易错点)
- 会议专项提炼(决策、分歧、跟进)
### 3.3 默认分类体系
| 一级分类 | 二级分类示例 |
|---------|-------------|
| 法律 | 诉讼、合同、知产、劳动 |
| 财税 | 税务筹划、税务争议、财务分析 |
| 金融 | 投融资、并购、跨境 |
| 行业 | 客户管理、AI应用、培训学习 |
> 可在 `config.json` 中自定义分类体系。
---
## Step 4:多端沉淀
### 4.1 飞书多维表格(必选,结构化检索)
首次使用时自动创建多维表格,包含以下字段:
| 字段名 | 类型 | 说明 |
|--------|------|------|
| 录音标题 | 文本 | Get笔记原标题 |
| 录音日期 | 日期 | 录音创建时间 |
| 录音类型 | 单选 | 谈案/会议/课堂/电话/闪念/本地 |
| 时长(分钟) | 数字 | 录音时长 |
| 一级分类 | 单选 | AI自动分类 |
| 二级分类 | 单选 | AI自动分类 |
| 录音概要 | 文本 | 蒸馏产出 |
| 知识要点 | 文本 | 蒸馏产出 |
| 法规引用 | 文本 | 蒸馏产出 |
| 行业数据 | 文本 | 蒸馏产出 |
| 案例素材 | 文本 | 蒸馏产出 |
| 标签 | 多选 | 自动+手动 |
| 待办事项 | 文本 | 录音中的行动项 |
| 隐私级别 | 单选 | P0已脱敏/P1已确认/P2无敏感/P1待确认 |
| 处理状态 | 单选 | 待处理/已蒸馏/已入库/需确认 |
| Get笔记ID | 文本 | 溯源用 |
| 入库时间 | 日期 | 写入时间 |
详细建表指南见 [references/bitable-setup.md](references/bitable-setup.md)
### 4.2 IMA知识库(可选,语义搜索)
在 `config.json` 中设置 `ima.enabled = true` 并填入 `kb_id` 后启用。
蒸馏后的知识要点会自动创建IMA笔记并添加到指定知识库。
### 4.3 飞书知识库(可选,团队共享)
在 `config.json` 中设置 `feishu_wiki.enabled = true` 并填入 `space_id` 后启用。
蒸馏后的内容会自动创建飞书文档并挂载到知识库空间。
---
## 执行模式
### 模式A:单条处理
```
用户:处理一下昨天那条XX录音
→ 拉取指定录音 → 隐私审查 → 蒸馏 → 沉淀
```
### 模式B:批量扫描
```
用户:把Get笔记里的录音都处理一下
→ 拉取全部录音 → 对比已处理列表 → 按batch_size逐批处理
→ 跳过时长<skip_short_duration_seconds的超短录音
```
### 模式C:定时自动(cron)
```
cron触发 → 扫描auto_scan_hours内新录音 → 自动处理
→ P1内容发确认给所有者 → 确认后完成入库
→ 超时按default_p1_action处理
```
### 模式D:搜索召回
```
用户:搜一下之前录音里关于XX的内容
→ 搜索飞书多维表格(结构化)+ IMA知识库(语义)→ 返回结果
```
### 模式E:查看统计
```
用户:我的录音处理了多少了?
→ 读取processed_notes.json → 统计已处理/待处理/各分类占比
```
---
## 已处理记录追踪
**追踪文件**:`processed_notes.json`
自动记录每条已处理录音的ID、处理时间、隐私状态、各平台入库状态,防止重复处理。
---
## 首次运行引导流程
当检测到 `config.json` 中 `bitable.app_token` 为空时,自动执行:
1. **询问用户职业**(用于优化蒸馏提示词)→ 写入 config.json
2. **创建飞书多维表格**「Get笔记录音知识台账」+ 全部17个字段
3. **写入配置** → app_token/table_id/url 写入 config.json
4. **询问可选配置** → IMA知识库?飞书知识库?自定义分类?
5. **试跑一条** → 自动选最新一条录音跑全流程,让用户看到效果
---
## 环境变量
| 变量 | 说明 | 必需 |
|------|------|------|
| `GETNOTE_API_KEY` | Get笔记API密钥(格式:gk_live_xxx) | ✅ |
| `GETNOTE_CLIENT_ID` | Get笔记客户端ID(格式:cli_xxx) | ✅ |
| `IMA_OPENAPI_CLIENTID` | IMA知识库客户端ID | 可选(启用IMA同步时需要) |
| `IMA_OPENAPI_APIKEY` | IMA知识库API Key | 可选(启用IMA同步时需要) |
飞书的凭证由 OpenClaw 飞书通道统一管理,无需额外配置。
---
## 常见问题
### Q:Get笔记API Key怎么获取?
访问 [biji.com](https://biji.com) 开发者后台申请。需要Get笔记会员。
### Q:没有飞书怎么办?
目前多维表格依赖飞书。未来版本会支持更多平台(Notion、本地CSV等)。
### Q:录音转写不准怎么办?
蒸馏环节会自动纠正转写中的常见错别字和专业术语错误。如果原始转写质量太差,蒸馏结果也会标注"转写质量较低,建议人工核实"。
### Q:处理一条录音需要多长时间?
取决于录音长度和模型速度,通常30秒-2分钟/条。
### Q:已处理的录音可以重新处理吗?
可以。指定录音说"重新处理XX",会覆盖之前的结果。
---
## 安全红线
1. 🔴 **原始转写文本永远不直接入知识库** — 必须经过隐私审查+蒸馏
2. 🔴 **P0级敏感信息必须自动脱敏** — 不等所有者确认
3. 🔴 **P1级信息未确认前不入库** — 默认按脱敏处理
4. 🔴 **隐私审查报告必须存档** — 可追溯、可审计
5. 🔴 **录音音频文件本身不上传知识库** — 只处理转写文本
6. 🔴 **Get笔记API凭证不写入任何日志或知识库** — 仅在运行时使用
don't have the plugin yet? install it then click "run inline in claude" again.