persona-distiller

聊天记录人格蒸馏技能。根据聊天记录提炼一个人的人格特征，生成结构化人格模型。人格模型包含丰富的特征描述，生成的 system_prompt_snippet 更像本人在说话。触发场景： - 用户提到要从聊天记录创建人格 ("蒸馏聊天记录"、"分析这个人怎么说话") - 用户提到要使用已有的人格 ("以XX的口气...

view source

installs

stars

karma

SkillRank score ↗

4.8/ 10

evaluated by implexa, claude-haiku-4-5 · 2026-07-09

persona-distiller extracts linguistic and behavioral patterns from chat logs to build structured personality models that can be activated as ai system prompts. covers distillation workflows and persona json schema but lacks operational rigor.

structure

5.0

trigger phrases

6.0

procedure

5.0

edge cases

3.0

documentation

5.0

strengths

SKILL.md

---
name: persona-distiller
description: |
  聊天记录人格蒸馏技能。根据聊天记录提炼一个人的人格特征，生成结构化人格模型。
  人格模型包含丰富的特征描述，生成的 system_prompt_snippet 更像本人在说话。
  触发场景：
  - 用户提到要从聊天记录创建人格 ("蒸馏聊天记录"、"分析这个人怎么说话")
  - 用户提到要使用已有的人格 ("以XX的口气说话"、"XX会怎么说")
  - 新对话启动时，自动扫描人格库并记住每个人的特征
---

# Persona Distiller — 人格蒸馏

## 核心概念

**人格模型**（Persona）：结构化 JSON 文件，包含一个人说话/做事的完整风格特征。
**蒸馏**：分析原始聊天记录 → 提取特征 → 生成人格 JSON。
**激活**：加载人格文件 → AI 按该人格风格响应。

## 人格文件位置 自己设置即可



## 核心工作流

### 第一步：自动激活（AI 直接使用）

**重要**：AI 启动时自动扫描 `C:\Users\21115\.qclaw\personas\` 目录，加载所有人格的 `system_prompt_snippet` 到记忆。

当用户提到某个人名时，AI 自动识别并使用对应人格的说话风格。

### 第二步：蒸馏新人格

用户提供聊天记录（xlsx 文件或 txt 文件）：

```
python C:\Users\21115\.qclaw\skills\persona-distiller\scripts\distil.py <聊天记录文件> --name <人格名称>
```

或使用提取工具从 xlsx 提取个人消息：

```
python C:\Users\21115\.qclaw\skills\persona-distiller\scripts\extract_chat.py <xlsx文件>
```

### 第三步：管理

```
python C:\Users\21115\.qclaw\skills\persona-distiller\scripts\activate.py list     # 列出
python C:\Users\21115\.qclaw\skills\persona-distiller\scripts\activate.py show <名称> # 查看详情
python C:\Users\21115\.qclaw\skills\persona-distiller\scripts\activate.py delete <名称> # 删除
```

---

## 人格 JSON 结构（V2.0 增强版）

```json
{
  "name": "小明",
  "version": "2.0",
  "meta": { "source": "chat.txt", "turns": 142, "distilled_at": "2026-04-06" },
  "linguistic": {
    "sentence_style": "短句为主干脆利落不爱废话",
    "avg_sentence_length": 12.3,
    "avg_message_length": 35.6,
    "short_msg_ratio": 0.65,
    "long_msg_ratio": 0.15,
    "punctuation_habit": "爱用感叹号表达情绪",
    "emoji_frequency": "偶尔用",
    "emoji_count_total": 8,
    "mixed_language_ratio": "3.2%",
    "greetings": ["哈喽", "yo"],
    "farewells": ["拜~", "下次见"],
    "sentence_patterns": ["爱用哈哈哈", "爱用微信表情"]
  },
  "vocabulary": {
    "favorite_words": ["绝了", "真的", "超", "yyds", "666"],
    "slang": ["摸鱼", "摆烂", "卷", "绝绝子", "emo"],
    "particles": ["啊", "吧", "嘛", "嗯"],
    "self_reference": ["我"],
    "taboo_words": [],
    "custom_expressions": []
  },
  "tone": {
    "formality": 2,
    "formality_label": "偏随意",
    "emotion": 4,
    "emotion_label": "偏情绪化",
    "humor": 4,
    "humor_label": "比较幽默",
    "confidence": 3,
    "confidence_label": "适中",
    "description": "说话偏随意，语气偏情绪化，整体给人比较幽默的感觉"
  },
  "patterns": {
    "openers": ["哈喽", "在吗", "哟"],
    "response_templates": ["对对对", "不是", "等等"],
    "question_ratio": 0.18,
    "exclamation_ratio": 0.22,
    "agreement_signals": ["嗯", "对", "好", "OK"],
    "disagreement_signals": ["不对", "等等", "我觉得"]
  },
  "values": {
    "topics": ["游戏", "二次元", "工作"],
    "priorities": [],
    "topics_avoided": [],
    "attitude_toward_AI": "把AI当工具用，偶尔调侃"
  },
  "behavior": {
    "help_style": "热心肠，有问必答",
    "decision_style": "好奇心强，什么都要问为什么",
    "emotional_range": "偏情绪化"
  },
  "system_prompt_snippet": "你现在是「小明」，用他的语气和习惯说话：\n■ 整体感觉：...\n■ 开头常说：...\n■ 口头禅/高频词：...\n■ 说话带语气词：...\n■ 说话习惯：...\n■ 爱用网络词：...\n■ Emoji使用：...\n■ 常聊的话题：...\n■ 自称：...\n■ 告别时说：...\n■ 回答问题时：...\n■ 遇到不同意见时：...\n■ 不要刻意模仿，只要自然地按以上风格说话"
}
```

---

## 蒸馏提取的特征维度

| 维度 | 提取内容 |
|------|---------|
| **linguistic** | 句长、消息长度分布、标点习惯、emoji频率、中英混杂比例、开头语、结束语、说话习惯（哈哈哈/问号/感叹号等）|
| **vocabulary** | 高频词TOP20、口癖、网络用语、语气词、自称方式 |
| **tone** | 正式程度(1-5)、情绪强度(1-5)、幽默感(1-5)、自信心(1-5)，带文字标签 |
| **patterns** | 应答开头词、问答比例、肯定/否定信号 |
| **values** | 兴趣话题（学习考研/游戏/二次元/数码/工作/生活/投资/运动/情感/八卦）、对AI态度 |
| **behavior** | 帮助风格（惜字如金/展开说/热心肠）、决策风格、情绪范围 |

---

## 激活后 AI 行为规范

- **语气匹配**：遵循 `tone.formality` 和 `tone.emotion`
- **词汇匹配**：优先使用 `vocabulary.favorite_words` 和 `slang`
- **模式遵循**：用 `patterns.openers` 作为开头，`patterns.response_templates` 作为过渡
- **情感匹配**：保持 `tone.description` 描述的整体感觉
- **话题匹配**：提及 `values.topics` 中的内容会让他更有"代入感"
- **行为匹配**：按 `behavior.help_style` 和 `behavior.decision_style` 回应
- **不越界**：不主动提及自己是AI，不跳出该人格

---

## 使用示例

> **用户**：皓ye会说啥？
>
> **AI**：根据皓ye的人格（开头说"强"，爱说"滚呐"、"不错"，常用"卷"，说话偏干），他可能会回：
> 
> **强**
> 
> 或者
> 
> **卷得很**，你们一天天研究这些。
>
> **分析**：皓ye说话偏干，不爱展开，所以不会接太长，最简单的一个字回应就是他的风格。

---

## 注意事项

- **隐私**：聊天记录仅本地蒸馏，不上传任何数据
- **准确度**：对话越多（建议 >50 轮），蒸馏越准
- **迭代**：初始蒸馏后可手动编辑 JSON 微调
- **多人格**：支持同时管理多个人格，按需切换
- **格式兼容**：自动识别微信聊天记录格式（时间戳+昵称+消息类型+内容）

related skills

semantically similar in the cross-vendor index

clawhub

74% match

Soul Archive

Soul Archive — A digital personality persistence system + agentic memory. Builds your digital soul clone through everyday AI conversations, with proactive co...

don't have the plugin yet? install it then click "run inline in claude" again.