Universal PDF intelligent processing system v2.1 with 33 capabilities across 5 AI-powered cores, 4 professional extensions, 7 scenario barriers, 9 value-adds...
SKILL.md

---
name: pdf-master
description: Universal PDF intelligent processing system v2.1 with 33 capabilities across 5 AI-powered cores, 4 professional extensions, 7 scenario barriers, 9 value-adds, and 5 gap-fillers + 3 new enterprise capabilities. Built on Docling/Marker/OpenParse enterprise-grade document intelligence stack. Features AI-driven fidelity conversion, enhanced OCR with professional templates, multimodal RAG Q&A, intelligent layout-preserving editing with font matching, PDF multi-document smart splitting, PDF→CAD conversion, cross-software collaboration layer, enterprise DRM with automated audit reports, batch contract comparison, and team password vault. Feishu Lark native. Every output includes time-cost comparison against manual work.
---

# 万能PDF大师 2.1 —— 企业级 PDF 智能处理中枢

## Overview

一站式 PDF 处理系统，**33项精准能力**，不是"功能堆砌"而是"手术刀级痛点歼灭"。每个能力都回答三个问题：免费工具的坑在哪？我们怎么做到**更精细**？优越在哪？

**2.1 核心升级**：
- **3项新增能力**：PDF内多文档智能拆解（第31项）、PDF→CAD高保真转换（第32项）、跨软件协作兼容层（第33项）
- **5项深度优化**：多模态RAG问答、专业OCR模板库、字体智能匹配+仿真编辑、视觉比对审核、自动化审计报告
- **2项微能力**：团队共享密码托管、批量合同比对
- **精细度深化**：从"30项能力覆盖"升级到"33项+7处精细度深化"

**核心价值主张**：免费工具让你"勉强能用"，我们让你"零妥协"——精度、速度、安全、合规、协作，每一项都比行业标准高一个段位。

---

## 五大AI驱动核心能力

### 1. PDF↔Office 高保真互转（AI双引擎驱动）
**职场场景**：收到 PDF 合同/标书/论文需要修改，免费工具转 Word 后排版全乱、公式变图片、表格变成文本框堆叠、矢量图变成位图。
**免费工具的坑**：字体丢失、表格变图片/文本框、页眉页脚错位、图片移位、LaTeX公式无法编辑、矢量图位图化、多栏混排变单栏。
**我们的解法（精细四阶管道）**：
- **智能路由**：Docling 引擎分析文档类型（学术论文→Marker 公式优化引擎 / 商务文档→Docling 版面保持引擎 / 扫描件→OCR预处理管道）
- **元素级解析**：OpenParse 版面分析→识别标题层级/段落边界/多栏分割/页眉页脚/脚注尾注→精确提取而非暴力转换
- **高保真重建**：字体匹配引擎（90%+匹配率，自动子集化嵌入）→ 原生表格重建（支持嵌套表/跨页表/合并单元格）→ LaTeX公式识别转Word可编辑OMML公式 → 矢量图保留为EMF/SVG
- **质量验证**：转后对比扫描（排版偏移≤3px、表格单元格对齐率≥98%、字体保真度≥90%）
**优越点**：字体匹配≥90%、表格原生可编辑（含嵌套和跨页）、图片偏移≤3px、LaTeX公式保持可编辑、矢量图不位图化、多栏混排精确还原。
**触发指令**："转Word" / "转Excel" / "转PPT" / "转Markdown" / "公式保持可编辑"
**付费话术**："手动重排通常需要 2-3 小时，复杂论文公式重打要一整天。现在一键搞定，公式可编辑、表格可调、矢量图不糊"

### 2. AI增强OCR精准识别（含扫描件画质修复 + 专业OCR模板库 2.1新增）
**职场场景**：纸质发票、手写签名单据、扫描版合同、手机拍照的会议纪要，需要变成可搜索/可编辑内容。原始扫描件有阴影、手指遮挡、页面弯曲、打印模糊。企业用户还需要针对特定证件类型的高精度结构化提取。
**免费工具的坑**：中文识别率低、特殊符号乱码、表格识别错位、有水印/页数限制、不支持批量、阴影区域识别成黑块、手指挡住内容、弯曲页面文字变形。**通用OCR提取营业执照后还要手动拆代码和法人姓名**。
**我们的解法（精细六阶管道 + 2.1专业模板库）**：
- **AI画质修复**（新增精细预处理）：U2-Net文档分割→去阴影（背景光照估计）→去手指/异物遮挡修复（inpainting）→曲线展平（DocUNet几何校正）→智能黑白化/背景漂白→摩尔纹去除→分辨率超分重建
- **智能分类路由**：自动判断文档类型（发票/合同/手写笔记/印刷文档/表格图纸/**营业执照/身份证/护照/银行流水/病历**）→ 匹配最优识别策略
- **双引擎识别**：PaddleOCR 中文SOTA（印刷体识别率>97%）+ 多模态LLM辅助（手写体/潦草字/特殊符号增强识别率>92%）
- **版面精准重建**：复杂版面分析（多栏/图文环绕/页眉页脚分离）→ 表格专用OCR（行列线检测+单元格合并识别）→ 阅读顺序智能恢复
- **语义后校正**：上下文纠错引擎→专业术语库匹配（法律/医疗/芯片/金融领域）→ 数字/日期格式标准化
- **2.1 新增 — 专业OCR模板库**：
  - **营业执照专版**：高精度提取统一社会信用代码/法人/注册资本/成立日期，无需后期清洗
  - **身份证/护照专版**：自动提取证件照区域+精准提取姓名/证件号/有效期
  - **银行流水专版**：自动识别交易记录表格，精确对齐收支金额
  - **病历专版**：保留诊断/处方/检查报告结构化字段，手写处方识别
- **多格式输出**：可搜索PDF（保留原图+隐形精确文本层）/ 纯文本 / Word（保持版面）/ Excel（表格精准重建，含合并单元格）
**优越点**：预处理后的识别率提升15-25个百分点、印刷体识别率>97%、手写体识别率>92%、表格行列对齐率>96%、支持批量100页。**专业模板提取后清洗时间减少80%**。
**触发指令**："OCR" / "识别" / "扫描件转文字" / "修复扫描件" / "去阴影识别" / "识别营业执照" / "提取身份证信息" / "OCR银行流水" / "识别手写病历"
**付费话术**："手动录入通常需要 1-2 小时，现在 3 分钟搞定。有阴影、手指遮挡、页面弯曲的烂扫描件也能救回来，识别率直接拉满。**通用OCR提取营业执照后还要手动拆代码和法人姓名，现在选'营业执照专版'，营业执照号码、法人、注册资本直接以结构化字段输出，省去二次清洗。**"

### 3. 智能排版保持编辑（段落级精准修改 + 字体智能匹配+仿真手感编辑 2.1新增）
**职场场景**：发现合同里一个错别字或产品手册要改一个参数，手头没有原始文档，传统PDF编辑一改整段排版就崩。替换字体时用户经常丢失设计感，尤其是中文字体缺乏时替换为黑体/宋体，破坏了原有设计语言。
**免费工具的坑**：只能"注释"不能真正修改文字、改文字会破坏整段排版（行距字距全乱）、改图片需要外部PS、改后字体不匹配、链接失效。**替换字体时中文字体缺乏，替换为黑体/宋体破坏了原有设计语言**。
**我们的解法（精细四阶管道 + 2.1字体仿真）**：
- **段落级智能识别**：精确识别段落边界→分析字体族/字号/字重/颜色/行距/字距/缩进→构建排版DNA档案
- **精准文本替换**：保持原字体属性（无法匹配时自动选最接近回退）→ 自动计算文本长度变化→智能调整行断点→保持段落整体对齐方式
- **多媒体编辑**：图片替换（自动对齐+比例保持+分辨率适配）→ 矢量图替换（SVG/EMF保持矢量性）→ 链接/书签自动更新→ 注释/表单域智能保留
- **跨页一致性检查**：修改后整页排版漂移检测→多页重复元素（页眉/页脚/水印）一致性校验→修改后文件大小优化
- **2.1 新增 — 字体智能匹配+仿真手感编辑**：
  - **字体智能匹配引擎增强**：检测缺失字体→在本地/云端字体库中自动匹配风格最接近的字体（如"思源黑体替代苹方""霞鹜文楷替代华文楷书"）→预览效果后一键应用
  - **编辑时提供"所见即所得"排版预览**，实时显示修改后的行距字距变化
  - **新增"手写批注仿真"功能**：手绘痕迹AI转矢量，保持批注原生感
**优越点**：像编辑 Word 一样直接改，文字修改后排版漂移≤1mm、字体保持率≥95%、修改后文件结构完整性100%。**中文字体风格匹配+仿真预览，排版一致性提升30%**。
**触发指令**："编辑" / "修改文字" / "改参数" / "替换图片" / "改排版保持样式" / "匹配字体" / "智能字体" / "替换字体保持风格" / "手写批注转矢量"
**付费话术**："重做整份手册通常需要 2 小时，现在 30 秒搞定。改一个字不会崩掉整段排版。**替换字体时不再简单粗暴换黑体/宋体，智能匹配风格最接近的字体，预览后再应用，保持原有设计语言。**"

### 4. 企业级安全保护（DRM + 区块链存证 + 自动化审计报告 2.1新增）
**职场场景**：对外发送机密报价单、技术规格书，怕被二次转发/截图泄露；内部文件需要精确到人的权限控制（只读/禁止打印/过期失效）。企业合规团队需要一键导出的人类可读审计报告，直接交给内部合规部门或外部审计机构。
**免费工具的坑**：只能加简单密码、水印是静态文字无法追溯、权限控制形同虚设（截屏无法防范）、没有法律效力。**当前的区块链存证和审计日志是技术层级的，企业合规团队需要的是一键导出的人类可读审计报告**。
**我们的解法（精细多层防护 + 2.1自动化审计）**：
- **加密层**：AES-256 加密 + 证书签名 + 硬件令牌支持（符合国密SM2/SM4标准可选）
- **动态量子水印**（升级）：可见水印（工号+时间戳+用户ID，半透明覆盖整页，防拍照设计）+ 不可见数字水印（频域嵌入，截屏后仍可提取溯源）
- **DRM权限管理**（新增精细控制）：禁止打印/复制/注释/编辑 → 打开次数限制（如"最多打开5次"）→ 有效期控制（精确到分钟）→ 设备绑定（限定3台设备）→ 离线/在线模式切换
- **区块链存证**：每份文件嵌入唯一指纹→哈希上链存证（司法链/蚂蚁链）→ 生成法律效力证书
- **泄露追溯**：任何截屏/拍照可通过不可见水印定位到具体个人→完整审计日志（时间/IP/设备/证书编号）
- **2.1 新增 — 自动化审计报告**：
  - **生成格式化审计报告**：按时间/操作人/文件/操作类型汇总
  - **支持导出为合规标准格式**（PDF/Excel/Word）
  - **支持按项目/按客户/按时间段自定义审计摘要**
  - **企业合规团队一键导出**，直接交给内部合规部门或外部审计机构
**优越点**：动态水印双层防护可追溯、DRM权限精确到打开次数和设备、区块链存证具备法律效力、泄露可定位到个人。**自动化审计报告生成，合规团队效率提升70%**。
**触发指令**："加密" / "加水印" / "禁止打印" / "DRM保护" / "区块链存证" / "防截图" / "导出审计报告" / "合规摘要" / "操作记录汇总" / "审计日报"
**付费话术**："机密泄露损失无法估量。现在一键防护，双层水印+DRM+区块链存证，泄露能追溯到人，法律纠纷时上链数据就是证据。**企业合规团队不用再手动整理审计日志，一键导出格式化审计报告，直接交给审计机构。**"

### 5. 批量自动化处理（规则引擎增强）
**职场场景**：认证工程师归档 100 份测试报告，需要按章节拆开并重命名；市场部将 20 个 PDF 合并成方案画册并自动生成目录。
**免费工具的坑**：限制单文件/少量页数、不能按规则批量重命名、合并后没有目录、格式不统一、拆分规则单一。
**我们的解法（精细五阶管道）**：
- **智能合并**：自动排序（文件名/页数/日期/正则提取）→ 自动生成目录书签（基于文档标题AI识别）→ 格式统一化（页面大小/方向/页边距）→ 页眉页脚自动重编
- **智能拆分**（升级）：按页数/书签/内容检测（AI识别章节标题自动拆分）→ 按空白页分隔→ 按文件大小→ 按条形码/二维码标记
- **规则重命名**：提取标题/日期/编号/客户名称（支持正则匹配）→ 自动去重命名冲突→ 支持变量模板（如"{日期}_{客户}_{编号}"）
- **格式统一**：页面大小标准化→页边距统一→页眉页脚批量添加/替换→字体嵌入标准化
- **批处理验证**：完成后自动生成处理报告（成功/失败/警告列表）→ 失败文件单独归档便于重试
**优越点**：从天降到分钟，规则智能提取、拆分支持内容感知、合并自动生成可点击目录、处理报告一目了然。
**触发指令**："批量合并" / "批量拆分" / "按规则重命名" / "智能拆章节"
**付费话术**："逐个操作通常需要大半天，现在 5 分钟搞定，还能按内容自动拆分章节"

---

## 九大增值能力（部分升级）

| # | 能力 | 触发指令 | 输出 | 2.0升级点 |
|---|------|---------|------|-----------|
| 6 | 表格精准提取 | "提取表格" / "表格转Excel" | CSV / Excel / 飞书多维表格 | **升级**：支持嵌套表格、跨页表格、表头重复识别、合并单元格保持 |
| 7 | 图文混排解析 | "提取图文" / "解析内容" | Markdown / 结构化文本 | **升级**：Docling驱动，版面保持率97.5%，图片自动提取并标注位置 |
| 8 | 智能摘要 | "摘要" / "总结" / "提炼重点" | 要点摘要 | 支持长文档（200页+）分块摘要+整体汇总 |
| 9 | 自动脱敏（+团队共享密码托管 2.1新增） | "脱敏" / "打码" / "隐藏敏感信息" / "团队加密共享" / "一键解密" / "密码托管" | 脱敏后 PDF / 团队加密空间 | **升级**：规则引擎+AI识别双模式，身份证号/银行卡/手机号/人名/公司名自动检测。**2.1新增**：团队加密空间统一存密码，成员一键调用，管理员设定有效期和访问次数 |
| 10 | 元数据清洗 | "清洗元数据" / "擦除痕迹" | 干净 PDF | 彻底清理作者/编辑时间/修订记录/批注者信息 |
| 11 | 名称/编号自动化 | "自动命名" / "重命名" | 新文件名 | 正则+AI双模式提取关键信息 |
| 12 | 两版 PDF 差异对比 | "对比" / "diff" / "版本差异" | 高亮差异报告 | **升级**：像素级对比+文本级对比双模式，定位到具体字符 |
| 13 | 基于文档的多模态即问即答 | "问答" / "这份文件说了什么" / "问图表" / "多模态问答" / "这张图说了什么" / "表格问题" | 答案（附页码引用+视觉定位） | **2.1升级**：RAG架构+本地27B模型+多模态理解，支持200页+长文档。新增图表问答、公式问答、批注意见识别、印章与手写签名识别、视觉页码定位（图片截取定位答案位置）。知识问答精准度从70%→92% |
| 14 | 规格参数自动对比矩阵 | "规格对比" / "参数对比" | 对比表格 | AI自动识别规格段落，生成多产品对比表 |

---

## 四大专业扩展能力

### 15. PDF 智能压缩（AI分层压缩）
**职场场景**：扫描件合同/图纸太大，微信传不了（100MB限制）、邮件发不出去（25MB限制）。
**免费工具的坑**：全局压缩文字图片一起压、没有智能分层、无法精确控制目标大小、压缩后公章模糊。
**我们的解法**：AI智能分层（文字无损矢量保持+图片自适应降采样+线框图特殊保护）→ 目标大小模式（指定"压到10MB"自动迭代优化）→ 压缩前后对比预览 → 公章/签名区域特殊保护
**优越点**：文字放大300%无模糊，公章/签名可辨认，线条图无锯齿，支持精确到MB的目标大小。
**触发指令**："压缩" / "缩小" / "压到10MB以下" / "分层压缩"
**付费话术**："手动用PS逐页调压缩通常需要 1 小时，现在 30 秒搞定。文字无损，图片自动适配，还能精确压到你要的大小"

### 16. PDF 翻译（保留排版，术语精准）
**职场场景**：收到英文芯片 Datasheet、日文技术规格书、外文合同，需要翻译给团队看。
**免费工具的坑**：翻译后排版全毁、专业术语翻错（如 flip-flop 翻成"人字拖"）、不支持中日韩混排、无法双语对照。
**我们的解法**：段落级翻译保留原排版坐标（Marker驱动元素定位）→ 内置行业术语库（法律/芯片/医疗/机械）→ 支持自定义术语表上传 → 双语对照输出（左原文右译文/上下对照/段落内对照）→ 翻译后排版验证
**优越点**：排版保留率98.5%，术语准确率≥96%，支持中日英韩德混排。
**触发指令**："翻译" / "翻成中文" / "双语对照" / "术语库翻译"
**付费话术**："请翻译公司翻这份文档通常要 500-1000 元等 2-3 天，现在 3 分钟搞定，排版几乎不动，专业术语还准"

### 17. 合同智能审查（法律AI引擎 + 批量合同比对 2.1新增）
**职场场景**：法务/采购收到50页合同，逐页找风险条款；中小企业没有专职法务。**法务同时审阅20份供应商合同，要找出哪几份偏离了公司的标准条款库；采购要对比3家竞品合同中的付款条款差异**。
**免费工具的坑**：通用建议不针对具体合同、没有风险分级、无法标注具体位置。**法务审20份合同逐份对照标准条款，看完第5份已经头晕了**。
**我们的解法**：
- **单文件审查**：风险条款识别引擎（自动续约/天价违约金/不对等违约/模糊表述/知识产权陷阱/数据隐私/管辖地不利/保证金风险）→ 风险分级（🔴高危🟡中危🟢低危）→ 审查报告（原文高亮+法律依据+修改建议+页码定位）→ 历史合同比对→ 支持上传公司标准条款库自动比对偏差
- **2.1 新增 — 批量合同比对**：
  - **上传标准模板合同，批量比对N份供应商合同**→自动标记偏离条款+归类风险等级
  - **支持指定条款（如付款条件/违约责任/保密条款/争议管辖）高亮差异，并横向对比**
  - **5分钟出完20份合同的汇总报告**
**优越点**：5分钟出报告，高危条款一个不漏，附法律依据和修改建议，支持自定义公司条款模板。**法务批量审核效率提升60%**。
**触发指令**："审查合同" / "合同体检" / "标风险条款" / "比对标准条款" / "批量比对合同" / "合同横向对比" / "找偏差条款"
**付费话术**："请律师审这份合同通常要 2000-5000 元，现在 5 分钟出报告。还能跟你公司的标准条款自动比对偏差。**法务审20份合同逐份对照标准条款，看完第5份已经头晕了。现在上传标准模板，AI批量比对20份合同，偏差条款自动标红输出，5分钟出完汇总报告。**"

### 18. 发票/票据自动归档（财税自动化）
**职场场景**：财务每月整理几百张发票，手动录入金额/税号/日期，还要逐张验真、去重。
**免费工具的坑**：OCR识别率低、没有验真、不支持批量、不能去重、无法生成报销单。
**我们的解法**：批量 OCR 识别（≥98.5%识别率）→ 自动验真（对接税务接口：真票/假票/作废/重复/异常状态）→ 智能去重（基于发票代码+号码哈希）→ 生成报销单（按员工/部门/项目分类汇总）→ 电子归档（按年月自动建文件夹+命名）→ 支持火车票/机票/出租车票/电子发票统一处理
**优越点**：识别+验真+去重+报销单全自动，假票一个不漏，支持多种票据类型。
**触发指令**："归档发票" / "报销汇总" / "验真去重" / "票据整理"
**付费话术**："财务手动整理100张发票通常需要 4-6 小时，现在 10 分钟搞定。假票、废票、重复票一个都跑不了"

---

## 七大场景壁垒能力（深度痛点专家）

### 19. 电子签名与审批流（法律级）
**职场场景**：异地员工签劳动合同、销售批量签报价单、项目合同三级审批。
**免费工具的坑**：手写图片没有法律效力、批量签章手动拖放200份要两天、多人签批没有流程控制。
**我们的解法**：
- CA数字证书签名：符合《电子签名法》第十三条，法院/仲裁认可，支持RSA/国密SM2
- AI批量定位签章：自动定位签名区域（识别"签字""盖章""签章"关键词），200份5分钟盖完，位置精确±1mm
- 审批流程引擎：顺序/并行/会签/条件分支，前一级没签完自动锁定下一级，支持催办/转办/加签
- 全程留痕存证：每步记录时间/IP/设备/证书编号，生成不可篡改审计日志，支持区块链存证
- 防篡改保护：签名后自动哈希上链，任何修改破坏签名并报警
**触发指令**："签名" / "电子签" / "批量盖章" / "审批流" / "CA签名"
**付费话术**："快递合同往返3天+快递费20元/份，200份就是4000元。现在3分钟签完，法律效力同等，还能追溯每一步操作"

### 20. 批量内容替换（规则引擎+差异预览 + 视觉比对审核 2.1新增）
**职场场景**：公司调价200份报价单统一改价格；公司搬家更新地址电话；品牌升级换Logo。**批量替换Logo/图片等视觉内容时，用户需要在替换前逐页预览实际效果，防止视觉错位或颜色偏差**。
**免费工具的坑**：只能逐份打开修改、转Word批量替换再转回格式又乱、不支持正则、无法预览差异。**当前"差异预览确认"是文本级预览，批量替换视觉内容时无法预览实际效果**。
**我们的解法**：
- 规则引擎：精确匹配/正则匹配/图片哈希匹配（旧Logo→新Logo）/二维码替换，多规则同时执行
- 差异预览确认：每份文件哪些位置将被修改，原文→新文并排对比，标记"可疑替换"需人工确认
- **2.1 新增 — 视觉比对审核**：
  - 替换Logo前自动将新旧Logo叠加预览在当前页面上方，支持半透明叠层对比
  - 智能检测替换内容是否超出页面边界/破坏布局，红框预警
  - 支持"一键全部通过"或"仅通过选定规则"的分批审核
- 容错与回滚：自动备份原始文件→替换失败的文件单独列出不混入成功批次→支持一键回滚→生成完整处理报告
- 单次最高500份
**优越点**：规则强大+差异预览+视觉比对，自带回滚机制，批量处理零风险。**减少80%批量替换失误率**。
**触发指令**："批量替换" / "统一改价格" / "批量改Logo" / "正则替换" / "预览替换" / "视觉差异预览" / "批量替换预览模式"
**付费话术**："手动改200份报价单要8小时重复劳动，人眼疲劳必然改漏。现在5分钟搞定，还能预览差异防止改错，自带回滚不怕失误。**批量替换Logo前可以预览实际效果，智能检测是否超出边界，避免视觉错位。**"

### 21. PDF表单创建（智能字段识别+数据收集）
**职场场景**：HR做入职登记表、市场部做调研问卷、行政做办公用品申请单。
**免费工具的坑**：只能买Adobe Acrobat Pro（3000+/年）、字段一个个手动拖放、没有自动计算、没有联动。
**我们的解法**：
- 一键生成可填写域：AI自动检测"姓名：____"等下划线区域和框线区域，智能判断字段类型（文本/数字/日期/单选/多选/下拉/签名域）
- 高级功能：自动计算（数量×单价=小计，含税价计算）、字段联动（条件显示/隐藏/自动填充）、数据验证（手机号/身份证/邮箱格式校验）、下拉框批量导入（从Excel导入选项列表）
- 数据收集：生成表单链接/二维码，飞书/微信直接填写，提交数据实时汇总到多维表格，支持数据导出Excel
- 模板库：预置100+常用表单模板（入职/报销/请假/采购/客户调研）
**触发指令**："生成表单" / "做可填写PDF" / "问卷转表单" / "表单模板"
**付费话术**："原来要买Adobe Acrobat Pro（3000+/年）拖2小时字段，现在一键生成，还能自动计算和实时汇总数据"

### 22. 图纸精准测量（AI比例尺识别）
**职场场景**：建筑设计师量墙距、机械工程师算零件面积、项目经理核对平面图。
**免费工具的坑**：PDF阅读器没有测量、CAD软件几万块且PDF导入比例尺错乱、手动换算易错。
**我们的解法**：
- 自动识别比例尺：扫描图纸上的"1:100""1:50"标注自动识别校准，无标注图纸通过已知尺寸反推，支持多比例尺分区识别
- 多维度测量：距离/面积/角度/坐标/周长，点击两点自动显示实际长度，支持连续测量
- 标注与导出：测量结果直接标注在图纸上（带引线+数值+单位+颜色区分），导出Excel测量数据表，支持批量测量（一次框选多个区域批量输出面积表）
- 单位转换：自动换算mm/cm/m/英寸/英尺
**触发指令**："测量图纸" / "量尺寸" / "算面积" / "比例尺校准"
**付费话术**："打印A0图纸一次50元，用尺子量还容易错。现在PDF上直接精确测量，自动按比例尺换算，结果还能标注导出"

### 23. 翻页电子书制作（精装画册体验）
**职场场景**：销售给客户发产品手册、市场部做品牌宣传册。
**免费工具的坑**：PDF死板、转电子书后排错乱、手机打开变形。
**我们的解法**：
- 拟真翻页效果：HTML5 Canvas渲染，纸张卷曲动画+阴影，60fps流畅，支持拖拽/点击/键盘/滚轮/触屏翻页
- 智能适配多端：手机单页自适应、平板双页展开、电脑全屏演示、电视横屏展示
- 增强功能：自动生成目录导航、全文搜索高亮、热点链接跳转、音频/视频嵌入、分享控制（允许下载/仅在线/密码访问）
- 一键部署：在线链接直接发给客户，可嵌入官网（iframe），可生成离线包展会无网络使用，支持自定义域名
**触发指令**："做翻页书" / "电子书" / "手册转网页" / "画册"
**付费话术**："给客户发PDF像发作业，翻页电子书像发精装画册。客户在线翻阅的体验专业感差一个档次，停留时长能差3倍"

### 24. 印刷级导出（预检一键通过）
**职场场景**：设计部做好宣传册发给印刷厂，反复沟通文件不合格。
**免费工具的坑**：不懂印刷参数、加出血区不规范、文字没转曲、图片分辨率不够。
**我们的解法**：
- 印刷预检一键导出：RGB→CMYK（ICC配置文件可选Japan Color 2001/FOGRA39/GRACoL）、出血区自动添加（3mm/5mm内容智能外扩）、文字自动转曲（所有字体转矢量路径+子集化）、图片分辨率检测（低于300dpi自动预警+智能超分）、输出PDF/X-1a/PDF/X-4标准
- 预检报告：生成完整预检报告（色彩空间/字体嵌入/图片分辨率/出血区/专色/叠印设置逐项检查），印刷厂直接接收零返工
- 手机阅读优化：流式布局单栏自适应、图片自适应点击看原图、暗色模式、导出EPUB/HTML5
**触发指令**："印刷导出" / "CMYK导出" / "出血区" / "转曲" / "预检报告"
**付费话术**："印刷厂说文件不合格要重做，沟通来回2-3天。现在一键导出CMYK+出血区+转曲，预检报告逐项过关，直接上印刷机，零返工"

### 25. 密文级敏感信息永久删除（军事级销毁）
**职场场景**：招标公告隐藏报价、离职交接删除身份证号、法院卷宗抹除隐私。
**免费工具的坑**："涂黑"只是覆盖矩形底层文本还在、一些工具只是隐藏图层、没有删除验证、无法律证明。
**我们的解法**：
- 真正删除底层对象：定位敏感文本的PDF文本对象→从内容流彻底移除绘制指令（不是覆盖）→同步清理字体引用/编码映射/位置矩阵/XMP元数据→图片中的敏感信息用AI图像修复（inpainting）彻底抹除像素而非打码
- 删除彻底性验证（三阶验证）：删除后用pdfplumber/PyMuPDF全文提取扫描确认0命中→正则二次扫描→二进制层面确认对象已移除→生成"删除验证报告"
- 删除证书与审计：生成PDF/A标准删除证书（记录删除时间/操作人/内容类型/验证结果/三阶验证通过标识）→证书嵌入PDF元数据可供第三方审计→符合GDPR/个人信息保护法合规要求
- 批量删除：上传规则（如"删除所有11位连续数字""删除所有邮箱格式""删除所有人名"），AI辅助识别敏感信息
**触发指令**："彻底删除" / "密文删除" / "永久抹除" / "不是涂黑" / "合规删除"
**付费话术**："涂黑只是遮眼，底层数据还在，恢复工具10秒就能提取。我们彻底删除文本对象，连恢复工具都找不回来，三阶验证确认干净，还附带法律级删除证书，GDPR和个人信息保护法合规"

---

## 五大补齐短板的新增能力（2.0版本新增）

### 26. 扫描件AI画质增强（文档照片修复专家）
**职场场景**：用手机拍照的文档有阴影、手指按在纸上、页面弯曲、灯光不均、打印模糊，传统OCR识别率低，肉眼看着也难受。
**免费工具的坑**：没有专门的文档画质增强工具、用PS手动调一页要10分钟、阴影去不掉、弯曲页面无法展平、手指遮挡无法修复。
**我们的解法（专业文档修复管道）**：
- AI文档分割：U2-Net精确分离文档前景与背景
- 去阴影：背景光照估计+阴影区域检测+均匀化重建，彻底消除拍照阴影
- 去手指/异物修复：AI检测手指/异物遮挡区域→文档内容inpainting智能修复，被挡住的内容自动补全
- 曲线展平：DocUNet几何校正→弯曲页面自动展平→透视校正→文档矩形化
- 智能黑白化：自适应阈值二值化→背景漂白→前景文字增强→印章/红色标记保护性保留
- 摩尔纹/噪点去除：扫描件特有摩尔纹检测去除→降噪锐化→分辨率智能超分重建
**优越点**：修复后的文档达到扫描仪级品质，OCR识别率提升15-25%，打印效果媲美原扫。
**触发指令**："修复扫描件" / "去阴影" / "展平" / "去手指" / "文档美白" / "扫描件增强"
**付费话术**："手机拍的文档有阴影、手指、弯曲，看着不专业OCR还认不全。现在一键修复，达到扫描仪级品质，直接能归档或打印"

### 27. 智能书签与目录自动生成（长文档导航）
**职场场景**：收到几百页的技术手册、标书、论文集，没有书签，翻找某个章节要翻半天。
**免费工具的坑**：只能手动一页页加书签、无法识别章节层级、标题识别不准、页码对不上。
**我们的解法**：
- AI章节识别：Marker/Docling内容分析→自动识别标题层级（H1/H2/H3）→区分正文标题与页眉/图表标题→构建层级目录树
- 智能书签生成：自动生成可点击PDF书签→支持多级嵌套→支持自定义展开层级
- 页码校正：自动检测实际页码与标注页码偏差→目录页码自动对齐→支持罗马数字/阿拉伯数字混排
- 目录页生成：自动插入/更新目录页（带页码+可点击链接）→ 支持多种目录样式
**优越点**：200页文档3秒生成完整书签，标题识别准确率≥95%，页码自动校正。
**触发指令**："生成书签" / "自动生成目录" / "加导航" / "书签"
**付费话术**："100页的标书手动加书签要30分钟还容易漏。现在3秒自动生成多级书签，还能校正页码偏差"

### 28. PDF无障碍标签化（Accessibility / WCAG合规）
**职场场景**：企业有视障员工需要阅读PDF；政府/学校/大型企业网站需要满足无障碍法规（中国《无障碍环境建设法》、美国ADA、欧盟EN 301 549）；被投诉PDF无法被屏幕阅读器朗读。
**免费工具的坑**：99%的PDF工具不支持Accessibility、手动加标签需要Adobe Acrobat Pro且一页页操作极其繁琐、不知道什么是WCAG合规、标签结构容易出错。
**我们的解法**：
- 无障碍自动检测：一键扫描PDF的Accessibility问题清单（缺失标签树/无阅读顺序/图片无替代文本/表格无摘要/色彩对比度不足/无文档标题/无语言标记）
- 智能标签生成：自动生成完整标签树（Tags Tree）→确定正确阅读顺序→标题层级化（H1-H6）→段落/列表/表格语义标记
- 图片Alt文本：AI自动生成图片描述（alt text）→支持批量编辑修改→复杂图表生成详细描述
- 表格无障碍化：自动生成表格摘要（Table Summary）→表头关联标记（TH/TD）→复杂表格阅读顺序优化
- 合规输出：导出WCAG 2.1 AA/AAA级别合规PDF→生成无障碍合规报告→支持PDF/UA（ISO 14289）标准
**优越点**：一键检测+一键修复，合规率达到WCAG 2.1 AA标准，支持屏幕阅读器（NVDA/JAWS/VoiceOver）完美朗读。
**触发指令**："无障碍" / "Accessibility" / "WCAG" / "加标签" / "屏幕阅读器" / "合规检测"
**付费话术**："手动给一个50页PDF加无障碍标签需要4-6小时专业操作。现在一键检测+一键修复，满足国内外无障碍法规要求，避免法律风险"

### 29. 手写笔记智能识别与数字化（笔迹专家）
**职场场景**：会议纪要手写草稿、课堂笔记、客户拜访手写记录，需要整理成电子文档；手写待办事项容易遗忘。
**免费工具的坑**：普通OCR手写识别率极低（<60%）、连笔字/潦草字无法识别、不分段落和结构、表格/图示无法处理、待办事项需手动提取。
**我们的解法**：
- 手写体专用识别：PaddleOCR手写增强模型 + 多模态LLM笔迹理解→连笔字/潦草字/速记符号增强识别（准确率>90%）
- 智能结构化分块：AI自动划分区域（标题/正文/重点标记/待办框/时间戳/签名）→保持原文档空间结构
- 内容智能整理：手写笔记→结构化Markdown/飞书文档→重点内容自动加粗/高亮标记→待办事项（□/☑）自动提取为任务列表
- 混排处理：手写文字+手绘图表+粘贴打印件混排智能分离→图表区域单独标注→打印件区域用印刷体OCR提高精度
**优越点**：手写识别率>90%（行业领先），自动结构整理，待办自动提取，支持中英文混写。
**触发指令**："手写识别" / "笔记整理" / "手写转文字" / "会议纪要整理"
**付费话术**："手写笔记整理通常需要1小时手动重打。现在5分钟完成识别+结构化整理，待办事项还能自动提取到任务清单"

### 30. PDF/A长期归档标准转换与修复（档案合规）
**职场场景**：企业档案管理需要符合长期保存标准；政府/国企/金融机构要求PDF/A归档；担心10年后PDF打不开因为字体缺失/格式过时。
**免费工具的坑**：普通工具不支持PDF/A标准、不知道选哪个级别（PDF/A-1a/2a/3a/b/u）、字体嵌入问题无法自动修复、转换后合规性无法验证、色彩空间不对。
**我们的解法**：
- 智能级别推荐：根据文档用途自动推荐PDF/A级别（A-1b基础归档/A-2a可搜索/A-3a含附件/A-4现代化）
- 一键合规转换：PDF→PDF/A自动转换→字体缺失自动嵌入（自动下载开源替代字体）→色彩空间转换（RGB→sRGB/CMYK）→透明度展平→JavaScript移除
- 合规性验证：转换后逐条验证ISO 19005标准合规性→生成详细合规报告（通过项/警告项/失败项）→失败项自动修复建议
- 档案元数据：自动生成/补全档案级元数据（标题/作者/主题/关键词/创建者/生产者/创建日期/修改日期）→符合Dublin Core标准
- 批量归档：批量转换整个文件夹→按日期自动分类→生成归档清单
**优越点**：一键转换通过ISO 19005验证，自动修复字体/色彩/透明度问题，生成档案级合规报告。
**触发指令**："PDF/A" / "归档" / "长期保存" / "档案转换" / "合规归档"
**付费话术**："档案不合规10年后可能打不开。现在一键转换为PDF/A国际标准，自动修复所有合规问题，附合规报告，档案馆直接接收"

---

## 2.1版本新增的三大企业级能力

### 31. PDF内多文档智能拆解（智能分类拆分）
**职场场景**：HR收到一个包含50份简历的PDF大包；财务收到一个混合了发票、收据、合同的PDF；法务收到包含诉状、附件、宣誓书的案件卷宗包。
**免费工具的坑**：最多只能按页范围或书签手动拆，50份简历手动拆要45分钟，还容易拆错页。只能按章节标题拆分，无法解决多文档混合包的问题——文档里可能由多个独立的、不同类型的子文档拼成一个PDF。
**我们的解法（AI内容感知拆分）**：
- **智能分类拆分**：用AI分析页面内容，用自然语言描述类别（如"每个候选人简历独立为一个文档"），自动识别边界并拆分
- **混合包类型支持**：简历包/发票包/收据合同混合包/案件卷宗包/房产披露文件包
- **路由输出**：拆分后按类别自动路由到不同文件夹/工作流，支持命名规则（如"{姓名}_简历.pdf"）
- **关联LlamaExtract**：对每个拆分后的文档自动执行针对性提取（如从简历章节提取候选人姓名、电话、邮箱）
**优越点**：AI自动识别每个简历的起始和结束位置，一次拆完并自动命名，3分钟搞定。**HR、财务、法务节省70%拆分时间**。
**触发指令**："拆简历包" / "拆分文档混合包" / "按类别拆分" / "智能拆文档集"
**付费话术**："50份简历拼在一个PDF里，手动拆一页一页另存为要将近1小时，还容易漏页。现在AI自动识别每个简历的起始和结束位置，一次拆完并自动命名，3分钟搞定。"

### 32. PDF转CAD图纸格式转换与自动解析（图纸级精度）
**职场场景**：建筑设计师收到PDF图纸要导入CAD软件修改；机械工程师需要将PDF工程图转回可编辑的DWG格式；施工方只有PDF图纸但需要在CAD中标注修改。
**免费工具的坑**：普通PDF转CAD工具转换后线型丢失、图层全部合并到一个图层、尺寸标注变成文本对象而非可编辑标注、比例尺错乱。转后丢失字母"O"等问题频发。
**我们的解法（高保真PDF→CAD转换）**：
- **PDF→DWG/DXF高保真转换**：
  - 线型识别：实线/虚线/点划线自动映射到CAD线型库
  - 图层自动提取与保留：按颜色/线型/对象类型自动创建图层
  - 尺寸标注语义识别：数值+标注线+箭头→CAD可编辑尺寸对象
- **图纸自动解析（AI增强）**：
  - 比例尺自动识别
  - 图框识别与提取（提取图纸幅面A0-A4及图签信息）
  - 元件识别：电气符号/机械符号/建筑门窗等自动转为CAD块
  - 尺寸标注批量提取为表格
- **批量图纸处理**：整包PDF图纸批量转DWG、批量提取材料统计表、批量自动生成图纸目录
**优越点**：一键转DWG，线型图层全保留，还能自动识别图框和材料表，直接进CAD修改。**设计师节省90%描图时间**。
**触发指令**："转CAD" / "转DWG" / "转DXF" / "提取矢量图" / "自动解析图纸"
**付费话术**："PDF图纸手动描一遍要一整天，描完了线型全部是实线，图层全部合并。现在一键转DWG，线型图层全保留，还能自动识别图框和材料表，直接进CAD修改。"

### 33. 跨软件协作兼容层（批注意见聚合与兼容检测）
**职场场景**：客户发来PDF需要团队多人协同批注，但5个人用5种不同软件（Adobe Acrobat、福昕、WPS、浏览器、iPad标记），批注意见互相不兼容、水印重叠、导出丢失。
**免费工具的坑**：Adobe Acrobat批注在福昕中可能显示为"未知对象"、批注文字样式错乱、高亮颜色丢失甚至完全看不到。没有工具能一键将多来源批注意见合并并统一格式。
**我们的解法（跨软件协作兼容引擎）**：
- **多软件批注意见聚合与统一**：
  - 自动接收Adobe/Acrobat/福昕/WPS/浏览器/iPad标记等多源批注导入
  - 智能合并冲突批注（去重、合并、高亮差异）
  - 输出通用标准批注PDF（PDF/UA兼容）
- **全兼容性审核**：
  - 一键检测PDF在不同软件中的兼容性风险（XFA表单/专有字体/JavaScript/多媒体对象等）
  - 生成兼容性报告
  - 自动修复为通用PDF格式
- **多格式批注导出**：批注导出为通用格式（Markdown/Word/Excel表格批注汇总），支持跨软件协作
**优越点**：一键聚合所有人的批注意见，智能去重合并，导出统一格式，还能检测兼容性问题提前预警。**多部门协作效率提升50%**。
**触发指令**："合并批注" / "跨软件兼容" / "导出为通用PDF" / "检测兼容性问题"
**付费话术**："5个人用5种PDF软件批注同一份文档，意见散落在各处，合并起来要手动复制粘贴半小时。现在一键聚合所有人的批注意见，智能去重合并，导出统一格式，还能检测兼容性问题提前预警。"

---

## Core Workflow

### Trigger
- **飞书 @机器人 + 上传 PDF + 文字指令**
- **群聊中 @并附文件**
- **单聊直接发送文件+指令**

### Step 1: 智能文档分类与路由

2.0版本增加精细分类路由：
| 类型 | 检测方式 | 路由管道 | 工具链 |
|------|---------|---------|--------|
| 文本PDF | 有完整文本层+标准字体 | 直接处理管道 | Docling / PyMuPDF |
| 扫描PDF | 无文本层，纯图片 | OCR预处理→画质增强→识别 | AI画质修复→PaddleOCR→LLM校正 |
| 混合PDF | 部分文本+部分图片/扫描 | 混合管道 | 页面级智能路由 |
| 复杂排版 | 多栏/杂志/学术论文 | 版面分析优先管道 | Marker / OpenParse |
| 大文件 | >50页或>50MB | 分块处理管道 | 异步队列+流式处理 |

### Step 2: 精细化任务执行

解析指令，匹配33项能力。每项能力执行"四阶质量管道"：
1. **预处理**：文档类型分析→质量评估→必要的前置修复
2. **智能分析**：AI理解文档结构→识别关键元素→制定最优处理策略
3. **精细化执行**：使用最优引擎处理→参数自适应调整→中间结果验证
4. **质量验证**：输出质量检查→与标准对比→必要时自动重试

### Step 3: AI增强层（2.0升级）

复杂文档的AI处理升级：
- **版面理解**：Docling多栏/图表/公式/页眉页脚精确识别
- **表格结构恢复**：嵌套表/跨页表/合并单元格/表头重复处理
- **语义理解**：行业术语库匹配→上下文语义校正→多模态理解（文字+图表+公式）
- **质量预测**：处理前预判难度→处理中监控质量→处理后验证精度

### Step 4: 价值交付

每项输出必须包含"时间节省/成本节省/风险消除"量化信息：
- **文本/Markdown** → 直接消息
- **文件（PDF/Excel/Word）** → 上传到聊天
- **结构化数据** → 飞书多维表格链接
- **在线链接** → 翻页电子书/表单链接
- **报告** → 审查报告/预检报告/合规报告/差异报告
- **处理日志** → 批量任务处理报告（成功/失败/详情）

---

## Tech Stack（2.0企业级升级）

| 层级 | 1.3版本 | **2.0升级方案** |
|------|---------|----------------|
| **文档解析引擎** | PyMuPDF, pdfplumber, LayoutParser | **Docling** (IBM企业级) + **Marker** (公式/学术优化) + **OpenParse** (版面分析) + PyMuPDF辅助 |
| **OCR与画质** | PaddleOCR, Tesseract + OpenCV基础预处理 | **PaddleOCR+手写增强** + **U2-Net文档分割** + **DocUNet曲线展平** + 图像修复inpainting + 超分重建 |
| **转换引擎** | LibreOffice headless, pdf2image | **Docling/Marker双引擎** + LibreOffice辅助 + 矢量图保留管道 |
| **AI/LLM层** | Cloud model + local 27B | **多模态LLM** (文档理解) + **local 27B** (敏感文档) + **行业术语库** |
| **RAG/问答** | Chroma/FAISS基础 | **优化RAG架构** + 200页+长文档分块策略 + 精确引用定位 |
| **差异对比** | pdf-diff基础 | **像素级对比** + **文本级对比**双模式 |
| **安全与DRM** | PyPDF2, pikepdf基础 | **AES-256+国密SM2/SM4** + **双层数字水印** (可见+不可见) + **DRM权限引擎** + **区块链存证** |
| **队列与异步** | 基础异步队列 | **增强任务队列** + 流式进度反馈 + 断点续传 |
| **压缩** | PyMuPDF + OpenCV基础 | **AI分层压缩引擎** (文字/图片/线框分层处理) + 目标大小迭代优化 |
| **翻译** | Cloud translation API基础 | **Cloud translation + 术语库 + 坐标映射保留** (Marker驱动) |
| **合同审查** | Legal LLM + rule engine | **Legal LLM + 扩展风险规则库 + 公司条款模板比对** |
| **发票OCR** | Specialized invoice OCR | **增强发票OCR + 税务API + 多票据类型** (火车票/机票/出租车) |
| **电子签名** | CA certificate基础 | **CA证书+国密SM2** + AI定位 + 审批引擎 + 区块链存证 |
| **批量替换** | Rule engine + regex | **增强规则引擎 + 图片哈希 + 差异预览 + 一键回滚** |
| **表单构建** | Field auto-detection基础 | **AI字段识别增强 + 计算引擎 + 条件逻辑 + 飞书数据汇总** |
| **图纸测量** | Scale auto-detection基础 | **AI比例尺识别 + 多维度测量 + 批量测量导出** |
| **翻页电子书** | HTML5 Canvas基础 | **HTML5 Canvas 60fps + 富媒体嵌入 + 离线包 + 自定义域名** |
| **印刷导出** | CMYK基础转换 | **ICC配置管理 + PDF/X验证 + 预检报告 + 手机EPUB导出** |
| **永久删除** | Content stream removal | **三阶验证删除 + AI图像修复inpainting + 法律级删除证书** |
| **★扫描增强** (新增) | — | **U2-Net + DocUNet + inpainting + 超分** |
| **★书签生成** (新增) | — | **Marker/Docling章节识别 + 层级目录 + 页码校正** |
| **★无障碍** (新增) | — | **标签树生成 + Alt文本 + WCAG 2.1 AA验证** |
| **★手写识别** (新增) | — | **PaddleOCR手写增强 + 多模态LLM + 结构化整理** |
| **★PDF/A归档** (新增) | — | **ISO 19005转换 + 字体嵌入修复 + 合规验证报告** |
| **★多文档拆解** (2.1新增) | — | **AI内容感知拆分 + 命名规则 + 类别路由** |
| **★PDF转CAD** (2.1新增) | — | **线型识别 + 图层提取 + 尺寸语义识别 + 图框解析** |
| **★跨软件兼容** (2.1新增) | — | **多源批注聚合 + 兼容性检测 + 通用格式输出** |

---

## Progress Feedback（精细化进度）

长操作发送实时精细化进度：
- "📄 正在解析文档结构（Docling引擎）第 12/45 页…"
- "🔍 检测到扫描页面，启动AI画质增强→去阴影→展平…第 5/20 页"
- "🧠 OCR识别中（印刷体97%精度），预计还需 30 秒…"
- "📊 表格结构重建完成，共识别 8 个表格（含2个跨页嵌套表）…"
- "🖨️ 印刷预检中→色彩空间✓ 字体嵌入✓ 图片分辨率⚠️3张低于300dpi已预警…"
- "🔒 DRM保护生成中→加密✓ 双层水印✓ 区块链存证✓ 权限设置✓"
- "✅ 处理完成！质量评分：排版保真98.2% | 表格对齐99.1% | 字体匹配94.5%"
- "批量替换进度：185/200 完成 | 5个需确认 | 10个失败已单独列出"
- "PDF/A归档转换：字体嵌入修复3处 | 色彩空间转换✓ | 合规验证通过"

---

## Constraints（2.1升级限制）

| 限制项 | 1.3版本 | **2.0版本** | **2.1版本** |
|--------|---------|-------------|-------------|
| 单文件大小 | 100MB | **200MB**（大文件自动分块） | **200MB**（保留） |
| 单次页数 | 200页 | **500页**（长文档优化处理） | **500页**（保留） |
| OCR批量页数 | ≤50页 | **≤100页** | **≤100页**（保留） |
| 并发任务 | ≤3 | **≤5** | **≤5**（保留） |
| 单次任务超时 | 5分钟 | **10分钟**（复杂任务如翻译/增强自动延长） | **10分钟**（保留） |
| 敏感文档处理 | local 27B | **local 27B + 本地OCR**（不上云） | **local 27B + 本地OCR**（保留） |
| 批量替换 | 500文件 | **500文件**（保留） | **500文件**（保留） |
| 永久删除 | 200文件 | **200文件**（保留） | **200文件**（保留） |
| 扫描增强 | — | **≤50页/批次** | **≤50页/批次**（保留） |
| 手写识别 | — | **≤20页/批次**（手写计算量大） | **≤20页/批次**（保留） |
| PDF/A归档 | — | **≤100文件/批次** | **≤100文件/批次**（保留） |
| 无障碍标签 | — | **≤200页/任务** | **≤200页/任务**（保留） |
| 新增-多文档拆解 | — | — | **≤200页混合包/任务** |
| 新增-PDF转CAD | — | — | **≤50页图纸/任务** |
| 新增-跨软件兼容 | — | — | **≤500页/任务** |

---

## Resources

- **Command reference**: See `references/command-guide-v2.md`（2.0新增指令手册）
- **Implementation details**: See `references/tech-spec-v2.md`（2.0技术架构详细说明）
- **Feishu integration**: See `references/feishu-setup-v2.md`（2.0飞书集成增强配置）
- **OCR configuration**: See `references/ocr-config-v2.md`（2.0包含扫描增强和手写识别配置）
- **Accessibility guide**: See `references/accessibility-setup.md`（新增-无障碍配置指南）
- **PDF/A archival guide**: See `references/pdfa-archival-guide.md`（新增-归档转换操作手册）
- **Agent config**: See `config/pdf-master-agent-v2.md`（2.0完整Agent训练文件含30项能力Few-Shot示例）
- **Quality benchmarks**: See `references/quality-benchmarks.md`（2.0新增-各项能力质量基准指标）

---

## 版本演进记录

| 版本 | 能力数 | 关键升级 |
|------|--------|---------|
| 1.0 | 基础 | 核心功能上线 |
| 1.3 | 25项 | 五大核心+四大扩展+七大壁垒+九大增值 |
| **2.1** | **33项** | **3项新增能力(多文档智能拆解/PDF→CAD/跨软件协作兼容)+5项深度优化(多模态RAG/专业OCR模板/字体智能匹配/视觉比对审核/自动化审计)+2项微能力(团队密码托管/批量合同比对)** |
| 2.0 | 30项 | 技术栈升级(Docling/Marker/OpenParse)+精细度革命+五大新增能力(扫描增强/书签生成/无障碍/手写识别/PDF/A归档) |
PDF万能大师

SKILL.md

related skills