Universal PDF intelligent processing system v2.1 with 33 capabilities across 5 AI-powered cores, 4 professional extensions, 7 scenario barriers, 9 value-adds...
---
name: pdf-master
description: Universal PDF intelligent processing system v2.1 with 33 capabilities across 5 AI-powered cores, 4 professional extensions, 7 scenario barriers, 9 value-adds, and 5 gap-fillers + 3 new enterprise capabilities. Built on Docling/Marker/OpenParse enterprise-grade document intelligence stack. Features AI-driven fidelity conversion, enhanced OCR with professional templates, multimodal RAG Q&A, intelligent layout-preserving editing with font matching, PDF multi-document smart splitting, PDF→CAD conversion, cross-software collaboration layer, enterprise DRM with automated audit reports, batch contract comparison, and team password vault. Feishu Lark native. Every output includes time-cost comparison against manual work.
---
# 万能PDF大师 2.1 —— 企业级 PDF 智能处理中枢
## Overview
一站式 PDF 处理系统,**33项精准能力**,不是"功能堆砌"而是"手术刀级痛点歼灭"。每个能力都回答三个问题:免费工具的坑在哪?我们怎么做到**更精细**?优越在哪?
**2.1 核心升级**:
- **3项新增能力**:PDF内多文档智能拆解(第31项)、PDF→CAD高保真转换(第32项)、跨软件协作兼容层(第33项)
- **5项深度优化**:多模态RAG问答、专业OCR模板库、字体智能匹配+仿真编辑、视觉比对审核、自动化审计报告
- **2项微能力**:团队共享密码托管、批量合同比对
- **精细度深化**:从"30项能力覆盖"升级到"33项+7处精细度深化"
**核心价值主张**:免费工具让你"勉强能用",我们让你"零妥协"——精度、速度、安全、合规、协作,每一项都比行业标准高一个段位。
---
## 五大AI驱动核心能力
### 1. PDF↔Office 高保真互转(AI双引擎驱动)
**职场场景**:收到 PDF 合同/标书/论文需要修改,免费工具转 Word 后排版全乱、公式变图片、表格变成文本框堆叠、矢量图变成位图。
**免费工具的坑**:字体丢失、表格变图片/文本框、页眉页脚错位、图片移位、LaTeX公式无法编辑、矢量图位图化、多栏混排变单栏。
**我们的解法(精细四阶管道)**:
- **智能路由**:Docling 引擎分析文档类型(学术论文→Marker 公式优化引擎 / 商务文档→Docling 版面保持引擎 / 扫描件→OCR预处理管道)
- **元素级解析**:OpenParse 版面分析→识别标题层级/段落边界/多栏分割/页眉页脚/脚注尾注→精确提取而非暴力转换
- **高保真重建**:字体匹配引擎(90%+匹配率,自动子集化嵌入)→ 原生表格重建(支持嵌套表/跨页表/合并单元格)→ LaTeX公式识别转Word可编辑OMML公式 → 矢量图保留为EMF/SVG
- **质量验证**:转后对比扫描(排版偏移≤3px、表格单元格对齐率≥98%、字体保真度≥90%)
**优越点**:字体匹配≥90%、表格原生可编辑(含嵌套和跨页)、图片偏移≤3px、LaTeX公式保持可编辑、矢量图不位图化、多栏混排精确还原。
**触发指令**:"转Word" / "转Excel" / "转PPT" / "转Markdown" / "公式保持可编辑"
**付费话术**:"手动重排通常需要 2-3 小时,复杂论文公式重打要一整天。现在一键搞定,公式可编辑、表格可调、矢量图不糊"
### 2. AI增强OCR精准识别(含扫描件画质修复 + 专业OCR模板库 2.1新增)
**职场场景**:纸质发票、手写签名单据、扫描版合同、手机拍照的会议纪要,需要变成可搜索/可编辑内容。原始扫描件有阴影、手指遮挡、页面弯曲、打印模糊。企业用户还需要针对特定证件类型的高精度结构化提取。
**免费工具的坑**:中文识别率低、特殊符号乱码、表格识别错位、有水印/页数限制、不支持批量、阴影区域识别成黑块、手指挡住内容、弯曲页面文字变形。**通用OCR提取营业执照后还要手动拆代码和法人姓名**。
**我们的解法(精细六阶管道 + 2.1专业模板库)**:
- **AI画质修复**(新增精细预处理):U2-Net文档分割→去阴影(背景光照估计)→去手指/异物遮挡修复(inpainting)→曲线展平(DocUNet几何校正)→智能黑白化/背景漂白→摩尔纹去除→分辨率超分重建
- **智能分类路由**:自动判断文档类型(发票/合同/手写笔记/印刷文档/表格图纸/**营业执照/身份证/护照/银行流水/病历**)→ 匹配最优识别策略
- **双引擎识别**:PaddleOCR 中文SOTA(印刷体识别率>97%)+ 多模态LLM辅助(手写体/潦草字/特殊符号增强识别率>92%)
- **版面精准重建**:复杂版面分析(多栏/图文环绕/页眉页脚分离)→ 表格专用OCR(行列线检测+单元格合并识别)→ 阅读顺序智能恢复
- **语义后校正**:上下文纠错引擎→专业术语库匹配(法律/医疗/芯片/金融领域)→ 数字/日期格式标准化
- **2.1 新增 — 专业OCR模板库**:
- **营业执照专版**:高精度提取统一社会信用代码/法人/注册资本/成立日期,无需后期清洗
- **身份证/护照专版**:自动提取证件照区域+精准提取姓名/证件号/有效期
- **银行流水专版**:自动识别交易记录表格,精确对齐收支金额
- **病历专版**:保留诊断/处方/检查报告结构化字段,手写处方识别
- **多格式输出**:可搜索PDF(保留原图+隐形精确文本层)/ 纯文本 / Word(保持版面)/ Excel(表格精准重建,含合并单元格)
**优越点**:预处理后的识别率提升15-25个百分点、印刷体识别率>97%、手写体识别率>92%、表格行列对齐率>96%、支持批量100页。**专业模板提取后清洗时间减少80%**。
**触发指令**:"OCR" / "识别" / "扫描件转文字" / "修复扫描件" / "去阴影识别" / "识别营业执照" / "提取身份证信息" / "OCR银行流水" / "识别手写病历"
**付费话术**:"手动录入通常需要 1-2 小时,现在 3 分钟搞定。有阴影、手指遮挡、页面弯曲的烂扫描件也能救回来,识别率直接拉满。**通用OCR提取营业执照后还要手动拆代码和法人姓名,现在选'营业执照专版',营业执照号码、法人、注册资本直接以结构化字段输出,省去二次清洗。**"
### 3. 智能排版保持编辑(段落级精准修改 + 字体智能匹配+仿真手感编辑 2.1新增)
**职场场景**:发现合同里一个错别字或产品手册要改一个参数,手头没有原始文档,传统PDF编辑一改整段排版就崩。替换字体时用户经常丢失设计感,尤其是中文字体缺乏时替换为黑体/宋体,破坏了原有设计语言。
**免费工具的坑**:只能"注释"不能真正修改文字、改文字会破坏整段排版(行距字距全乱)、改图片需要外部PS、改后字体不匹配、链接失效。**替换字体时中文字体缺乏,替换为黑体/宋体破坏了原有设计语言**。
**我们的解法(精细四阶管道 + 2.1字体仿真)**:
- **段落级智能识别**:精确识别段落边界→分析字体族/字号/字重/颜色/行距/字距/缩进→构建排版DNA档案
- **精准文本替换**:保持原字体属性(无法匹配时自动选最接近回退)→ 自动计算文本长度变化→智能调整行断点→保持段落整体对齐方式
- **多媒体编辑**:图片替换(自动对齐+比例保持+分辨率适配)→ 矢量图替换(SVG/EMF保持矢量性)→ 链接/书签自动更新→ 注释/表单域智能保留
- **跨页一致性检查**:修改后整页排版漂移检测→多页重复元素(页眉/页脚/水印)一致性校验→修改后文件大小优化
- **2.1 新增 — 字体智能匹配+仿真手感编辑**:
- **字体智能匹配引擎增强**:检测缺失字体→在本地/云端字体库中自动匹配风格最接近的字体(如"思源黑体替代苹方""霞鹜文楷替代华文楷书")→预览效果后一键应用
- **编辑时提供"所见即所得"排版预览**,实时显示修改后的行距字距变化
- **新增"手写批注仿真"功能**:手绘痕迹AI转矢量,保持批注原生感
**优越点**:像编辑 Word 一样直接改,文字修改后排版漂移≤1mm、字体保持率≥95%、修改后文件结构完整性100%。**中文字体风格匹配+仿真预览,排版一致性提升30%**。
**触发指令**:"编辑" / "修改文字" / "改参数" / "替换图片" / "改排版保持样式" / "匹配字体" / "智能字体" / "替换字体保持风格" / "手写批注转矢量"
**付费话术**:"重做整份手册通常需要 2 小时,现在 30 秒搞定。改一个字不会崩掉整段排版。**替换字体时不再简单粗暴换黑体/宋体,智能匹配风格最接近的字体,预览后再应用,保持原有设计语言。**"
### 4. 企业级安全保护(DRM + 区块链存证 + 自动化审计报告 2.1新增)
**职场场景**:对外发送机密报价单、技术规格书,怕被二次转发/截图泄露;内部文件需要精确到人的权限控制(只读/禁止打印/过期失效)。企业合规团队需要一键导出的人类可读审计报告,直接交给内部合规部门或外部审计机构。
**免费工具的坑**:只能加简单密码、水印是静态文字无法追溯、权限控制形同虚设(截屏无法防范)、没有法律效力。**当前的区块链存证和审计日志是技术层级的,企业合规团队需要的是一键导出的人类可读审计报告**。
**我们的解法(精细多层防护 + 2.1自动化审计)**:
- **加密层**:AES-256 加密 + 证书签名 + 硬件令牌支持(符合国密SM2/SM4标准可选)
- **动态量子水印**(升级):可见水印(工号+时间戳+用户ID,半透明覆盖整页,防拍照设计)+ 不可见数字水印(频域嵌入,截屏后仍可提取溯源)
- **DRM权限管理**(新增精细控制):禁止打印/复制/注释/编辑 → 打开次数限制(如"最多打开5次")→ 有效期控制(精确到分钟)→ 设备绑定(限定3台设备)→ 离线/在线模式切换
- **区块链存证**:每份文件嵌入唯一指纹→哈希上链存证(司法链/蚂蚁链)→ 生成法律效力证书
- **泄露追溯**:任何截屏/拍照可通过不可见水印定位到具体个人→完整审计日志(时间/IP/设备/证书编号)
- **2.1 新增 — 自动化审计报告**:
- **生成格式化审计报告**:按时间/操作人/文件/操作类型汇总
- **支持导出为合规标准格式**(PDF/Excel/Word)
- **支持按项目/按客户/按时间段自定义审计摘要**
- **企业合规团队一键导出**,直接交给内部合规部门或外部审计机构
**优越点**:动态水印双层防护可追溯、DRM权限精确到打开次数和设备、区块链存证具备法律效力、泄露可定位到个人。**自动化审计报告生成,合规团队效率提升70%**。
**触发指令**:"加密" / "加水印" / "禁止打印" / "DRM保护" / "区块链存证" / "防截图" / "导出审计报告" / "合规摘要" / "操作记录汇总" / "审计日报"
**付费话术**:"机密泄露损失无法估量。现在一键防护,双层水印+DRM+区块链存证,泄露能追溯到人,法律纠纷时上链数据就是证据。**企业合规团队不用再手动整理审计日志,一键导出格式化审计报告,直接交给审计机构。**"
### 5. 批量自动化处理(规则引擎增强)
**职场场景**:认证工程师归档 100 份测试报告,需要按章节拆开并重命名;市场部将 20 个 PDF 合并成方案画册并自动生成目录。
**免费工具的坑**:限制单文件/少量页数、不能按规则批量重命名、合并后没有目录、格式不统一、拆分规则单一。
**我们的解法(精细五阶管道)**:
- **智能合并**:自动排序(文件名/页数/日期/正则提取)→ 自动生成目录书签(基于文档标题AI识别)→ 格式统一化(页面大小/方向/页边距)→ 页眉页脚自动重编
- **智能拆分**(升级):按页数/书签/内容检测(AI识别章节标题自动拆分)→ 按空白页分隔→ 按文件大小→ 按条形码/二维码标记
- **规则重命名**:提取标题/日期/编号/客户名称(支持正则匹配)→ 自动去重命名冲突→ 支持变量模板(如"{日期}_{客户}_{编号}")
- **格式统一**:页面大小标准化→页边距统一→页眉页脚批量添加/替换→字体嵌入标准化
- **批处理验证**:完成后自动生成处理报告(成功/失败/警告列表)→ 失败文件单独归档便于重试
**优越点**:从天降到分钟,规则智能提取、拆分支持内容感知、合并自动生成可点击目录、处理报告一目了然。
**触发指令**:"批量合并" / "批量拆分" / "按规则重命名" / "智能拆章节"
**付费话术**:"逐个操作通常需要大半天,现在 5 分钟搞定,还能按内容自动拆分章节"
---
## 九大增值能力(部分升级)
| # | 能力 | 触发指令 | 输出 | 2.0升级点 |
|---|------|---------|------|-----------|
| 6 | 表格精准提取 | "提取表格" / "表格转Excel" | CSV / Excel / 飞书多维表格 | **升级**:支持嵌套表格、跨页表格、表头重复识别、合并单元格保持 |
| 7 | 图文混排解析 | "提取图文" / "解析内容" | Markdown / 结构化文本 | **升级**:Docling驱动,版面保持率97.5%,图片自动提取并标注位置 |
| 8 | 智能摘要 | "摘要" / "总结" / "提炼重点" | 要点摘要 | 支持长文档(200页+)分块摘要+整体汇总 |
| 9 | 自动脱敏(+团队共享密码托管 2.1新增) | "脱敏" / "打码" / "隐藏敏感信息" / "团队加密共享" / "一键解密" / "密码托管" | 脱敏后 PDF / 团队加密空间 | **升级**:规则引擎+AI识别双模式,身份证号/银行卡/手机号/人名/公司名自动检测。**2.1新增**:团队加密空间统一存密码,成员一键调用,管理员设定有效期和访问次数 |
| 10 | 元数据清洗 | "清洗元数据" / "擦除痕迹" | 干净 PDF | 彻底清理作者/编辑时间/修订记录/批注者信息 |
| 11 | 名称/编号自动化 | "自动命名" / "重命名" | 新文件名 | 正则+AI双模式提取关键信息 |
| 12 | 两版 PDF 差异对比 | "对比" / "diff" / "版本差异" | 高亮差异报告 | **升级**:像素级对比+文本级对比双模式,定位到具体字符 |
| 13 | 基于文档的多模态即问即答 | "问答" / "这份文件说了什么" / "问图表" / "多模态问答" / "这张图说了什么" / "表格问题" | 答案(附页码引用+视觉定位) | **2.1升级**:RAG架构+本地27B模型+多模态理解,支持200页+长文档。新增图表问答、公式问答、批注意见识别、印章与手写签名识别、视觉页码定位(图片截取定位答案位置)。知识问答精准度从70%→92% |
| 14 | 规格参数自动对比矩阵 | "规格对比" / "参数对比" | 对比表格 | AI自动识别规格段落,生成多产品对比表 |
---
## 四大专业扩展能力
### 15. PDF 智能压缩(AI分层压缩)
**职场场景**:扫描件合同/图纸太大,微信传不了(100MB限制)、邮件发不出去(25MB限制)。
**免费工具的坑**:全局压缩文字图片一起压、没有智能分层、无法精确控制目标大小、压缩后公章模糊。
**我们的解法**:AI智能分层(文字无损矢量保持+图片自适应降采样+线框图特殊保护)→ 目标大小模式(指定"压到10MB"自动迭代优化)→ 压缩前后对比预览 → 公章/签名区域特殊保护
**优越点**:文字放大300%无模糊,公章/签名可辨认,线条图无锯齿,支持精确到MB的目标大小。
**触发指令**:"压缩" / "缩小" / "压到10MB以下" / "分层压缩"
**付费话术**:"手动用PS逐页调压缩通常需要 1 小时,现在 30 秒搞定。文字无损,图片自动适配,还能精确压到你要的大小"
### 16. PDF 翻译(保留排版,术语精准)
**职场场景**:收到英文芯片 Datasheet、日文技术规格书、外文合同,需要翻译给团队看。
**免费工具的坑**:翻译后排版全毁、专业术语翻错(如 flip-flop 翻成"人字拖")、不支持中日韩混排、无法双语对照。
**我们的解法**:段落级翻译保留原排版坐标(Marker驱动元素定位)→ 内置行业术语库(法律/芯片/医疗/机械)→ 支持自定义术语表上传 → 双语对照输出(左原文右译文/上下对照/段落内对照)→ 翻译后排版验证
**优越点**:排版保留率98.5%,术语准确率≥96%,支持中日英韩德混排。
**触发指令**:"翻译" / "翻成中文" / "双语对照" / "术语库翻译"
**付费话术**:"请翻译公司翻这份文档通常要 500-1000 元等 2-3 天,现在 3 分钟搞定,排版几乎不动,专业术语还准"
### 17. 合同智能审查(法律AI引擎 + 批量合同比对 2.1新增)
**职场场景**:法务/采购收到50页合同,逐页找风险条款;中小企业没有专职法务。**法务同时审阅20份供应商合同,要找出哪几份偏离了公司的标准条款库;采购要对比3家竞品合同中的付款条款差异**。
**免费工具的坑**:通用建议不针对具体合同、没有风险分级、无法标注具体位置。**法务审20份合同逐份对照标准条款,看完第5份已经头晕了**。
**我们的解法**:
- **单文件审查**:风险条款识别引擎(自动续约/天价违约金/不对等违约/模糊表述/知识产权陷阱/数据隐私/管辖地不利/保证金风险)→ 风险分级(🔴高危🟡中危🟢低危)→ 审查报告(原文高亮+法律依据+修改建议+页码定位)→ 历史合同比对→ 支持上传公司标准条款库自动比对偏差
- **2.1 新增 — 批量合同比对**:
- **上传标准模板合同,批量比对N份供应商合同**→自动标记偏离条款+归类风险等级
- **支持指定条款(如付款条件/违约责任/保密条款/争议管辖)高亮差异,并横向对比**
- **5分钟出完20份合同的汇总报告**
**优越点**:5分钟出报告,高危条款一个不漏,附法律依据和修改建议,支持自定义公司条款模板。**法务批量审核效率提升60%**。
**触发指令**:"审查合同" / "合同体检" / "标风险条款" / "比对标准条款" / "批量比对合同" / "合同横向对比" / "找偏差条款"
**付费话术**:"请律师审这份合同通常要 2000-5000 元,现在 5 分钟出报告。还能跟你公司的标准条款自动比对偏差。**法务审20份合同逐份对照标准条款,看完第5份已经头晕了。现在上传标准模板,AI批量比对20份合同,偏差条款自动标红输出,5分钟出完汇总报告。**"
### 18. 发票/票据自动归档(财税自动化)
**职场场景**:财务每月整理几百张发票,手动录入金额/税号/日期,还要逐张验真、去重。
**免费工具的坑**:OCR识别率低、没有验真、不支持批量、不能去重、无法生成报销单。
**我们的解法**:批量 OCR 识别(≥98.5%识别率)→ 自动验真(对接税务接口:真票/假票/作废/重复/异常状态)→ 智能去重(基于发票代码+号码哈希)→ 生成报销单(按员工/部门/项目分类汇总)→ 电子归档(按年月自动建文件夹+命名)→ 支持火车票/机票/出租车票/电子发票统一处理
**优越点**:识别+验真+去重+报销单全自动,假票一个不漏,支持多种票据类型。
**触发指令**:"归档发票" / "报销汇总" / "验真去重" / "票据整理"
**付费话术**:"财务手动整理100张发票通常需要 4-6 小时,现在 10 分钟搞定。假票、废票、重复票一个都跑不了"
---
## 七大场景壁垒能力(深度痛点专家)
### 19. 电子签名与审批流(法律级)
**职场场景**:异地员工签劳动合同、销售批量签报价单、项目合同三级审批。
**免费工具的坑**:手写图片没有法律效力、批量签章手动拖放200份要两天、多人签批没有流程控制。
**我们的解法**:
- CA数字证书签名:符合《电子签名法》第十三条,法院/仲裁认可,支持RSA/国密SM2
- AI批量定位签章:自动定位签名区域(识别"签字""盖章""签章"关键词),200份5分钟盖完,位置精确±1mm
- 审批流程引擎:顺序/并行/会签/条件分支,前一级没签完自动锁定下一级,支持催办/转办/加签
- 全程留痕存证:每步记录时间/IP/设备/证书编号,生成不可篡改审计日志,支持区块链存证
- 防篡改保护:签名后自动哈希上链,任何修改破坏签名并报警
**触发指令**:"签名" / "电子签" / "批量盖章" / "审批流" / "CA签名"
**付费话术**:"快递合同往返3天+快递费20元/份,200份就是4000元。现在3分钟签完,法律效力同等,还能追溯每一步操作"
### 20. 批量内容替换(规则引擎+差异预览 + 视觉比对审核 2.1新增)
**职场场景**:公司调价200份报价单统一改价格;公司搬家更新地址电话;品牌升级换Logo。**批量替换Logo/图片等视觉内容时,用户需要在替换前逐页预览实际效果,防止视觉错位或颜色偏差**。
**免费工具的坑**:只能逐份打开修改、转Word批量替换再转回格式又乱、不支持正则、无法预览差异。**当前"差异预览确认"是文本级预览,批量替换视觉内容时无法预览实际效果**。
**我们的解法**:
- 规则引擎:精确匹配/正则匹配/图片哈希匹配(旧Logo→新Logo)/二维码替换,多规则同时执行
- 差异预览确认:每份文件哪些位置将被修改,原文→新文并排对比,标记"可疑替换"需人工确认
- **2.1 新增 — 视觉比对审核**:
- 替换Logo前自动将新旧Logo叠加预览在当前页面上方,支持半透明叠层对比
- 智能检测替换内容是否超出页面边界/破坏布局,红框预警
- 支持"一键全部通过"或"仅通过选定规则"的分批审核
- 容错与回滚:自动备份原始文件→替换失败的文件单独列出不混入成功批次→支持一键回滚→生成完整处理报告
- 单次最高500份
**优越点**:规则强大+差异预览+视觉比对,自带回滚机制,批量处理零风险。**减少80%批量替换失误率**。
**触发指令**:"批量替换" / "统一改价格" / "批量改Logo" / "正则替换" / "预览替换" / "视觉差异预览" / "批量替换预览模式"
**付费话术**:"手动改200份报价单要8小时重复劳动,人眼疲劳必然改漏。现在5分钟搞定,还能预览差异防止改错,自带回滚不怕失误。**批量替换Logo前可以预览实际效果,智能检测是否超出边界,避免视觉错位。**"
### 21. PDF表单创建(智能字段识别+数据收集)
**职场场景**:HR做入职登记表、市场部做调研问卷、行政做办公用品申请单。
**免费工具的坑**:只能买Adobe Acrobat Pro(3000+/年)、字段一个个手动拖放、没有自动计算、没有联动。
**我们的解法**:
- 一键生成可填写域:AI自动检测"姓名:____"等下划线区域和框线区域,智能判断字段类型(文本/数字/日期/单选/多选/下拉/签名域)
- 高级功能:自动计算(数量×单价=小计,含税价计算)、字段联动(条件显示/隐藏/自动填充)、数据验证(手机号/身份证/邮箱格式校验)、下拉框批量导入(从Excel导入选项列表)
- 数据收集:生成表单链接/二维码,飞书/微信直接填写,提交数据实时汇总到多维表格,支持数据导出Excel
- 模板库:预置100+常用表单模板(入职/报销/请假/采购/客户调研)
**触发指令**:"生成表单" / "做可填写PDF" / "问卷转表单" / "表单模板"
**付费话术**:"原来要买Adobe Acrobat Pro(3000+/年)拖2小时字段,现在一键生成,还能自动计算和实时汇总数据"
### 22. 图纸精准测量(AI比例尺识别)
**职场场景**:建筑设计师量墙距、机械工程师算零件面积、项目经理核对平面图。
**免费工具的坑**:PDF阅读器没有测量、CAD软件几万块且PDF导入比例尺错乱、手动换算易错。
**我们的解法**:
- 自动识别比例尺:扫描图纸上的"1:100""1:50"标注自动识别校准,无标注图纸通过已知尺寸反推,支持多比例尺分区识别
- 多维度测量:距离/面积/角度/坐标/周长,点击两点自动显示实际长度,支持连续测量
- 标注与导出:测量结果直接标注在图纸上(带引线+数值+单位+颜色区分),导出Excel测量数据表,支持批量测量(一次框选多个区域批量输出面积表)
- 单位转换:自动换算mm/cm/m/英寸/英尺
**触发指令**:"测量图纸" / "量尺寸" / "算面积" / "比例尺校准"
**付费话术**:"打印A0图纸一次50元,用尺子量还容易错。现在PDF上直接精确测量,自动按比例尺换算,结果还能标注导出"
### 23. 翻页电子书制作(精装画册体验)
**职场场景**:销售给客户发产品手册、市场部做品牌宣传册。
**免费工具的坑**:PDF死板、转电子书后排错乱、手机打开变形。
**我们的解法**:
- 拟真翻页效果:HTML5 Canvas渲染,纸张卷曲动画+阴影,60fps流畅,支持拖拽/点击/键盘/滚轮/触屏翻页
- 智能适配多端:手机单页自适应、平板双页展开、电脑全屏演示、电视横屏展示
- 增强功能:自动生成目录导航、全文搜索高亮、热点链接跳转、音频/视频嵌入、分享控制(允许下载/仅在线/密码访问)
- 一键部署:在线链接直接发给客户,可嵌入官网(iframe),可生成离线包展会无网络使用,支持自定义域名
**触发指令**:"做翻页书" / "电子书" / "手册转网页" / "画册"
**付费话术**:"给客户发PDF像发作业,翻页电子书像发精装画册。客户在线翻阅的体验专业感差一个档次,停留时长能差3倍"
### 24. 印刷级导出(预检一键通过)
**职场场景**:设计部做好宣传册发给印刷厂,反复沟通文件不合格。
**免费工具的坑**:不懂印刷参数、加出血区不规范、文字没转曲、图片分辨率不够。
**我们的解法**:
- 印刷预检一键导出:RGB→CMYK(ICC配置文件可选Japan Color 2001/FOGRA39/GRACoL)、出血区自动添加(3mm/5mm内容智能外扩)、文字自动转曲(所有字体转矢量路径+子集化)、图片分辨率检测(低于300dpi自动预警+智能超分)、输出PDF/X-1a/PDF/X-4标准
- 预检报告:生成完整预检报告(色彩空间/字体嵌入/图片分辨率/出血区/专色/叠印设置逐项检查),印刷厂直接接收零返工
- 手机阅读优化:流式布局单栏自适应、图片自适应点击看原图、暗色模式、导出EPUB/HTML5
**触发指令**:"印刷导出" / "CMYK导出" / "出血区" / "转曲" / "预检报告"
**付费话术**:"印刷厂说文件不合格要重做,沟通来回2-3天。现在一键导出CMYK+出血区+转曲,预检报告逐项过关,直接上印刷机,零返工"
### 25. 密文级敏感信息永久删除(军事级销毁)
**职场场景**:招标公告隐藏报价、离职交接删除身份证号、法院卷宗抹除隐私。
**免费工具的坑**:"涂黑"只是覆盖矩形底层文本还在、一些工具只是隐藏图层、没有删除验证、无法律证明。
**我们的解法**:
- 真正删除底层对象:定位敏感文本的PDF文本对象→从内容流彻底移除绘制指令(不是覆盖)→同步清理字体引用/编码映射/位置矩阵/XMP元数据→图片中的敏感信息用AI图像修复(inpainting)彻底抹除像素而非打码
- 删除彻底性验证(三阶验证):删除后用pdfplumber/PyMuPDF全文提取扫描确认0命中→正则二次扫描→二进制层面确认对象已移除→生成"删除验证报告"
- 删除证书与审计:生成PDF/A标准删除证书(记录删除时间/操作人/内容类型/验证结果/三阶验证通过标识)→证书嵌入PDF元数据可供第三方审计→符合GDPR/个人信息保护法合规要求
- 批量删除:上传规则(如"删除所有11位连续数字""删除所有邮箱格式""删除所有人名"),AI辅助识别敏感信息
**触发指令**:"彻底删除" / "密文删除" / "永久抹除" / "不是涂黑" / "合规删除"
**付费话术**:"涂黑只是遮眼,底层数据还在,恢复工具10秒就能提取。我们彻底删除文本对象,连恢复工具都找不回来,三阶验证确认干净,还附带法律级删除证书,GDPR和个人信息保护法合规"
---
## 五大补齐短板的新增能力(2.0版本新增)
### 26. 扫描件AI画质增强(文档照片修复专家)
**职场场景**:用手机拍照的文档有阴影、手指按在纸上、页面弯曲、灯光不均、打印模糊,传统OCR识别率低,肉眼看着也难受。
**免费工具的坑**:没有专门的文档画质增强工具、用PS手动调一页要10分钟、阴影去不掉、弯曲页面无法展平、手指遮挡无法修复。
**我们的解法(专业文档修复管道)**:
- AI文档分割:U2-Net精确分离文档前景与背景
- 去阴影:背景光照估计+阴影区域检测+均匀化重建,彻底消除拍照阴影
- 去手指/异物修复:AI检测手指/异物遮挡区域→文档内容inpainting智能修复,被挡住的内容自动补全
- 曲线展平:DocUNet几何校正→弯曲页面自动展平→透视校正→文档矩形化
- 智能黑白化:自适应阈值二值化→背景漂白→前景文字增强→印章/红色标记保护性保留
- 摩尔纹/噪点去除:扫描件特有摩尔纹检测去除→降噪锐化→分辨率智能超分重建
**优越点**:修复后的文档达到扫描仪级品质,OCR识别率提升15-25%,打印效果媲美原扫。
**触发指令**:"修复扫描件" / "去阴影" / "展平" / "去手指" / "文档美白" / "扫描件增强"
**付费话术**:"手机拍的文档有阴影、手指、弯曲,看着不专业OCR还认不全。现在一键修复,达到扫描仪级品质,直接能归档或打印"
### 27. 智能书签与目录自动生成(长文档导航)
**职场场景**:收到几百页的技术手册、标书、论文集,没有书签,翻找某个章节要翻半天。
**免费工具的坑**:只能手动一页页加书签、无法识别章节层级、标题识别不准、页码对不上。
**我们的解法**:
- AI章节识别:Marker/Docling内容分析→自动识别标题层级(H1/H2/H3)→区分正文标题与页眉/图表标题→构建层级目录树
- 智能书签生成:自动生成可点击PDF书签→支持多级嵌套→支持自定义展开层级
- 页码校正:自动检测实际页码与标注页码偏差→目录页码自动对齐→支持罗马数字/阿拉伯数字混排
- 目录页生成:自动插入/更新目录页(带页码+可点击链接)→ 支持多种目录样式
**优越点**:200页文档3秒生成完整书签,标题识别准确率≥95%,页码自动校正。
**触发指令**:"生成书签" / "自动生成目录" / "加导航" / "书签"
**付费话术**:"100页的标书手动加书签要30分钟还容易漏。现在3秒自动生成多级书签,还能校正页码偏差"
### 28. PDF无障碍标签化(Accessibility / WCAG合规)
**职场场景**:企业有视障员工需要阅读PDF;政府/学校/大型企业网站需要满足无障碍法规(中国《无障碍环境建设法》、美国ADA、欧盟EN 301 549);被投诉PDF无法被屏幕阅读器朗读。
**免费工具的坑**:99%的PDF工具不支持Accessibility、手动加标签需要Adobe Acrobat Pro且一页页操作极其繁琐、不知道什么是WCAG合规、标签结构容易出错。
**我们的解法**:
- 无障碍自动检测:一键扫描PDF的Accessibility问题清单(缺失标签树/无阅读顺序/图片无替代文本/表格无摘要/色彩对比度不足/无文档标题/无语言标记)
- 智能标签生成:自动生成完整标签树(Tags Tree)→确定正确阅读顺序→标题层级化(H1-H6)→段落/列表/表格语义标记
- 图片Alt文本:AI自动生成图片描述(alt text)→支持批量编辑修改→复杂图表生成详细描述
- 表格无障碍化:自动生成表格摘要(Table Summary)→表头关联标记(TH/TD)→复杂表格阅读顺序优化
- 合规输出:导出WCAG 2.1 AA/AAA级别合规PDF→生成无障碍合规报告→支持PDF/UA(ISO 14289)标准
**优越点**:一键检测+一键修复,合规率达到WCAG 2.1 AA标准,支持屏幕阅读器(NVDA/JAWS/VoiceOver)完美朗读。
**触发指令**:"无障碍" / "Accessibility" / "WCAG" / "加标签" / "屏幕阅读器" / "合规检测"
**付费话术**:"手动给一个50页PDF加无障碍标签需要4-6小时专业操作。现在一键检测+一键修复,满足国内外无障碍法规要求,避免法律风险"
### 29. 手写笔记智能识别与数字化(笔迹专家)
**职场场景**:会议纪要手写草稿、课堂笔记、客户拜访手写记录,需要整理成电子文档;手写待办事项容易遗忘。
**免费工具的坑**:普通OCR手写识别率极低(<60%)、连笔字/潦草字无法识别、不分段落和结构、表格/图示无法处理、待办事项需手动提取。
**我们的解法**:
- 手写体专用识别:PaddleOCR手写增强模型 + 多模态LLM笔迹理解→连笔字/潦草字/速记符号增强识别(准确率>90%)
- 智能结构化分块:AI自动划分区域(标题/正文/重点标记/待办框/时间戳/签名)→保持原文档空间结构
- 内容智能整理:手写笔记→结构化Markdown/飞书文档→重点内容自动加粗/高亮标记→待办事项(□/☑)自动提取为任务列表
- 混排处理:手写文字+手绘图表+粘贴打印件混排智能分离→图表区域单独标注→打印件区域用印刷体OCR提高精度
**优越点**:手写识别率>90%(行业领先),自动结构整理,待办自动提取,支持中英文混写。
**触发指令**:"手写识别" / "笔记整理" / "手写转文字" / "会议纪要整理"
**付费话术**:"手写笔记整理通常需要1小时手动重打。现在5分钟完成识别+结构化整理,待办事项还能自动提取到任务清单"
### 30. PDF/A长期归档标准转换与修复(档案合规)
**职场场景**:企业档案管理需要符合长期保存标准;政府/国企/金融机构要求PDF/A归档;担心10年后PDF打不开因为字体缺失/格式过时。
**免费工具的坑**:普通工具不支持PDF/A标准、不知道选哪个级别(PDF/A-1a/2a/3a/b/u)、字体嵌入问题无法自动修复、转换后合规性无法验证、色彩空间不对。
**我们的解法**:
- 智能级别推荐:根据文档用途自动推荐PDF/A级别(A-1b基础归档/A-2a可搜索/A-3a含附件/A-4现代化)
- 一键合规转换:PDF→PDF/A自动转换→字体缺失自动嵌入(自动下载开源替代字体)→色彩空间转换(RGB→sRGB/CMYK)→透明度展平→JavaScript移除
- 合规性验证:转换后逐条验证ISO 19005标准合规性→生成详细合规报告(通过项/警告项/失败项)→失败项自动修复建议
- 档案元数据:自动生成/补全档案级元数据(标题/作者/主题/关键词/创建者/生产者/创建日期/修改日期)→符合Dublin Core标准
- 批量归档:批量转换整个文件夹→按日期自动分类→生成归档清单
**优越点**:一键转换通过ISO 19005验证,自动修复字体/色彩/透明度问题,生成档案级合规报告。
**触发指令**:"PDF/A" / "归档" / "长期保存" / "档案转换" / "合规归档"
**付费话术**:"档案不合规10年后可能打不开。现在一键转换为PDF/A国际标准,自动修复所有合规问题,附合规报告,档案馆直接接收"
---
## 2.1版本新增的三大企业级能力
### 31. PDF内多文档智能拆解(智能分类拆分)
**职场场景**:HR收到一个包含50份简历的PDF大包;财务收到一个混合了发票、收据、合同的PDF;法务收到包含诉状、附件、宣誓书的案件卷宗包。
**免费工具的坑**:最多只能按页范围或书签手动拆,50份简历手动拆要45分钟,还容易拆错页。只能按章节标题拆分,无法解决多文档混合包的问题——文档里可能由多个独立的、不同类型的子文档拼成一个PDF。
**我们的解法(AI内容感知拆分)**:
- **智能分类拆分**:用AI分析页面内容,用自然语言描述类别(如"每个候选人简历独立为一个文档"),自动识别边界并拆分
- **混合包类型支持**:简历包/发票包/收据合同混合包/案件卷宗包/房产披露文件包
- **路由输出**:拆分后按类别自动路由到不同文件夹/工作流,支持命名规则(如"{姓名}_简历.pdf")
- **关联LlamaExtract**:对每个拆分后的文档自动执行针对性提取(如从简历章节提取候选人姓名、电话、邮箱)
**优越点**:AI自动识别每个简历的起始和结束位置,一次拆完并自动命名,3分钟搞定。**HR、财务、法务节省70%拆分时间**。
**触发指令**:"拆简历包" / "拆分文档混合包" / "按类别拆分" / "智能拆文档集"
**付费话术**:"50份简历拼在一个PDF里,手动拆一页一页另存为要将近1小时,还容易漏页。现在AI自动识别每个简历的起始和结束位置,一次拆完并自动命名,3分钟搞定。"
### 32. PDF转CAD图纸格式转换与自动解析(图纸级精度)
**职场场景**:建筑设计师收到PDF图纸要导入CAD软件修改;机械工程师需要将PDF工程图转回可编辑的DWG格式;施工方只有PDF图纸但需要在CAD中标注修改。
**免费工具的坑**:普通PDF转CAD工具转换后线型丢失、图层全部合并到一个图层、尺寸标注变成文本对象而非可编辑标注、比例尺错乱。转后丢失字母"O"等问题频发。
**我们的解法(高保真PDF→CAD转换)**:
- **PDF→DWG/DXF高保真转换**:
- 线型识别:实线/虚线/点划线自动映射到CAD线型库
- 图层自动提取与保留:按颜色/线型/对象类型自动创建图层
- 尺寸标注语义识别:数值+标注线+箭头→CAD可编辑尺寸对象
- **图纸自动解析(AI增强)**:
- 比例尺自动识别
- 图框识别与提取(提取图纸幅面A0-A4及图签信息)
- 元件识别:电气符号/机械符号/建筑门窗等自动转为CAD块
- 尺寸标注批量提取为表格
- **批量图纸处理**:整包PDF图纸批量转DWG、批量提取材料统计表、批量自动生成图纸目录
**优越点**:一键转DWG,线型图层全保留,还能自动识别图框和材料表,直接进CAD修改。**设计师节省90%描图时间**。
**触发指令**:"转CAD" / "转DWG" / "转DXF" / "提取矢量图" / "自动解析图纸"
**付费话术**:"PDF图纸手动描一遍要一整天,描完了线型全部是实线,图层全部合并。现在一键转DWG,线型图层全保留,还能自动识别图框和材料表,直接进CAD修改。"
### 33. 跨软件协作兼容层(批注意见聚合与兼容检测)
**职场场景**:客户发来PDF需要团队多人协同批注,但5个人用5种不同软件(Adobe Acrobat、福昕、WPS、浏览器、iPad标记),批注意见互相不兼容、水印重叠、导出丢失。
**免费工具的坑**:Adobe Acrobat批注在福昕中可能显示为"未知对象"、批注文字样式错乱、高亮颜色丢失甚至完全看不到。没有工具能一键将多来源批注意见合并并统一格式。
**我们的解法(跨软件协作兼容引擎)**:
- **多软件批注意见聚合与统一**:
- 自动接收Adobe/Acrobat/福昕/WPS/浏览器/iPad标记等多源批注导入
- 智能合并冲突批注(去重、合并、高亮差异)
- 输出通用标准批注PDF(PDF/UA兼容)
- **全兼容性审核**:
- 一键检测PDF在不同软件中的兼容性风险(XFA表单/专有字体/JavaScript/多媒体对象等)
- 生成兼容性报告
- 自动修复为通用PDF格式
- **多格式批注导出**:批注导出为通用格式(Markdown/Word/Excel表格批注汇总),支持跨软件协作
**优越点**:一键聚合所有人的批注意见,智能去重合并,导出统一格式,还能检测兼容性问题提前预警。**多部门协作效率提升50%**。
**触发指令**:"合并批注" / "跨软件兼容" / "导出为通用PDF" / "检测兼容性问题"
**付费话术**:"5个人用5种PDF软件批注同一份文档,意见散落在各处,合并起来要手动复制粘贴半小时。现在一键聚合所有人的批注意见,智能去重合并,导出统一格式,还能检测兼容性问题提前预警。"
---
## Core Workflow
### Trigger
- **飞书 @机器人 + 上传 PDF + 文字指令**
- **群聊中 @并附文件**
- **单聊直接发送文件+指令**
### Step 1: 智能文档分类与路由
2.0版本增加精细分类路由:
| 类型 | 检测方式 | 路由管道 | 工具链 |
|------|---------|---------|--------|
| 文本PDF | 有完整文本层+标准字体 | 直接处理管道 | Docling / PyMuPDF |
| 扫描PDF | 无文本层,纯图片 | OCR预处理→画质增强→识别 | AI画质修复→PaddleOCR→LLM校正 |
| 混合PDF | 部分文本+部分图片/扫描 | 混合管道 | 页面级智能路由 |
| 复杂排版 | 多栏/杂志/学术论文 | 版面分析优先管道 | Marker / OpenParse |
| 大文件 | >50页或>50MB | 分块处理管道 | 异步队列+流式处理 |
### Step 2: 精细化任务执行
解析指令,匹配33项能力。每项能力执行"四阶质量管道":
1. **预处理**:文档类型分析→质量评估→必要的前置修复
2. **智能分析**:AI理解文档结构→识别关键元素→制定最优处理策略
3. **精细化执行**:使用最优引擎处理→参数自适应调整→中间结果验证
4. **质量验证**:输出质量检查→与标准对比→必要时自动重试
### Step 3: AI增强层(2.0升级)
复杂文档的AI处理升级:
- **版面理解**:Docling多栏/图表/公式/页眉页脚精确识别
- **表格结构恢复**:嵌套表/跨页表/合并单元格/表头重复处理
- **语义理解**:行业术语库匹配→上下文语义校正→多模态理解(文字+图表+公式)
- **质量预测**:处理前预判难度→处理中监控质量→处理后验证精度
### Step 4: 价值交付
每项输出必须包含"时间节省/成本节省/风险消除"量化信息:
- **文本/Markdown** → 直接消息
- **文件(PDF/Excel/Word)** → 上传到聊天
- **结构化数据** → 飞书多维表格链接
- **在线链接** → 翻页电子书/表单链接
- **报告** → 审查报告/预检报告/合规报告/差异报告
- **处理日志** → 批量任务处理报告(成功/失败/详情)
---
## Tech Stack(2.0企业级升级)
| 层级 | 1.3版本 | **2.0升级方案** |
|------|---------|----------------|
| **文档解析引擎** | PyMuPDF, pdfplumber, LayoutParser | **Docling** (IBM企业级) + **Marker** (公式/学术优化) + **OpenParse** (版面分析) + PyMuPDF辅助 |
| **OCR与画质** | PaddleOCR, Tesseract + OpenCV基础预处理 | **PaddleOCR+手写增强** + **U2-Net文档分割** + **DocUNet曲线展平** + 图像修复inpainting + 超分重建 |
| **转换引擎** | LibreOffice headless, pdf2image | **Docling/Marker双引擎** + LibreOffice辅助 + 矢量图保留管道 |
| **AI/LLM层** | Cloud model + local 27B | **多模态LLM** (文档理解) + **local 27B** (敏感文档) + **行业术语库** |
| **RAG/问答** | Chroma/FAISS基础 | **优化RAG架构** + 200页+长文档分块策略 + 精确引用定位 |
| **差异对比** | pdf-diff基础 | **像素级对比** + **文本级对比**双模式 |
| **安全与DRM** | PyPDF2, pikepdf基础 | **AES-256+国密SM2/SM4** + **双层数字水印** (可见+不可见) + **DRM权限引擎** + **区块链存证** |
| **队列与异步** | 基础异步队列 | **增强任务队列** + 流式进度反馈 + 断点续传 |
| **压缩** | PyMuPDF + OpenCV基础 | **AI分层压缩引擎** (文字/图片/线框分层处理) + 目标大小迭代优化 |
| **翻译** | Cloud translation API基础 | **Cloud translation + 术语库 + 坐标映射保留** (Marker驱动) |
| **合同审查** | Legal LLM + rule engine | **Legal LLM + 扩展风险规则库 + 公司条款模板比对** |
| **发票OCR** | Specialized invoice OCR | **增强发票OCR + 税务API + 多票据类型** (火车票/机票/出租车) |
| **电子签名** | CA certificate基础 | **CA证书+国密SM2** + AI定位 + 审批引擎 + 区块链存证 |
| **批量替换** | Rule engine + regex | **增强规则引擎 + 图片哈希 + 差异预览 + 一键回滚** |
| **表单构建** | Field auto-detection基础 | **AI字段识别增强 + 计算引擎 + 条件逻辑 + 飞书数据汇总** |
| **图纸测量** | Scale auto-detection基础 | **AI比例尺识别 + 多维度测量 + 批量测量导出** |
| **翻页电子书** | HTML5 Canvas基础 | **HTML5 Canvas 60fps + 富媒体嵌入 + 离线包 + 自定义域名** |
| **印刷导出** | CMYK基础转换 | **ICC配置管理 + PDF/X验证 + 预检报告 + 手机EPUB导出** |
| **永久删除** | Content stream removal | **三阶验证删除 + AI图像修复inpainting + 法律级删除证书** |
| **★扫描增强** (新增) | — | **U2-Net + DocUNet + inpainting + 超分** |
| **★书签生成** (新增) | — | **Marker/Docling章节识别 + 层级目录 + 页码校正** |
| **★无障碍** (新增) | — | **标签树生成 + Alt文本 + WCAG 2.1 AA验证** |
| **★手写识别** (新增) | — | **PaddleOCR手写增强 + 多模态LLM + 结构化整理** |
| **★PDF/A归档** (新增) | — | **ISO 19005转换 + 字体嵌入修复 + 合规验证报告** |
| **★多文档拆解** (2.1新增) | — | **AI内容感知拆分 + 命名规则 + 类别路由** |
| **★PDF转CAD** (2.1新增) | — | **线型识别 + 图层提取 + 尺寸语义识别 + 图框解析** |
| **★跨软件兼容** (2.1新增) | — | **多源批注聚合 + 兼容性检测 + 通用格式输出** |
---
## Progress Feedback(精细化进度)
长操作发送实时精细化进度:
- "📄 正在解析文档结构(Docling引擎)第 12/45 页…"
- "🔍 检测到扫描页面,启动AI画质增强→去阴影→展平…第 5/20 页"
- "🧠 OCR识别中(印刷体97%精度),预计还需 30 秒…"
- "📊 表格结构重建完成,共识别 8 个表格(含2个跨页嵌套表)…"
- "🖨️ 印刷预检中→色彩空间✓ 字体嵌入✓ 图片分辨率⚠️3张低于300dpi已预警…"
- "🔒 DRM保护生成中→加密✓ 双层水印✓ 区块链存证✓ 权限设置✓"
- "✅ 处理完成!质量评分:排版保真98.2% | 表格对齐99.1% | 字体匹配94.5%"
- "批量替换进度:185/200 完成 | 5个需确认 | 10个失败已单独列出"
- "PDF/A归档转换:字体嵌入修复3处 | 色彩空间转换✓ | 合规验证通过"
---
## Constraints(2.1升级限制)
| 限制项 | 1.3版本 | **2.0版本** | **2.1版本** |
|--------|---------|-------------|-------------|
| 单文件大小 | 100MB | **200MB**(大文件自动分块) | **200MB**(保留) |
| 单次页数 | 200页 | **500页**(长文档优化处理) | **500页**(保留) |
| OCR批量页数 | ≤50页 | **≤100页** | **≤100页**(保留) |
| 并发任务 | ≤3 | **≤5** | **≤5**(保留) |
| 单次任务超时 | 5分钟 | **10分钟**(复杂任务如翻译/增强自动延长) | **10分钟**(保留) |
| 敏感文档处理 | local 27B | **local 27B + 本地OCR**(不上云) | **local 27B + 本地OCR**(保留) |
| 批量替换 | 500文件 | **500文件**(保留) | **500文件**(保留) |
| 永久删除 | 200文件 | **200文件**(保留) | **200文件**(保留) |
| 扫描增强 | — | **≤50页/批次** | **≤50页/批次**(保留) |
| 手写识别 | — | **≤20页/批次**(手写计算量大) | **≤20页/批次**(保留) |
| PDF/A归档 | — | **≤100文件/批次** | **≤100文件/批次**(保留) |
| 无障碍标签 | — | **≤200页/任务** | **≤200页/任务**(保留) |
| 新增-多文档拆解 | — | — | **≤200页混合包/任务** |
| 新增-PDF转CAD | — | — | **≤50页图纸/任务** |
| 新增-跨软件兼容 | — | — | **≤500页/任务** |
---
## Resources
- **Command reference**: See `references/command-guide-v2.md`(2.0新增指令手册)
- **Implementation details**: See `references/tech-spec-v2.md`(2.0技术架构详细说明)
- **Feishu integration**: See `references/feishu-setup-v2.md`(2.0飞书集成增强配置)
- **OCR configuration**: See `references/ocr-config-v2.md`(2.0包含扫描增强和手写识别配置)
- **Accessibility guide**: See `references/accessibility-setup.md`(新增-无障碍配置指南)
- **PDF/A archival guide**: See `references/pdfa-archival-guide.md`(新增-归档转换操作手册)
- **Agent config**: See `config/pdf-master-agent-v2.md`(2.0完整Agent训练文件含30项能力Few-Shot示例)
- **Quality benchmarks**: See `references/quality-benchmarks.md`(2.0新增-各项能力质量基准指标)
---
## 版本演进记录
| 版本 | 能力数 | 关键升级 |
|------|--------|---------|
| 1.0 | 基础 | 核心功能上线 |
| 1.3 | 25项 | 五大核心+四大扩展+七大壁垒+九大增值 |
| **2.1** | **33项** | **3项新增能力(多文档智能拆解/PDF→CAD/跨软件协作兼容)+5项深度优化(多模态RAG/专业OCR模板/字体智能匹配/视觉比对审核/自动化审计)+2项微能力(团队密码托管/批量合同比对)** |
| 2.0 | 30项 | 技术栈升级(Docling/Marker/OpenParse)+精细度革命+五大新增能力(扫描增强/书签生成/无障碍/手写识别/PDF/A归档) |
don't have the plugin yet? install it then click "run inline in claude" again.