AI 驱动的 Word 文档图片提取技能。在 Claude Code 或 WorkBuddy 中说出需求,技能自动加载 — 解析文档、理解上下文、智能命名、一键输出。569 张技术标实测:100% 标题检测,99.8% 语义命中。
在终端中用自然语言发起请求,技能自动加载执行。
在 WorkBuddy 中通过对话调用技能,实时看到每一步执行结果。
确认文档路径
确认输出目录
选择命名模式
styles.xml 标题层级
段落上下文采集
图片关系映射
题注匹配
主题短语提取
碎片检测挽救
PNG 格式转换
按文档分目录
呈现命名清单
| 优先级 | 策略 | 上下文示例 | 最终命名 |
|---|---|---|---|
| P1 | 题注匹配 | 段落包含"图2-1 施工现场平面布置图" | 施工现场平面布置图 |
| P2 | 图表标题 | 上段文字为"附表五:施工总平面图" | 施工总平面图 |
| P3 | 标题 + 主题 | 最近标题"基础施工部署",内容谈土方开挖 | 基础施工部署-土方开挖 |
| P4 | 上下文主题提取 | "…气膜全密闭部署,气膜覆盖基坑…" | 气膜全密闭施工部署 |
| P5 | 词频分析 | "…钢筋加工场…钢筋原材料堆放区…" | 钢筋加工上部结构 |
| P6 | pic-XXX 兜底 | logo / 分隔符 / 无任何上下文 | pic-357 |
| 输出文件/目录 | 说明 | 示例 |
|---|---|---|
| 文档名/ | 按文档分目录存放命名后的图片 | 济南总承包技术标/ |
| *.png | 统一 PNG 格式输出的图片 | 基础施工部署-土方开挖.png |
| _naming_context.json | 语义上下文数据文件 | 供 LLM 模式或复查使用 |
| _semantic_names.json | 命名映射文件 | old_name → new_name |
.docx 零依赖原生解析,.doc 自动调用 LibreOffice 转换。缺失工具时自动提示安装命令。
解析 styles.xml 的 outlineLvl,支持 Heading / BT / 数字ID / 中文样式名全类型标题样式。
去编号前缀(4)/(1)/ 第X章)、句子碎片挽救、箭头符号转换、标点清理、重名加数字后缀。
自动转换为 PNG 格式。Pillow 缺失时保留原始格式并给出提示,不影响提取流程。
多文档批量处理时自动按文档名分文件夹,输出结构清晰不混淆。
损坏图片跳过并警告,工具缺失优雅降级,临时文件自动清理,不残留中间产物。
| 场景 | 建议 |
|---|---|
| 日常批量提取 | 直接说「提取图片」,技能默认用语义模式,又快又好 |
| 关键文档精细处理 | 说「用 LLM 模式提取图片」,Claude 会逐张理解上下文命名 |
| 多文档同时处理 | 一次说多个文件路径,技能自动批量处理 |
| 命名不满意 | 说「把第 X 张图改名为 YYY」,技能直接重命名文件 |
| 查看上下文依据 | 说「看看图片命名的依据」,可查看 _naming_context.json |
| .doc 旧格式 | 确保安装了 LibreOffice,否则技能会提示安装命令 |
| 非 PNG 输出 | 安装 Pillow:说「帮我安装 Pillow」或运行 pip install Pillow |