Claude Code Skill · WorkBuddy 可用 · v1.0.0

BooAi-images-docx图片库智能提取器

AI 驱动的 Word 文档图片提取技能。在 Claude Code 或 WorkBuddy 中说出需求,技能自动加载 — 解析文档、理解上下文、智能命名、一键输出。569 张技术标实测:100% 标题检测,99.8% 语义命中。

CLAUDE CODE · 对话演示
YOU帮我把这个技术标里的图片全部提取出来,放到 D:\图片库,文件名要简洁中文
CLAUDE
SKILL加载 BooAi-images-docx · 图片库智能提取器
CLAUDE好的,使用语义模式提取。正在解析文档结构…
TOOLextract_images.py --semantic --auto
RESULT✅ 提取完成:569 张图片 → D:\图片库\济南总承包技术标\
在 Claude Code / WorkBuddy 中使用
无需手动运行脚本。像平时对话一样说需求,技能自动触发并完成全部工作。
提取文档图片
直接说"帮我把这个文档的图片提取出来"
导出 Word 中的图片
"把 docx 里的图片导出来"
图片库整理
"整理一下这个文档的图片库"
批量提取图片
"这几个文档的图片全部提出来"
文档图片归档
"归档一下技术标的图片"
图片命名
"根据上下文给图片命名"

Claude Code

在终端中用自然语言发起请求,技能自动加载执行。

  1. 打开 Claude Code,进入项目目录
  2. 说出需求,如「把这个文档的图片提取出来,名叫 D:\图片库」
  3. 技能自动匹配并加载 BooAi-images-docx
  4. Claude 确认文档路径和输出目录
  5. 自动选择最佳命名模式,运行提取
  6. 呈现结果摘要,列出所有图片名
# 最简单的用法
> 把「技术标.docx」里的图片提取到 D:\图片库

# 带要求的用法
> 用语义模式提取「技术标.docx」和「清单.docx」的图片,文件名要简洁的中文,放到 D:\img

# 批量处理
> 把 D:\投标文件\ 下面所有 docx 的图片都提出来,按文档名分文件夹

WorkBuddy

在 WorkBuddy 中通过对话调用技能,实时看到每一步执行结果。

  1. 在 WorkBuddy 对话中上传或指定文档
  2. 说「提取这个文档的图片」
  3. WorkBuddy 调用 BooAi-images-docx 技能
  4. 技能执行提取→命名→输出三步流程
  5. 可在对话中预览提取结果和文件名
  6. 如有命名不满意,可即时要求调整
# 上传文件后对话
> 刚上传的技术标,帮我把里面所有图片提取出来

# 中途调整
> 第 3 张图的名字不太对,改成"施工总平面布置图"

# 技能自动执行重命名
> ✅ 已重命名:附表五施工总平面图.png → 施工总平面布置图.png
技能内部工作流程
当你说出"提取图片"后,技能在后台自动执行以下四阶段流程。
01

理解需求

确认文档路径
确认输出目录
选择命名模式

02

解析文档

styles.xml 标题层级
段落上下文采集
图片关系映射

03

智能命名

题注匹配
主题短语提取
碎片检测挽救

04

输出结果

PNG 格式转换
按文档分目录
呈现命名清单

三种命名模式
技能会根据你的需求自动选择合适模式。你也可以明确指定。
01
机 械
快速模式。匹配题注 + 截取标题关键词,四级降级兜底。适合大批量快速导出,对命名精度要求不高的场景。
极速良好质量默认模式
02
语 义
精准模式。解析上下文语义,内置 50+ 工程专业主题词库,碎片自动检测挽救。日常推荐使用。
快速精准质量推荐
03
LLM
深度模式。Claude 亲自阅读每张图片的上下文,理解语义后命名。质量最佳,适合关键文档的精细处理。
较慢最佳质量精细场景
命名优先级
技能从题注到兜底逐级降级,确保每张图片都有合理的中文名(≤15字)。
优先级策略上下文示例最终命名
P1题注匹配段落包含"图2-1 施工现场平面布置图"施工现场平面布置图
P2图表标题上段文字为"附表五:施工总平面图"施工总平面图
P3标题 + 主题最近标题"基础施工部署",内容谈土方开挖基础施工部署-土方开挖
P4上下文主题提取"…气膜全密闭部署,气膜覆盖基坑…"气膜全密闭施工部署
P5词频分析"…钢筋加工场…钢筋原材料堆放区…"钢筋加工上部结构
P6pic-XXX 兜底logo / 分隔符 / 无任何上下文pic-357
输出结构与命名示例
技能执行完毕后,图片按文档名分目录存放,上下文数据文件伴随输出。
100%
标题检测率
99.8%
语义命中率
89%
命名优良率
569
实测图片数
输出文件/目录说明示例
文档名/按文档分目录存放命名后的图片济南总承包技术标/
*.png统一 PNG 格式输出的图片基础施工部署-土方开挖.png
_naming_context.json语义上下文数据文件供 LLM 模式或复查使用
_semantic_names.json命名映射文件old_name → new_name
技能核心能力
所有能力通过技能自动调用,用户无需关心底层实现。
📦

双格式支持

.docx 零依赖原生解析,.doc 自动调用 LibreOffice 转换。缺失工具时自动提示安装命令。

🏷️

100% 标题识别

解析 styles.xml 的 outlineLvl,支持 Heading / BT / 数字ID / 中文样式名全类型标题样式。

🧹

自动清洗

去编号前缀(4)/(1)/ 第X章)、句子碎片挽救、箭头符号转换、标点清理、重名加数字后缀。

🖼️

PNG 统一输出

自动转换为 PNG 格式。Pillow 缺失时保留原始格式并给出提示,不影响提取流程。

📁

按文档分目录

多文档批量处理时自动按文档名分文件夹,输出结构清晰不混淆。

🛡️

容错降级

损坏图片跳过并警告,工具缺失优雅降级,临时文件自动清理,不残留中间产物。

使用建议
在日常使用中积累的最佳实践。
场景建议
日常批量提取直接说「提取图片」,技能默认用语义模式,又快又好
关键文档精细处理说「用 LLM 模式提取图片」,Claude 会逐张理解上下文命名
多文档同时处理一次说多个文件路径,技能自动批量处理
命名不满意说「把第 X 张图改名为 YYY」,技能直接重命名文件
查看上下文依据说「看看图片命名的依据」,可查看 _naming_context.json
.doc 旧格式确保安装了 LibreOffice,否则技能会提示安装命令
非 PNG 输出安装 Pillow:说「帮我安装 Pillow」或运行 pip install Pillow

开始使用 BooAi-images-docx

在 Claude Code 中直接说 提取文档图片 即可自动加载技能。
在 WorkBuddy 对话中上传文档后说需求,技能同样会自动触发。