Claude Code Skill · SkillHub 验证 · v1.0.1

文档查重检测BOO-CHECK-REVIEW

段落级重复检测 + 文档元数据取证。检测 docx/doc 文件中重复段落,提取作者/编辑人/创建日期等元数据,生成含摘要页的查重报告。

CLAUDE CODE · 对话演示
YOU检查这个技术标有没有重复段落
CLAUDE加载 boo-check-review,启动文档查重…
SKILL段落重复检测 + 元数据提取
CLAUDE查重完成。检出 7 处重复段落(相似度 > 80%),文档作者:张三,最后编辑人:李四,修改时间:2025-06-15。
六大核心能力
🔎

段落重复检测

逐段比对文档内重复内容,基于语义相似度算法,支持自定义相似度阈值。

📋

元数据提取

自动提取作者、编辑人、创建日期、修改日期、版本号等文档属性信息。

📊

查重报告生成

含摘要页的完整查重报告,清晰展示重复段落位置、相似度和原文对照。

📄

双格式支持

同时支持 .docx 和 .doc 格式文档,自动识别并选择最优解析策略。

👤

编辑人分析

深度分析文档编辑历史,识别所有编辑人员及其修改时间线。

📈

重复率统计

总体重复率、各章节重复率分布、重复类型分类汇总等多维度统计。

四阶段查重流程
01

文档解析

段落提取
文本清洗
结构索引构建

02

相似度计算

段落指纹生成
语义相似度比对
重复对识别

03

元数据提取

文档属性读取
编辑人解析
时间线重建

04

报告生成

重复段落列表
摘要统计页
可视化对比

查重核心指标
多维度量化文档内部重复情况。
#指标说明
01总体重复率存在重复的段落数 / 总段落数,反映文档整体重复程度
02高度重复段落相似度 ≥ 90% 的段落对,几乎完全相同的内容
03中度重复段落相似度 70%-90% 的段落对,可能为模板化改写
04跨章重复分布各章节内重复率和跨章节重复分布热力图
05重复类型分类完全照搬/微调改写/结构重复等分类统计
06编辑人信息作者/最后编辑人/创建时间/修改历史等完整元数据
使用建议
场景建议
标书自检送审前对技术标做一次全面查重,避免因重复雷同导致废标
多人协作文档检测不同章节之间是否存在模板化重复粘贴
文档来源追溯通过编辑人信息了解文档编辑历史和主要贡献者
多文档对比同时加载多个文档,检测跨文档的重复内容
阈值调节根据审查严格程度调整相似度阈值(默认 80%)
配合审查使用查重结果可输入 boo-bid-review 作为审查参考维度

开始使用文档查重检测

在 Claude Code 中输入 /boo-check-review 或直接说「检查这个文档有没有重复」。
支持 .docx 和 .doc 双格式。