跳到主要内容
版本:V2.8

文档比对

业务场景描述

合同审核是一个公司防范风险的关键工作,尤其在风控要求高的企事业单位,如信托、基金、证券等行业,合同的审查要求非常严格,一旦审核出现疏漏,损失难以估量。

一般合同签订的流程为:

  1. 甲、乙方线上确认电子版合同。
  2. 乙方打印电子合同,盖章后寄出。
  3. 甲方收到纸质合同后,先与电子版合同进行比对,确认内容条款未发生变化,盖章寄回乙方一份。
  4. 乙方收到纸质合同后,与电子版合同进行再次确认后,进行归档。

在流程中很重要的一步就是合同比对。传统的合同比对需要法务人员逐字逐句比对,不仅效率低下,而且导致法务人员大部分精力耗费在非专业问题上。由于业务素养、体力、精神状态等因素的影响,审核难以确保绝对不出错。

文档比对AI能力可用于法务部门合同审核场景,协助人工审核合同条款,快速定位合同是否被恶意篡改,提升法务人员工作效率。

特点

  • 多种文档:pdf、doc/docx、图片(jpeg、jpg、png、bmp、tiff)。
  • 全文比对:支持不同页数的文档进行内容比对。
  • 操作简单:通过不同颜色的标注文档的变化,支持结果快速定位,点击差异可快速定位差异发生位置。
  • 智能干预:提供智能干预模型,根据语义信息合并差异、去除空格等冗余信息,还提供忽略标点符号设置供用户自行选择。

概念介绍

我们把一次文档的比对称之为一个比对任务参考文档是比对任务中用来作为参照物的文档,比对文档是比对任务中需要寻找差异的文档。

差异/diff是比对文档的内容相对于参考文档的内容发生的变化。 我们将差异归纳为三类:

  • 新增:基于参考文档内容,比对文档中新增的内容。
  • 删除:基于参考文档内容,比对文档中删除的内容。
  • 修改:基于参考文档内容,比对文档中发生修改的内容。

使用方法

新建模型

1 登录平台后从以下路径 文档理解/文档比对 进入该AI能力页面

2 点击新建模型按钮,输入模型名称,选择OCR引擎版本,提交确认

模型设置

1 点击已创建模型的设置按钮,进入模型配置页面

2 配置是否忽略标点符号,勾选后点击保存后配置生效

  • 忽略标点符号指的是当差异内容全部为标点符号忽略本条差异。
  • 如果差异内容中含有其他可读字符,则不属于标点符号类差异。
  • 系统将仅在每次比对完成后,对结果执行干预。

比对测试

1 选中已创建的模型,点击测试

docDiff1

2 上传参考文档和比对文档,点击开始比对

注意:当比对文件页数过多时,请耐心等待,页面上会实时展示比对进度。

docDiff2

可视化结果展示

可视化结果将展示以下信息:

  • 整体比对结果
    • 2份文档存在差异的页码
    • 比对发现的差异总数(不包含已忽略差异总数)
    • 已忽略差异总数
  • 详细比对结果
    • 现存差异
      • 以差异为单位展示2份文档的所有差异
      • 不同颜色代表差异的不同类型,红色代表删除、橙色代表修改、绿色代表新增
      • 点击差异内容,2份文档会同时定位到差异发生的位置,并高亮差异内容
    • 已忽略差异
      • 以差异为单位展示2份文档的所有已忽略差异
      • 点击差异内容,2份文档会同时定位到差异发生的位置,并高亮差异内容

docDiff3

比对任务列表

1 登录平台后从以下路径 文档理解文档比对 进入该AI能力页面

2 打开已创建的模型,进入当前模型的任务列表页面

3 所有通过新建任务API调用方式创建的比对任务都将出现在此任务列表中

docDiff4

提交一个比对任务

1 点击新建任务,打开新建比对任务弹窗

2 选取需要比对的文件

3 确认参考文档和比对文档

可以通过文档类型下的选为参考文档按钮调整参考文档。

docDiff5

查看比对任务结果

1 点击任务列表的操作项详情,查看当前比对任务的比对结果

2 比对结果的可视化内容与测试器相同

下载比对结果

1 点击任务列表的操作项更多/下载比对结果,下载当前比对任务的比对结果

2 比对结果说明

每个比对任务下载的比对结果包含3个文件:

  • 比对结果概览.txt
    • 整体比对结果说明
    • 详细比对结果(不包含已忽略的差异)
  • 参考文档
    • 带高亮标注的pdf文件
  • 比对文档
    • 带高亮标注的pdf文件

批量操作

1 点击任务列表页面的批量操作

docDiff6

2 选取多个比对任务

3 选择对应的批量操作

注意:当选取的某个任务不能进行对应操作时,平台将自动忽略该任务。如,批量下载多个任务时,包含了一个状态为比对中的任务,批量下载将自动跳过该任务。

docDiff7

视频演示