文档比对
业务场景描述
合同审核是一个公司防范风险的关键工作,尤其在风控要求高的企事业单位,如信托、基金、证券等行业,合同的审查要求非常严格,一旦审核出现疏漏,损失难以估量。
一般合同签订的流程为:
- 甲、乙方线上确认电子版合同。
- 乙方打印电子合同,盖章后寄出。
- 甲方收到纸质合同后,先与电子版合同进行比对,确认内容条款未发生变化,盖章寄回乙方一份。
- 乙方收到纸质合同后,与电子版合同进行再次确认后,进行归档。
在流程中很重要的一步就是合同比对。传统的合同比对需要法务人员逐字逐句比对,不仅效率低下,而且导致法务人员大部分精力耗费在非专业问题上。由于业务素养、体力、精神状态等因素的影响,审核难以确保绝对不出错。
文档比对AI能力可用于法务部门合同审核场景,协助人工审核合同条款,快速定位合同是否被恶意篡改,提升法务人员工作效率。
特点
- 多种文档:pdf、doc/docx、图片(jpeg、jpg、png、bmp、tiff)。
- 全文比对:支持不同页数的文档进行内容比对。
- 操作简单:通过不同颜色的标注文档的变化,支持结果快速定位,点击差异可快速定位差异发生位置。
- 智能干预:提供智能干预模型,根据语义信息合并差异、去除空格等冗余信息,还提供忽略标点符号设置供用户自行选择。
概念介绍
我们把一次文档的比对称之为一个比对任务,参考文档是比对任务中用来作为参照物的文档,比对文档是比对任务中需要寻找差异的文档。
差异/diff是比对文档的内容相对于参考文档的内容发生的变化。 我们将差异归纳为三类:
- 新增:基于参考文档内容,比对文档中新增的内容。
- 删除:基于参考文档内容,比对文档中删除的内容。
- 修改:基于参考文档内容,比对文档中发生修改的内容。
使用方法
新建模型
1 登录平台后从以下路径 文档理解/文档比对 进入该AI能力页面
2 点击新建模型按钮,输入模型名称,选择OCR引擎版本,提交确认
模型设置
1 点击已创建模型的设置按钮,进入模型配置页面
2 配置是否忽略标点符号,勾选后点击保存后配置生效
- 忽略标点符号指的是当差异内容全部为标点符号忽略本条差异。
- 如果差异内容中含有其他可读字符,则不属于标点符号类差异。
- 系统将仅在每次比对完成后,对结果执行干预。
比对测试
1 选中已创建的模型,点击测试
2 上传参考文档和比对文档,点击开始比对
注意:当比对文件页数过多时,请耐心等待,页面上会实时展示比对进度。
可视化结果展示
可视化结果将展示以下信息:
- 整体比对结果
- 2份文档存在差异的页码
- 比对发现的差异总数(不包含已忽略差异总数)
- 已忽略差异总数
- 详细比对结果
- 现存差异
- 以差异为单位展示2份文档的所有差异
- 不同颜色代表差异的不同类型,红色代表删除、橙色代表修改、绿色代表新增
- 点击差异内容,2份文档会同时定位到差异发生的位置,并高亮差异内容
- 已忽略差异
- 以差异为单位展示2份文档的所有已忽略差异
- 点击差异内容,2份文档会同时定位到差异发生的位置,并高亮差异内容
- 现存差异
比对任务列表
1 登录平台后从以下路径 文档理解文档比对 进入该AI能力页面
2 打开已创建的模型,进入当前模型的任务列表页面
3 所有通过新建任务和API调用方式创建的比对任务都将出现在此任务列表中
提交一个比对任务
1 点击新建任务,打开新建比对任务弹窗
2 选取需要比对的文件
3 确认参考文档和比对文档
可以通过文档类型下的选为参考文档按钮调整参考文档。
查看比对任务结果
1 点击任务列表的操作项详情,查看当前比对任务的比对结果
2 比对结果的可视化内容与测试器相同
下载比对结果
1 点击任务列表的操作项更多/下载比对结果,下载当前比对任务的比对结果
2 比对结果说明
每个比对任务下载的比对结果包含3个文件:
- 比对结果概览.txt
- 整体比对结果说明
- 详细比对结果(不包含已忽略的差异)
- 参考文档
- 带高亮标注的pdf文件
- 比对文档
- 带高亮标注的pdf文件
批量操作
1 点击任务列表页面的批量操作
2 选取多个比对任务
3 选择对应的批量操作
注意:当选取的某个任务不能进行对应操作时,平台将自动忽略该任务。如,批量下载多个任务时,包含了一个状态为比对中的任务,批量下载将自动跳过该任务。