使用说明
让我们按照指导试一试!
使用引导
1. 配置抽取模型
在来也智能文档处理平台的自训练抽取AI能力下完成抽取模型的配置,并测试效果是否符合预期。
具体操作流程见如何配置一个自训练抽取模型
2. 配置协同组
- 点击【管理中心】目录的 协同组管理,可管理协同组或协同组内成员
- 添加成员至协同组前,请先确保该用户与您属于同一组织下的成员,并已给该用户开通了【任务处理】模块的操作权限,否则该用户接收到协同任务后也无法进入平台进行处理
3. 配置协同规则
基础信息:点击【管理中心】目录的 协同规则管理,打开【新建协同规则】弹窗,完成基础信息的填写
选择协同组:协同组内成员才可接收、处理基于此协同规则生成的协同任务,其他人员无法查看
字段配置:选择拥有上线版本的模型,勾选需要提取的字段;支持勾选 基础字段 ,或灵活添加 智能字段 、 自定义字段,同时可将重点字段标记出来
基础字段:已选模型内已有字段
智能字段:基于大语言模型,根据字段名称和描述抽取文档信息
自定义字段:定义模型抽取结果之外的字段,满足特定的业务需求
设置重点字段:点击字段后的星星标记,设为重点字段,可以在任务处理筛选查看
规则设置:选择启用规则设置,可以对当前协同规则增加个性化要求;支持基础审核、智能审核、字段空值设置
基础审核:开启时,系统将满足条件的供人工处理,仅支持选择基础字段;关闭时,系统将全部协同任务供人工处理
智能审核:基于大语言模型,用自然语言设定审核的目标和预期,任何一条审核规则未通过都将请业务人员复核,仅支持选择智能字段
字段空值设置:支持在协同表单中按业务需求配置任务初始状态,满足多种业务需求
- 字段值识别为空时,默认设定为已标注状态,允许提交
- 字段值识别为空时,默认设定为未标注状态,不允许提交
- 测试协同规则
- 选择刚配置好的协同规则,点击操作中的 测试,打开新建协同规则任务弹窗
- 上传文档后,提交协同任务,并前往 任务处理 查看是否成功生成了协同任务
- 接受并处理协同任务
4. 处理协同任务
- 选择一个待处理的协同任务,打开任务处理界面,左边为数据文件视图,右边为提取的关键信息
- 业务人员可以在这个界面对信息提取结果进行审核和修改
- 单击提取的值 -> 左侧图片数据对应位置高亮展示
- 双击提取的值 -> 进入编辑状态
- 点击左侧文档-框选值hover的“删除标注” 或点击右侧-提取的值的“删除”按钮,都可以清除提取出的关键信息
- 所有字段审核完成,点击提交,任务处理完成
任务处理界面
- 左边为数据文件视图,右边为提取的关键信息,竖列排布
任务处理界面(带结构化展示)
- 模型上线版本选用 单据自训练 的训练方式,且模型含有【整组】、【line_extract】、【组合】字段时,任务处理界面将结构化展示所提取的【整组】、【line_extract】、【组合】字段中的信息
5. 通过API发起协同任务并获取处理结果
- 由于协同任务的处理需要人工介入,处理时间不确定性大,所以我们提供了异步的 2 个接口 - 发起任务和获取结果,支持灵活配置业务流程
- 选择对应的协同表单,点击操作中的API,获取API调用凭证
- 根据 接口文档 进行API调用
- 通过创建协同任务接口发起协同任务,通过查询协同任务结果接口来获取文档的最终提取结果
6.获取业务数据提升模型效果
- IDP自训练抽取界面支持获取人机协同平台上同AI能力下,已处理的数据来优化模型。
特定场景用法
1. 希望定义 IDP抽取模型结果之外的字段
适用客户场景举例:
- A 场景:业务需求抽取《商品进货单据》,票据中已可抽取 “商品名称” 等信息,但对于这些商品的品质业务上有自己的分级体系(原票据中不含此信息,先前业务流采用人工分辨的方式、在单据上手写标记)
- 解决方案:额外创建 商品等级 自定义字段,通过 OpenAPI 为 商品等级 字段添加 “一级货”“二级货”“三级货” 等备选值范围,业务人员即可在任务处理页面通过下拉框快速选值
- B 场景:业务需求抽取《采购PO单据》,希望将其信息与企业ERP系统中的《生产MO单据》结合,连结货物上下游信息(生产原因->生产号)
- 解决方案:额外创建 生产MO号 自定义字段,导出企业ERP系统(或其他内部系统)中的生产MO单号产品数据,通过 OpenAPI 将这些数据信息配置为 生产MO号 字段的备选值范围,业务人员即可模糊搜索选项内容、为采购PO单据快速标注业务下游对应的生产信息
- A 场景:业务需求抽取《商品进货单据》,票据中已可抽取 “商品名称” 等信息,但对于这些商品的品质业务上有自己的分级体系(原票据中不含此信息,先前业务流采用人工分辨的方式、在单据上手写标记)
限制说明:
- 限制自定义字段为 "字符串" 类型,后处理为 "不处理"
- 自定义字段值的默认输入方式为 "手动输入"
- 如需为字段配置“下拉列表输入字段值”的方式,请通过人机OpenAPI实现
规则配置页面 :
任务处理页面:
2. 希望修改 IDP抽取模型结果中的值(如:联动RPA实现抽取结果的批量“后处理”)
通过 OpenAPI-更新协同任务 来实现
适用客户场景举例:
- A 场景:客户需求抽取多页的货物运输单据,其中每页都有货物的 “金额” “日期” “数量” 等信息,但业务部门面对单据中的这些数字有较复杂的换算逻辑、以测算出的货物运输风险程度。
- 解决方案:通过人机协同额外创建自定义风险值字段、初始值即为空,通过OpenAPI-查询协同任务结果 获取 IDP 模型抽出的-单据中每页的 “金额” “日期” “数量” 等信息数据、并通过第三方完成换算 ,最终运用OpenAPI-更新协同任务将计算出的数值更新至 风险值 字段中。
- B 场景:客户对于 IDP 模型的抽取结果,有较复杂的后处理逻辑而无法通过产品预置的后处理或正则表达式等满足业务场景。因此决定通过 RPA 等三方方式作更复杂的后处理。
- 解决方案:通过OpenAPI-查询协同任务结果 获取 IDP 模型的抽取结果,通过 RPA 等三方方式完成后处理后,运用OpenAPI-更新协同任务将最终数据批量刷新至对应字段中。
- A 场景:客户需求抽取多页的货物运输单据,其中每页都有货物的 “金额” “日期” “数量” 等信息,但业务部门面对单据中的这些数字有较复杂的换算逻辑、以测算出的货物运输风险程度。
3. 希望在人机协同中心,看到结构化样式的抽取结果
适用客户场景举例:
- 抽取结构化、半结构化文档/单据时,业务需求在人工校对时看到与纸质单据一致的表格样式,以此提高用户核对效率和使用体验、降低校对风险
使用说明:
- 触发条件(需同时达成abc三点):
- 模型的训练方式为 单据自训练
- 训练模型中带有 整组 、line_extract 、组合 字段(将结构化的、行维度的展示该 整组 、line_extract 、组合 字段中所涵盖的字段名和字段值信息,并支持灵活的编辑操作)
- 配置协同规则 - 提取字段 时,勾选 整组 、line_extract 、组合 字段
- 触发条件(需同时达成abc三点):
适配 OpenAPI:
- 可通过 OpenAPI-创建协同任务 接口,创建带有结构化展示的任务,触发条件&触发效果与功能页面直接配置的一致
- 可通过 OpenAPI-查询协同任务结果 接口,从已提交的协同任务结果中获得结构化信息的位置关系,从而在平台外实现表格信息的自由拼装
4. 希望定义智能字段,自动抽取IDP抽取模型结果之外的字段
功能说明: 使用大语言模型对人机协同中心进行功能增强,补齐 IDP 产品金融贸易单据和自训练抽取中的业务空白,实现用户添加字段描述后,自动提取内容,帮助用户定制化需求快速上线。支持新建"智能字段",并添加有意义的字段名称,和除字段名称外的其他附加信息(非必须),如输出格式,业务逻辑描述,实现基于大语言模型的智能提取。
限制说明:
- 限制智能字段个数限定为10个
- 多页pdf文件会截取前100页内容识别并抽取内容
- 限制智能字段为 "字符串" 类型
规则配置页面 :
5. 希望用自然语言定义审核条件,获得智能审核建议
基于大语言模型的智能审核助手,使用自然语言对智能字段设定审核的目标和预期
如果未通过智能审核,将在任务处理页面提供更详细的修改建议
在描述审核目标时,需用明确、无歧义、具体的表述,若输出效果不佳,可以尝试举例说明,以下列举了正确与错误描述:
- ✅ 正确的描述
- 合同中提取的总金额格式符合数字大写要求,包含“人民币”字样,以“元整”结尾
- 签订日期不能晚于验收日期
- 签订日期格式为:YYYY-MM-DD
- 争端解决所在地为甲方所在地 - ❌ 错误的描述
- 合同中提取的总金额格式要求合规
- 签订日期和验收日期是否合理
- 签订日期格式要求合理
- 争端解决所在地是否为甲方
- ✅ 正确的描述