跳到主要内容
版本:latest

什么是智能文档处理平台?

这是公有云环境最新版产品手册-当前对应 GPU IDP V3.24 Cloud

总体介绍

对RPA机器人来说,如果说AI是它的大脑,认知能力是它的眼睛、嘴、耳朵,RPA是它的双手。结合了AI能力,RPA从只能帮助基于规则的、机械性、重复性的任务实现自动化,拓展到了更丰富的业务场景,将物理世界与数字世界有效连接,满足实际业务中更灵活、多元的自动化需求。而企业采用具备AI能力的RPA平台,可以快速、经济、灵活地将AI技术应用到业务中。

intro1

在UiBot产品矩阵中,Creator用于生产机器人,Worker用于执行机器人,Commander用于管理机器人。来也智能文档处理平台作为面向RPA的AI平台,提供了丰富的图片理解、文本理解的AI能力,赋能机器人生产和执行过程。

intro2

来也智能文档处理平台的优势

  • 提供丰富的预训练的AI模型。 使用者无需AI经验,开箱即用。
  • 提供强大的定制化的AI能力。 使用者可以在自己的数据集上,通过无代码的方式,标注、训练、测评、优化AI模型,使模型能够理解专业领域的文档。
  • 通过预置件和Creator无缝集成。 通过拖拽即可让机器人具备AI能力,帮助企业快速落地RPA+AI。
  • 支持公有云、私有部署以及混合部署方式。 私有部署支持国产化适配,保证数据的私密性。
  • 适用于财务、人力、法务、IT运维、电网、运营商、营销、客服等各行各业,形成端到端的智能自动化解决方案。

AI能力简介

平台上的AI能力,可以从不同角度理解。

  1. 从定制化程度看,AI能力可以分为通用AI能力和定制化AI能力两类。
    • 预训练AI能力提供了开箱即用的AI模型,能够处理通用文档、表格等非结构化数据,以及身份证、营业执照、增值税发票、火车票识别等结构化数据。
    • 定制化AI能力,需要上传自己的数据,通过标注、训练、测评、优化AI模型,使模型能够理解专业领域的文档。
  2. 从处理的数据类型上看,AI能力可以分为图片理解、文本理解。
  3. 此外,平台有综合性的AI能力,提供文档的端到端解决方案,利用平台上已有的OCR、NLP原子能力以及深度学习模型,能够协助机器人理解文档,提取文档中的关键信息。

下表列出了平台上所有的AI能力,描述了每种能力的分类和用途。

定制化程度数据类型能力用途
预训练AI能力图片理解金融贸易单据识别实现金融贸易单据的内容识别和关键信息自动提取。
通用文字识别识别文档中的所有文字。
通用表格识别识别文档中的表外文字和表内文字,并按照单元格的排列顺序,输出表格内容。
通用多票据识别识别普通发票、专用发票、电子发票、销货清单、卷式发票、出租车票、火车票、动车票、飞机行程单、定额发票、购车发票等全票种发票,并返回核心字段值。
通用卡证识别识别银行卡、身份证、社保卡、驾驶证、行驶证、户口本、护照、结婚证、房产证、不动产证、营业执照、开户许可证、组织机构代码证、车辆合格证、车辆登记证、基本存款账户信息,并返回核心字段值。
验证码识别识别包括且不限于英文数字组合、四则运算、滑块等多种类型验证码。
印章识别判断印章是否存在,并返回识别印章的位置、颜色。
版面分析检测和分析图片中的内容,将文档分割成不同的版面区域,并返回每个区域的类型、位置、内容、以及置信度。
二维码码识别检测并识别图像中的二维码,返回内容包括二维码的位置和二维码中的内容
发票验真判断接收到的发票的真实性
文本理解文档抽取提取文档中的关键信息并返回。
标准地址提取地址中的省、市、区、街道信息并返回。
定制化AI能力图片理解自定义模版上传一组版面样式相对固定的文档,通过配置规则的方式,依赖位置关系抽取到业务需要的字段值。
文本理解信息抽取上传一组文本内容相对固定的文本文件,通过配置规则或训练模型的方式,依赖上下文语义信息抽取到业务需要的字段值。
文本分类创建分类并上传每个分类的相似说法,自动生成AI模型。输入新的文本可以返回匹配到的分类和置信度。
文档理解分类文档分类通过标注少量数据即可训练出一个文档分类模型,可以对文档进行分类推荐。适用于对整个文档进行分类,也支持对文档的每一页进行分类推荐。
抽取自训练抽取通过标注数据即可训练出一个文档抽取模型,用于对文档进行关键信息自动提取。
比对文档比对比对电子版合同和实际签署纸质合同扫描件,快速定位差异,提升法务人员工作效率。