什么是智能文档处理平台?
这是公有云环境最新版产品手册-当前对应 GPU IDP V3.25 Cloud
总体介绍
对RPA机器人来说,如果说AI是它的大脑,认知能力是它的眼睛、嘴、耳朵,RPA是它的双手。结合了AI能力,RPA从只能帮助基于规则的、机械性、重复性的任务实现自动化,拓展到了更丰富的业务场景,将物理世界与数字世界有效连接,满足实际业务中更灵活、多元的自动化需求。而企业采用具备AI能力的RPA平台,可以快速、经济、灵活地将AI技术应用到业务中。
在UiBot产品矩阵中,Creator用于生产机器人,Worker用于执行机器人,Commander用于管理机器人。来也智能文档处理平台作为面向RPA的AI平台,提供了丰富的图片理解、文本理解的AI能力,赋能机器人生产和执行过程。
来也智能文档处理平台的优势
- 提供丰富的预训练的AI模型。 使用者无需AI经验,开箱即用。
- 提供强大的定制化的AI能力。 使用者可以在自己的数据集上,通过无代码的方式,标注、训练、测评、优化AI模型,使模型能够理解专业领域的文档。
- 通过预置件和Creator无缝集成。 通过拖拽即可让机器人具备AI能力,帮助企业快速落地RPA+AI。
- 支持公有云、私有部署以及混合部署方式。 私有部署支持国产化适配,保证数据的私密性。
- 适用于财务、人力、法务、IT运维、电网、运营商、营销、客服等各行各业,形成端到端的智能自动化解决方案。
AI能力简介
平台上的AI能力,可以从不同角度理解。
- 从定制化程度看,AI能力可以分为通用AI能力和定制化AI能力两类。
- 预训练AI能力提供了开箱即用的AI模型,能够处理通用文档、表格等非结构化数据,以及身份证、营业执照、增值税发票、火车票识别等结构化数据。
- 定制化AI能力,需要上传自己的数据,通过标注、训练、测评、优化AI模型,使模型能够理解专业领域的文档。
- 从处理的数据类型上看,AI能力可以分为图片理解、文本理解。
- 此外,平台有综合性的AI能力,提供文档的端到端解决方案,利用平台上已有的OCR、NLP原子能力以及深度学习模型,能够协助机器人理解文档,提取文档中的关键信息。
下表列出了平台上所有的AI能力,描述了每种能力的分类和用途。
定制化程度 | 数据类型 | 能力 | 用途 |
预训练AI能力 | 图片理解 | 金融贸易单据识别 | 实现金融贸易单据的内容识别和关键信息自动提取。 |
通用文字识别 | 识别文档中的所有文字。 | ||
通用表格识别 | 识别文档中的表外文字和表内文字,并按照单元格的排列顺序,输出表格内容。 | ||
通用多票据识别 | 识别普通发票、专用发票、电子发票、销货清单、卷式发票、出租车票、火车票、动车票、飞机行程单、定额发票、购车发票等全票种发票,并返回核心字段值。 | ||
通用卡证识别 | 识别银行卡、身份证、社保卡、驾驶证、行驶证、户口本、护照、结婚证、房产证、不动产证、营业执照、开户许可证、组织机构代码证、车辆合格证、车辆登记证、基本存款账户信息,并返回核心字段值。 | ||
验证码识别 | 识别包括且不限于英文数字组合、四则运算、滑块等多种类型验证码。 | ||
印章识别 | 判断印章是否存在,并返回识别印章的位置、颜色。 | ||
版面分析 | 检测和分析图片中的内容,将文档分割成不同的版面区域,并返回每个区域的类型、位置、内容、以及置信度。 | ||
二维码码识别 | 检测并识别图像中的二维码,返回内容包括二维码的位置和二维码中的内容 | ||
发票验真 | 判断接收到的发票的真实性 | ||
文本理解 | 文档抽取 | 提取文档中的关键信息并返回。 | |
标准地址 | 提取地址中的省、市、区、街道信息并返回。 | ||
定制化AI能力 | 图片理解 | 自定义模版 | 上传一组版面样式相对固定的文档,通过配置规则的方式,依赖位置关系抽取到业务需要的字段值。 |
文本理解 | 信息抽取 | 上传一组文本内容相对固定的文本文件,通过配置规则或训练模型的方式,依赖上下文语义信息抽取到业务需要的字段值。 | |
文本分类 | 创建分类并上传每个分类的相似说法,自动生成AI模型。输入新的文本可以返回匹配到的分类和置信度。 | ||
文档理解 | 分类 | 文档分类 | 通过标注少量数据即可训练出一个文档分类模型,可以对文档进行分类推荐。适用于对整个文档进行分类,也支持对文档的每一页进行分类推荐。 |
抽取 | 自训练抽取 | 通过标注数据即可训练出一个文档抽取模型,用于对文档进行关键信息自动提取。 | |
比对 | 文档比对 | 比对电子版合同和实际签署纸质合同扫描件,快速定位差异,提升法务人员工作效率。 |