跳到主要内容

版本：V3.16

通用文字识别

业务场景描述

通用文字识别能够识别常见文档上的文字内容。比如：

识别合同、法律文书、红头文件等非结构化长文本文档，将识别后的文字直接归档。或识别后，使用定制化AI能力信息抽取将识别后的长文本结构化。
识别送货单、海外发票、保单等半结构化单据，然后使用定制化AI能力自定义模板，基于位置和文本信息对单据进行结构化。

使用通用文字识别将线下数据转化为线上数据，能够将工作人员从重复机械的打字工作中解脱出来，投入到更多的高杠杆的工作当中。

特点

通用文字识别具有以下几个特点：

多语言：支持中文（繁简）、英语、日语、韩语、法语、德语、葡萄牙语、意大利语、西班牙语、荷兰语等50多种常见语言。
复杂场景：能够处理旋转、遮挡、倾斜、密集文字、复杂背景、光照不均、抖动模糊、手写等复杂场景。
多种格式：支持jpeg, jpg, png, pdf, bmp, tiff格式等文档。
高准确率：印刷体识别准确率可达99%。

使用方法

视频版

RPA示例代码

下载示例代码压缩包：通用文字识别

文字版

1）登录Mage平台，点击通用文字识别菜单。 c5vKYe

2）新建一个通用文字识别模型 6VOB7w

3）点击右上角测试器，进入测试页面 vrYYWQ

4）上传一篇文档，点击开始测试，获取识别结果 uYh8gC

业务场景描述
特点
使用方法