跳到主要内容
版本:latest

通用文字识别

业务场景描述

通用文字识别能够识别常见文档上的文字内容。比如:

  • 识别合同、法律文书、红头文件等非结构化长文本文档,将识别后的文字直接归档。或识别后,使用定制化AI能力信息抽取将识别后的长文本结构化。
  • 识别送货单、海外发票、保单等半结构化单据,然后使用定制化AI能力自定义模板,基于位置和文本信息对单据进行结构化。

使用通用文字识别将线下数据转化为线上数据,能够将工作人员从重复机械的打字工作中解脱出来,投入到更多的高杠杆的工作当中。

特点

通用文字识别具有以下几个特点:

  • 多语言:支持中文(繁简)、英语、日语、韩语、法语、德语、葡萄牙语、意大利语、西班牙语、荷兰语等50多种常见语言。
  • 复杂场景:能够处理旋转、遮挡、倾斜、密集文字、复杂背景、光照不均、抖动模糊、手写等复杂场景。
  • 多种格式:支持jpeg, jpg, png, pdf, bmp, tiff格式等文档。
  • 高准确率:印刷体识别准确率可达99%。

使用方法

视频版

RPA示例代码

下载示例代码压缩包:通用文字识别

文字版

1)登录Mage平台,点击通用文字识别菜单。 c5vKYe

2)新建一个通用文字识别模型 6VOB7w

3)点击右上角测试器,进入测试页面 vrYYWQ

4)上传一篇文档,点击开始测试,获取识别结果 uYh8gC