通用文字识别
业务场景描述
通用文字识别能够识别常见文档上的文字内容。比如:
- 识别合同、法律文书、红头文件等非结构化长文本文档,将识别后的文字直接归档。或识别后,使用定制化AI能力信息抽取将识别后的长文本结构化。
- 识别送货单、海外发票、保单等半结构化单据,然后使用定制化AI能力自定义模板,基于位置和文本信息对单据进行结构化。
使用通用文字识别将线下数据转化为线上数据,能够将工作人员从重复机械的打字工作中解脱出来,投入到更多的高杠杆的工作当中。
特点
通用文字识别具有以下几个特点:
- 多语言:支持中文(繁简)、英语、日语、韩语、法语、德语、葡萄牙语、意大利语、西班牙语、荷兰语等50多种常见语言。
- 复杂场景:能够处理旋转、遮挡、倾斜、密集文字、复杂背景、光照不均、抖动模糊、手写等复杂场景。
- 多种格式:支持jpeg, jpg, png, pdf, bmp, tiff格式等文档。
- 高准确率:印刷体识别准确率可达99%。
使用方法
视频版
RPA示例代码
下载示例代码压缩包:通用文字识别
文字版
1)登录Mage平台,点击通用文字识别菜单。
2)新建一个通用文字识别模型
3)点击右上角测试器,进入测试页面
4)上传一篇文档,点击开始测试,获取识别结果