通用表格识别
业务场景描述
通用表格识别能够识别文档上的文字内容,并将其中的表格提取出来。这个AI能力适合识别银行流水、年报三大表、纳税申报表,和企业内部自定义的形形色色的表格文档。
使用通用表格识别将线下数据转化为线上数据,能够将工作人员从重复机械的打字、复制粘贴工作中解脱出来,投入到更多的高杠杆的工作当中。
特点
通用表格识别具有以下几个特点:
- 文字表格混合:支持一张图片中既有文字,又有表格,可以分开输出识别结果。
- 一图多表:支持识别一张图片中的多个表格。
- 复杂场景:能够处理单元格合并、框线形变、无框表格等复杂场景。
- 多种格式:支持jpeg, jpg, png, pdf, bmp, tiff格式等文档。
使用方法
视频版
RPA示例代码
下载示例代码压缩包:通用表格识别
文字版
1)登录Mage平台,点击通用表格识别菜单。
2)新建一个通用表格识别模型
3)点击右上角测试器,进入测试页面
4)上传一篇文档,点击开始测试,获取识别结果