跳到主要内容

获取全部文本

命令说明

获取通用文字识别结果中的全部文本

命令原型

sRet = Mage.ExtractAllText(jsonRet,include_enter)

命令参数

参数必选类型默认值说明
jsonRetTrueexpressionjsonRet使用"屏幕文字识别"、"图像文字识别"、"PDF文字识别"命令输出到的变量
include_enterTruebooleanFalse全部文本中是否包含换行信息,为"是"则在每行后面添加\n。“否”则不添加

返回结果

sRet,将命令运行后的结果赋值给此变量。

运行实例

/**********************获取全部文本**********************
命令原型:
sRet = Mage.ExtractAllText(jsonRet,false)
入参:
jsonRet--使用"屏幕文字识别"、"图像文字识别"、"PDF文字识别"命令输出到的变量
include_enter--全部文本中是否包含换行信息,为"是"则在每行后面添加\n。“否”则不添加
出参:
sRet:函数调用的输出保存到的变量
****************************************************/
Rem 测试数据
Dim jsonRet = {"ai_function" : "ocr_text","items" : [{"char_positions" : [],"content" : "将PDF指定的页码通过 Laiye Intelligent Document Processing 通用文字识别,识别结果返回JSON格","handwrite_info" : null,"importance_info" : null,"page_number" : 1,"positions" : [{"x" : 71,"y" : 60},{"x" : 522,"y" : 61},{"x" : 522,"y" : 75},{"x" : 71,"y" : 74}],"probabilities" : []},{"char_positions" : [],"content" : "式。在识别多页过程中如果其中一页失败则整个识别会返回错误,且会消耗配额","handwrite_info" : null,"importance_info" : null,"page_number" : 1,"positions" : [{"x" : 72,"y" : 76},{"x" : 420,"y" : 76},{"x" : 420,"y" : 89},{"x" : 72,"y" : 89}],"probabilities" : []}],"struct_content" : {"page" : [{"content" : "将PDF指定的页码通过 Laiye Intelligent Document Processing 通用文字识别,识别结果返回JSON格式。在识别多页过程中如果其中一页失败则整个识别会返回错误,且会消耗配额","page_id" : 0,"page_number" : 1}],"paragraph" : [{"content" : "将PDF指定的页码通过 Laiye Intelligent Document Processing 通用文字识别,识别结果返回JSON格式。在识别多页过程中如果其中一页失败则整个识别会返回错误,且会消耗配额","page_number" : 1,"paragraph_id" : 0}],"row" : [{"content" : "将PDF指定的页码通过 Laiye Intelligent Document Processing 通用文字识别,识别结果返回JSON格","page_number" : 1,"row_id" : 0},{"content" : "式。在识别多页过程中如果其中一页失败则整个识别会返回错误,且会消耗配额","page_number" : 1,"row_id" : 1}]}} // 测试数据
Dim sRet="" // 输出结果

sRet = Mage.ExtractAllText(jsonRet,false)
TracePrint(sRet)

可视化样例