获取全部文本
命令说明
获取通用文字识别结果中的全部文本
命令原型
sRet = Mage.ExtractAllText(jsonRet,include_enter)
命令参数
参数 | 必选 | 类型 | 默认值 | 说明 |
---|---|---|---|---|
jsonRet | True | expression | jsonRet | 使用"屏幕文字识别"、"图像文字识别"、"PDF文字识别"命令输出到的变量 |
include_enter | True | boolean | False | 全部文本中是否包含换行信息,为"是"则在每行后面添加\n。“否”则不添加 |
返回结果
sRet,将命令运行后的结果赋值给此变量。
运行实例
/**********************获取全部文本**********************
命令原型:
sRet = Mage.ExtractAllText(jsonRet,false)
入参:
jsonRet--使用"屏幕文字识别"、"图像文字识别"、"PDF文字识别"命令输出到的变量
include_enter--全部文本中是否包含换行信息,为"是"则在每行后面添加\n。“否”则不添加
出参:
sRet:函数调用的输出保存到的变量
****************************************************/
Rem 测试数据
Dim jsonRet = {"ai_function" : "ocr_text","items" : [{"char_positions" : [],"content" : "将PDF指定的页码通过 Laiye Intelligent Document Processing 通用文字识别,识别结果返回JSON格","handwrite_info" : null,"importance_info" : null,"page_number" : 1,"positions" : [{"x" : 71,"y" : 60},{"x" : 522,"y" : 61},{"x" : 522,"y" : 75},{"x" : 71,"y" : 74}],"probabilities" : []},{"char_positions" : [],"content" : "式。在识别多页过程中如果其中一页失败则整个识别会返回错误,且会消耗配额","handwrite_info" : null,"importance_info" : null,"page_number" : 1,"positions" : [{"x" : 72,"y" : 76},{"x" : 420,"y" : 76},{"x" : 420,"y" : 89},{"x" : 72,"y" : 89}],"probabilities" : []}],"struct_content" : {"page" : [{"content" : "将PDF指定的页码通过 Laiye Intelligent Document Processing 通用文字识别,识别结果返回JSON格式。在识别多页过程中如果其中一页失败则整个识别会返回错误,且会消耗配额","page_id" : 0,"page_number" : 1}],"paragraph" : [{"content" : "将PDF指定的页码通过 Laiye Intelligent Document Processing 通用文字识别,识别结果返回JSON格式。在识别多页过程中如果其中一页失败则整个识别会返回错误,且会消耗配额","page_number" : 1,"paragraph_id" : 0}],"row" : [{"content" : "将PDF指定的页码通过 Laiye Intelligent Document Processing 通用文字识别,识别结果返回JSON格","page_number" : 1,"row_id" : 0},{"content" : "式。在识别多页过程中如果其中一页失败则整个识别会返回错误,且会消耗配额","page_number" : 1,"row_id" : 1}]}} // 测试数据
Dim sRet="" // 输出结果
sRet = Mage.ExtractAllText(jsonRet,false)
TracePrint(sRet)