跳到主要内容

获取段落文本

命令说明

获取通用文字识别结果中按段落划分的全部文本

命令原型

arrayRet = Mage.ExtractParagraphText(jsonRet)

命令参数

参数必选类型默认值说明
jsonRetTrueexpressionjsonRet使用"屏幕文字识别"、"图像文字识别"、"PDF文字识别"命令输出到的变量

返回结果

arrayRet,将命令运行后的结果赋值给此变量。

运行实例

/**********************获取段落文本**********************
命令原型:
arrayRet = Mage.ExtractParagraphText(jsonRet)
入参:
jsonRet--使用"屏幕文字识别"、"图像文字识别"、"PDF文字识别"命令输出到的变量
出参:
arrayRet:函数调用的输出保存到的变量
****************************************************/
Rem 测试数据
Dim jsonRet = {"ai_function" : "ocr_text","items" : [{"char_positions" : [],"content" : "将PDF指定的页码通过 Laiye Intelligent Document Processing 通用文字识别,识别结果返回JSON格","handwrite_info" : null,"importance_info" : null,"page_number" : 1,"positions" : [{"x" : 71,"y" : 60},{"x" : 522,"y" : 61},{"x" : 522,"y" : 75},{"x" : 71,"y" : 74}],"probabilities" : []},{"char_positions" : [],"content" : "式。在识别多页过程中如果其中一页失败则整个识别会返回错误,且会消耗配额","handwrite_info" : null,"importance_info" : null,"page_number" : 1,"positions" : [{"x" : 72,"y" : 76},{"x" : 420,"y" : 76},{"x" : 420,"y" : 89},{"x" : 72,"y" : 89}],"probabilities" : []}],"struct_content" : {"page" : [{"content" : "将PDF指定的页码通过 Laiye Intelligent Document Processing 通用文字识别,识别结果返回JSON格式。在识别多页过程中如果其中一页失败则整个识别会返回错误,且会消耗配额","page_id" : 0,"page_number" : 1}],"paragraph" : [{"content" : "将PDF指定的页码通过 Laiye Intelligent Document Processing 通用文字识别,识别结果返回JSON格式。在识别多页过程中如果其中一页失败则整个识别会返回错误,且会消耗配额","page_number" : 1,"paragraph_id" : 0}],"row" : [{"content" : "将PDF指定的页码通过 Laiye Intelligent Document Processing 通用文字识别,识别结果返回JSON格","page_number" : 1,"row_id" : 0},{"content" : "式。在识别多页过程中如果其中一页失败则整个识别会返回错误,且会消耗配额","page_number" : 1,"row_id" : 1}]}} // 测试数据
Dim arrayRet="" // 输出结果

arrayRet = Mage.ExtractParagraphText(jsonRet)
TracePrint(arrayRet)

可视化样例