PDF印章识别
命令说明
使用 Laiye Intelligent Document Processing 识别 PDF 文件中指定页码区域内的印章信息,识别结果为JSON格式。在识别多页过程中如果其中一页失败,则会引发异常,且会消耗配额
命令原型
jsonRet = Mage.PDFOCRStamp(filepath,config,all_pg_state,page_cfg,sleepTime,time,optionArgs)
命令参数
参数 | 必选 | 类型 | 默认值 | 说明 |
---|---|---|---|---|
filepath | True | path | '''C:\Users''' | 待识别PDF文件的存放路径 |
config | True | expression | {} | Laiye Intelligent Document Processing 的调用配置 |
all_pg_state | True | boolean | True | 对PDF文件中指定的页码区域进行识别,默认识别全部页 |
page_cfg | True | expression | [[1,3]] | 支持正整数和数组格式,如输入2,则识别第2页;如输入[1,3,5],则识别第1,3,5页;如输入[1,[6,9],4],则识别1,4页和第6到第9页。当识别全部页码设为"是",则识别指定页码的输入失效。超出PDF页码总数的部分会报错,页码重叠部分仅识别1次 |
sleepTime | True | number | 10000 | 对PDF文件中每页的间隔时长(以毫秒为单位),默认10000毫秒(10秒)。识别页数较多,间隔较短可能会引发调用频率超限异常 |
time | True | number | 30000 | 指定等待时间(以毫秒为单位),如果超出该时间,则引发异常。默认30000毫秒(30秒) |
password | False | string | "" | 仅需要提供PDF文件密码时才填写 |
返回结果
jsonRet,将命令运行后的结果赋值给此变量。
运行实例
/**********************PDF印章识别**********************
命令原型:
jsonRet = Mage.PDFOCRStamp('''C:\Users''',{},true,[[1,3]],10000,30000,{"password":""})
入参:
filepath--待识别包含印章图片的PDF文件路径
config--mage配置,需配置Pubkey和Secret.Type:Dict
all_pg_state--是否识别全部页
page_cfg--指定页码区域
sleepTime--间隔时间.默认单位:毫秒.Type:Int
time--超时时间.默认单位:毫秒.Type:Int
optionArgs--可选参数(包括:密码).Type:Dict
出参:
jsonRet--函数调用的输出保存到的变量
注意事项:
需要获取mage对应的Key/Secret和URL
****************************************************/
Dim filepath='''''' // 待识别包含印章图片的PDF文件路径
Dim jsonRet="" // 输出结果
jsonRet = Mage.PDFOCRStamp(filepath,{"Pubkey":"XDDpJLuf57aLAYb69WAu2ise","Secret":"MWikeR0v3TbwdYwTCcPc46aGywaybKmJ","Url":"https://mage.uibot.com.cn"},true,[[1,3]],10000,30000,{"password":""})
TracePrint(jsonRet)