跳到主要内容
版本:V1.2

硬件要求

必要条件

目前私有部署都需要基于k8s部署,所以硬件要求较比之前有所提高。

硬件要求因需求模块、请求量及数据量等因素而异,导致硬件配置要求也不一致。

tip

如多个产品部署在一起,磁盘空间不叠加,取最大值即可

磁盘空间取决于:

  • 数据保留策略(数据保留期)
  • 日志保留策略
  • 数据量大小
  • 非必要不建议使用NAS,NFS等网络挂载磁盘,除非您能确保服务器与网盘网络传输很稳定
  • 强烈建议磁盘使用SSD,或性能较好的HDD

可根据实际业务量及需求模块适当增加或缩小磁盘大小资源。数据参考如下:

MinIO: 1个Worker 在分辨率为1920 * 1080的情况下,每2分钟生成60-70MB的录屏文件

MySQL: 1个Worker 每年产生约1GB。按每天100个任务、每个任务50条记录、每条记录0.5KB

硬件性能要求

  • 磁盘性能:读取速度不低于200M/s, 写入速度不低于200M/s.检查方法
  • 网络性能:内网传输速度不低于512k/s
  • CPU指令集:如果您购买的产品中包含了OCR识别能力(CPU版),需要指令集包含fma、avx、avx2指令
caution

如果您购买的产品中包含了OCR识别能力(GPU版),请确保您的服务器中拥有GPU显卡,并且安装了驱动程序。

推荐显卡型号为Nvidia【v100、p100、p40、t4】

单节点 部署

您可以参考下表,来统计您所需要的硬件资源:

ProductCPU CoresRAM(GB)HDD(GB)GPU(GB)备注
机器人指挥官816500--
智能文档处理平台816300-所有AI能力都要先加上智能文档处理平台,如果之前已经部署则不需要,且增加的模块可以与提前部署的智能文档处理平台连接
对话式AI平台1632300--
人机协同中心48---
数据服务22---
自研ocr go服务816--使用以下功能时需要加上该服务的配置(如果有多个能力都需要该模块只需要加一次即可)通用文字识别、通用表格识别、通用卡证识别、通用票据识别、印章识别、验证码识别、二维码识别、版面分析
通用文字识别-标准版GPU48-8需要加上智能文档处理平台或OCR的配置
通用表格识别-标准版GPU44-8需要加上通用文字识别+(智能文档处理平台或OCR)的配置
通用多票据识别-标准版GPU1064-11需要加上智能文档处理平台或OCR的配置
通用卡证识别标准版 - 身份证GPU48-8需要加上智能文档处理平台或OCR的配置
通用卡证识别标准版 - 身份证CPU816--需要加上智能文档处理平台或OCR的配置
通用卡证识别标准版 - 营业执照GPU48-8需要加上智能文档处理平台或OCR的配置
通用卡证识别标准版 - 营业执照CPU816--需要加上智能文档处理平台或OCR的配置
通用卡证识别标准版 - 驾驶证\行驶证GPU48-8需要加上智能文档处理平台或OCR的配置
通用卡证识别标准版 - 驾驶证\行驶证CPU816--需要加上智能文档处理平台或OCR的配置
验证码识别12--需要加上智能文档处理平台或OCR的配置
印章识别48--需要加上智能文档处理平台或OCR的配置
版面分析48--需要加上通用文字识别+(智能文档处理平台或OCR)的配置
文档分类24--需要加上通用文字识别+(智能文档处理平台或OCR)的配置
文档抽取24--需要加上通用文字识别+(智能文档处理平台或OCR)的配置
信息抽取24--需要加上通用文字识别+(智能文档处理平台或OCR)的配置
文本分类24--需要加上通用文字识别+(智能文档处理平台或OCR)的配置
单据自训练抽取24--需要加上通用文字识别+(智能文档处理平台或OCR)的配置
文档比对816--需要加上智能文档处理平台+通用文字识别的配置
自定义模版识别12--需要加上智能文档处理平台或OCR的配置

多节点 部署

caution

对于多节点部署,需要3个及以上的节点。需要您创建一个负载均衡(lb)作为访问入口,将多节点作为后端服务器处理。

如果您无法提供一个负载均衡(lb)地址,那么您可以向我们提供一个空闲IP,我们将利用软件实现您的需求。

(不过据我所知,Aliyuns等第三方云服务器提供商是不支持这种方式的)

三节点

以下为每台节点配置信息

ProductCPU CoresRAM(GB)HDD(GB)GPU(GB)备注
机器人指挥官816500--
智能文档处理平台816300-所有AI能力都要先加上智能文档处理平台,如果之前已经部署则不需要,且增加的模块可以与提前部署的智能文档处理平台连接
对话式AI平台1632300--
人机协同中心48---
数据服务22---
自研ocr go服务816--使用以下功能时需要加上该服务的配置(如果有多个能力都需要该模块只需要加一次即可)通用文字识别、通用表格识别、通用卡证识别、通用票据识别、印章识别、验证码识别、二维码识别、版面分析
通用文字识别-标准版GPU48-8需要加上智能文档处理平台或OCR的配置
通用表格识别-标准版GPU44-8需要加上通用文字识别+(智能文档处理平台或OCR)的配置
通用多票据识别-标准版GPU1064-11需要加上智能文档处理平台或OCR的配置
通用卡证识别标准版 - 身份证GPU48-8需要加上智能文档处理平台或OCR的配置
通用卡证识别标准版 - 身份证CPU816--需要加上智能文档处理平台或OCR的配置
通用卡证识别标准版 - 营业执照GPU48-8需要加上智能文档处理平台或OCR的配置
通用卡证识别标准版 - 营业执照CPU816--需要加上智能文档处理平台或OCR的配置
通用卡证识别标准版 - 驾驶证\行驶证GPU48-8需要加上智能文档处理平台或OCR的配置
通用卡证识别标准版 - 驾驶证\行驶证CPU816--需要加上智能文档处理平台或OCR的配置
验证码识别12--需要加上智能文档处理平台或OCR的配置
印章识别48--需要加上智能文档处理平台或OCR的配置
版面分析48--需要加上通用文字识别+(智能文档处理平台或OCR)的配置
文档分类24--需要加上通用文字识别+(智能文档处理平台或OCR)的配置
文档抽取24--需要加上通用文字识别+(智能文档处理平台或OCR)的配置
信息抽取24--需要加上通用文字识别+(智能文档处理平台或OCR)的配置
文本分类24--需要加上通用文字识别+(智能文档处理平台或OCR)的配置
单据自训练抽取24--需要加上通用文字识别+(智能文档处理平台或OCR)的配置
文档比对816--需要加上智能文档处理平台+通用文字识别的配置
自定义模版识别12--需要加上智能文档处理平台或OCR的配置

三节点以上

对于三节点以上的安装,将使用master和node方式来规划硬件配置

  • master: 部署k8s基础服务,比如:apiserver、kube-controller、kube-scheduler以及中间件服务
  • node: 实际运行服务模块的节点

大致可分为以下两种情况:

3 < nodes < 6: master=3,node=节点数量(master同时也为node)

6 =< nodes: master=3,node=节点数量-master数量(master仅为master)

假设提供的节点数量为4个,那么其中master角色数量为3,node角色数量为4。