正泰自定义表格文字识别系统

访问官方
将表格图像中的数据信息准确快速的提取,并结构化的输出
《自定义格式文字识别系统》,包括三大引擎,文档分类引擎、区域识别(表格识别)引擎、全文识别引擎。适用于具有文件格式的表格、单据、票据、文档、申请表、合格证、问卷、证件等格式,可支持扫描仪扫描件,高拍仪高拍见,手机拍照件等影像,通过系统图像处理、自动分类、OCR文字识别技术,将表格图像中的数据信息准确快速的提取,并结构化的输出,以XML或者JSON的方式,与企事业单位的ERP、CRM等系统实现无缝对接。系统支持中英文、数字、符号等多类型字符的手写体、印刷体识别。 产品功能: 文档分类: 针对影像文件的版面格式提取不同的文档特征,对文档类型自动分类,例如有大量的不同格式的表格单据等,需要进行分类存储或者管理。 区域识别(表格识别): 通过对样本图像使用标注工具进行标注,对指定区域进行识别,并格式化的输出结果。方便用户在系统中集成调用并对接到业务系统中。对不同的识别要素增加属性,例如,姓名项,地址项,身份证号项等不同识别要素的属性,对识别要素属性以及要素内容,以JSON的方式输出。 全文识别: 对于无格式的影响文档,则可以进行全文识别,按行格式进行识别输出。可在文件检索,文件电子化,合同比对等场景使用。