ocr吧 关注:902贴子:3,067
  • 0回复贴,共1

文通票据识别系统介绍

只看楼主收藏回复

文通票据识别系统介绍
银行票据系统介绍文通银行票据识别系统特性文通银行票据识别系统是北京文通公司在TH-OCR识别核心的基础上开发的表格识别软件,其不仅可以完成金融领域风险监督系统中银行票据影像的OCR识别,并且可以实现其它表格类影像的自动识别(如各种申请表、测评表、定单、保险单等)。票据识别系统有两部份组成:表格模板编辑器和表格分类识别核心。其中表格模板编辑器完成表格模板的定制工作,并由识别模板指导识别核心进行影像分类和识别。
2.模板分类精细、准确率高
模板分类的准确率达到98%左右,规范凭证模板分类准确率超过99%;字段识别率高,单流水字段的识别率高于90%。银行票据识别系统不仅可以完成一种凭证打印同一种交易的模板分类,并可以完成同一种凭证打印多种交易以及同一种凭证分多联的凭证分类。本系统充分利于了凭证的标题、框线、打印文本等多种特征进行模板的区分。
3.支持多种字符类型的识别
印刷体汉字、印刷体英文数字、手写汉字、手写数字、磁码、复选框、条码识别(一维条码支持:Code39, Code128, Code32,
EAN-128, EAN-13 and JAN, EAN-8, UPC-A, UPC-E, Add2, Add5, BCD Matrix等;二维条码支持:PDF417和 DataMatrix)等。
4.模板编辑器便捷高效
通过模板编辑器可以很便捷的制作出高识别率的模板。


1.2. 文通银行票据识别系统功能
1.2.1模板编辑器
文通银行票据识别系统提供了便捷的模板制作工具——模板编辑器。模板为识别过程提供指导,包括分类标识、定位标识、识别要素等详细信息。分类标识信息包括:图像大小、版面特征文件、框线信息、标题信息、文本信息等多种分类信息。在识别过程中具体采用的分类算法可以通过模板编辑器在主模板中配置。识别区域支持多种字符类型:包括:印刷体汉字、印刷体英文数字、手写汉字、手写数字、磁码、复选框、条码识别等,可以快速灵活配置识别单元的类型。
文通银行票据识别系统票据分类功能强大:系统同时支持表格框线(位置、颜色)分类、标题单元(标题内容、标题颜色)分类、文本区域(文本内容、文本颜色)分类等,以最大限度发掘不同凭证之间的差异。如框线颜色、标题颜色均可以用来区分多联凭证的不同联;文本内容可以区分同一凭证打印多种交易的影像;文本颜色可以用来区分同一种凭证分多联并且不同联之间框线颜色和标题颜色均相同的影像。

1.1.2识别预处理功能
文通银行票据识别系统在对影像进行识别前做了多项预处理操作,以为之后识别输出最优的图像质量,具体有纠偏、偏色校正、滤色、降噪、二值化、增强识别单元对比度等功能。这些预处理功能均可通过参数灵活配置、自由组合。
1、适应性强
文通银行票据识别系统简体中文识别核心支持常用的宋体、仿宋、楷体、黑体、隶书、幼圆等汉字字体。印刷体英文和数字同样支持多种字体包括常见的:Arial、Times New Roman、Avant Garde、Bookman Old Style、 Helvetica、Verdana等多种字体。通过对邮储银行的几轮测试对横纵向压缩后的数字识别有很好的适应性,能取得较高的识别率。
2、票据分类精准
文通银行票据识别系统有很强的版面区分能力,充分利于框线、框线颜色、标题内容、标题颜色、文本内容、文本颜色等多种特征来进行版面的区分,版面识别的准确率在99%以上。
3、识别类型丰富
系统支持印刷汉字识别、印刷英文识别、印刷数字识别、手写汉字识别、手写英文识别、手写数字识别、磁码识别、条形码识别、客户签字检测、附件章检测等多个识别引擎。
4、识别速度快
经过实际生产线运行计算,单张票据识别时间为300ms~900ms,平均识别时间约为500ms。
5、识别率高
印刷体汉字识别率达99.5%;
印刷体英文和数字识别率>99.6%;
规范手写数字识别率达99%;
一维条码、二维条码(PDF417、DataMatrix)识别率>99%。
1.1.4文通银行票据识别系统核心模块
Ø 银行票据识别模板编辑器
提供识别先验信息,无需专业人员制作;
Ø 票据分类核心模块
标题分类、框线分类、智能分类
Ø 字符识别核心模块
2.1.5文通票据识别系统特性
Ø 识别字符范围广
n 打印数字、打印英文、打印中文、规范手写数字、 规范手写中文、磁码等。
Ø 识别率高
n 打印数字识别误码率在万分之四以下
n 规范手写数字识别准确性达98%
Ø 识别速度快
² 黑白票据图像: 0.5~1.0秒/张
² 彩色票据图像: 1.0~1.5秒/张
Ø 提供两种识别方案
n 黑白二值图像识别
n 彩色图像识别


回复
1楼2019-08-05 18:19