庄闲ag·(中国)红蓝大战集团庄闲ag

产品知识

OPT小讲堂 ∣ Smart图像识别之OCR:字符识别

在第十二课中,我们讲了图像检测中的轮廓提取和轮廓操作工具。

今天我们来讲解Smart图像识别模块中的OCR功能。在这之前,先了解2个小问题:什么是OCR?OCR的技术特性是什么?



一.什么是OCR


1.OCR的概念

OCR,是Optical Character Recognition的简称,即光学字符识别技术,是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,用字符识别的方法将形状翻译成计算机文字的过程;通俗地说,即对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。


2.OCR的技术特性

OCR技术针对印刷体字符,采用光学的方式将文本资料中的文字转换成为灰度图像,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工。

一个OCR系统通常具有分类、识别与转换功能。衡量一个OCR系统性能好坏的主要指标有:拒识率,误识率,识别速度,用户界面的友好性,产品的稳定性、易用性及可行性等。本公司的OCR系统能有效定位图像中的字符,并通过提取字符的特征快速分类与识别。




二.OCR操作详解


打开Smart智能视觉软件,在主界面右下方工具箱栏点击图像识别的图标,如图1所示:

图1 图像识别工具界面图





1.OCR操作的基本流程

 

图2 OCR操作的流程图



2.OCR算子工具界面


2.1 OCR分割界面及参数解析

图3  OCR分割界面图


(1)预处理:

通过二值化、形态学等方法将字符区域从背景中提取出来,只留下字符区,其它部分去掉


(2)筛选:

●最小面积:找到的字符的面积最小值

●最大面积:找到的字符的面积最大值

●元素最小宽度:当一个连通域的总宽度小于元素最小宽度,此连通区域不为元素

●元素最大宽度:当一个连通域的宽度大于元素最大宽度,此连通区域不为元素

●元素间隔:元素之间的最小距离,大于该距离则认为是两个独立的元素,否则就进行合并

●字符最小宽度:找到的字符的宽度最小值

●字符最大宽度:找到的字符的宽度最大值

●字符最小高度:找到的字符的高度最小值

●字符最大高度:找到的字符的高度最大值



2.2 OCR训练界面及参数解析

图4 OCR训练界面图


(1)字符路径:

●读取:读取指定的路径下已经存在的字符集文本

●追加:追加字符集到已经存在的字符集文本

●保存:保存字符集到指定的路径


(2)训练方式:

●所有字符:将所有字符一次性进行训练

●单个字符:选择指定序号单个字符进行训练


(3)根据标准字体生成样本:

●字体:选择识别对象的字体

●大小:调整字体的大小

●加粗:调整字体加粗



2.3 OCR识别界面及参数解析


图5 OCR识别界面图


(1)识别结果:显示 OCR 识别的字符信息

(2)字符个数:OCR 识别的数量

(3)替代字符:识别失败的字符,可用自定义编辑的字符代替

(4)最小识别得分:设置字符识别的最低得分。若小于这个得分,识别失败


3.OCR的应用场景及举例

3.1应用场景

(1)产品外包装生产批号字符识别

(2)汽车零部件编号的字符识别

(3)交通标识、车牌等字符识别



3.2应用举例

图6  OCR原图


图7  OCR效果图



以上为OPT小讲堂之Smart智能视觉软件操作培训第十三课的内容,如对课程有任何问题欢迎来电咨询,全国服务热线400-0769-068。



联系OPT(奥普特):
联系销售团队|
获取产品演示|
获取产品报价
查看相关产品
庄闲ag