
产品知识
OPT小讲堂 ∣ Smart图像识别之OCR:字符识别
在第十二课中,我们讲了图像检测中的轮廓提取和轮廓操作工具。
今天我们来讲解Smart图像识别模块中的OCR功能。在这之前,先了解2个小问题:什么是OCR?OCR的技术特性是什么?
一.什么是OCR
1.OCR的概念
OCR,是Optical Character Recognition的简称,即光学字符识别技术,是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,用字符识别的方法将形状翻译成计算机文字的过程;通俗地说,即对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。
2.OCR的技术特性
OCR技术针对印刷体字符,采用光学的方式将文本资料中的文字转换成为灰度图像,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工。
一个OCR系统通常具有分类、识别与转换功能。衡量一个OCR系统性能好坏的主要指标有:拒识率,误识率,识别速度,用户界面的友好性,产品的稳定性、易用性及可行性等。本公司的OCR系统能有效定位图像中的字符,并通过提取字符的特征快速分类与识别。
二.OCR操作详解
打开Smart智能视觉软件,在主界面右下方工具箱栏点击图像识别的图标,如图1所示:
图1 图像识别工具界面图
1.OCR操作的基本流程
图2 OCR操作的流程图
2.OCR算子工具界面
2.1 OCR分割界面及参数解析
图3 OCR分割界面图
(1)预处理:
通过二值化、形态学等方法将字符区域从背景中提取出来,只留下字符区,其它部分去掉
(2)筛选:
●最小面积:找到的字符的面积最小值
●最大面积:找到的字符的面积最大值
●元素最小宽度:当一个连通域的总宽度小于元素最小宽度,此连通区域不为元素
●元素最大宽度:当一个连通域的宽度大于元素最大宽度,此连通区域不为元素
●元素间隔:元素之间的最小距离,大于该距离则认为是两个独立的元素,否则就进行合并
●字符最小宽度:找到的字符的宽度最小值
●字符最大宽度:找到的字符的宽度最大值
●字符最小高度:找到的字符的高度最小值
●字符最大高度:找到的字符的高度最大值
2.2 OCR训练界面及参数解析
图4 OCR训练界面图
(1)字符路径:
●读取:读取指定的路径下已经存在的字符集文本
●追加:追加字符集到已经存在的字符集文本
●保存:保存字符集到指定的路径
(2)训练方式:
●所有字符:将所有字符一次性进行训练
●单个字符:选择指定序号单个字符进行训练
(3)根据标准字体生成样本:
●字体:选择识别对象的字体
●大小:调整字体的大小
●加粗:调整字体加粗
2.3 OCR识别界面及参数解析
图5 OCR识别界面图
(1)识别结果:显示 OCR 识别的字符信息
(2)字符个数:OCR 识别的数量
(3)替代字符:识别失败的字符,可用自定义编辑的字符代替
(4)最小识别得分:设置字符识别的最低得分。若小于这个得分,识别失败
3.OCR的应用场景及举例
3.1应用场景
(1)产品外包装生产批号字符识别
(2)汽车零部件编号的字符识别
(3)交通标识、车牌等字符识别
3.2应用举例
图6 OCR原图
图7 OCR效果图
以上为OPT小讲堂之Smart智能视觉软件操作培训第十三课的内容,如对课程有任何问题欢迎来电咨询,全国服务热线400-0769-068。