产品知识

OPT小讲堂 ∣ Smart图像识别之OCR：字符识别

在第十二课中，我们讲了图像检测中的轮廓提取和轮廓操作工具。

今天我们来讲解Smart图像识别模块中的OCR功能。在这之前，先了解2个小问题：什么是OCR？OCR的技术特性是什么？

一.什么是OCR

1.OCR的概念

OCR，是Optical Character Recognition的简称，即光学字符识别技术，是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，通过检测暗、亮的模式确定其形状，用字符识别的方法将形状翻译成计算机文字的过程；通俗地说，即对文本资料进行扫描，然后对图像文件进行分析处理，获取文字及版面信息的过程。

2.OCR的技术特性

OCR技术针对印刷体字符，采用光学的方式将文本资料中的文字转换成为灰度图像，并通过识别软件将图像中的文字转换成文本格式，供文字处理软件进一步编辑加工。

一个OCR系统通常具有分类、识别与转换功能。衡量一个OCR系统性能好坏的主要指标有：拒识率，误识率，识别速度，用户界面的友好性，产品的稳定性、易用性及可行性等。本公司的OCR系统能有效定位图像中的字符，并通过提取字符的特征快速分类与识别。

二.OCR操作详解

打开Smart智能视觉软件，在主界面右下方工具箱栏点击图像识别的图标，如图1所示：

图1 图像识别工具界面图

1.OCR操作的基本流程

图2 OCR操作的流程图

2.OCR算子工具界面

2.1 OCR分割界面及参数解析

图3 OCR分割界面图

（1）预处理：

通过二值化、形态学等方法将字符区域从背景中提取出来，只留下字符区，其它部分去掉

（2）筛选：

●最小面积：找到的字符的面积最小值

●最大面积：找到的字符的面积最大值

●元素最小宽度：当一个连通域的总宽度小于元素最小宽度，此连通区域不为元素

●元素最大宽度：当一个连通域的宽度大于元素最大宽度，此连通区域不为元素

●元素间隔：元素之间的最小距离，大于该距离则认为是两个独立的元素，否则就进行合并

●字符最小宽度：找到的字符的宽度最小值

●字符最大宽度：找到的字符的宽度最大值

●字符最小高度：找到的字符的高度最小值

●字符最大高度：找到的字符的高度最大值

2.2 OCR训练界面及参数解析

图4 OCR训练界面图

（1）字符路径：

●读取：读取指定的路径下已经存在的字符集文本

●追加：追加字符集到已经存在的字符集文本

●保存：保存字符集到指定的路径

（2）训练方式：

●所有字符：将所有字符一次性进行训练

●单个字符：选择指定序号单个字符进行训练

（3）根据标准字体生成样本：

●字体：选择识别对象的字体

●大小：调整字体的大小

●加粗：调整字体加粗

2.3 OCR识别界面及参数解析

图5 OCR识别界面图

（1）识别结果：显示 OCR 识别的字符信息

（2）字符个数：OCR 识别的数量

（3）替代字符：识别失败的字符，可用自定义编辑的字符代替

（4）最小识别得分：设置字符识别的最低得分。若小于这个得分，识别失败

3.OCR的应用场景及举例

3.1应用场景

（1）产品外包装生产批号字符识别

（2）汽车零部件编号的字符识别

（3）交通标识、车牌等字符识别

3.2应用举例

图6 OCR原图

图7 OCR效果图

以上为OPT小讲堂之Smart智能视觉软件操作培训第十三课的内容，如对课程有任何问题欢迎来电咨询，全国服务热线400-0769-068。

联系OPT（奥普特）：: 联系销售团队|; 获取产品演示|; 获取产品报价

查看相关产品

庄闲ag·(中国)红蓝大战集团庄闲ag

产品知识

OPT小讲堂 ∣ Smart图像识别之OCR：字符识别

OPT小讲堂 ∣ Smart图像识别之OCR：字符识别