基于OpenCV的生产日期字符识别研究*

作者：李佳琪（安徽理工大学经济与管理学院，安徽淮南 232000）时间：2021-07-27 来源：电子产品世界收藏

编者按：利用OpenCV-python和开源OCR技术进行图像预处理，并通过训练得到一个专属字库，能较为精准地识别生产日期字符。针对如何提高商品标签识别系统的工作效率，从改善商品标签图像质量和提高识别算法效率入手进行研究，目的是提高生产效率、提升产品质量。

商品的标识技术是对标签进行编码和标记的技术手段，也是产品可追溯性的基础。标识技术关系到物流、食品和电子商务等多个行业，影响深远。伴随人们生活水平的提高，对于健康和安全的关注越来越多，每个行业对产品的品质和安全性的要求也越来越高^[1]。编码标识的不统一阻碍了各个行业的发展，包括对产品的溯源、电子商务及对产品标签标准化的要求，因此，国家商品生产日期标识规范体系的建立显得尤为必要。

本文引用地址：//m.amcfsurvey.com/article/202107/427161.htm

OCR 技术通过照相机拍摄图片，利用检测模式扫描图像，从中排除干扰信息并提取文本信息，然后对文本信息进行字符识别，用一系列算法翻译成计算机处理文本^[2]。现在，还可直接连接摄像头或照相机直接进行视频识别。典型的OCR 技术首先是对输入图像进行预处理，再对处理过的图像进行文字检测识别，在不同项目背景下，根据光照、背景颜色、产品材质和产品要求的不同，预处理和识别方法也会有所差异。

识别过程将由计算机端的Python 程序完成。本文采用的商品标签识别过程如图1 所示。

作者简介：李佳琪(1995~)，女，安徽舒城，回族，硕士生，研究方向：神经网络字符识别，E-mail：568950838@qq.com。

*国家自然科学基金，61873004，多源传感器环境下基于异构特征信息融合的行为识别

国家自然科学基金，51474007，基于领域本体的煤矿安全数据融合方法及应用

图1 商标标签识别过程

1 预处理与识别

1.1OpenCV

OpenCV是一个跨平台的轻量级开源计算机视觉库，支持多种机器语言。OpenCV模块覆盖全面，其中囊括了字符识别、图像处理、人脸识别等。OpenCV 涵盖300 多个C 语言函数的中、高层API，对于输入图像的格式也非常包容，用它进行应用开发非常高效和简洁，而且包含了丰富的工业检测类函数，能够用于实时图像处理，使用便捷，功能完善，适用于本文实验环境。

1.2Tesseract-OCR

Tesseract-OCR是19 世纪80 年代由惠普实验室开发的，谷歌改进了其中的算法，通过排除引擎缺陷进行了优化。Tesseract-OCR的功能强大，应用广泛，是开源的OCR 识别系统^[3]。Tesseract-OCR 识别引擎在开源别引擎中占有重要地位，完整识别过程由一种页面结构阐发方法对图片做布局剖析，旨在辨别图像上的表格、文本、图片等内容，为后续识别工作做铺垫。

2图像预处理

将背景信息和文本信息分开，消除图像无关信息、加强有效信息，从而简化后续辨认字符步调，减轻辨认难度和错误率。

2.1 图像倾斜校正

产品在流水线输送带上运动时，经过高速摄像机拍摄照片，可能会遇到产品放置不规范的问题，导致拍摄的照片歪斜，不平行于水平线。预处理第一步是将扭曲的原始图片进行校正。在此环境中，使用傅里叶变换做图像的倾斜校正。

二维图像的傅里叶变换公式：

式中，f 和F 分别为空间域值和频域值，示出了傅立叶变换后的结果需要使用的真实图像加虚拟图像，或振幅图像（magitude 图像）加相位图像[4]（如图2）。

（a）倾斜校正前

（b）倾斜校正后

图2 校正前后对比

2.2 图像噪声处理

在收集、传输和处理图像的过程中，图像会产生一些不可避免的噪声，包含与图像无关和冗余滋扰信息。降低图像噪声不仅可以使图像更加清晰，而且可以突出图像的感兴趣区域，易于识别（如图3）。

（a）原图

（b）中值滤波对噪声的处理

图3 噪声处理前后的对比

2.3 图像二值化

遍历像素点，通过选取合适的值，灰度值二分为255 或0，白色为255，黑色为0，如式（3）所示。分类后图像变为黑白，分辨图像中的图形和文本，便于后续将文本信息提取出来^[5]。

1）Otsu 算法

此算法是把背景和目标阈值的差距拉大，分裂性较强，所求的是类内方差min，和类间方差的max，首先遍历所有像素点，统计灰度级像素的个数，将图像灰度化，再次遍历计算出最大类间方差，程序略显复杂^[6]，效果图如图4 所示。

图4 Otsu对光照不均的处理

2）Sauvola 算法

该算法通过引入以像素点为中心领域的wide 为参数windowsize 和自定义系数比例因子k 来降低对噪声的敏感性，也就是对niblack 算法进行改进。它集中于当前像素，阈值是根据该像素的当前像素的附近灰度平均值和标准偏差动态计算[7]。

灰度均值m 与标准方差s：

然后是该点的阈值T(x, y)，其中T的大小可以根据k 来调节：

图5 Sauvola对光照不均的处理

2.4 边缘检测

边缘检测是通过卷积或微分计算后得到的二值化

图像。

1）Laplacian 算子边缘检测

拉普拉斯算子被分成4 个和8 个邻域，域是像素梯度需求邻域的4 个相邻方向上的中央附近的方向和梯度^[8]（如图6）。

图6 Laplacian的边缘处理

2）Canny 边缘检测算法

Canny 从信噪比、单边缘和定位性能方面来判定边缘的优劣，Canny 边缘检测算法可以分为以下5 个步骤：

①图像灰度化

通过RGB 三个通道，为了降维，将图片图像进行灰度化。

②高斯模糊处理

此步骤是对图像进行smooth 处理，通过滤波器将高斯函数离散化^[9]，高斯函数与滤波器的计算：

③图像梯度、梯度幅值、梯度方向计算

该点通过计算当前像素与其附近的像素差值来进行位置判断，接近这个差值称为图像梯度。首先计算一阶导数：

计算梯度幅值M：

计算梯度值的方向：

④ NMS（非极大值抑制）

留存边缘方向上具有极大值的像素，通过NMS 找出其中的局部最大值，将其他位置的值取0。

⑤双阈值的边界选取

梯度大于任何边缘的最大阈值是真正的边缘，而低于最小阈值的边缘为非边缘，非边缘即舍去（如图7）。

图7 Canny的边缘处理

2.5本文算法的选取

中值滤波是对光滑脉冲噪声表现良好，效果图像的边界顺滑清晰。与平均灰度法比较，Sauvola 使用二值化的图像，能解决产生照度不均的影响。拉普拉斯对噪声敏感，分辨边缘像素的位置表现优异，但易出现双像素边界，导致日期显示模糊不清晰；Canny 对比Laplacian 克制了噪声引起的非边缘，对于光照不均的图像也能有如图所示的效果，线条更流畅光滑，同时细化过的边缘比较清晰，易于后续的识别工作。

综上，根据实际检测考虑，本项目的噪声处理、二值化及边缘检测的算法分别借用的是中值滤波、Sauvola算法和Canny 边缘检测法。

3 商品生产日期字符识别

3.1 识别目的

在车间生产中，生产日期是由操作工人设置喷印装置并对生产日期进行喷印。生产日期的错误为后续的溯源、仓储造成困难。为避免生产资料的浪费和后续工作的开展，制作日期字符识别数据集并校验成果。

本文通过jTessBoxEditor 进行字符识别训练工作，Tesseract 深度学习样本训练工具基于Java 开发，当Tesseract 的自带字符库不足以满足需要时，通过jTessBoxEditor 训练得到专属字符库，提高生产日期识别率和准确率。

3.2 字符集的创建和测试

在jTessBoxEditor 编辑器中点击merge tiff，打开拍摄到的商品生产日期图片，并为文件命名，以生成训练集的tif 文件（如图8）。