1. 研究目的与意义
随着科技的进步,现代化生活水平逐渐提高,但是在某些领域,自动化生产并未完全实现。就比如说目前的自动化药房中,在补药环节仍以人工或半自动补药方式为主,并没有完全实现自动化。因此,实现补药环节的机器人操作受到广泛关注与研究。然而要实现补药自动化,药品识别是关键。药品名称位于上表面醒目位置,可通过文字识别出药名。因此,本课题拟对药品名称识别的图像预处理、文本检测、药品区域确定、药品文字识别方法进行理论分析和实验研究 。
本课题希望利用摄像头和微型计算机,来设计一种应用于药房的智能检测识别设备,通过设备对药盒上印刷字的识别,来进一步节省人工成本,实现药房补药环节的进一步智能化。2. 课题关键问题和重难点
本文将研究一种基于机器视觉的药品名称识别系统。该系统由主控模块、摄像头信息采集模块以及图像存储模块组成。在此系统中,以主控模块为核心,通过摄像头采集到的图像信息,在通过图像存储模块保存后,交由主控模块进行数据处理,来尽可能的识别出药品名称。
需要解决的问题如下:
(1) 寻找合适的摄像头模块。摄像头获取信息是整个智能识别系统的首要环节,因此摄像头也是识别设备的关键部件。摄像头的分辨率、视野广度等性能都会影响识别功能的准确性。
3. 国内外研究现状(文献综述)
图像预处理 |
图像灰度化处 理 |
图像锐化 |
CRAFT文本检测 |
药名区域确定 |
OCR文字识别 |
文本区域识别 |
文字识别 |
图4-1 药盒药名识别系统结构图
其中图像预处理包括图像灰度化、滤波降噪、图像锐化、边缘检测以及查找轮廓并裁剪。
(1)灰度化:将原彩图像转化为灰度图像的过程。采用平均值法,将彩色图像中三个分量的亮度求平均值得到灰度图像。灰度化后的图像仍能反映出图像色度和高亮等级的分布和特征。
(2)滤波降噪:因为图像采集环境良好,所以噪声的成分相对来说较简单。中值滤波由于运算简单而且速度快,比较适合用于此情景。
(3)图像锐化:经过滤波后,对图像进行了积分运算或平均值运算,图像会变得模糊,细节会变得平缓,因此需要对图像进行逆运算来一定程度上抵消滤波带来的影响,比如使用微分运算,来使图像变得更加清晰,可辨认。
(4)边缘检测:边缘检测采用Canny算法,对药名文本区域进行识别和分割。
(5)轮廓查找并提取:确定药盒数据,为后续查找剔除不正确选项,保留类似选择,以供备选。
除此以外,文本区域的检测则是在查找到药盒轮廓并进行分割之后,通过确定文本区域,并截取出药名区域,然后再进行药品名称的识别工作。
(1)文本检测:基于神经网络的场景文本检测方法是当下应用最广泛的文本检测方法之一。本方案拟采用字符级的文本检测方法CRAFT。这种算法通过挖掘每个字符和字符间的亲和度来有效的检测文本区域。
(2)药品名称区域定位:CRAFT算法见到文本区域之后,系统还会对药名区域进行定位。经过对大量药盒的数据统计发现,药盒上的文本区域中,药名区域的文字相对来说会较大于其他文本。因此,本方案采取的定位思路是:将识别到的所以文本区域按照宽度排序,然后选出适合的文本区域,再进行识别。
最后就是文字识别方法——文字识别方法的目标是已处于定位区域内的文字,其中的主要问题就是如何将一副文字图片转录为一串与之对应的字符。市面上相对流行的文字识别方法有Tesseract-OCR和百度OCR两种算法。Tesseract是一款文字识别引擎。其基础上的LSTM神经网络是一种改进的循环神经网络,解决了普通RNN在实际应用中难以处理长文本的缺陷。而百度OCR是目前基于深度学习较为成熟的文字识别技术,能适用于不同的业务场景对识别速度和进度的要求。
2、软件流程图
系统开始运行后,摄像头开始采集图像信息,然后将采集到的图像交由主控模块进行图像预处理——灰度化处理、滤波处理以及锐化处理,然后再进行文本区域的识别,通过CRAFT算法检测文本,并将采集到的图像进行分割,最后借助OCR算法进行文字识别。
SHAPE \* MERGEFORMAT
摄像头采集图像 |
终止 |
图像灰度化处理 |
图像滤波 |
图像锐化 |
CRAFT文本检测 |
药名区域确定 |
OCR文字识别 |
图4-2 药盒药名识别系统软件流程图
5. 工作计划
第 1周( 2.20-2.24)接受任务书,领会课题含义按要求查找相关资料;翻译英文;
第 2周( 2.27-3.3)阅读相关资料,理解有内容;写出开题报告一份;
第 3周( 3.6-3.10)确定机器视觉、信号传输电路,参阅有关资料分析调理工作原理;
以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。