视频内容中商品的LOGO识别技术研究与实现开题报告

 2022-11-26 13:01:58

1. 研究目的与意义

视频是承载信息量最大、最有感染力和冲击力的信息形态,已经成为人们获取信息、日常娱乐的主要形式。

而且研究表明,人类对物质世界的感知中,有80%以上的信息来源于视觉。

所以多媒体逐渐成为人们的主流需求,数字视频已经成为人们日常生活不可或缺的一部分。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 课题关键问题和重难点

关键问题:1.本课题是对视频内容中商品LOGO的识别,所以最基本也是最关键的问题是如何对视频内的文本进行准确的提取,一个典型的视频文本信息提取系统又包括文本检测、文本定位、文本跟踪、文本增强、文本分割和OCR识别六个部分。

2.如何识别出所要找的商标,也就是如何对商标的各种特征(例如:颜色的分布、相互关系、组成等;图像的纹理结构、方向、组合及对称关系等;形状:图像轮廓组成、形状、大小等;图像中子对象的关系、数量、属性、旋转等。

)进行提取。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 国内外研究现状(文献综述)

随着网络技术和多媒体技术的高速发展,多媒体的数量与日俱增。

视频作为多媒体最主要的组成部分,在社会、经济和生活中扮演者举足轻重的角色。

面对庞大的视频数据,如何能在如此多的视频中找到自己感兴趣的内容已经成为人们研究的热点。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 研究方案

本课题是视频内容中商品的LOGO识别技术研究与实现,所以本课题采用python和opencv两者相辅实现本课题所需实现的功能。

本课题最为关键的问题就是如何能在视频中找出课题所需要的LOGO标识,因本课题只考虑文本类型,所以运用的主要是关于文本方面的知识,所以总体设计是围绕文本展开的,总体设计大致分为三个部分:1. 商品LOGO文本特征的提取;2. 将所提取的文本特征设置为待识别LOGO,在视频中寻找与之相似的LOGO;3. 记录所找到LOGO的位置,时间,时长。

第一步文本特征的提取本课题采用SIFT算法,通过构建尺度空间,检测极值点,获得尺度不变性;特征点过滤并进行精确定位,剔除不稳定的特征点;在特征点出提取特征描述符,为特征点分配方向值;生成特征描述子,利用特征描述符寻找匹配点;计算变换参数这五步来提取文本特征并将其合在一起作为待识别LOGO。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 工作计划

2022.12.2-2022.12.3:确定选题,完成申请表; 2022.12.3-2022.12.8:查阅资料,熟悉任务书要求; 2022.12.8-2022.12.14:查阅资料,准备撰写开题报告; 2022.12.14-2022.12.23:搜集、查阅相关文献资料,确定总体研究计划; 2022.12.23-2022.1.2:搭建研发环境,准备实验数据; 2022.1.2-2022.1.12:确定实验设计方案 2022.1.12-2022.1.31:论证设计方案;完成开题报告初稿; 2022.2.1-2022.2.8:完善开题报告;完成开题; 2022.2.8-2022.2.22:系统开发:成功设定待识别LOGO标识; 2022.2.22-2022.3.7:系统开发:能定位出LOGO在视频中的位置;检查与完善英文翻译; 2022.3.7-2022.3.21:系统开发:能确定出LOGO在视频中的时间; 2022.3.21-2022.4.11:系统开发:能确定LOGO在视频中的时长;完成中期检查; 2022.4.11-2022.4.18:结合导师意见,完善系统,测试系统成果; 2022.4.18-2022.5.3:参考研究过程资料,撰写论文,完成论文初稿;完成软硬件验收; 2022.5.3-2022.5.16:对论文进行修饰和完善,完成论文二稿;完成论文查重; 2022.5.16-2022.5.30:完成论文定稿,制作PPT,完成答辩

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。