基于特征摘要图的视频中的户外场景文本自动获取方法-豆柴文库

基于特征摘要图的视频中的户外场景文本自动获取方法.pdf

2023-09-01

10金币

1.3MB

15页

飞飙****ng

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共15页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN108038458A(43)申请公布日2018.05.15(21)申请号201711381971.5(22)申请日2017.12.20(71)申请人首都师范大学地址100048北京市海淀区西三环北路105号(72)发明人黄晓冬王勤(74)专利代理机构北京德琦知识产权代理有限公司11018代理人夏宪富(51)Int.Cl.G06K9/00(2006.01)G06K9/34(2006.01)G06K9/46(2006.01)G06K9/62(2006.01)权利要求书4页说明书7页附图3页(54)发明名称基于特征摘要图的视频中的户外场景文本自动获取方法(57)摘要一种基于特征摘要图的视频中的户外场景文本自动获取方法，首先获取场景文本的视频帧图像，并基于视频帧图像的RGB色彩空间生成视频帧特征摘要图：先在RGB色彩空间上分别提取水平、垂直、45度和135度四个方向的四个卷积图，得到表征色彩空间的四个方向特征向量，进而获得代表不同方向视频帧的十个显著图并进行融合计算，得到视频帧特征摘要图。然后基于视频帧特征摘要图和RGB色彩空间进行K均值颜色聚类计算，得到表示背景、前景文字字符、字符轮廓和噪音的四个区域的四类结果后，再分别分析四类结果的连通域，删除背景和噪音两个区域，自动获取最终的户外场景文本。本发明操作步骤简单、计算容易，能够实时识别和获取的户外场景文本，推广应用前景好。CN108038458ACN108038458A权利要求书1/4页1.一种基于特征摘要图的视频中的户外场景文本自动获取方法，其特征在于：该方法包括下列操作步骤：步骤1，获取场景文本的视频帧图像，并基于该视频帧图像的红绿蓝RGB色彩空间生成视频帧特征摘要图：首先在RGB色彩空间上分别提取包括水平方向、垂直方向、45度方向和135度方向的四个卷积图，得到用于表征RGB色彩空间的四个方向特征向量；再将该四个方向特征向量分别进行两两向量的乘积运算，以获得分别代表不同方向视频帧的十个显著图；然后对该不同方向的十个显著图进行融合计算，得到视频帧特征摘要图，作为后续获取视频中的场景文本的视觉表征，并删除背景和噪声干扰，提高识别精准度；步骤2，自动获取场景文本：首先基于该视频帧特征摘要图和RGB色彩空间进行K均值颜色聚类计算，将该视频帧摘要图细分为分别表示背景、前景文字字符、字符轮廓和噪音的四个区域的四类结果；再对该四类结果分别进行连通域分析，删除背景和噪音两个区域，获取最终的场景文本。2.根据权利要求1所述的方法，其特征在于：所述在RGB色彩空间上分别提取的包括水平方向、垂直方向、45度方向和135度方向的四个卷积图中，水平方向卷积图采用的水平方向卷积核是索贝尔Sobel算子中计算水平方向微分的计算模板：垂直方向卷积图采用的垂直方向卷积核是Sobel算子中计算垂直方向微分的计算模板：45度方向卷积图采用的45度方向卷积核是计算45度方向微分的计算模板：135度方向卷积图采用的135度方向卷积核是计算135度方向微分的计算模板：基于卷积核的卷积图特征提取方法特点是算法简单、运算速度快、有利于工程实现，且提取的卷积特征不容易受到户外场景中的光照变化影响。3.根据权利要求1所述的方法，其特征在于：所述步骤1包括下列操作内容：(11)先分别在红色通道上分别提取水平方向卷积图Rh、垂直方向卷积图Rv、45度方向卷积图Rl和135度方向卷积图Rr，在绿色通道上分别提取水平方向卷积图Gh、垂直方向卷积图Gv、45度方向卷积图Gl和135度方向卷积图Gr，在蓝色通道上分别提取水平方向卷积图Bh、垂直方向卷积图Bv、45度方向卷积图Bl和135度方向卷积图Br；再将上述各个方向卷积图按照RGB色彩空间排列，得到用于表征RGB色彩空间的四个方向特征向量：水平方向特征向量H＝{Rh,Gh,Bh},垂直方向特征向量V＝{Rv,Gv,Bv}，45度方向特征向量L＝{Rl,Gl,Bl}，135度方向特征向量R＝{RrGr,Br}；(12)将该四个方向特征向量分别进行两两向量的乘积运算，获得代表视频帧的不同方2CN108038458A权利要求书2/4页向的十个显著图，以便在保留多个设定方向边缘特征的同时，删除其余方向的背景和噪音干扰，并获取场景文本多种方向的笔划特征，有助于自动提取场景文本；(13)对该不同方向的十个显著图进行融合计算，得到视频帧特征摘要图，为后续获取视频中的场景文本提供视觉表征，并删除背景和噪声干扰，提高场景文本自动获取结果的精准度和完整度。4.根据权利要求3所述的方法，其特征在于：所述步骤(12)包括下列操作内容：(120)按照公式Shh＝{Rh,Gh,Bh}×{Rh,Gh,Bh}计算水平方向特征向量的自乘之积，

相关资料

基于特征摘要图的视频中的户外场景文本自动获取方法.pdf

一种基于特征摘要图的视频中的户外场景文本自动获取方法，首先获取场景文本的视频帧图像，并基于视频帧图像的RGB色彩空间生成视频帧特征摘要图：先在RGB色彩空间上分别提取水平、垂直、45度和135度四个方向的四个卷积图，得到表征色彩空间的四个方向特征向量，进而获得代表不同方向视频帧的十个显著图并进行融合计算，得到视频帧特征摘要图。然后基于视频帧特征摘要图和RGB色彩空间进行K均值颜色聚类计算，得到表示背景、前景文字字符、字符轮廓和噪音的四个区域的四类结果后，再分别分析四类结果的连通域，删除背景和噪音两个区域，

2023-09-01

1.3MB

基于特征融合的视频文本获取研究.docx

基于特征融合的视频文本获取研究摘要：针对现代社会大量产生的视频数据和文本数据，本文提出了一种基于特征融合的视频文本获取方法。该方法通过将视频数据和文本数据中的特征进行融合，实现了对文本信息的提取和分析。这一方法不仅可以提高视频和文本信息的处理效率，同时可以提高其准确性和实用性。本文通过实验验证了该方法的可行性和有效性，证明该方法可以应用于各种视频和文本信息的处理和分析。关键词：视频；文本；特征融合；信息提取；挖掘Introduction：随着互联网技术的不断发展，视频和文本数据的应用越来越广泛。视频数据和

2024-10-15

11KB

基于特征融合的视频文本获取研究的任务书.docx

基于特征融合的视频文本获取研究的任务书一、研究背景随着社交媒体和视频平台的兴起，用户在日常生活中观看视频的时间越来越长，因此对于视频中的数据分析和获取变得越来越重要。视频文本获取是一项关键技术，它可以通过提取视频中的关键信息（例如子标题、标注、语音识别结果等）来使视频内容更加系统化并且便于管理。但是，在实际应用中，由于视频本身的多样性和复杂性，单一特征获取的方法已经无法满足我们的需求，因此，需要对特征进行综合利用。综合利用特征的方法通常称为特征融合，通过将视频中的不同特征进行整合，可以提高提取视频文本的准

2024-09-30

11KB

视频中的场景文本检测方法研究的开题报告.docx

视频中的场景文本检测方法研究的开题报告一、研究背景数字化技术的快速发展使得视频数据的数量和规模大大增加，视频数据的应用场景也越来越广泛。而在视频数据中，文本包含的信息量非常大，可以提供丰富的信息，如视频中的演讲、字幕、广告、标志等。因此，文本检测在视频领域中具有重要意义。当前，文本检测方法已经在图像领域有了广泛应用，但在视频领域中文本检测的问题仍然是具有挑战性的。由于视频中的文本可能受到光照、运动模糊、遮挡和背景变化等多种因素的干扰，使得文本检测难度变得很高。为了解决这个问题，本研究主要关注在视频中自动检

2024-10-13

11KB

基于神经网络的用户视频评分自动获取方法.docx

基于神经网络的用户视频评分自动获取方法基于神经网络的用户视频评分自动获取方法随着互联网和移动互联网的普及，大量的视频流媒体服务和在线视频分享平台如优酷、爱奇艺、B站等涌现出来。这些视频平台给用户带来了丰富的内容选择和互动体验，但是也为视频的质量评价和视频内容推荐带来了挑战。传统的基于用户评分的视频质量评价方法需要用户主动参与，费时费力且易受到用户偏见等因素影响。因此，语音识别、基于视频内容分析的自动评分方法等新技术正在发展中。其中，基于神经网络的用户视频评分自动获取方法拓展了传统的视频评价方法，能够更好地

2024-11-02

11KB