多特征融合的新闻视频摘要提取方法-豆柴文库

多特征融合的新闻视频摘要提取方法.pdf

2023-12-07

10金币

1MB

14页

冬易****娘子

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共14页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN105516802A(43)申请公布日2016.04.20(21)申请号201510807865.3H04N21/8549(2011.01)(22)申请日2015.11.19(71)申请人上海交通大学地址200240上海市闵行区东川路800号申请人上海神州数码有限公司(72)发明人蒋兴浩孙锬锋王娟姜华郁聪(74)专利代理机构上海汉声知识产权代理有限公司31236代理人郭国中(51)Int.Cl.H04N21/44(2011.01)H04N21/4728(2011.01)H04N21/845(2011.01)权利要求书2页说明书8页附图3页(54)发明名称多特征融合的新闻视频摘要提取方法(57)摘要本发明提供了一种多特征融合的新闻视频摘要提取方法，其对原始新闻视频利用镜头分割和镜头标定获得新闻视频基本处理单元。就静态视频摘要，对新闻基本处理单元采用角点检测、颜色滤波和形态学分析进行主题字幕检测，再结合人脸识别和聚类获得新闻主要人物信息；就动态视频摘要，对新闻基本处理单元进行静音分析，得到静音段，然后判定每个静音段是否包含主题字幕，如果有，则将其加入到最终的动态摘要序列，反之亦然；从而得到有意义的高语义动态和静态视频摘要。本发明能获得的静态摘要，可灵活地浏览和组织视频内容；并能获得的动态摘要，包含丰富的多媒体信息能清晰地表达原始视频内容，更具有娱乐性和观赏性。CN105516802ACN105516802A权利要求书1/2页1.一种多特征融合的新闻视频摘要提取方法，其特征在于，包括如下任一个或任多个步骤：获取新闻基本处理单元步骤：从新闻视频中提取新闻基本处理单元；检测主题字幕帧步骤：从新闻视频中提取主题字幕帧；检测静音段步骤：从新闻视频中提取静音段；检测人脸步骤：从新闻视频中提取人脸。2.根据权利要求1所述的多特征融合的新闻视频摘要提取方法，其特征在于，所述新闻基本处理单元是指，一段以主持人镜头出现为开始时刻，中间时段包含内容镜头，并以下一个主持人镜头出现的开始时刻作为结束时刻的视频片段。3.根据权利要求2所述的多特征融合的新闻视频摘要提取方法，其特征在于，所述获取新闻基本处理单元步骤包括镜头分割步骤，其中，所述镜头分割步骤，包括如下步骤：根据如下计算式得到D(i,j)：其中，D(i,j)表示第i帧与第j帧的差异，N表示新闻视频帧灰度级的数量，fi,k表示第i帧新闻视频中第k级灰度的像素个数，fj,k表示第j帧新闻视频中第k级灰度的像素个数，第i帧与第j帧为前后两帧；i、j为正整数；如果第i帧与第j帧的差异D(i,j)大于指定阈值Tshot，则认为存在镜头边界，将第j帧与设定的主持人模板进行匹配；若第j帧与设定的主持人模板匹配，则将第j帧作为新闻基本处理单元的起始帧。4.根据权利要求1所述的多特征融合的新闻视频摘要提取方法，其特征在于，所述检测主题字幕帧步骤，包括如下步骤：设置新闻视频帧的感兴趣区域；对各个新闻视频帧的感兴趣区域，采用Harris角点检测算子进行角点检测以获取感兴趣区域中的角点，根据角点得到待融合主题字母区域；将各个新闻视频帧的感兴趣区域中满足如下条件的区域提取为蓝色区域：100≤Hue≤2600.33≤Saturation≤1对提取到的蓝色区域提取矩形外轮廓，其中，Hue表示色调，Saturation表示饱和度；将符合如下条件的矩形外轮廓所属的新闻视频帧确认为主题字幕帧，并将不符合如下条件的矩形外轮廓所属的新闻视频帧确认为伪主题字幕帧：Height≥Theight其中，Height表示矩形外轮廓的高度，Theight表示设定的高度阈值，ContourAreamax为各个新闻视频帧中矩形外轮廓中的最大轮廓面积，ContourAreamax-1为各个新闻视频帧中矩形外轮廓中的第二大轮廓面积，Tcontour表示设定的比例阈值；将角点检测得到的待融合主题字母区域与主题字幕帧中矩形外轮廓的内部区域进行2CN105516802A权利要求书2/2页图像融合，得到候选主题字幕区域；以矩形结构元素对候选主题字幕区域进行形态学膨胀操作，得到待鉴别文本连通域；将符合如下条件的待鉴别文本连通域认为是伪文本块，将不符合如下条件的待鉴别文本连通域认为是文本块：Areatext≤TareaRatiotext≤Tratio其中，Areatext表示待鉴别文本连通域的面积，Tarea表示设定的面积阈值，Ratiotext表示待鉴别文本连通域的宽高比，Tratio表示设定的宽高比阈值。5.根据权利要求4所述的多特征融合的新闻视频摘要提取方法，其特征在于，所述根据角点得到待融合主题字母区域，具体为：将角点连线划定出待融合主题字母区域。6.根据权利要求1所述的多特征融合的新

相关资料

多特征融合的新闻视频摘要提取方法.pdf

本发明提供了一种多特征融合的新闻视频摘要提取方法，其对原始新闻视频利用镜头分割和镜头标定获得新闻视频基本处理单元。就静态视频摘要，对新闻基本处理单元采用角点检测、颜色滤波和形态学分析进行主题字幕检测，再结合人脸识别和聚类获得新闻主要人物信息；就动态视频摘要，对新闻基本处理单元进行静音分析，得到静音段，然后判定每个静音段是否包含主题字幕，如果有，则将其加入到最终的动态摘要序列，反之亦然；从而得到有意义的高语义动态和静态视频摘要。本发明能获得的静态摘要，可灵活地浏览和组织视频内容；并能获得的动态摘要，包含丰富

2023-12-07

1MB

多特征融合的汉越双语新闻摘要方法.docx

多特征融合的汉越双语新闻摘要方法摘要随着数据爆炸式的增长，做好信息摘要变得越来越重要。汉越双语新闻摘要方法可以为中越两国之间的交流提供便利。但是，传统的单一特征模型无法有效地捕捉文本中的各种语义信息，因此，多特征融合是必要的。本文提出了一种基于多特征融合的汉越双语新闻摘要方法，该方法利用了多种特征，包括词频、TF-IDF值、句子相似度和文本结构。为了测试该方法的有效性，我们进行了实验，并将其与传统单一特征模型进行比较。实验结果表明，多特征融合的汉越双语新闻摘要方法比传统模型有更好的效果。我们的研究成果可以

2024-11-01

10KB

基于多特征分层的视频摘要提取算法.pptx

,目录PartOnePartTwo算法定义算法目标算法流程算法特点PartThree颜色特征提取形状特征提取运动特征提取音频特征提取PartFour视频层摘要提取镜头层摘要提取关键帧层摘要提取音频层摘要提取PartFive实现方法优化策略时间复杂度分析空间复杂度分析PartSix实验数据集介绍实验结果展示结果分析性能评估PartSeven总结算法优缺点分析应用前景展望THANKS

2024-10-03

4.5MB

基于多模态融合的讲座类视频摘要提取的方法设计与研究.docx

基于多模态融合的讲座类视频摘要提取的方法设计与研究1.引言随着互联网的快速发展，大量的视频资源得到了广泛的传播，并且讲座类视频逐渐成为人们获取知识的重要来源之一。然而，讲座类视频一般长度较长、信息密度较高，给用户带来了较大的时间和认知成本。因此，讲座类视频摘要提取变得十分必要，其可以从视频中提取出关键信息，帮助用户更加快速和准确地获取所需要的内容。视频摘要提取可以视为一个文本生成问题，旨在从视频的不同片段中生成一个简短但包含核心信息的文本概述。然而，讲座类视频的摘要提取过程受到了以下两个方面的限制：-讲座

2024-10-22

11KB

基于多模态特征融合的新闻视频摘要技术研究的任务书.docx

基于多模态特征融合的新闻视频摘要技术研究的任务书任务书一、选题背景及意义新闻视频是一种重要的信息传播方式，其具有图像、音频、文本等多模态特征，通过融合这些多模态特征可以更全面、准确地提取新闻视频的关键信息和核心内容，从而实现新闻视频的自动摘要。新闻视频摘要技术可以为用户提供快速了解新闻内容的途径，也可以为新闻媒体提供自动化的编辑辅助工具，提高工作效率。因此，基于多模态特征融合的新闻视频摘要技术的研究具有重要的理论和实际价值。二、研究内容和目标本课题旨在研究基于多模态特征融合的新闻视频摘要技术，主要包括以下

2024-10-20

11KB