预览加载中,请您耐心等待几秒...
1/7
2/7
3/7
4/7
5/7
6/7
7/7

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号(10)申请公布号CNCN103714147103714147A(43)申请公布日2014.04.09(21)申请号201310733513.9(22)申请日2013.12.26(71)申请人乐视网信息技术(北京)股份有限公司地址100089北京市海淀区学院南路68号19号楼六层6184号房间(72)发明人曹坤波郑磊(74)专利代理机构北京国昊天诚知识产权代理有限公司11315代理人许志勇(51)Int.Cl.G06F17/30(2006.01)权权利要求书1页利要求书1页说明书4页说明书4页附图1页附图1页(54)发明名称视频资源数据源的处理方法及其系统(57)摘要本发明公开了一种视频资源数据源的处理方法及其系统,其中该方法包括:获取多种维度的视频资源数据的数据源;将所述数据源转换为按照预定数据结构建立的数据模型,并将所述数据模型存储为物化视图。通过本发明在建立倒排索引时只需面对统一的数据模型的物化视图,在执行查询时可以快速地得到处理结果,从而大大节约了建立倒排索引的时间。CN103714147ACN10374ACN103714147A权利要求书1/1页1.一种视频资源数据源的处理方法,其特征在于,包括:获取多种维度的视频资源数据的数据源;将所述数据源转换为按照预定数据结构建立的数据模型,并将所述数据模型存储为物化视图。2.根据权利要求1所述的方法,其特征在于,所述数据模型包括:基础数据,其进一步包括以下信息:视频标题、视频简介、演员、导演。3.根据权利要求2所述的方法,其特征在于,所述数据模型还包括:扩展数据,其进一步包括以下信息:平台属性、码流信息。4.根据权利要求3所述的方法,其特征在于,所述将所述数据源转换为按照预定数据结构建立的数据模型的步骤,包括:对于所述数据模型的基础数据,其采用定长结构,并将所述基础数据按照横表的方式进行存储;对于所述数据模型的扩展数据,其采用不定长结构,并将所述扩展数据按照列表的方式进行存储。5.根据权利要求1所述的方法,其特征在于,所述获取多种维度的视频资源数据的数据源包括:按照视频资源数据的来源划分所述数据源包括:文件系统、数据库;按照视频资源应用的终端渠道划分所述数据源包括:电视终端、移动终端;按照视频资源的文件格式划分所述数据源包括:可扩展标记语言文件、文本文件。6.一种视频资源数据源的处理系统,其特征在于,包括:获取模块,用于获取多种维度的视频资源数据的数据源;处理模块,用于将所述数据源转换为按照预定数据结构建立的数据模型,并将所述数据模型存储为物化视图。7.根据权利要求6所述的系统,其特征在于,所述数据模型包括:基础数据,其进一步包括以下信息:视频标题、视频简介、演员、导演。8.根据权利要求7所述的系统,其特征在于,所述数据模型还包括:扩展数据,其进一步包括以下信息:平台属性、码流信息。9.根据权利要求8所述的系统,其特征在于,所述处理模块进一步包括:第一处理模块,用于对于所述数据模型的基础数据,其采用定长结构,并将所述基础数据按照横表的方式进行存储;第二处理模块,用于对于所述数据模型的扩展数据,其采用不定长结构,并将所述扩展数据按照列表的方式进行存储。10.根据权利要求5所述的系统,其特征在于,所述获取多种维度的视频资源数据的数据源包括:按照视频资源数据的来源划分所述数据源包括:文件系统、数据库;按照视频资源应用的终端渠道划分所述数据源包括:电视终端、移动终端;按照视频资源的文件格式划分所述数据源包括:可扩展标记语言文件、文本文件。2CN103714147A说明书1/4页视频资源数据源的处理方法及其系统技术领域[0001]本发明涉及信息检索技术,尤其涉及一种视频资源数据源的处理方法及其系统。背景技术[0002]随着科技的发展,越来越多的用户通过互联网搜索并观看各种视频。由于互联网提供的视频信息十分丰富,并具有不断变化及更新的特点,随之产生了多种搜索引擎进行视频信息检索。[0003]在关系数据库系统中,索引是检索数据最有效率的方式。但对于全网的视频搜索引擎,并不能满足其特殊要求。由于搜索引擎面对的是全网的海量视频数据,例如乐视网等大型的视频网站搜索引擎索引都是亿级甚至几千亿的网页数量,面对如此海量的视频数据,使得数据库系统很难有效的管理。[0004]倒排索引是搜索引擎极为重要的索引方式,通过倒排索引解决海量的视频资源的存储与检索。在实际中,搜索引擎通常要面对不同的视频资源的数据源,这些数据源类型多样、来源复杂,如果不对这些各种维度的数据源进行处理则导致建立的倒排索引查询效率低下,不能够满足搜索引擎的需求。[0005]综上所述可知,现有技术中对视频资源的数据源的处理不符合倒排索引需求的技术方案,因此有必要提出