预览加载中,请您耐心等待几秒...
1/6
2/6
3/6
4/6
5/6
6/6

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局*CN102375860A*(12)发明专利申请(10)申请公布号CN102375860A(43)申请公布日2012.03.14(21)申请号201010264864.6(22)申请日2010.08.27(71)申请人盛乐信息技术(上海)有限公司地址201203上海市浦东新区郭守敬路356号(72)发明人霍炬(74)专利代理机构上海浦一知识产权代理有限公司31211代理人张骥(51)Int.Cl.G06F17/30(2006.01)权利要求书1页说明书3页附图1页(54)发明名称基于云的结构化数据搜索方法(57)摘要本发明公开了一种基于云的结构化数据搜索方法,包括以下步骤:第一步,建立一个由多台计算机组成的云平台,各计算机之间通过socket连接起来;在云平台上实现集中管理和SAAS服务;各计算机上设有索引服务和检索服务;第二步,对源数据进行标注,以使数据结构化;第三步,根据源数据的标注结果,建立不同类型的索引,用于搜索。本发明通过建立搜索集群,为其他网站提供搜索服务,网站可以将结构化之后的数据通知给本服务,从而提供根据结构化数据和自定义条件的搜索结果。CN10237586ACCNN110237586002375867A权利要求书1/1页1.一种基于云的结构化数据搜索方法,其特征在于,包括以下步骤:第一步,建立一个由多台计算机组成的云平台,各计算机之间通过socket连接起来;在云平台上实现集中管理和SAAS服务;各计算机上设有索引服务和检索服务;第二步,对源数据进行标注,以使数据结构化;第三步,根据源数据的标注结果,建立不同类型的索引,用于搜索。2.根据权利要求1所述的基于云的结构化数据搜索方法,其特征在于:所述第二步对源数据进行标注的方法是,将数据分为多种类型,数据类型包括:可被搜索且分词的;可被搜索且不分词的;不被搜索仅存储的;可做排序和范围查询的;时间;需要快速变化的。3.根据权利要求1所述的基于云的结构化数据搜索方法,其特征在于:所述第三步建立不同类型的索引的方法是,将索引分为多种类型,索引类型包括:全文索引;快速变化的数字索引;用来存储但不参与搜索的源数据。2CCNN110237586002375867A说明书1/3页基于云的结构化数据搜索方法技术领域[0001]本发明涉及一种互联网的搜索方法,具体涉及一种基于云的结构化数据搜索方法。背景技术[0002]随着互联网内容量的增加,各类网站均拥有了大量内容。这些内容分布广泛,目前通用的搜索引擎只能收录到其中很少一部分内容,无法覆盖全面。[0003]这是由目前通用搜索的技术限制造成的。通用搜索希望覆盖尽可能广泛的内容,内容的重要性由搜索引擎本身根据一定算法决定,并不依赖于内容源本身的重要程度。同时,因为索引系统的容量所限,通用搜索也不可能把地球上所有网站的内容全部包括。[0004]同样,通用搜索一般按照自己定义的排序方法进行排序,并预先把计算好的排序结果保存在索引中。[0005]对于拥有内容的网站本身,又不简单满足于通用的搜索引擎基于文本的搜索方式,而希望根据其数据结构提供复杂而结构化的搜索结果。这些网站希望搜索引擎可以检索到全部内容,可以按照自己的要求调整排序,并希望可以快速的适应各种变化,包括内容变化,排序变化等。发明内容[0006]本发明所要解决的技术问题是提供一种基于云的结构化数据搜索方法,它可以提供根据结构化数据和自定义条件的搜索结果。[0007]为解决上述技术问题,本发明基于云的结构化数据搜索方法的技术解决方案为:[0008]包括以下步骤:[0009]第一步,建立一个由多台计算机组成的云平台,各计算机之间通过socket连接起来;在云平台上实现集中管理和SAAS服务;各计算机上设有索引服务和检索服务;[0010]第二步,对源数据进行标注,以使数据结构化;[0011]对源数据进行标注的方法是,将数据分为多种类型,数据类型包括:[0012]可被搜索且分词的;[0013]可被搜索且不分词的;[0014]不被搜索仅存储的;[0015]可做排序和范围查询的;[0016]时间;[0017]需要快速变化的。[0018]第三步,根据源数据的标注结果,建立不同类型的索引,用于搜索。[0019]建立不同类型的索引的方法是,将索引分为多种类型,索引类型包括:[0020]全文索引;[0021]快速变化的数字索引;3CCNN110237586002375867A说明书2/3页[0022]用来存储但不参与搜索的源数据。[0023]本发明可以达到的技术效果是:[0024]本发明通过建立搜索集群(云),为其他网站提供搜索服务,网站可以将结构化之后的数据通知给本服务,从而提供根据结构化数据和自定义条件的搜索结果。[0025]本发明能够为网站提供搜索功能,其优