预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共30页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利(10)授权公告号(10)授权公告号CNCN102460437102460437B(45)授权公告日2014.10.15(21)申请号201080028234.7(51)Int.Cl.(22)申请日2010.06.28G06F17/30(2006.01)(30)优先权数据(56)对比文件2009-1524812009.06.26JPCN1536483A,2004.10.13,WO2006/051647A1,2006.05.18,(85)PCT国际申请进入国家阶段日2011.12.23审查员鞠博(86)PCT国际申请的申请数据PCT/JP2010/0609872010.06.28(87)PCT国际申请的公布数据WO2010/150910JA2010.12.29(73)专利权人乐天株式会社地址日本东京都品川区(72)发明人平野广美(74)专利代理机构中科专利商标代理有限责任公司11021代理人樊建中权权利要求书2页利要求书2页说明书16页说明书16页附图11页附图11页(54)发明名称信息检索装置、信息检索方法、信息检索程序及记录了信息检索程序的记录介质(57)摘要本发明提供一种信息检索装置,针对来自用户的提问能准确地回答检索结果。本发明存储与收集到的文本的句子相关的句子信息,从终端(2)接收来自用户的用户提问句子的信息,将用户提问句子分解成文节(S10),提取用户提问句子的文节中的弧线文节相同的文本,并将该文本与提问句子进行比较来检索提问句子中缺少的叶文节(S12~S16),将检索结果发送至终端(2)(S19)。CN102460437BCN1024637BCN102460437B权利要求书1/2页1.一种信息检索装置,其特征在于,具备:文本收集单元,其收集文本;第1文本文节分解单元,其将收集到的所述文本的句子分解成文节;第1文本文节间依存性分析单元,其分析所述文本的句子的文节之间的文节间依存性关系,将各自的文节至少分类成以下文节类别、即叶文节和根文节,其中所述根文节是与所述句子的树形结构的根部相应的文节,所述叶文节是与所述树形结构的叶子或内部节点相应的文节;文本结构存储单元,其存储所述文本、该文本的句子、该句子的文节及该文节的文节类别;接收单元,其从用户终端接收已被输入所述用户终端中的用户提问句子的信息;第2文本文节分解单元,其将所述用户提问句子分解成文节;第2文本文节间依存性分析单元,其分析所述用户提问句子的文节之间的文节间依存性关系,将各自的文节至少分类成以下文节类别、即叶文节和根文节,其中所述根文节是与所述句子的树形结构的根部相应的文节,所述叶文节是与所述树形结构的叶子或内部节点相应的文节;句子提取单元,其参照所述文本结构存储单元,提取包括与所述用户提问句子的根文节对应的根文节在内的句子;检索单元,其参照提取出的句子,检索该句子的叶文节中的所述用户提问句子的叶文节缺少的叶文节;和发送单元,其将所述检索单元检索到的文节发送至所述终端,所述第1文本文节间依存性分析单元对收集到的所述文本的句子的文节之间的文节间依存性关系赋予弧线,所述第1文本文节间依存性分析单元还比较根文节的弧线数和从该根文节经由弧线相连的叶文节的弧线数,并在该根文节的弧线数比该叶文节的弧线数少的情况下将该叶文节的文节类别从叶文节变换成检索用根文节且将该根文节的文节类别从根文节变换成检索用叶文节,所述文本结构存储单元存储变换后的文节、文节类别及弧线。2.根据权利要求1所述的信息检索装置,其特征在于,所述句子提取单元参照所述文本结构存储单元,提取包括与所述用户提问句子的根文节对应的根文节且弧线数超过所述用户提问句子中的该根文节的弧线数的根文节的句子。3.根据权利要求1或2所述的信息检索装置,其特征在于,所述信息检索装置还具备对用户提问句子生成单元,该对用户提问句子生成单元基于检索到的文节,对用户生成对用户提问句子,所述发送单元将所述对用户提问句子发送至所述终端。4.根据权利要求1或2所述的信息检索装置,其特征在于,所述信息检索装置还具备对用户提问句子生成单元,该对用户提问句子生成单元基于检索到的文节,对用户生成对用户提问句子,所述发送单元取代检索到的文节而将所述对用户提问句子发送至所述终端。5.根据权利要求3所述的信息检索装置,其特征在于,2CN102460437B权利要求书2/2页在检索到的文节的数目在规定数以上的情况下,所述对用户提问句子生成单元生成对用户提问句子。6.根据权利要求4所述的信息检索装置,其特征在于,在检索到的文节的数目在规定数以上的情况下,所述对用户提问句子生成单元生成对用户提问句子。7.一种信息检索方法,其特征在于,包括:文本收集步骤,收集文本;第1文本文节分解步骤,将收集到的所述文本的句子