预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共55页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局*CN103443792A*(12)发明专利申请(10)申请公布号(10)申请公布号CNCN103443792103443792A(43)申请公布日2013.12.11(21)申请号201380000869.X代理人李辉金玲(22)申请日2013.01.30(51)Int.Cl.(30)优先权数据G06F17/30(2006.01)2012-0547592012.03.12JP(85)PCT申请进入国家阶段日2013.09.10(86)PCT申请的申请数据PCT/JP2013/0520372013.01.30(87)PCT申请的公布数据WO2013/136865JA2013.09.19(71)申请人乐天株式会社地址日本东京都(72)发明人新里圭司(74)专利代理机构北京三友知识产权代理有限公司11127权权利要求书4页利要求书4页说明书30页说明书30页附图20页附图20页(54)发明名称信息处理装置、信息处理方法、信息处理装置用程序和记录介质(57)摘要取得作为基础的基本词、将该基本词作为被修饰语的复合词、用于对该复合词进行分类的分类项目、与作为用于对该复合词进行分类的线索的特征有关的特征信息(S10、S11、S12、S13),使用预先生成的分类模型和所取得的特征信息,将包含基本词的复合词分配给所取得的分类项目(S14、S15),根据基本词取得包含与基本词相关联的多个要素的基本词关联信息(S16),根据该分类结果,将所取得的基本词关联信息中包含的要素中的至少一部分分别分类到分类项目中的任意一方(S17),输出该分类后的基本词关联信息(网页40、50、51)(S18)。CN103443792ACN1034792ACN103443792A权利要求书1/4页1.一种信息处理装置,其特征在于具有:基本词取得单元,其取得作为基础的基本词;复合词取得单元,其从复合词存储单元取得将由所述基本词取得单元取得的基本词作为被修饰语的复合词;分类项目取得单元,其参照分类项目存储单元取得用于对由所述复合词取得单元取得的复合词进行分类的分类项目;特征信息取得单元,其参照特征信息存储单元取得特征信息,该特征信息与作为用于对由所述复合词取得单元取得的复合词进行分类的线索的特征有关;复合词分类单元,其使用预先生成的分类模型和由所述特征信息取得单元针对由所述复合词取得单元取得的复合词取得的特征信息,将包含所述基本词的所述复合词分配给由所述分类项目取得单元取得的分类项目;基本词关联信息取得单元,其根据所述基本词取得包含与基本词相关联的多个要素的基本词关联信息;基本词关联信息分类单元,其根据所述复合词分类单元的分类结果,将由所述基本词关联信息取得单元取得的基本词关联信息中包含的要素中的至少一部分分别分类到所述分类项目中的任意一方;以及输出单元,其输出由所述基本词关联信息分类单元进行分类后的基本词关联信息。2.根据权利要求1所述的信息处理装置,其特征在于还具有:特征矢量生成单元,其针对复合词,使用特征信息生成该复合词的特征矢量;学习用复合词取得单元,其取得学习用的复合词;学习用分类项目取得单元,其取得与由所述学习用复合词取得单元取得的学习用的复合词对应的学习用的分类项目;以及分类模型构建单元,其使用由所述特征矢量生成单元生成的学习用的复合词的特征矢量和由所述学习用分类项目取得单元取得的学习用的分类项目进行机器学习,构建所述分类模型,其中,该学习用的复合词是由所述学习用复合词取得单元取得的;所述特征矢量生成单元针对由所述复合词取得单元取得的复合词,使用所述特征信息生成该复合词的特征矢量,所述复合词分类单元使用由所述分类模型构建单元构建的分类模型和由所述复合词取得单元取得的复合词的特征矢量,将包含所述基本词的所述复合词分配给所述分类项目。3.根据权利要求1所述的信息处理装置,其特征在于还具有修饰语部分取得单元,该修饰语部分取得单元取得所述复合词的针对所述基本词的修饰语部分,所述特征信息存储单元存储将各个所述分类项目和规定的词关联起来的分类辞典,所述特征信息取得单元参照所述特征信息存储单元取得将各个所述分类项目和规定的词关联起来的分类辞典,所述复合词分类单元使用利用所述特征信息存储单元中存储的分类辞典而预先生成的分类模型和针对由所述修饰语部分取得单元取得的修饰语部分的所述特征信息,将包含所述基本词的所述复合词分配给所述分类项目。4.根据权利要求3所述的信息处理装置,其特征在于还具有后缀取得单元,该后缀取2CN103443792A权利要求书2/4页得单元从所述修饰语部分取得单元所取得的修饰语部分取得后缀,所述复合词分类单元使用利用所述特征信息存储单元中存储的分类辞典而预先生成的分类模型和针对除了由所述后缀取得单元取得的后缀以外的所述修饰