预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共19页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113032553A(43)申请公布日2021.06.25(21)申请号201911250452.4(22)申请日2019.12.09(71)申请人富士通株式会社地址日本神奈川县(72)发明人高玥张姝孙俊(74)专利代理机构北京集佳知识产权代理有限公司11227代理人王萍王鹏(51)Int.Cl.G06F16/35(2019.01)G06N20/00(2019.01)权利要求书1页说明书12页附图5页(54)发明名称信息处理装置和信息处理方法(57)摘要本公开涉及信息处理方法和信息处理装置。根据本公开的信息处理装置包括:提取单元,被配置成将多路数据转换为张量数据并且提取所述张量数据的核心张量;聚类单元,被配置成对所述核心张量执行聚类处理;贡献度计算单元,被配置成针对所述核心张量的每个簇,计算所述张量数据的各分量数据的贡献度;以及降采样单元,被配置成基于所述贡献度对所述张量数据执行降采样处理。根据本公开的信息处理装置和信息处理方法在保留张量数据的高阶特征的同时减小张量数据的存储空间和处理成本,提高用于张量数据的分类模型的分类准确性。CN113032553ACN113032553A权利要求书1/1页1.一种信息处理装置,包括:提取单元,被配置成将多路数据转换为张量数据并且提取所述张量数据的核心张量;聚类单元,被配置成对所述核心张量执行聚类处理;贡献度计算单元,被配置成针对所述核心张量的每个簇,计算所述张量数据的各分量数据的贡献度;以及降采样单元,被配置成基于所述贡献度对所述张量数据执行降采样处理。2.根据权利要求1所述的信息处理装置,其中,所述张量数据为三阶或更高阶的张量数据。3.根据权利要求1所述的信息处理装置,其中,所述提取单元被配置成对所述张量数据进行分解,从而得到所述核心张量和一个或更多个因子矩阵,所述因子矩阵的数量与所述张量数据的阶数相对应。4.根据权利要求3所述的信息处理装置,其中,所述提取单元被配置成使用DeepTensor方法对所述张量数据进行分解。5.根据权利要求1所述的信息处理装置,其中,所述聚类单元被配置成使用K-means聚类方法对所述核心张量进行聚类。6.根据权利要求1所述的信息处理装置,其中,所述贡献度计算单元包括:样本分布确定子单元,其被配置成针对所述核心张量的每个簇,使用该簇中包含的核心张量作为扰动样本来获得该簇的样本分布,贡献度计算子单元,其被配置成基于该簇的样本分布来计算该簇中的每个张量数据中的各个分量数据的贡献度。7.根据权利要求6所述的信息处理装置,其中,所述簇的样本分布用线性回归模型来表示。8.根据权利要求1所述的信息处理装置,其中,所述降采样单元被配置成通过删除所述张量数据中的贡献度为零的分量数据来执行降采样。9.根据权利要求1所述的信息处理装置,其中,所述降采样单元被配置成基于构成所述张量数据的分量数据的数目来确定对所述张量数据执行降采样的策略。10.一种信息处理方法,包括:将多路数据转换为张量数据并且提取所述张量数据的核心张量;所述核心张量执行聚类处理;针对所述核心张量的每个簇,计算所述张量数据的各分量数据的贡献度;以及基于所述贡献度对所述张量数据执行降采样处理。2CN113032553A说明书1/12页信息处理装置和信息处理方法技术领域[0001]本文公开的实施方式涉及信息处理的技术领域。特别地,本公开的实施方式涉及用于对张量数据进行降采样的信息处理装置和信息处理方法。背景技术[0002]在目前的大数据分析领域中,众多数据常常以多路数据(multi-waydata)的形式存在。这些多路数据通常可以使用张量(tensor)数据的形式来表示。[0003]随着深度学习的发展,开发了例如DeepTensor(DeepTensor:ElicitingNewInsightsfromGraphDatathatExpressRelationshipsbetweenPeopleandThings,KojiMaruhashi,FUJITSUSci.Tech.J.,Vol.53,No.5,pp-26-31,September2017)、图卷积神经网络等深度学习技术,这些技术可以利用高阶张量数据的数据结构来表示多路数据,随后通过机器学习的方法进行分析,从而能够直接提取重要的特征来进行分类。[0004]然而,以张量数据形式表示多路数据往往会忽略多路数据内在重要的关系特征。此外,大多数的多路数据包含较大信息量,因而所构建的数据结构分布较为复杂,导致表示多路数据的张量数据的分布过于稀疏,使得这些深度学习技术往往无法进行充分的学习。[0005]再者,与传统分类方法相比,深度学习的分类方法一种是“黑盒”方法,即难以准确描述其内部机理,因而