预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共27页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115668134A(43)申请公布日2023.01.31(21)申请号202080101011.2(51)Int.Cl.(22)申请日2020.06.05G06F8/75(2006.01)(85)PCT国际申请进入国家阶段日2022.11.16(86)PCT国际申请的申请数据PCT/JP2020/0224402020.06.05(87)PCT国际申请的公布数据WO2021/245950JA2021.12.09(71)申请人富士通株式会社地址日本神奈川县(72)发明人尾上聪片冈正弘百足勇人中野太智(74)专利代理机构北京集佳知识产权代理有限公司11227专利代理师金雪梅权利要求书3页说明书11页附图12页(54)发明名称信息处理程序、信息处理方法以及信息处理装置(57)摘要本发明的信息处理装置通过对源代码执行词素解析,将源代码分割为多个保留字和多个变量。信息处理装置通过基于定义有保留字与静态代码的关系的静态词典,对源代码的保留字分配与保留字对应的静态代码,对源代码的变量分配动态代码,来生成压缩代码序列。信息处理装置对变量、分配给变量的动态代码以及变量的属性建立对应关系登记到动态词典中。信息处理装置通过基于与动态代码对应的属性,将动态代码嵌入到矢量空间中,通过将矢量分配给压缩代码序列的动态代码,将预先决定的矢量分配给压缩代码序列的静态代码,来计算源代码的矢量。CN115668134ACN115668134A权利要求书1/3页1.一种信息处理程序,其特征在于,使计算机执行如下处理:通过对源代码执行词素解析,将上述源代码分割为多个保留字和多个变量,通过基于定义有保留字与静态代码的关系的静态词典,对上述源代码的保留字分配与保留字对应的静态代码,对上述源代码的变量分配动态代码,来生成压缩代码序列,对上述变量、分配给上述变量的动态代码以及上述变量的属性建立对应关系登记到动态词典中,通过基于与上述动态代码对应的属性,将上述动态代码嵌入到矢量空间,而将矢量分配给上述压缩代码序列的动态代码,将预先决定的矢量分配给上述压缩代码序列的静态代码,来计算上述源代码的矢量。2.根据权利要求1所述的信息处理程序,其特征在于,上述静态词典还定义声明语句与属性的关系,上述登记的处理还执行基于配置在上述变量之前方的声明语句的属性,来确定与上述变量对应的属性的处理。3.根据权利要求1所述的信息处理程序,其特征在于,在上述计算矢量的处理中,将与同一属性对应的多个动态代码嵌入到庞加莱空间的相似的位置,将与上述庞加莱空间的位置相应的矢量分配给嵌入的动态代码。4.根据权利要求1所述的信息处理程序,其特征在于,在上述生成压缩代码序列的处理中,对上述源代码的每个行生成上述压缩代码序列,在上述计算矢量的处理中,还执行如下处理:对每个行计算上述压缩代码序列的矢量,生成对各压缩代码序列的矢量和偏移建立对应关系的转置索引。5.根据权利要求1所述的信息处理程序,其特征在于,在上述生成压缩代码序列的处理中,对上述源代码所包含的每个函数生成上述压缩代码序列,在上述计算矢量的处理中,还执行如下处理:对每个函数计算压缩代码序列的矢量,生成对各压缩代码序列的矢量和偏移建立对应关系的转置索引。6.根据权利要求1~5中任一项所述的信息处理程序,其特征在于,还执行基于上述源代码的矢量来评价多个源代码的相似度的处理。7.根据权利要求4所述的信息处理程序,其特征在于,还执行如下处理:基于与成为查询的源代码的行对应的矢量和上述转置索引,来确定与成为查询的源代码的行相似的源代码的行。8.根据权利要求5所述的信息处理程序,其特征在于,还执行如下处理:基于与成为查询的源代码的函数对应的矢量和上述转置索引,来确定与成为查询的源代码的行对应的源代码的函数。9.一种信息处理方法,是由计算机执行的信息处理方法,其特征在于,执行如下处理:通过对源代码执行词素解析,将上述源代码分割为多个保留字和多个变量,通过基于定义有保留字与静态代码的关系的静态词典,对上述源代码的保留字分配与保留字对应的静态代码,对上述源代码的变量分配动态代码,来生成压缩代码序列,对上述变量、分配给上述变量的动态代码以及上述变量的属性建立对应关系登记到动态词典中,通过基于与上述动态代码对应的属性,将上述动态代码嵌入到矢量空间,而将矢量分2CN115668134A权利要求书2/3页配给上述压缩代码序列的动态代码,将预先决定的矢量分配给上述压缩代码序列的静态代码,来计算上述源代码的矢量。10.根据权利要求9所述的信息处理方法,其特征在于,上述静态词典还定义声明语句与属性的关系,上述登记的处理还执行基于配置在上述变量之前方的声明语句的属性,来确定与上述变量对应的属性的处理。11.根据权利要求9所述的