预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共15页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115757816A(43)申请公布日2023.03.07(21)申请号202211382672.4(22)申请日2022.11.07(71)申请人北京交通大学地址100044北京市海淀区上园村3号(72)发明人李红辉韩铖山张大林闫佳和林映利屈靖淇贾志伟(74)专利代理机构北京卫平智业专利代理事务所(普通合伙)11392专利代理师闫萍(51)Int.Cl.G06F16/36(2019.01)G06F16/335(2019.01)G06F16/31(2019.01)权利要求书2页说明书7页附图5页(54)发明名称一种多源异构信息通道耦合方法(57)摘要本发明涉及多源异构信息通道技术领域,具体是一种多源异构信息通道耦合方法,包括构建初始通道耦合知识图谱,基于通道耦合知识图谱实现通道数据耦合和基于通道耦合知识图谱实现数据检索。通道耦合知识图谱的实体是以通道标准数据形式存在,减小知识图谱的占用空间;通道耦合知识图谱在融合过程中以及在检索过程中,采用了剪枝策略进行逐层匹配,加快了检索速度;通道数据耦合是对知识图谱不断拓展的动态过程,增加了数据存储量。CN115757816ACN115757816A权利要求书1/2页1.一种多源异构信息通道耦合方法,其特征在于,包括构建初始通道耦合知识图谱,基于通道耦合知识图谱实现通道数据耦合和基于通道耦合知识图谱实现数据检索;所述构建初始通道耦合知识图谱,包括:将信息资源目录中规定的“类”、“项”、“目”抽取成实体,形成初始通道耦合知识图谱的框架;再对每一个“目”提取关键词,将关键词抽取为“细目”实体,补充初始通道耦合知识图谱的枝叶;其中,“类”与“项”实体之间是包含关系,“项”和“目”实体之间是包含关系,“目”和“细目”实体之间是关联关系;所述基于通道耦合知识图谱实现通道数据耦合,包括获取通道数据,数据预处理,数据封装和通道数据融合;所述数据预处理包括:通过元数据管理引擎,对每条通道设置一种数据处理方式,将数据处理为元数据,并提取数据的关键词作为通道标准数据关键词;所述数据封装包括:将所述数据预处理得到的元数据、通道ID、文件格式、关键词、物理存储地址封装形成通道标准数据;所述通道数据融合包括:采用词目链接策略和目目关联策略将所述通道标准数据融合到通道耦合知识图谱中,其中,所述词目链接策略,即采用剪枝策略将通道标准数据关键词与通道耦合知识图谱逐层匹配,将匹配成功的通道标准数据链接到通道耦合知识图谱的“细目”;所述目目关联策略,即当多个“细目”共同链接同一通道标准数据时,将“细目”之间彼此关联;所述基于通道耦合知识图谱实现数据检索,包括:采用剪枝策略将目标词与通道耦合知识图谱逐层匹配,得到匹配得分最大的目标“细目”,并计算所述目标“细目”的所有一步关联“细目”与目标词的匹配得分,读取匹配得分大于设定阈值的“细目”所链接的通道标准数据,索引物理存储地址并展示;其中,所述一步关联“细目”为链接相同通道标准数据的“细目”。2.如权利要求1所述的多源异构信息通道耦合方法,其特征在于:所述元数据的类型包括文本、视频、传感、图像、定位、结构化和非结构化数据。3.如权利要求1所述的多源异构信息通道耦合方法,其特征在于:所述匹配通过计算语义向量间的余弦相似度完成。4.如权利要求1所述的多源异构信息通道耦合方法,其特征在于,所述词目链接策略具体包括以下步骤:第一步,判断通道标准数据中是否有通道标准数据关键词,如果没有,标记人工处理,并结束;如果有,依次执行通道标准数据关键词与“类”、“项”、“目”、“细目”匹配;第二步,匹配“类”,设置类匹配阈值,如果匹配得分高于类匹配阈值,则将所匹配到的“类”放在“类”列表中,依次匹配,直至匹配所有的“类”;第三步,判定“类”列表中是否有值,如果没有,则标记该关键词,并回到第一步循环;如果有,则对“类”列表中的“类”执行下一步操作;第四步,匹配“项”,设置项匹配阈值,如果匹配得分高于项匹配阈值,则将所匹配到的“项”放在“项”列表中,依次匹配,直至匹配所有的“项”;第五步,判定“项”列表中是否有值,如果没有,则标记该关键词,并回到第一步循环;如果有,则对“项”列表中的“项”执行下一步操作;第六步,匹配“目”,设置目匹配阈值,如果匹配得分高于目匹配阈值,则将所匹配到的2CN115757816A权利要求书2/2页“目”放在“目”列表中,依次匹配,直至匹配所有的“目”;第七步,判定“目”列表中是否有值,如果没有,则标记该关键词,并回到第一步循环;如果有,则对“目”列表中的“目”执行下一步操作;第八步,匹配“细目”,设置细目匹配阈值,如果匹配得分高于细目匹配阈值,则将所匹配到的“细目”放在“细目”列表中,依次匹配,直至匹配所有的“细