一种基于异构数据融合的图文匹配方法及系统-豆柴文库

一种基于异构数据融合的图文匹配方法及系统.pdf

2023-06-03

10金币

1.1MB

12页

春兰****89

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共12页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115908870A(43)申请公布日2023.04.04(21)申请号202211280916.8G06F40/284(2020.01)(22)申请日2022.10.19G06F40/242(2020.01)(71)申请人海南港航控股有限公司地址570311海南省海口市滨海大道157号(72)发明人张勇张恺玉李森(74)专利代理机构武汉华之喻知识产权代理有限公司42267专利代理师邓彦彦廖盈春(51)Int.Cl.G06V10/75(2022.01)G06V10/74(2022.01)G06V10/82(2022.01)G06N3/0442(2023.01)G06N3/0464(2023.01)G06N3/08(2023.01)权利要求书2页说明书8页附图1页(54)发明名称一种基于异构数据融合的图文匹配方法及系统(57)摘要本发明提供一种基于异构数据融合的图文匹配方法及系统，包括：确定待匹配的图像数据集和文本数据集；将所述图像数据集输入到im2txt模型，以为图像数据集中的每张图像生成对应的图像描述文本；将图像数据集中每张图像的描述文本与文本数据集中的每个文本进行相似度计算，将文本数据集中与每张图像描述文本相似度大于阈值的文本作为图像数据集中每张图像的匹配文本，完成对图像数据集和文本数据集两种异构数据的匹配。本发明使用im2txt模型实现图像模态数据到文本模态数据的转换，借由模态转换，能够将多模态数据匹配转为单模态数据匹配，单模态数据匹配只需对一种模态的语义信息进行提取，且可避免不同模态数据语义信息的差异性，直接进行匹配。CN115908870ACN115908870A权利要求书1/2页1.一种基于异构数据融合的图文匹配方法，其特征在于，包括如下步骤：确定待匹配的图像数据集和文本数据集；将所述图像数据集输入到im2txt模型，以为图像数据集中的每张图像生成对应的图像描述文本；将图像数据集中每张图像的描述文本与文本数据集中的每个文本进行相似度计算，将文本数据集中与每张图像描述文本相似度大于阈值的文本作为图像数据集中每张图像的匹配文本，完成对图像数据集和文本数据集两种异构数据的匹配。2.根据权利要求1所述的方法，其特征在于，所述im2txt模型包括：Encoder端和Decoder端；在Encoder端经由CNN提取出固定维度的图像特征向量，再输入到Decoder端；在Decoder端经由LSTM网络生成一句关于图像内容的描述，作为图像描述文本。3.根据权利要求1所述的方法，其特征在于，将所述图像数据集输入到im2txt模型，还包括如下步骤：对图像数据集中的每张图像进行预处理，所述预处理为：对图像解码得到图像的三维矩阵张量，并将三维矩阵张量转化为预设维度和预设数据类型的张量，随后对转化后张量的各个元素归一化处理，之后采用激活函数对归一化后的张量进行处理，得到图像的稀疏特征图，并将稀疏特征图降维成预设维度的向量；将所述图像数据集输入到im2txt模型具体为：将图像数据集中每张图像预处理后得到的向量输入到im2txt模型。4.根据权利要求3所述的方法，其特征在于，im2txt模型为图像数据集中的每张图像生成对应的图像描述文本，具体为：CNN基于每张图像预处理后的向量提取图像特征信息作为初始状态信息并实例化InitialCaption；将InitialCaption输入到partial_captions堆，将partial_captions排序提取后读取partial_captions堆中每个Caption对应的sentence和state，输入到LSTM网络；LSTM网络获取新的状态信息new_state以及下一个可能词汇和概率的列表，针对每一个的下一预测词，更新对应参数信息并实例化Caption，根据预测的下一个预测词是否为终止符放到不同的Caption堆中，直至所有预测文本结束，输出前几个最大可能性的预测文本作为图像描述文本。5.根据权利要求4所述的方法，其特征在于，所述输出前几个最大可能性的预测文本作为图像描述文本，具体为：式中，score为预测文本得分，len(sentence)表示预测文本长度，log(pi)表示预测文本第i个词汇Pi的对数似然估计；将得分值大于预设值的预测文本输出作为图像的描述文本。6.一种基于异构数据融合的图文匹配系统，其特征在于，包括：待匹配数据确定单元，用于确定待匹配的图像数据集和文本数据集；图像文本描述单元，用于将所述图像数据集输入到im2txt模型，以为图像数据集中的2CN115908870A权利要求书2/2页每张图像生成对应的图像描述文本；图文匹配单元，用于将图像数据集中每张图像的描述文本与文本数据集中的每个文本进行相似度计算，

相关资料

一种基于异构数据融合的图文匹配方法及系统.pdf

本发明提供一种基于异构数据融合的图文匹配方法及系统，包括：确定待匹配的图像数据集和文本数据集；将所述图像数据集输入到im2txt模型，以为图像数据集中的每张图像生成对应的图像描述文本；将图像数据集中每张图像的描述文本与文本数据集中的每个文本进行相似度计算，将文本数据集中与每张图像描述文本相似度大于阈值的文本作为图像数据集中每张图像的匹配文本，完成对图像数据集和文本数据集两种异构数据的匹配。本发明使用im2txt模型实现图像模态数据到文本模态数据的转换，借由模态转换，能够将多模态数据匹配转为单模态数据匹配，

2023-06-03

1.1MB

基于模式匹配和实体匹配的数据融合方法、装置、系统.pdf

本发明公开了一种基于模式匹配和实体匹配的数据融合方法，通过利用给定的初始连接的记录对进行实体匹配，然后再利用当前实体匹配的结果进行模式匹配，然后再根据模式匹配的结果进行实体匹配，以此类推，每一轮匹配均以上一轮的匹配结果作为输入数据，在前一轮的成功匹配的记录对的基础上再次进行匹配，可以使我们能够修正前一轮中可能的错误匹配或没有找到记录组，不断地去修正模式匹配的结果。直到模式和实体匹配的结果都趋于稳定。该方法可以提高数据融合的准确率，提升数据价值。本发明还公开了一种基于模式匹配和实体匹配的数据融合装置、系统及

2023-08-30

1.3MB

基于物联网的多源异构数据融合方法及系统.pdf

本申请提供的基于物联网的多源异构数据融合方法及系统，目标异构操作数据的异构数据区间分布数据、预期异构数据区间和目前异构数据区间，预测出总异构数据区间符合数据误差许可范围并统计出数据误差许可范围，将多个目标异构操作数据全局分析历史平均分析异构数据介绍属性进行融合，可以预测出预期平均分析异构数据介绍属性，通过预期平均分析异构数据介绍属性和历史平均分析异构数据介绍属性的相对关联度，以及预设关联度数据预设误差许可范围对预期异构数据区间进行校验，可以准确的确定每一目标异构操作数据的目标异构数据区间，实现对目标异构操

2023-07-25

735KB

一种跨系统异构数据融合表征方法.pdf

本发明公开了一种跨系统异构数据融合表征方法,涉及电力信息系统领域。电力系统存在较多的异构数据系统和设备,不同系统之间的异构数据难以融合,为具体的数据分析、异常检测任务加大了工作难度。本发明通过构建两个异构数据系统之间的数据关联图,然后基于数据关联图自动化生成元路径,最后在在元路径的约束下,基于随机游走获得节点序列最大化每个节点出现的条件概率即可获得每个节点最终的嵌入结果,从而实现了数据的融合表征。有效实现跨系统的异构数据融合表征,降低应用难度。

2023-05-23

555KB

一种基于图文交互的多模态数据融合方法.pdf

本发明公开了一种基于图文交互的多模态数据融合方法,包括如下步骤:S1、获取多模态数据,所述多模态数据包括巡检图像数据和设备状态数据;S2、通过卷积神经网络获取巡检图像的图像特征图;S3、通过文本抽取器对设备状态数据进行预处理得到文本特征图;S4、构建多头注意力模块获取文本注意力权重和图像注意力权重;S5、基于文本注意力权重和图像注意力权重获取图像文本混合特征;S6、通过多头交叉注意力模块获取训练数据和目标的双向交互式信息;S7、通过特征图混合模块得到混合特征图信息并输出预测结果。方案通过对多模态特征进行融

2023-04-20

438KB