基于多模态信息融合的异构数据特征提取方法-豆柴文库

基于多模态信息融合的异构数据特征提取方法.pdf

2023-06-03

10金币

378KB

11页

是你****优呀

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共11页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115935969A(43)申请公布日2023.04.07(21)申请号202310030248.1(22)申请日2023.01.10(71)申请人西安电子科技大学地址710071陕西省西安市太白南路2号(72)发明人宋建锋陈慧苗启广谢琨刘如意权义宁刘向增(74)专利代理机构陕西电子工业专利中心61205专利代理师田文英王品华(51)Int.Cl.G06F40/279(2020.01)G06F40/216(2020.01)G06F40/30(2020.01)G06N3/08(2023.01)G06N3/0464(2023.01)权利要求书3页说明书6页附图1页(54)发明名称基于多模态信息融合的异构数据特征提取方法(57)摘要本发明公开了一种基于多模态信息融合的异构数据特征提取方法，其实现步骤为：通过使用文本编码器和图像编码器组成双流架构，对不同模态的数据特征提取分别构建不同的编码器，在对异构数据特征进行融合的时候充分考虑到不同模态数据之间的局部对应关系，使用注意力机制对异构数据进行融合。由此解决现有技术编码器模型参数混乱、训练过程复杂，以及异构数据特征信息融合不完全的问题。使得本发明能更好地处理异构数据，提高了异构数据特征提取的准确度。同时也提高了信息融合的完整度，确保提取出来的异构信息特征融合的有效性。CN115935969ACN115935969A权利要求书1/3页1.一种基于多模态信息融合的异构特征提取方法，其特征在于，采用文本编码器和图像编码器组成的双流结构分别提取文本数据和图像数据的特征，通过注意力机制对异构特征进行特征融合；该异构特征提取方法的具体步骤包括如下：步骤1，生成训练集：步骤1.1，收集一门科目考试中一个学期内至少100名学生的所有考试答题记录；将每个学生每次该门科目考试的答题试卷的答案整理为(q‑id,kc‑id,ans)格式，作为该门科目中一道试题的一个样本数据，采用相同的方法，得到该门科目考试试卷的所有学生的每道试题的答题记录；其中，q‑id表示第q个学生回答的第id道试题，kc‑id表示第id道试题中所包含的知识点kc，ans为第id道试题的标签，其取值为0或1，ans＝0表示该道试题的回答正确，ans＝1表示该道试题的回答错误；步骤1.2，采用与步骤1.1相同的方式，从每门科目考试的30000条答题记录中随机选取20000个样本数据，组成学生答题记录训练集；步骤2，生成文本编码器和图像编码器的预训练集：步骤2.1利用爬虫技术，爬取与步骤1.1中相同科目的试题总共40000道，并获取每道试题的试题文本、试题附图、试题知识点、试题分数信息；去除含有相同题目文本和不含题目例图的试题后，将剩余的32000道不重复且含有文本、图像两种模态数据的试题组成学生考试试题库；步骤2.2,将试题库中的每道试题的题目文本整理成格式text，作为该道试题的一个文本样本数据；从试题库中随机选取10000个文本样本数据组成文本编码器的文本预训练集；步骤2.3,将试题库中的每道试题的题目附图整理成格式img，作为该道试题的一个图像样本数据；从试题库中随机选取10000个图像样本数据组成图像编码器的图像预训练集；步骤3，设置编码器：步骤3.1，采用Bert预训练模型作为文本编码器，将该文本编码器的字嵌入向量维度设置为768，输入文本的最大长度设置为80；步骤3.2，采用Transformer模型作为图像编码器，将该图像编码器的隐状态维度设置为512，多头注意力模块的注意力头数设置为6；步骤4，预训练编码器：步骤4.1，将文本预训练集输入到文本编码器中，随机选取输入文本中15％的词语使用[mask]标记进行替换，输出[mask]标记的预测词，利用交叉熵损失函数，计算文本编码器输出的预测词与真实词之间的损失值，通过梯度下降法，迭代更新文本编码器中的所有参数，直至损失值不再变化为止，得到预训练好的文本编码器；步骤4.2，将图像预训练集输入到图像编码器中，输出能够表征图像特征的图像特征向量，使用主成分分析法，将该图像特征向量还原成图像；利用交叉熵损失函数，计算真实图像与还原图像之间的损失值，通过梯度下降法，迭代更新图像编码器的所有参数，直至损失值不再变化为止，得到预训练好的图像编码器；步骤5，训练学生知识状态生成网络：步骤5.1，将循环神经网络作为学生知识状态生成网络；步骤5.2，将学生答题记录训练集输入到学生知识状态生成网络中，输出训练中每个样本的预测标签，利用交叉熵损失函数，计算训练样本的预测标签与真实标签之间的损失值，2CN115935969A权利要求书2/3页通过梯度下降法，迭代更新学生知识状态生成网络中的所有参数，直至损失函数收敛为止，得到训练好的学生知识状态

相关资料

基于多模态信息融合的异构数据特征提取方法.pdf

本发明公开了一种基于多模态信息融合的异构数据特征提取方法，其实现步骤为：通过使用文本编码器和图像编码器组成双流架构，对不同模态的数据特征提取分别构建不同的编码器，在对异构数据特征进行融合的时候充分考虑到不同模态数据之间的局部对应关系，使用注意力机制对异构数据进行融合。由此解决现有技术编码器模型参数混乱、训练过程复杂，以及异构数据特征信息融合不完全的问题。使得本发明能更好地处理异构数据，提高了异构数据特征提取的准确度。同时也提高了信息融合的完整度，确保提取出来的异构信息特征融合的有效性。

2023-06-03

378KB

基于多模态数据融合的商品推荐方法.pdf

本发明提供了一种基于多模态数据融合的商品推荐方法，属于深度学习技术领域。通过ALBERT‑TextCNN提升从客户基本属性数据集中提取出的词向量的表征能力和最大程度保留客户不同层次的语义信息，提升不同客户群体的分类效果；通过AlBert‑BiLSTM‑CRF有效解决对于文本中一词多义解析效果差、多义词的不同语境无法处理等传统语言处理模型无法解决的问题，将客户线上和线下交易数据集进行更加符合文本集上下文语义的关键词，更有针对性地构建客户标签；使用k维树方法获取两种标签类别的相似客户，再通过相似客户购买历史进

2023-11-06

626KB

一种基于数据质量的多模态异构数据存储方法及系统.pdf

本发明是一种基于数据质量的多模态异构数据存储方法及系统,包括以下步骤:1)将原始本文数据以key?value格式在原始数据库中进行分布式存储;2)针对原始多媒体类数据进行数据建模,以文件的形式在文件数据库中进行分布式存储;3)将key?value数据转换为关系型数据,构建关系数据库;4)根据关系数据库中实体之间的关系构建图数据库;5)将实体的活动数据以链式的结构进行数据建模,构建链式数据库;6)将多媒体数据转换为文本数据,按数据类型分别存储于多媒体数据库及原始数据库;7)通过构建多级索引结构将各个子数据库

2023-05-09

700KB

基于最优编码位的手指多模态特征提取与融合方法.pdf

一种基于最优编码位的手指多模态图像编码和融合方法。其方法对原始手指三模态图像进行增强，获得手指三模态增强图像；利用方向编码方法对上述手指三模态增强图像的最优增强方向进行二进制编码，以提取出手指三模态的有效纹理特征，获得手指三模态特征编码；利用特征编码融合方法对手指三模态特征编码进行融合，获得最终融合图像等步骤。本发明效果：有效凸显了手指血管成像区域，实现了退化手指图像的稳定增强。解决了可能会产生的冗余信息和冗余特征编码位的问题，以便提取特征。可以充分利用手指三模态信息并提高识别的准确性和鲁棒性。

2023-06-29

1.3MB

一种基于图文交互的多模态数据融合方法.pdf

本发明公开了一种基于图文交互的多模态数据融合方法,包括如下步骤:S1、获取多模态数据,所述多模态数据包括巡检图像数据和设备状态数据;S2、通过卷积神经网络获取巡检图像的图像特征图;S3、通过文本抽取器对设备状态数据进行预处理得到文本特征图;S4、构建多头注意力模块获取文本注意力权重和图像注意力权重;S5、基于文本注意力权重和图像注意力权重获取图像文本混合特征;S6、通过多头交叉注意力模块获取训练数据和目标的双向交互式信息;S7、通过特征图混合模块得到混合特征图信息并输出预测结果。方案通过对多模态特征进行融

2023-04-20

438KB