一种基于BERT采样的文本通用触发器生成系统和方法.pdf
是你****嘉嘉
亲,该文档总共11页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
一种基于BERT采样的文本通用触发器生成系统和方法.pdf
本发明公开了一种基于BERT采样的文本通用触发器生成系统和方法,设置初始单词序列长度m及批次大小n,将初始单词序列复制n份得到n个单词序列,在其上随机选择第i个位置,将初始单词序列输入到BERT语言模型中,获得第i个位置单词的概率分布;采样一个单词y,将第i个位置的原始掩码符号替换为单词y,得到一批初始触发词序列,并连接到数据测试集的所有样本上,输入到目标模型进行测试;将测试结果传输到BERT采样模块,并调整单词分布概率,然后采样获得候选单词;继续将候选单词在除第i个位置外的其他位置上进行替换,直到目标模
一种基于BERT的中文ASR输出文本修复方法及系统.pdf
本发明提出了一种基于BERT的中文ASR文本修复方法及系统,该系统包含:中文标点符号预测模型和中文纠错模型。中文标点预测模型基于BERT进行了两方面的改进:使用RoBERTa模型替换基础BERT模型,通过改变预训练任务中的掩码策略来提高模型的效率;通过提取字音和字形两个嵌入给模型提供更多的中文额外信息。通过这两个方面的改动提出了目前较为完整的中文标点符号预测模型。中文纠错模型使用PLOME预训练模型,该模型的特点也是结合了中文额外特征来提高模型对中文的理解能力。通过简单的结合,本发明得到了一个端到端的中文
基于BERT和双分支网络的胃镜文本分类系统.pdf
本发明属于自然语言处理领域,提供一种基于BERT和双分支网络的胃镜文本分类系统,获取待分类的胃镜文本数据;从待分类的胃镜文本数据中分离镜下所见文本和病理诊断文本;对镜下所见文本和病理诊断文本分别进行切分,获得由若干文本单元组成的集合,即文本单元集合;在所述文本单元集合内的每个文本单元前插入[CLS]标记,每个文本单元后插入[SEP]标记,并将它们重新组合成一段连续的文本;使用预训练好的BERT模型提取每个[CLS]字符对应的文本特征向量,得到文本单元的特征向量集合;基于文本单元的特征向量集合,利用预先训练
基于采样的颜色信息生成和传输图像序列的系统和方法.pdf
在一个实施例中,用于从稀疏数据生成完整帧的方法可以分别访问与帧的序列相关联的样本数据集。每个样本数据集可以包括相关联的帧的不完整像素信息。该系统可以使用第一机器学习模型基于样本数据集来生成帧序列,每个帧具有完整像素信息。第一机器学习模型被配置为保留与生成的帧相关联的时空表示。然后,该系统可以访问下一个样本数据集,该下一个样本数据集包括帧序列之后的下一个帧的不完整像素信息。该系统可以使用第一机器学习模型,基于下一个样本数据集生成下一个帧。该下一个帧具有完整像素信息,该完整像素信息包括该下一个样本数据集的不完
基于文本生成网络生成用户描述文本的方法和装置.pdf
本说明书实施例提供一种基于文本生成网络生成用户描述文本的方法和装置,方法包括:将目标用户的各项特征输入第一编码器,通过第一编码器获取各项特征分别对应的各初始用户特征向量,基于自注意力机制进行编码,得到编码状态向量;将编码状态向量输入检索模型,通过检索模型从人工知识库中检索出K个语句,确定K个语句包含的各个字对应的字编码向量,根据解码器的输出反馈向量以及字编码向量确定各注意力系数,并根据各注意力系数对各字编码向量进行加权求和,得到语义表征向量;将编码状态向量、语义表征向量输入解码器,通过解码器生成目标用户的