预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共21页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN112836520A(43)申请公布日2021.05.25(21)申请号202110189542.8G06N3/04(2006.01)(22)申请日2021.02.19G06N3/08(2006.01)(71)申请人支付宝(杭州)信息技术有限公司地址310000浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人李怀松黄涛王睿祺金先明张天翼(74)专利代理机构北京亿腾知识产权代理事务所(普通合伙)11309代理人陈霁周良玉(51)Int.Cl.G06F40/30(2020.01)G06F40/284(2020.01)G06F16/33(2019.01)G06K9/62(2006.01)权利要求书4页说明书12页附图4页(54)发明名称基于用户特征生成用户描述文本的方法和装置(57)摘要本说明书实施例提供一种基于用户特征生成用户描述文本的方法和装置。方法包括:将目标用户的各项特征的特征名和其对应的特征值输入第一编码器,得到各初始用户特征向量;将各初始用户特征向量输入检索模型,进行K次迭代,以得到K个语句;其中,每次迭代包括,确定各项特征分别对应的本次迭代的各注意力系数,并根据各注意力系数对各初始用户特征向量进行加权求和,得到综合表征向量,再根据综合表征向量从人工知识库中检索出一个语句;将K个语句输入第二编码器,对K个语句基于注意力机制进行编码,得到语义表征向量;将各初始用户特征向量和语义表征向量输入生成模型,生成目标用户的用户描述文本。能够兼顾效率和文本质量。CN112836520ACN112836520A权利要求书1/4页1.一种基于用户特征生成用户描述文本的方法,所述方法包括:将目标用户的各项特征的特征名和其对应的特征值输入第一编码器,通过所述第一编码器得到各项特征分别对应的各初始用户特征向量;将所述各初始用户特征向量输入检索模型,通过所述检索模型进行K次迭代,以通过K次迭代得到K个语句;其中,每次迭代包括,确定各项特征分别对应的本次迭代的各注意力系数,并根据各注意力系数对所述各初始用户特征向量进行加权求和,得到综合表征向量,再根据所述综合表征向量从人工知识库中检索出一个语句;将所述K个语句输入第二编码器,通过所述第二编码器对所述K个语句基于注意力机制进行编码,得到所述K个语句对应的语义表征向量;将所述各初始用户特征向量和所述语义表征向量输入生成模型,通过所述生成模型生成所述目标用户的用户描述文本。2.如权利要求1所述的方法,其中,所述各项特征的类型包括:数值型或文本型。3.如权利要求2所述的方法,其中,所述通过所述第一编码器得到各项特征分别对应的各初始用户特征向量之前,所述方法还包括:对类型为文本型的特征的原始特征值进行分词处理,得到多个分词结果;所述将目标用户的各项特征的特征名和其对应的特征值输入第一编码器,包括:将目标用户的类型为文本型的特征的特征名和其对应的多个分词结果输入第一编码器。4.如权利要求1所述的方法,其中,所述第一编码器包括第一嵌入矩阵、第二嵌入矩阵和第一编码模型;所述通过所述第一编码器得到各项特征分别对应的各初始用户特征向量包括:将所述各项特征中的任一项特征作为目标项特征,通过第一嵌入矩阵,将目标项特征的特征名转换为第一嵌入向量;通过第二嵌入矩阵,将目标项特征对应的特征值转换为第二嵌入向量;将所述各项特征分别对应的第一嵌入向量和第二嵌入向量输入所述第一编码模型,所述第一编码模型基于注意力机制进行编码,得到所述各项特征分别对应的初始用户特征向量。5.如权利要求1所述的方法,其中,所述确定各项特征分别对应的本次迭代的各注意力系数,包括:根据所述各初始用户特征向量和上一次迭代得到的综合表征向量,确定本次迭代的各项特征分别对应的各注意力系数。6.如权利要求1所述的方法,其中,所述根据所述综合表征向量从人工知识库中检索出一个语句,包括:将所述综合表征向量经过一层全连接层,得到维度为所述人工知识库包含的语句数的输出向量;将所述输出向量经过归一化处理后,得到归一化向量;选取所述归一化向量中最大数值对应的维度,将该维度对应的语句作为本次迭代中从人工知识库中检索出的一个语句。2CN112836520A权利要求书2/4页7.如权利要求1所述的方法,其中,所述第二编码器包括第二编码模型和自注意力层;所述通过所述第二编码器对所述K个语句基于注意力机制进行编码,包括:将所述K个语句包括的各个字的字嵌入向量输入第二编码模型,通过所述第二编码模型确定各个字的字编码向量;将所述各个字的字编码向量输入自注意力层,通过所述自注意力层确定各个字分别对应的注意力系数,根据各个字分别对应的注意力系数对所述各个字的字编码向量进行加权求和,得到所述K个语句对