预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共31页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114118062A(43)申请公布日2022.03.01(21)申请号202111538219.3(22)申请日2021.12.15(71)申请人广州小鹏汽车科技有限公司地址510555广东省广州市天河区岑村松岗大街8号(72)发明人梁成扬(74)专利代理机构广州德科知识产权代理有限公司44381代理人蔡丽妮万振雄(51)Int.Cl.G06F40/211(2020.01)G06F40/216(2020.01)G06F40/30(2020.01)G06K9/62(2022.01)权利要求书3页说明书20页附图7页(54)发明名称客户特征提取方法、装置、电子设备及存储介质(57)摘要本申请实施例公开一种客户特征提取方法、装置、电子设备及存储介质,其中,客户特征提取方法包括:通过训练完成的双向语言模型对所述目标服务记录文本进行语义识别,得到第一语义向量;通过所述双向语言模型对多个客户特征中每个客户特征分别对应的种子句子进行语义识别,得到与各个种子句子的第二语义向量;根据所述第一语义向量及所述各个种子句子的第二语义向量,确定所述目标服务记录文本与所述各个种子句子的相似度;根据所述目标服务记录文本与所述各个种子句子的相似度,从所述多个客户特征中确定出与所述目标服务记录文本对应的目标客户特征。该方法中由于利用了双向语言模型,使得输出的描述客户的特征更加准确。CN114118062ACN114118062A权利要求书1/3页1.一种客户特征提取方法,其特征在于,所述方法包括:通过训练完成的双向语言模型对目标服务记录文本进行语义识别,得到第一语义向量;通过所述双向语言模型对多个客户特征中每个客户特征分别对应的种子句子进行语义识别,得到与各个种子句子的第二语义向量;根据所述第一语义向量及所述各个种子句子的第二语义向量,确定所述目标服务记录文本与所述各个种子句子的相似度;根据所述目标服务记录文本与所述各个种子句子的相似度,从所述多个客户特征中确定出与所述目标服务记录文本对应的目标客户特征。2.根据权利要求1所述方法,其特征在于,在所述通过训练完成的双向语言模型对目标服务记录文本进行语义识别,得到第一语义向量之前,所述方法还包括:从待输入的目标服务记录文本中选取出第一短文本;以及,所述通过训练完成的双向语言模型对所述目标服务记录文本进行语义识别,得到第一语义向量,包括:将所述第一短文本输入至训练完成的双向语言模型;通过所述双向语言模型对所述第一短文本进行语义识别,得到第一语义向量。3.根据权利要求2所述方法,其特征在于,从待输入的目标服务记录文本中选取出第一短文本,包括:将待输入的目标服务记录文本与多个客户特征分别对应的关键词进行匹配,从所述目标服务记录文本中筛选出与所述关键词匹配的第一短文本。4.根据权利要求3所述方法,其特征在于,所述将待输入的目标服务记录文本与多个客户特征分别对应的关键词进行匹配,包括:对待输入的目标服务记录文本进行分句处理和文本清洗处理,得到多个第二短文本;将所述多个第二短文本与多个客户特征分别对应的关键词进行匹配。5.根据权利要求1所述方法,其特征在于,所述多个客户特征包括:第一客户特征;以及,所述根据所述目标服务记录文本与所述各个种子句子的相似度,从所述多个客户特征中确定出与所述目标服务记录文本对应的目标客户特征,包括:当所述目标服务记录文本与所述第一客户特征对应的种子句子的相似度的最大值大于设置的第一阈值时,将所述第一客户特征确定为与所述目标服务记录文本对应的目标客户特征。6.根据权利要求1所述方法,其特征在于,所述多个客户特征包括:第二客户特征;以及,所述根据所述目标服务记录文本与所述各个种子句子的相似度,从所述多个客户特征中确定出与所述目标服务记录文本对应的目标客户特征,包括:当所述第二客户特征对应的多个种子句子中,与所述目标服务记录文本的相似度大于第二阈值的种子句子的数量,大于第三阈值时,将所述第二客户特征确定为与所述目标服务记录文本对应的目标客户特征。7.根据权利要求1‑6任一项所述的方法,其特征在于,所述双向语言模式是利用与所述多个客户特征分别对应的样本短文本进行训练得到的;与每个客户特征对应的样本短文本是从样本记录文本中筛选出的,并且满足与所述客户特征相对应的专家规则;与每个客户2CN114118062A权利要求书2/3页特征对应的专家规则,是基于与每个客户特征对应的种子句子制定的。8.一种模型训练方法,其特征在于,所述方法包括:从样本服务记录文本中选取出与多个客户特征中每个客户特征分别对应的种子句子;根据与多个客户特征对应的专家规则,从所述样本服务记录文本中筛选出满足所述专家规则的样本短文本,以得到与所述多个客户特征分别对应