预览加载中,请您耐心等待几秒...
1/9
2/9
3/9
4/9
5/9
6/9
7/9
8/9
9/9

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115952259A(43)申请公布日2023.04.11(21)申请号202310240918.2G06N3/048(2023.01)(22)申请日2023.03.14G06N3/084(2023.01)(71)申请人深圳市迪博企业风险管理技术有限公司地址518000广东省深圳市福田区深南大道1006号国际创新中心A栋6楼西(72)发明人胡为民郑喜余露谢丽慧熊自康(74)专利代理机构北京惟盛达知识产权代理事务所(普通合伙)11855专利代理师陈钊(51)Int.Cl.G06F16/33(2019.01)G06F40/289(2020.01)G06N3/047(2023.01)权利要求书2页说明书5页附图1页(54)发明名称一种企业画像标签智能生成方法(57)摘要本申请实施例公开了一种企业画像标签智能生成方法,该方法通过收集企业经营数据文本,基于所述企业经营数据文本设计任务说明文本;并将所述任务说明文本通过训练后的所述生成模型,得到初始企业画像标签;再基于所述策略梯度损失函数优化所述生成模型生成标签的真实性和准确性;通过辨别模型对标签的真实性进行评分,实现真实且准确的企业画像标签生成,对企业经营情况进行多维度分析,提高企业的评估效率;该方法可以同时进行多个企业多方位的评估,简化了企业画像构建过程,提高了企业工作效率,并为企业投资提供了判断依据,降低了投资风险。CN115952259ACN115952259A权利要求书1/2页1.一种企业画像标签智能生成方法,其特征在于,包括:S1:收集企业经营数据文本,并基于所述企业经营数据文本构建文本向量对数据集;S2:构建生成模型;基于所述文本向量对数据集训练所述生成模型;训练过程包括计算与向量对应的概率分布;S3:基于所述企业经营数据文本设计任务说明文本;将所述任务说明文本通过训练后的所述生成模型,得到第一文本向量;S4:根据所述第一文本向量得到初始企业画像标签;基于所述初始企业画像标签构建向量矩阵;S5:构建辨别模型;将所述向量矩阵通过所述辨别模型,得到标签的真实性评分;S6:基于所述与向量对应的概率分布、所述标签的真实性评分,计算策略梯度损失函数;并基于所述策略梯度损失函数优化所述生成模型;S7:将所述任务说明文本通过优化后的所述生成模型,得到第二文本向量;根据所述第二文本向量得到真实企业画像标签。2.根据权利要求1所述的企业画像标签智能生成方法,其特征在于,S1中,构建所述文本向量对数据集的过程包括:采用中文分词器对所述企业经营数据文本进行分词,再基于one‑hot编码将分词结果向量化,得到企业数据词向量,所述企业数据词向量记为:;采用自回归预测方法将企业数据词向量的前i‑1个向量,与第i个向量组成文本向量对,所述文本向量对记为:,n表示向量的数量;基于多个所述文本向量对构建所述文本向量对数据集。3.根据权利要求2所述的企业画像标签智能生成方法,其特征在于,S2中,采用12层Transformer网络结构构建所述生成模型。4.根据权利要求2所述的企业画像标签智能生成方法,其特征在于,S2中,训练过程包括:将企业数据词向量的前i‑1个向量输入所述生成模型,提取其文本特征,将所述文本特征经过Softmax函数得到与第i个向量对应的一维概率分布,计算公式为:;其中,表示与第i个向量对应的一维概率分布;表示提取出的企业数据词向量的前i‑1个向量的文本特征;Gen()表示生成模型;表示企业数据词向量的前i‑1个向量;计算第i个向量及与其对应的一维概率分布的交叉熵损失函数,计算公式为:;其中,Loss()表示交叉熵损失函数;为生成模型的权重参数;x表示与第i个向量对应的一维概率分布中相同索引对应的值;y表示第i个向量中相同索引对应的值;表示第i个向量;在整个所述文本向量对数据集上,采用梯度下降反向传播算法最小化所述交叉熵损失函数,以此使所述生成模型学习到文本向量。2CN115952259A权利要求书2/2页5.根据权利要求4所述的企业画像标签智能生成方法,其特征在于,S3中,基于所述企业经营数据文本,并组合任务引导语句设计所述任务说明文本。6.根据权利要求5所述的企业画像标签智能生成方法,其特征在于,S3中,将所述任务说明文本向量化,再输入至训练后的所述生成模型,所述生成模型预测生成下一个文本向量,并递归地将所述下一个文本向量输入至所述生成模型,直至所述生成模型生成终止符号;将生成的所有文本向量作为一个整体,记为所述第一文本向量。7.根据权利要求6所述的企业画像标签智能生成方法,其特征在于,S4中,将所述第一文本向量转换为可读文本,并以所述可读文本为所述初始企业画像标签;将所述初始企业画像标签向量化,得到标签向量,所述标签向量记为