建立分类模型的方法和装置-豆柴文库

建立分类模型的方法和装置.pdf

2023-05-25

10金币

522KB

18页

Ro****44

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共18页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114328936A(43)申请公布日2022.04.12(21)申请号202210191386.3(22)申请日2022.03.01(71)申请人支付宝（杭州）信息技术有限公司地址310000浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人林昊(74)专利代理机构济南信达专利事务所有限公司37100代理人李世喆(51)Int.Cl.G06F16/35(2019.01)G06F40/242(2020.01)G06F40/30(2020.01)权利要求书2页说明书11页附图4页(54)发明名称建立分类模型的方法和装置(57)摘要本说明书实施例提供了一种建立分类模型的方法及装置。其中方法包括：首先获取待分类数据样本，并获取所述待分类数据样本对应的分类标签样本；然后将待分类数据样本及其对应的分类标签样本作为训练样本以构建训练集和回测集，所述训练集和所述回测集均包含多个训练样本；利用所述训练集训练分类模型；从所述回测集中选择对训练得到的分类模型产生满足预设要求的效果增益的训练样本；再获取对选择的训练样本中的待分类数据样本进行人工标注之后得到的分类标签样本，将所选择的训练样本中的待分类数据样本及其人工标注的分类标签样本构成新的训练样本加入所述训练集，转至利用所述训练集训练分类模型的步骤，直至达到预设的结束条件。CN114328936ACN114328936A权利要求书1/2页1.建立分类模型的方法，包括：获取待分类数据样本，并获取所述待分类数据样本对应的分类标签样本；将待分类数据样本及其对应的分类标签样本作为训练样本以构建训练集和回测集，所述训练集和所述回测集均包含多个训练样本；利用所述训练集训练分类模型；从所述回测集中选择对训练得到的分类模型产生满足预设要求的效果增益的训练样本；获取对所选择的训练样本中的待分类数据样本进行人工标注之后得到的分类标签样本；将所选择的训练样本中的待分类数据样本及其人工标注的分类标签样本构建新的训练样本加入所述训练集，转至利用所述训练集训练分类模型的步骤，直至达到预设的结束条件。2.根据权利要求1所述的方法，其中，所述获取所述待分类数据样本对应的分类标签样本包括：将所述待分类数据样本与预设的词典或语义表达模板进行匹配；依据匹配结果确定所述待分类数据样本对应的分类标签；基于确定的分类标签得到所述待分类数据样本对应的分类标签样本。3.根据权利要求1所述的方法，其中，从所述回测集中选择对训练得到的分类模型产生满足预设要求的效果增益的训练样本包括：利用训练得到的分类模型对所述回测集中的待分类数据样本进行分类，得到对待分类数据样本的分类结果；针对所述回测集中的待分类数据样本，基于该待分类数据样本的分类结果与该待分类数据样本对应的分类标签样本的差异，确定该待分类数据样本所在的训练样本对所述分类模型的效果增益，从所述回测集中选择效果增益满足预设要求的训练样本。4.根据权利要求3所述的方法，其中，所述基于该待分类数据样本的分类结果与该待分类数据样本对应的分类标签样本的差异确定该待分类数据样本所在的训练样本对所述分类模型的效果增益，从所述回测集中选择效果增益满足预设要求的训练样本包括：确定所述回测集中待分类数据样本的分类标签样本在分类结果中的置信度；从所述回测集中选择置信度小于或等于预设第一阈值的待分类数据样本所在的训练样本，或者，从所述回测集中选择置信度最低的N个待分类数据样本所在的训练样本，所述N为预设的正整数。5.根据权利要求1所述的方法，其中，所述预设的结束条件包括以下至少一种：所述分类模型的准确率达到预设准确率阈值；循环执行训练分类模型的次数超过预设的循环次数阈值；所述分类模型的分类效果收敛。6.根据权利要求1至5中任一项所述的方法，其中，所述待分类数据样本包括事件相关文本，所述分类模型包括事件抽取模型，所述分类标签包括事件信息标签；所述事件抽取模型用以从待分类数据中抽取事件信息。7.根据权利要求6所述的方法，该方法还包括：2CN114328936A权利要求书2/2页确定所述回测集中待分类数据样本的分类标签样本在分类结果中的置信度；将置信度大于或等于预设第二阈值的分类标签样本加入数据库，用以构建基于事件的知识图谱。8.建立分类模型的装置，包括：数据获取单元，被配置为获取待分类数据样本，并获取所述待分类数据样本对应的分类标签样本；样本构建单元，被配置为将待分类数据样本及其对应的分类标签样本作为训练样本以构建训练集和回测集，所述训练集和所述回测集均包含多个训练样本；模型训练单元，被配置为利用所述训练集训练分类模型；结束判断单元，被配置为所述模型训练单元训练得到分类模型后，判断是否达到预设的结束条件；样本选择单元，被配置为在所

相关资料

建立分类模型的方法和装置.pdf

本说明书实施例提供了一种建立分类模型的方法及装置。其中方法包括：首先获取待分类数据样本，并获取所述待分类数据样本对应的分类标签样本；然后将待分类数据样本及其对应的分类标签样本作为训练样本以构建训练集和回测集，所述训练集和所述回测集均包含多个训练样本；利用所述训练集训练分类模型；从所述回测集中选择对训练得到的分类模型产生满足预设要求的效果增益的训练样本；再获取对选择的训练样本中的待分类数据样本进行人工标注之后得到的分类标签样本，将所选择的训练样本中的待分类数据样本及其人工标注的分类标签样本构成新的训练样本加

2023-05-25

522KB

建立模型的方法和相关装置.pdf

本申请实施例提供一种建立模型的方法和相关装置，该方法包括：获取原始模型的N个顶点投影在目标平面上的投影坐标；从该N个顶点中确定M个顶点，其中M为大于或等于3且小于或等于N的正整数；根据该M个顶点的投影坐标和该原始模型的高度信息，建立对应于该原始模型的代理模型。利用上述技术方案可以建立原始模型的代理模型。与该原始模型相比，该代理模型保留了原始模型的细节信息，但是包括的顶点数目更少，从而结构更加简单。这样，在一些不需要利用模型渲染出图像的场景中(例如碰撞检测、遮挡剔除、阴影绘制)，可以使用结构更加简单的代理模

2023-06-01

2.1MB

分类检测模型训练方法和装置、分类检测方法和装置.pdf

本公开提供一种分类检测模型训练方法和装置、分类检测方法和装置。分类检测模型训练装置对恶意样本APK进行反编译，以得到目标文件，并从目标文件中提取出静态特征；利用沙箱工具从恶意样本APK中提取出动态特征；利用静态特征和动态特征生成训练数据集；利用预设的特征选取模型从训练数据集中提取出第一特征样本集合；利用第一特征样本集合对预设分类器进行训练，以得到经过训练的分类检测模型。从而利用所得到的分类检测模型对待检测APK进行分类检测。本公开在无需人工干预的情况下有效克服分类检测效率低、准确度低的问题。

2023-07-24

676KB

训练分类模型的方法和装置.pdf

本说明书实施例提供了一种训练分类模型的方法和装置。根据该实施例的方法，首先获取训练样本以及对各训练样本标注的类别标签，所述训练样本包括噪声样本；然后利用所述训练样本训练分类模型；其中在训练所述分类模型的过程中采用改进的交叉熵损失函数，所述改进的交叉熵损失函数用以降低对所述噪声样本的学习权重。

2023-05-25

513KB

分类模型的训练方法和装置.pdf

本说明书实施例提供一种分类模型的训练方法和装置。方法包括：获取第一领域的第一样本集合，包括多个第一训练样本，每个第一训练样本包括样本输入和对应的第一分类任务的类别标签；获取第二领域的第二样本集合，包括多个第二训练样本，每个第二训练样本包括样本输入和对应的第二分类任务的类别标签；两个分类任务的类别标签具有映射关系；将第二样本集合中的多个第二训练样本加入第一样本集合，并根据映射关系，将第二训练样本包括的第二分类任务的类别标签转换为第一分类任务的类别标签，得到第三样本集合；将第三样本集合中的样本输入输入待训练的

2023-05-25

613KB