预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113221548A(43)申请公布日2021.08.06(21)申请号202110356881.0(22)申请日2021.04.01(71)申请人深圳市猎芯科技有限公司地址518000广东省深圳市龙岗区坂田街道五和大道南2号万科星火ONLINE6栋301(72)发明人常江熊斌李成刚陈森彬杨树贤(74)专利代理机构深圳中细软知识产权代理有限公司44528代理人袁文英(51)Int.Cl.G06F40/279(2020.01)G06N20/00(2019.01)权利要求书2页说明书9页附图4页(54)发明名称基于机器学习的BOM表识别方法、装置、计算机设备及介质(57)摘要本发明实施例公开了一种基于机器学习的BOM表识别方法,通过使用Python平台的机器学习包scikit‑learn构建目标识别模型;获取待识别BOM表,对待识别BOM表进行特征提取,得到多个待识别特征项及对应的待识别特征数据;将待识别特征数据作为目标识别模型的输入进行识别,确定待识别特征项的特征类型,实现了对BOM表的自动化识别,无需用户参与,同时由于是采用机器学习的算法识别BOM表,能够应用于不同应用场景的BOM表,具有广泛适用性。此外,还提出了一种基于机器学习的BOM表识别装置、计算机设备及介质。CN113221548ACN113221548A权利要求书1/2页1.一种基于机器学习的BOM表识别方法,其特征在于,所述方法包括:使用Python平台的机器学习包scikit‑learn构建目标识别模型;获取待识别BOM表,对所述待识别BOM表进行特征提取,得到多个待识别特征项及对应的待识别特征数据;将所述待识别特征数据作为所述目标识别模型的输入进行识别,确定所述待识别特征项的特征类型。2.根据权利要求1所述的基于机器学习的BOM表识别方法,其特征在于,所述对所述待识别BOM表进行特征提取,得到多个待识别特征项,包括:利用tf‑idf关键词提取方法提取所述待识别BOM表的初始关键词;通过Python平台的分词器对所述关键词进行分词处理,得到目标关键词;基于所述目标关键词确定所述待识别特征项。3.根据权利要求2所述的基于机器学习的BOM表识别方法,其特征在于,所述基于所述目标关键词确定所述待识别特征项,包括:利用正则表达式对所述目标关键词进行筛选,得到候选关键词;获取所述待识别BOM表的目标特征数据;计算所述目标特征数据与所述关键词的匹配度;将所述匹配度中满足匹配度阈值的所述候选关键词确定为所述待识别特征项。4.根据权利要求2所述的基于机器学习的BOM表识别方法,其特征在于,在所述利用tf‑idf关键词提取方法提取所述待识别BOM表的初始关键词之前,还包括:对所述待识别BOM表进行预处理,所述预处理包括数据清洗、分词、或者数据格式转换中的至少一种。5.根据权利要求1所述的基于机器学习的BOM表识别方法,其特征在于,所述使用Python平台的机器学习包scikit‑learn构建目标识别模型,包括:获取样本BOM表,从所述样本BOM表中提取样本集,所述样本集包括多个样本特征项及对应的样本特征数据,所述样本特征数据标注了对应的特征类型;将所述样本集按照预设比例切分为训练集和验证集;根据所述训练集和所述验证集,利用所述机器学习包scikit‑learn中的估计器进行预测,确定所述目标识别模型。6.根据权利要求5所述的基于机器学习的BOM表识别方法,其特征在于,所述根据所述训练集和所述验证集,利用所述机器学习包scikit‑learn中的估计器进行预测,确定所述目标识别模型,包括:将所述训练集作为预设分类器的输入进行训练,得到第一识别模型;将所述验证集作为所述第一识别模型的输入进行验证,得到第一识别模型的准确率;基于所述准确率,通过网格搜索法确定所述第一识别模型的最佳超参数;根据所述最佳超参数对所述第一识别模型的参数进行更新,得到所述目标识别模型。7.根据权利要求5所述的基于机器学习的BOM表识别方法,其特征在于,所述将所述训练集作为预设分类器的输入进行训练,得到第一识别模型,包括:获取所述训练集中各个特征项对应的特征数据及权重;基于所述特征数据及权重进行矩阵回归计算,得到回归值;2CN113221548A权利要求书2/2页基于所述回归值,利用预设的激活函数进行激活,得到激活值;基于所述激活值,通过预设的损失函数确定损失值;利用梯度下降优化算法优化所述损失值,得到各个所述特征项的优化权重;基于所述预设的分类器及所述优化权重,生成所述第一识别模型。8.一种基于机器学习的BOM表识别装置,其特征在于,所述基于机器学习的BOM表识别装置包括:模型构建模块,用于使用Python平台的机器学习包sciki