一种识别方法和装置-豆柴文库

一种识别方法和装置.pdf

2023-06-14

10金币

766KB

20页

努力****爱静

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共20页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN112835990A(43)申请公布日2021.05.25(21)申请号201911158038.0(22)申请日2019.11.22(71)申请人北京沃东天骏信息技术有限公司地址100176北京市北京经济技术开发区科创十一街18号院2号楼4层A402室申请人北京京东世纪贸易有限公司(72)发明人孙志强刘阳(74)专利代理机构中原信达知识产权代理有限责任公司11219代理人冯培培耿雪利(51)Int.Cl.G06F16/28(2019.01)G06F16/58(2019.01)权利要求书2页说明书13页附图4页(54)发明名称一种识别方法和装置(57)摘要本发明公开了一种识别方法和装置，涉及计算机技术领域。该方法的一具体实施方式包括：从待处理文本获取第一产品词集合，根据所述待处理文本和图数据库获取所述待处理文本的多个参数与产品词的关系子图；按照所述待处理文本的多个参数与产品词的关系子图进行计算，得到第二产品词集合；根据所述图数据库从所述第一产品词集合和所述第二产品词集的交集中，识别所述待处理文本的核心产品词。该实施方式提高了识别的准确率。CN112835990ACN112835990A权利要求书1/2页1.一种识别方法，其特征在于，包括：从待处理文本获取第一产品词集合，根据所述待处理文本和图数据库获取所述待处理文本的多个参数与产品词的关系子图；按照所述待处理文本的多个参数与产品词的关系子图进行计算，得到第二产品词集合；根据所述图数据库从所述第一产品词集合和所述第二产品词集的交集中，识别所述待处理文本的核心产品词。2.根据权利要求1所述的方法，其特征在于，从待处理文本获取第一产品词集合，根据所述待处理文本和图数据库获取所述待处理文本的多个参数与产品词的关系子图，包括：从所述待处理文本中获取标题和第一类目，从所述标题中解析所述第一产品词集合、第一属性集合和第一品牌集合；按照所述第一属性集合、所述第一品牌集合和所述第一类目查询所述图数据库，得到所述第一属性集合中每个第一属性及与其对应的产品词的关系子图、所述第一品牌集合中每个第一品牌及与其对应的产品词的关系子图，以及所述第一类目及与其对应的产品词的关系子图；根据所述第一产品词集合和所述标题生成所述标题与第一产品词的关系子图。3.根据权利要求2所述的方法，其特征在于，根据所述图数据库从所述第一产品词集合和所述第二产品词集的交集中，识别所述待处理文本的核心产品词，包括：将所述第一产品词集合和所述第二产品词集合的交集，作为待选产品词集合；根据所述待选产品词集合和所述图数据库计算所述待选产品词集合中每个待选产品词的概率；从所述待选产品词集合中，选择出概率最高的待选产品词，作为所述待处理文本的核心产品词。4.根据权利要求3所述的方法，其特征在于，计算所述待选产品词的概率，包括：对于所述第一属性集合中每个第一属性，将所述第一属性与所述待选产品词在所述图数据库中共同出现次数，除以所述第一属性在所述图数据库中出现总次数，得到的值作为在所述第一属性的条件下所述待选产品词的概率；对于所述第一品牌集合中每个第一品牌，将所述第一品牌与所述待选产品词在所述图数据库中共同出现次数，除以所述第一品牌在所述图数据库中出现总次数，得到的值作为在所述第一品牌的条件下所述待选产品词的概率；将所述第一类目与所述待选产品词在所述图数据库中共同出现次数，除以所述第一类目在所述图数据库中出现总次数，得到的值作为在所述第一类目的条件下所述待选产品词的概率；将在每个第一属性的条件下所述待选产品词的概率、在每个第一品牌的条件下所述待选产品词的概率、在第一类目的条件下所述待选产品词的概率和所述待选产品词在所述标题中出现次数相乘，得到乘积，将所述乘积的对数作为所述待选产品词的概率。5.根据权利要求2所述的方法，其特征在于，按照所述待处理文本的多个参数与产品词的关系子图进行计算，得到第二产品词集合，包括：对所述第一属性集合中每个第一属性及与其对应的产品词的关系子图、所述第一品牌2CN112835990A权利要求书2/2页集合中每个第一品牌及与其对应的产品词的关系子图、所述第一类目及与其对应的产品词的关系子图，以及所述标题与第一产品词的关系子图进行合并，得到关系图；将所述关系图作为最近公共祖先算法的输入，进行计算，得到所述第二产品词集合。6.根据权利要求1-5任一项所述的方法，其特征在于，在从待处理文本获取第一产品词集合之前，包括：从日志集合中每个日志内，提取第二属性集合中每个第二属性及与其对应的产品词、第二品牌集合中每个第二品牌及与其对应的产品词，以及第二类目及与其对应的产品词；将所述第二属性及与其对应的产品词在所述日志集合中共同出现次数、所述第二属性、与其对应的

相关资料

一种识别方法和装置.pdf

本发明公开了一种识别方法和装置，涉及计算机技术领域。该方法的一具体实施方式包括：从待处理文本获取第一产品词集合，根据所述待处理文本和图数据库获取所述待处理文本的多个参数与产品词的关系子图；按照所述待处理文本的多个参数与产品词的关系子图进行计算，得到第二产品词集合；根据所述图数据库从所述第一产品词集合和所述第二产品词集的交集中，识别所述待处理文本的核心产品词。该实施方式提高了识别的准确率。

2023-06-14

766KB

一种手写识别方法和装置.pdf

本发明公开了一种手写识别方法和装置。其中，所述方法包括：接收手写输入的字符数据信号；根据所述字符数据信号间实时出现的抬笔轮候时间间隔，更新抬笔轮候时间阈值；判断当前的抬笔轮候时间间隔是否超过实时更新后的抬笔轮候时间阈值，若是，则确定当前字符输入完毕；对当前字符进行识别。通过本发明，能够实现对用户书写习惯的不断监测学习，实时更新抬笔轮候时间，提高字符识别效率。

2023-10-22

565KB

一种价格识别方法和装置.pdf

本发明公开了一种价格识别方法和装置，涉及计算机技术领域。该方法的一具体实施方式包括：对目标图片进行文本检测和识别，得到识别结果；按照位置信息排序识别到的文本，以基于正则匹配方式处理排序后的文本，过滤出疑似价格文本；确定与第一疑似价格文本位置相交或相邻、且一同符合预定合并规则的第二疑似价格文本，合并所述第一疑似价格文本和所述第二疑似价格文本，得到所述目标图片的价格文本。该实施方式解决众多电商场景下复杂版式的小数价格识别，提出注意力值这一理念，将小数价格特殊的位置信息以及整数部分突出的面积占比合二为一进行考虑

2023-07-25

730KB

一种路面识别方法和装置.pdf

本发明公开一种路面识别方法和装置，用以解决现有技术中根据图像数据无法可靠有效地识别路面的问题。该方法包括：路面识别装置获取一个驾驶环境的一个图像数据和一个点云数据，其中，图像数据来自于自动驾驶车辆的车载摄像头，点云数据来自于自动驾驶车辆的车载激光雷达；将点云数据投影到图像数据上得到投影数据，投影数据中包括图像数据的像素点和点云数据的投影点；从点云数据中识别出路面点云数据点；在投影数据中保留与路面点云数据点对应的投影点，得到路面投影数据，路面投影数据中包括路面点云投影点和图像数据的像素点；将路面点云投影点保

2023-11-15

1.5MB

一种夹层识别方法和装置.pdf

本申请实施例提供一种夹层识别方法和装置，涉及油藏资源开发技术领域，包括：根据测井曲线中M个采样点的第一指标数据，构建指标矩阵，获取每种第一指标数据各自对应的权重，并根据权重对指标矩阵进行加权处理得到由第二指标数据组成的结果矩阵，根据结果矩阵中每种第二指标数据各自对应的最大值、最小值和每个采样点对应的N种第二指标数据，确定每个采样点的夹层发育概率，根据每个采样点的夹层发育概率，获取测井曲线中K个测井曲线单元体各自的发育概率，若任一测井曲线单元体的发育概率大于预设阈值，则确定存在夹层。根据测井曲线，通过定量识

2023-05-26

1.9MB