预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共17页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113887231A(43)申请公布日2022.01.04(21)申请号202111223916.X(22)申请日2021.10.18(71)申请人成都美尔贝科技股份有限公司地址610041四川省成都市高新区吉庆三路333号1栋2单元4-7号(72)发明人王枫杨彪(74)专利代理机构成都弘毅天承知识产权代理有限公司51230代理人黄海斌(51)Int.Cl.G06F40/295(2020.01)G06F16/36(2019.01)G06F16/35(2019.01)权利要求书2页说明书9页附图5页(54)发明名称医疗美容实体对齐方法、装置、设备和可读存储介质(57)摘要本发明涉及实体对齐技术领域,公开了一种医疗美容实体对齐方法、装置、设备和可读存储介质,所述方法包括:采集医疗美容项目数据;基于医疗美容项目数据提取实体,实体的实体属性包括实体语义向量、项目实体向量和项目结构属性中的至少一个;对实体进行筛选获得第一标准实体集合和非标准实体集合;基于实体属性的相似度在非标准实体集合中的非标准实体与第一标准实体集合中的第一标准实体之间构建映射关键。本发明解决了现有医疗美容行业由于没有相对规范的行业标准和行业通用准则,导致其项目命名严重不规范,项目名称实体对齐难度大的问题。CN113887231ACN113887231A权利要求书1/2页1.医疗美容实体对齐方法,其特征在于,包括:采集医疗美容项目数据;基于所述医疗美容项目数据提取实体,所述实体的实体属性包括实体语义向量、项目实体向量和项目结构属性中的至少一个;对所述实体进行筛选获得第一标准实体集合和非标准实体集合;基于实体属性的相似度在所述非标准实体集合中的非标准实体与所述第一标准实体集合中的第一标准实体之间构建映射关键。2.根据权利要求1所述的医疗美容实体对齐方法,其特征在于,对所述实体进行筛选获得第一标准实体集合包括:对所述实体进行初步筛选,将数据来源为医疗美容机构的实体加入第一候选集合;对所述第一候选集合中的第一候选实体的实体项目名称进行频次统计,若所述频次统计结果大于第一预设阈值,则将所述第一候选实体加入第二标准实体集合;从所述第一候选集合中去除所述第二标准实体集合获得第二候选集合;对所述第二候选集合中的第二候选实体进行权重计算,若权重计算结果大于第二预设阈值,则将所述第二候选实体加入第三标准实体集合;结合所述第二标准实体集合和所述第三标准实体集合获得所述第一标准实体集合。3.根据权利要求2所述的医疗美容实体对齐方法,其特征在于,对所述第一候选集合中的第一候选实体的实体项目名称进行频次统计包括:确定所述第一候选实体的实体项目名称所归属的项目大类;获取具有所述项目大类的医疗美容机构的数量;获取具有所述第一候选实体的实体项目名称的医疗美容机构的数量;获取具有所述第一候选实体的实体项目名称的医疗美容机构的数量和具有所述项目大类的医疗美容机构的数量的比值。4.根据权利要求2所述的医疗美容实体对齐方法,其特征在于,对所述第二候选集合中的第二候选实体进行权重计算包括:基于实体识别模型构建所述第二候选集合中第二候选实体之间的互斥图,对所述互斥图进行权重排序得到所述第二候选实体的第一权重;基于实体属性中实体语义向量、项目实体向量的相似度得到所述第二候选实体在所述第二标准实体集合中相似度最高的第二标准实体,所述第二候选实体与实体语义向量、项目实体向量的相似度最高的第二标准实体的相似度分数为第二权重;基于实体属性中项目结构属性的相似度得到所述第二候选实体在所述第二标准实体集合中相似度最高的第二标准实体,所述第二候选实体与项目结构属性相似度最高的第二标准实体的相似度分数为第三权重;将所述二候选实体的第一权重减去其第二权重和第三权重得到权重差。5.根据权利要求1所述的医疗美容实体对齐方法,其特征在于,基于实体属性的相似度在所述非标准实体集合中的非标准实体与所述第一标准实体集合中的第一标准实体之间构建映射关键包括:计算所述非标准实体与所述第一标准实体之间的实体属性相似度,所述实体属性相似度包括实体语义向量相似度、项目实体向量相似度和项目实体属性相似度中的至少一个;2CN113887231A权利要求书2/2页基于所述实体属性相似度选择与所述非标准实体相似度最高的第一标准实体建立映射关键。6.根据权利要求1所述的医疗美容实体对齐方法,其特征在于,所述实体属性的相似度的计算方法包括:对于所述实体属性中的实体语义向量或项目实体向量,采用余弦相似度计算方法计算实体语义向量或项目实体向量的相似度;对于所述实体属性中的项目结构属性,采用重合度计算方法计算项目结构属性的相似度。7.根据权利要求1所述的医疗美容实体对齐方法,其特征在于,基于所述