一种文本标注方法和装置.pdf
努力****南绿
亲,该文档总共25页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
一种文本标注方法和装置.pdf
本发明公开了一种文本标注方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:响应于对目标文本中文本内容的选区操作,获取选区的焦点、锚点、焦点相对位置和锚点相对位置;分别处理焦点相对位置和锚点相对位置,根据得到的焦点绝对位置和锚点绝对位置,确定选区的绝对位置;将文本内容存储到页面标签内、以及将绝对位置添加至页面标签的属性中,将页面标签写入文本树结构中与选区对应的位置,以对文本内容进行打标展示。该实施方式提供一种可应用于带空格和回车换行的跨行/跨段落的文本标注工具,确定选区对于整个文本的绝对位置,便于
一种文本标注方法和装置.pdf
本发明公开了一种文本标注方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:创建标注任务;从服务端获取所述标注任务对应的原始文本,并通过浏览器渲染所述原始文本;响应标注用户对所述原始文本的标注指令,生成所述原始文本对应的标注结果数据;其中,所述标注结果数据为JSON格式;将所述标注结果数据上传至所述服务端。该实施方式能够解决标注结果数据通用性差和维护成本高的技术问题。
文本标注方法和装置.pdf
本发明公开了一种文本标注方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取待标注文本中每一字的词典特征向量;其中,所述词典特征向量中的分量表征该字与该字在待标注文本中的邻接字组成的词语是否为预设词典中的词语;将待标注文本中每一字的词典特征向量和预先获取的嵌入向量输入预先训练完成的文本标注模型,得到每一字对应的标签;其中,所述文本标注模型的训练数据包括多个字的词典特征向量和嵌入向量以及预先为所述多个字确定的标签。该实施方式能够提取待标注文本中每一字的词典特征输入模型来提高模型的泛化能力以及标注
一种短文本标签标注方法及装置.pdf
本申请公开一种短文本标签标注方法及装置,所述方法包括:根据样本间的相似度对样本进行初步聚类,通过从样本中提取出的词语组成的标签库,对样本进行打标,提高了样本标签的统一性;在对样本进行打标时,从各个聚类中选择多个相似度较低的样本进行打标,提高了对于样本的文本标注效率;根据每轮的打标结果对所述聚类进行更新,动态控制各个聚类的裂变程度,当在第j个聚类中的已标注样本包含L个不同标签时,根据所述第j个聚类中未标注样本与所述L个标签之间的相似度,将所述第j个聚类按照所述L个标签进行聚类更新,其中L≥2;当聚类稳定后获
一种数据标注方法和标注装置.pdf
本发明提供了一种数据标注方法和标注装置,以解决现有技术中对数据采集周期和采集质量失控,伴随法律风险过高,数据标注资源消耗过大的技术问题。方法,包括:在基准模型上进行人工标注形成特征关键点,随所述基准模型的变形形成所述特征关键点的位置变化数据,在所述基准模型变形后形成的影像中根据所述位置变化数据形成所述特征关键点的标注数据。形成利用基准模型一次人工标注形成一系列影像和影像的标注数据。使得训练数据生产成本可控,训练数据组合方式可控,训练数据环境场景复杂度可控,法律风险可控。以满足不同目的的深度学习需求。