文本序列的标注方法、装置、存储介质和电子设备.pdf
曾琪****是我
亲,该文档总共23页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
文本序列的标注方法、装置、存储介质和电子设备.pdf
本申请提出了一种文本序列的标注方法、装置、存储介质和电子设备。该标注方法包括:获取训练文本,训练文本包括输入字符和输出字符;根据预设规则构建第一模型的对齐规则,第一模型为加权有限状态转换机,对齐规则为对输入字符和输出字符进行对齐输出的规则;将训练文本输入至第一模型,基于对齐规则确定输入字符和输出字符的对齐结果;根据对齐结果确定第一标注数据,并根据第一标注数据对输入字符进行序列标注。
文本摘要标注方法、装置、电子设备和存储介质.pdf
本申请实施例中提供了一种文本摘要标注方法、装置、电子设备和存储介质,所述方法包括:首先获取待标注的摘要标注文本;然后计算所述待标注的摘要标注文本的每一个句子的目标摘要标注分数;根据所述目标摘要标注分数的大小从所述待标注的摘要标注文本中选取预设数量的句子作为所述待标注的摘要标注文本的摘要数据标注,从而可以自动为待标注的摘要标注文本添加摘要数据标注,无需人工标注,提高文本的标注效率的同时降低了标注的人力成本,另外,自动标注的方式也能统一摘要标注的标准,避免由于摘要标注的标准不统一影响模型的训练效果。
文本的时间标注方法、装置、电子设备和可读存储介质.pdf
本申请实施例提供一种文本的时间标注方法、装置、电子设备和可读存储介质,该方法包括:接收标注请求,根据目标音频的基频,获取目标音频中每个文本单元的播放起止时间,且根据目标音频中每个文本单元的播放起止时间,标注文本中每个文本单元的播放起止时间,得到标注文件,输出标注文件。本申请实施例可以通过目标音频中基频识别目标音频对应的文本中相邻两个文本单元之间的时刻,即可以区分该相邻两个文本单元,进而对齐文本单元。而并非采用目前识别文本单元的方式将文本单元对齐,避免了因目标音频中的文本单元和目标音频对应的文本中的文本单元
文本标注方法及装置、存储介质及电子设备.pdf
本公开涉及自然语言处理技术领域,具体涉及一种文本标注方法及装置、计算机可读存储介质及电子设备,方法包括:响应用户对待标注文本的标注操作,为待标注文本配置文本标识,并确定待标注文本与已标注文本是否存在重叠对象;将与对待标注文本存在重叠对象的已标注文本确定为目标文本,并为目标文本和待标注文本配置边框;根据目标文本以及重叠对象更新待标注文本中的各个对象的文本标识,并为重叠对象配置不同的显示样式。本公开实施例的技术方案克服了相关技术难以区分具有重叠对象的两个标注文本内容的问题。
信息标注方法、装置、电子设备和存储介质.pdf
本公开提供了一种信息标注方法,涉及人工智能技术领域,尤其涉及数据处理技术和数据生成技术。具体实现方案为:将与目标事件相关的多个结构化数据和与目标事件相关的非结构化信息,进行匹配;响应于至少一个结构化数据与非结构化信息匹配成功,将与非结构化信息匹配成功的至少一个结构化数据作为目标数据,得到每个目标数据与至少一个非结构化信息片段之间的匹配关系;根据匹配关系,建立至少一个非结构化信息片段与标签之间的对应关系,标签与目标数据相对应;以及根据对应关系,利用标签对非结构化信息进行标注。本公开还提供了一种信息标注装置、