场景对话文本识别方法、装置以及终端-豆柴文库

场景对话文本识别方法、装置以及终端.pdf

2023-08-30

10金币

619KB

13页

志玉****爱啊

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共13页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN108897723A(43)申请公布日2018.11.27(21)申请号201810716111.0(22)申请日2018.06.29(71)申请人北京百度网讯科技有限公司地址100085北京市海淀区上地十街10号百度大厦2层(72)发明人曹宇慧冯仕堃何径舟(74)专利代理机构北京市铸成律师事务所11313代理人王珺武晨燕(51)Int.Cl.G06F17/22(2006.01)G06F17/27(2006.01)G06F17/30(2006.01)G06N3/08(2006.01)权利要求书2页说明书7页附图3页(54)发明名称场景对话文本识别方法、装置以及终端(57)摘要本发明提出一种场景对话文本识别方法、装置以及终端。其中，该方法包括：将场景对话文本输入至长短记忆型递归神经网络模型中，得到对话语义连贯特征分数；将场景对话文本输入至特征抽取器中，生成对话特征参量；将对话语义连贯特征分数和对话特征参量输入至梯度提升数融合模型中，得到优质交互的概率值；如果优质交互的概率值大于优质交互阈值时，则场景对话文本是优质交互文本。有效的挖掘了场景对话文本中的语义信息，并将语义信息和其它的对话特征参量融合在一起，对场景对话文本进行识别，给多轮对话的场景对话文本打上优质或者非优质的标签。CN108897723ACN108897723A权利要求书1/2页1.一种场景对话文本识别方法，其特征在于，包括：将场景对话文本输入至长短记忆型递归神经网络模型中，得到对话语义连贯特征分数；将所述场景对话文本输入至特征抽取器中，生成对话特征参量；将所述对话语义连贯特征分数和所述对话特征参量输入至梯度提升数融合模型中，得到优质交互的概率值；如果所述优质交互的概率值大于优质交互阈值时，则所述场景对话文本是优质交互文本。2.根据权利要求1所述的方法，其特征在于，将场景对话文本输入至长短记忆型递归神经网络模型中，得到对话语义连贯特征分数，包括：将所述场景对话文本中的每条对话语句进行切词，并将切词后得到的各个分词转化为词向量；将每条所述对话语句包含的所述词向量进行相加，生成与所述对话语句对应的语句特征向量；将各个所述语句特征向量输入至所述长短记忆型递归神经网络层中，生成对话特征向量；将所述对话特征向量输入至全连接层，输出连贯性类别和非连贯性类别；将所述连贯性类别和所述非连贯性类别输入至多类别逻辑回归函数中计算对应的概率值，得到所述对话语义连贯特征分数。3.根据权利要求2所述的方法，其特征在于，按照对所述场景对话文本中的对话顺序将所述语句特征向量输入至所述长短记忆型递归神经网络层中。4.根据权利要求1所述的方法，其特征在于，所述对话特征参量包括多轮对话的轮次、每轮对话中交互次数、回复的文本长度和对话主题实体词中的至少一项。5.根据权利要求1所述的方法，其特征在于，所述长短记忆型递归神经网络模型用于接收所述场景对话文本中的长语句，所述长语句是文本长度大于对话长度阈值的语句。6.一种场景对话文本识别装置，其特征在于，包括：连贯特征分数生成模块，用于将场景对话文本输入至长短记忆型递归神经网络模型中，得到对话语义连贯特征分数；对话特征参量抽取模块，用于将所述场景对话文本输入至特征抽取器中，生成对话特征参量；优质交互概率值模块，用于将所述对话语义连贯特征分数和所述对话特征参量输入至梯度提升数融合模型中，得到优质交互的概率值；优质交互结果判断模块，用于如果所述优质交互的概率值大于优质交互阈值时，则所述场景对话文本是优质交互文本。7.根据权利要求6所述的装置，其特征在于，所述连贯特征分数生成模块包括：词向量转换单元，用于将所述场景对话文本中的每条对话语句进行切词，并将切词后得到的各个分词转化为词向量；词向量相加单元，用于将每条所述对话语句包含的所述词向量进行相加，生成与所述对话语句对应的语句特征向量；2CN108897723A权利要求书2/2页对话特征提取单元，用于将各个所述语句特征向量输入至所述长短记忆型递归神经网络层中，生成对话特征向量；全连接计算单元，用于将所述对话特征向量输入至全连接层，输出连贯性类别和非连贯性类别；特征分数计算单元，用于将所述连贯性类别和所述非连贯性类别输入至多类别逻辑回归函数中计算对应的概率值，得到所述对话语义连贯特征分数。8.一种场景对话文本识别终端，其特征在于，包括：一个或多个处理器；存储器，用于存储一个或多个程序；当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如权利要求1-5中任一所述的方法。9.一种计算机可读存储介质，其存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-5中任一所述的方法。3CN108897723A说明书1

相关资料

场景对话文本识别方法、装置以及终端.pdf

本发明提出一种场景对话文本识别方法、装置以及终端。其中，该方法包括：将场景对话文本输入至长短记忆型递归神经网络模型中，得到对话语义连贯特征分数；将场景对话文本输入至特征抽取器中，生成对话特征参量；将对话语义连贯特征分数和对话特征参量输入至梯度提升数融合模型中，得到优质交互的概率值；如果优质交互的概率值大于优质交互阈值时，则场景对话文本是优质交互文本。有效的挖掘了场景对话文本中的语义信息，并将语义信息和其它的对话特征参量融合在一起，对场景对话文本进行识别，给多轮对话的场景对话文本打上优质或者非优质的标签。

2023-08-30

619KB

一种场景文本识别方法和装置.pdf

本发明公开了一种场景文本识别方法和装置。其中，该方法包括：获取多张目标场景图像，其中，所述目标场景图像包含目标对象；将每张所述目标场景图像依次输入编码器进行特征提取和编码，生成图像编码特征序列；通过解码器解码所述图像编码特征序列，生成每张所述目标场景图像的字符识别结果；将多帧所述字符识别结果输入多帧综合模块，确定最终字符识别结果，解决现有技术场景文本识别准确率低、识别稳定性低、对采集图像要求高和抗攻击性差的技术问题。

2023-07-24

806KB

陈列场景识别方法、装置、设备以及存储介质.pdf

本公开提供了一种陈列场景识别方法、模型训练方法、装置、设备、存储介质以及计算机程序产品，涉及人工智能技术领域，具体为计算机视觉和深度学习技术领域，可应用于图像处理、图像识别等场景。具体实现方案为：获取待识别图像的特征向量并获取底库特征向量集；基于待识别图像的特征向量与底库特征向量集中每个特征向量的相似系数，从底库特征向量集中确定出至少两个候选特征向量；对至少两个候选特征向量的相似系数进行阈值判断，得到目标特征向量；基于目标特征向量对应的陈列场景标签确定待识别图像的陈列场景。根据对候选特征向量的相似系数进行

2023-07-25

1.3MB

文本识别方法、装置、设备以及存储介质.pdf

本公开提供了文本识别方法、装置、设备以及存储介质，涉及深度学习技术领域。具体实现方案为：接收目标图像；利用预先训练的轻量化文本检测网络对目标图像进行文本检测，得到文本检测框；利用预先训练的轻量化文本识别网络对文本检测框中的文本进行识别，得到文本识别结果。本实现方式能够利用轻量化网络进行文本识别，从而提高文本识别的效率，并且对硬件的要求不高。

2023-07-24

1MB

场景图导出方法、装置、终端设备以及存储介质.pdf

本发明公开了一种场景图导出方法、装置、终端设备以及存储介质，通过获取待处理场景图；识别所述待处理场景图的尺寸，并根据所述场景图的尺寸分配场景位图的内存；根据所述待处理场景图的尺寸计算场景分块个数，得到各场景分块；对各所述场景分块进行坐标平移变换，并渲染拷贝至所述场景位图中的对应位置，得到整体场景位图，以供将所述整体场景位图导出保存。本发明实现了大规模场景图的直接渲染及导出保存。

2024-01-06

561KB