预览加载中,请您耐心等待几秒...
1/5
2/5
3/5
4/5
5/5

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111814437A(43)申请公布日2020.10.23(21)申请号202010466752.2(22)申请日2020.05.28(71)申请人杭州视氪科技有限公司地址311121浙江省杭州市余杭区余杭街道文一西路1818-2号11幢8层802室(72)发明人于红雷邹可孙俊伟(74)专利代理机构杭州伍博专利代理事务所(普通合伙)33309代理人熊小芬(51)Int.Cl.G06F40/16(2020.01)G06F40/226(2020.01)G06F40/126(2020.01)G06N3/04(2006.01)G06N3/08(2006.01)权利要求书1页说明书3页(54)发明名称一种基于深度学习的盲文转中文方法(57)摘要本发明公开了一种基于深度学习的盲文转中文方法。它具体包括如下步骤:(1)对盲文文本预处理:盲文文本预处理对盲文做编码归一化处理;(2)深度学习算法模型构建:深度学习算法模型学习编码后的文本规律;(3)训练深度学习模型:通过深度学习模型翻译出对应的中文内容;(4)文本纠错:在文本纠错单元对盲文中的错别字进一步纠错。本发明的有益效果是:达到高精准度文本翻译结果。CN111814437ACN111814437A权利要求书1/1页1.一种基于深度学习的盲文转中文方法,其特征是,具体包括如下步骤:(1)对盲文文本预处理:盲文文本预处理对盲文做编码归一化处理;(2)深度学习模型构建:深度学习算法模型学习编码后的文本规律;(3)训练深度学习模型:通过深度学习模型翻译出对应的中文内容;(4)文本纠错:在文本纠错单元对盲文中的错别字进一步纠错。2.根据权利要求1所述的一种基于深度学习的盲文转中文方法,其特征是,在步骤(1)中,盲文文本预处理的具体方法如下:(11)对于盲文句子,根据盲文的特点,每一个中文字符对应的盲文都采用三方对齐表示,不足三方的用数字0填充表示;(12)对填充对齐后的盲文句子进行编码,转换成十进制编码字符串,编码后的字符串映射到0到63的编码空间,每个编码后的十进制数对应一个0到63的数字;(13)将每个编码后的十进制数替换成0到63对应的十进制数字,替换后的数字序列就是预处理的最终结果。3.根据权利要求2所述的一种基于深度学习的盲文转中文方法,其特征是,在步骤(12)中,盲文句子进行编码的具体方法如下:(121)对每一个盲文点方所代表的数字集合,对每一个数字进行2N计算,其中N表示盲文点方中每一个点代表的数字;(122)每一个盲文点方对所有的数字进行2N计算,然后求和,计算所得的数字就是编码后的值。4.根据权利要求2或3所述的一种基于深度学习的盲文转中文方法,其特征是,在步骤(2)中,深度学习模型构建的具体方法如下:(21)对编码后的盲文句子进行词嵌入编码,输出词嵌入编码后的词向量;(22)用cnn网络提取句子的语法信息和单词前后关联信息;(23)用双向lstm网络提取整个句子的句法结构信息;(24)步骤(23)作为网络的输出,通过交叉熵作为损失函数loss。5.根据权利要求4所述的一种基于深度学习的盲文转中文方法,其特征是,在步骤(22)中,具体操作方法如下:(221)该cnn网络的输入是经过词嵌入编码后的词向量;(222)词向量经过三层一维卷积神经网络,每一层的卷积核依次为7、5、3,用于提取不同长度句子中的语法信息和单词前后关联信息。6.根据权利要求2或3所述的一种基于深度学习的盲文转中文方法,其特征是,在步骤(3)中,训练深度学习模型的具体方法如下:(31)收集不同领域的中文文本,进行文本清洗,按句子分割,按照《国家通用盲文》规则,生成中盲对齐语料;(32)根据步骤(1)所述的文本预处理算法,对中盲对齐语料中的盲文进行编码;(33)将常用汉字做成词典,对中盲对齐语料中的中文句子进行编码;(34)中盲对齐语料中的盲文语句作为深度学习模型的input,中文句子作为深度学习模型的output。2CN111814437A说明书1/3页一种基于深度学习的盲文转中文方法技术领域[0001]本发明涉及深度学习相关技术领域,尤其是指一种基于深度学习的盲文转中文方法。背景技术[0002]盲文或称点字、凸字,是专为盲人设计、靠触觉感知的文字。透过点字板、点字机、点字打印机等在纸张上制作出不同组合的凸点而组成,一般每一个方块的点字是由六点组成,左侧从上到下为123,右侧为456,叫一方。它是由法国盲人路易·布莱尔于1824年创造的,故国际上通称为“布莱尔(Braille)”。[0003]现有的盲文转中文的操作方式中,只是简单的对盲文进行一对一的中文字符转化,导致转化过来的中文往往存在错别字、语句不通顺或者翻译不正确,这样的转化方式导