一种基于深度学习的语音编码方法、系统、介质及设备.pdf
宁馨****找我
亲,该文档总共15页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
一种基于深度学习的语音编码方法、系统、介质及设备.pdf
本申请公开了一种基于深度学习的语音编码方法、系统、介质及设备,属于音频编码技术领域,该方法包括:对输入的音频数据进行特征提取,得到特征参数;将特征参数输入到预训练的神经网络模型中,得到音频数据中存在语音的概率;根据概率对音频数据编码的码率进行调整,其中码率与概率成正比例关系;以及根据调整后的码率对音频数据继续进行编码。本申请的基于深度学习的语音编码方法通过对通话音频中存在语音的概率进行检测,根据该概率值适当调整对该音频编码的码率,在确保音质几乎不变的前提下降低编码速率,提高编码器的编码效率。
基于深度学习的文本生成语音的方法、系统、装置及介质.pdf
本发明公开了一种基于深度学习的文本生成语音的方法、系统、装置及介质,其中所述方法包括:获取包含目标说话人语音的第一数据集,根据第一数据集进行训练,获得能够生成包含目标说话人特征的声音频谱的目标模型;获取待转换文本,根据待转换文本确定待转换音频,将待转换音频输入目标模型则获得目标声音声音频谱,将目标声音频谱输入声码器则获得目标音频。本申请实施例通过训练好的目标模型,把文本转换为语音,并保留原说话人如音色,说话时的韵律等特征,使语音听起来与原说话人的语音一致。本申请可广泛用于语音处理技术领域。
基于深度学习的多层自动编码方法及系统.pdf
本发明涉及一种基于深度学习的多层自动编码方法及系统,结合深度学习原理与张量算法,采用张量的形式对原始数据进行表达,能够在不破坏原始数据结构的前提下,充分挖掘原有信息,并通过多层学习,获得更本质的抽象特征,从而克服采用向量表达的局限性,能较大程度上保留原始数据的结构信息,并且获得更为鲁棒的特征提取与模式学习,利于对原始数据本质的体现,有利于进行后续的模式分类。
一种基于深度学习的高效语音互动设备.pdf
本发明提供一种基于深度学习的高效语音互动设备,包括第一支撑杆,所述第一支撑杆的内部设置有升降机构,所述升降机构的顶部固定连接有第二支撑杆,所述第二支撑杆的顶部固定连接有第一固定板,所述第一固定板的顶部设置有第二固定板,第二固定板的正面固定连接有显示屏。本发明提供一种基于深度学习的高效语音互动设备,利用升降机构,通过第一锥形齿轮和第二锥形齿轮,方便带动螺纹杆旋转,通过螺纹杆和螺纹管的配合,可带动第一固定板进行移动,方便对第二固定板的高度进行调节,利用缠绕机构,通过第一连接板和第一连接杆,可对第二连接杆进行支
基于多模态的深度学习预测方法、系统、介质及设备.pdf
本发明提供一种基于多模态的深度学习预测方法、系统、介质及设备,所述基于多模态的深度学习预测方法包括:获取图像数据集,所述图像数据集包括至少两个模态的图像数据;将所述图像数据进行特征提取,以生成与每个模态对应的特征提取结果;结合预设的约束项对所述特征提取结果进行融合并分类预测。本发明设计了多模态的网络结构,对于每一个模态的图像,分别使用卷积神经网络进行特征提取,然后结合约束项在全连接层将这些特征进行融合,综合不同模态的特征信息,得到最终的分类结果。这样既保留了单个模态的信息特点又可以综合利用多模态的信息,提