一种在音频中切分句子的方法和系统及视频文件的字幕自动生成方法和系统.pdf
An****99
亲,该文档总共11页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
一种在音频中切分句子的方法和系统及视频文件的字幕自动生成方法和系统.pdf
本发明实施例公开了一种在音频中切分句子的方法和系统,及视频文件的字幕自动生成方法和系统,包括:识别第一停顿;识别第一句子;识别第二停顿;判断音频是否结束,如未结束则重复上述识别句子/停顿的步骤,结束则结束;其中,所述停顿具有最小长度限制,所述句子具有最小长度限制,所述句子还具有最大长度限制。由此提高了语音识别率,使得全自动的字幕制作成为可能。
一种增加字幕和/或音频的方法及系统.pdf
本申请提供一种增加字幕和/或音频的方法及系统。该方法包括:媒资服务器接收目标视频的标识和新语言文件,并将新语言文件转换为新语言介质文件;媒资服务器根据目标视频的标识找到第一索引文件,根据新语言介质文件在媒资服务器中的存储地址得到第二索引文件;媒资服务器将新语言介质文件和第二索引文件发送至内容分发服务器;内容分发服务器将第二索引文件中新语言介质文件在媒资服务器中的存储地址替换为在内容分发服务器中的存储地址,得到第三索引文件;内容分发服务器生成目标视频的第一URL。该方法实现了增加目标视频的新语言字幕或新语言
音频生成方法和系统.pdf
一种音频生成方法和系统,该方法包括以下步骤:接收多个输入音频资产,将每个输入音频资产转换为输入图形表示,通过将每个输入图形表示堆叠在图像的分离通道中来生成输入多通道图像,将输入多通道图像馈入生成模型以训练生成模型并生成一个或多个输出多通道图像,每个输出多通道图像包括输出图形表示,从每个输出多通道图像提取输出图形表示,并将每个输出图形表示转换为输出音频资产。
一种自动生成答案的方法和系统.pdf
本说明书的实施例公开了一种自动生成答案的方法,该方法包括:获取用户问题和至少一个第一文本,所述第一文本是多个第二文本中与所述用户问题相关的文本;从所述用户问题和所述至少一个第一文本中确定至少一个核心词,以及确定所述至少一个核心词中任意两个不同核心词之间的相关性;所述相关性代表所述核心词的重要程度;答案生成模型基于输入的所述用户问题、所述至少一个第一文本和所述相关性,输出所述用户问题的答案;其中,所述答案生成模型包括图神经网络模型,所述图神经网络模型的节点为所述核心词,所述图神经网络模型的边为所述相关性。
一种根据音频音乐生成动画的方法和系统.pdf
本发明提供了一种根据音频音乐生成动画的方法和系统,所述方法包括:对音频音乐的预设频率段进行分析,获得节奏音频、伴奏音频;依据所述各个音频的频率特性获得各个音轨,并组合生成MIDI文件;对MIDI文件进行音乐结构的分析,获得音乐分析结果以及音乐的时间属性;根据预置的动画素材库和上述音乐分析结果通过预置规则或者用户输入的参数构建各个动画元素及其对应关系;根据所述时间属性将各个动画元素及其对应关系组合成动画。通过本发明,可以自动的将音频音乐生成为内容丰富、与音乐表达的内容相对应的可视信息。