视频通话中语音处理系统及其方法.pdf
永香****能手
在线预览结束,喜欢就下载吧,查找使用更方便
相关资料
视频通话中语音处理系统及其方法.pdf
本发明提供一种视频通话中语音处理系统及方法,视频通话终端通过基础通信网互联互通;视频通话包含外部增强通话功能的在线服务器;外部增强通话功能的在线服务器包括在线语音转文字模块及在线通话氛围模块;在线语音转文字模块包括语音识别单元;用户通过视频通话终端进行通话;终端的本地语音转文字模块或在线语音转文字模块的语音识别单元对对方的音频数据进行处理,进行语音识别后转换成文字,存储在文字转字幕存储模块,将识别的文字内容叠加到终端的视频画面上进行显示;并调用终端本地通话氛围模块或外部增强通话功能服务器的在线通话氛围模块
视频通话语音处理方法及通信终端、可读存储介质.pdf
本申请公开一种视频通话语音处理方法及通信终端、可读存储介质。所述视频通话语音处理方法包括:识别当前视频图像中的目标人物;获取目标人物的接听参数,所述接听参数用于标识目标人物听到的声音强度,且包括目标人物在当前视频图像中的位置、目标人物的动作、以及目标人物的语音中的至少一者;根据接听参数调整声音采集设备的增益,并将调整后声音采集设备采集到的语音信号传输给目标终端。本申请能够在通话场景中根据对方情况来调节自身麦克风的输入增益,从而有利于为用户提供高质量的语音通话服务。
实时语音通话中的实时语音接收设备及降低延迟的方法.pdf
本发明实施例提供一种实时语音通话中的实时语音接收设备及降低延迟的方法。其方法应用于实时语音接收设备包括:至少监控重采样模块的输入缓冲区中的数据量,所述重采样模块的输入缓冲区中的数据至少是解压缩和解包处理后的数据;当监控的缓冲区的数据量达到重采样阈值,对所述重采样模块的输入缓冲区中的数据进行重采样;对重采样后的数据进行下一级处理。通过对数据进行重采样的方式减少缓存的数据量,相当于在语音接收设备加速播放,达到了降低延迟的目的。
视频处理系统中目标跟踪方法的研究.docx
视频处理系统中目标跟踪方法的研究摘要:随着科技的不断进步,视频处理技术的普及,目标跟踪技术出现了在许多领域的应用。本文概述了目标跟踪方法的发展历史、常用的目标跟踪算法和目标跟踪评价指标。然后,对比分析了不同算法的优缺点,以及目标跟踪常见的挑战因素。最后,总结了当前目标跟踪技术的发展趋势和应用前景,并提出可以优化和改良的方向。1.引言视频处理技术包括视频采集、视频编码、视频解码、视频传输和视频处理等,并且在许多领域得到了广泛的应用,如安全监控、医疗、自动驾驶、智能家居等。其中,视频处理中的目标跟踪技术从目标
实时通话中的语音处理方法及装置.pdf
本发明实施例提供了一种实时通话中的语音处理方法及装置。该方法中,框架层应用语音优化工具包对接收到的对方语音进行优化,得到第一优化处理结果,并将第一优化处理结果发送至浏览器内核,浏览器内核将第一优化处理结果发送至用户界面层进行语音播放。在经过这样的处理之后,用户界面层播放的即为经过优化之后的对方的语音信号,从而能够有效消除对方传来的语音信号中的各类干扰因素,提高语音通话的质量。