基于网页视频的语音搜索方法和装置-豆柴文库

基于网页视频的语音搜索方法和装置.pdf

2024-01-06

10金币

667KB

16页

闪闪****魔王

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共16页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN109697245A(43)申请公布日2019.04.30(21)申请号201811480054.7(22)申请日2018.12.05(71)申请人百度在线网络技术（北京）有限公司地址100085北京市海淀区上地十街10号百度大厦三层(72)发明人王群(74)专利代理机构北京清亦华知识产权代理事务所(普通合伙)11201代理人宋合成(51)Int.Cl.G06F16/73(2019.01)G06F16/735(2019.01)权利要求书2页说明书9页附图4页(54)发明名称基于网页视频的语音搜索方法和装置(57)摘要本申请提出一种基于网页视频的语音搜索方法和装置，其中，方法包括：通过网页中预先设置的语音交互接口获取用户输入的语音搜索信息；检测语音搜索信息是否包括用户观看的当前视频帧；在获知语音搜索信息包括当前视频帧时从语音搜索信息中提取与当前视频帧对应的引导搜索词；根据引导搜索词在当前视频帧中确定目标搜索对象并通过预设的图像数据库识别目标搜索对象获取对应的第一搜索文本信息；获取与第一搜索文本信息对应的搜索结果并根据视频的当前播放模式确定网页的可视区域进而将搜索结果渲染在可视区域。由此，能够在用户观看视频的过程中根据语音搜索信息检索相关的知识，提升用户使用体验。CN109697245ACN109697245A权利要求书1/2页1.一种基于网页视频的语音搜索方法，其特征在于，包括以下步骤：通过所述网页中预先设置的语音交互接口获取所述用户输入的语音搜索信息；检测所述语音搜索信息是否包括所述用户观看的当前视频帧；若获知所述语音搜索信息包括所述当前视频帧，则从所述语音搜索信息中提取与所述当前视频帧对应的引导搜索词；根据所述引导搜索词在所述当前视频帧中确定目标搜索对象，并通过预设的图像数据库识别所述目标搜索对象获取对应的第一搜索文本信息；获取与所述第一搜索文本信息对应的搜索结果，并根据所述视频的当前播放模式确定所述网页的可视区域，进而将所述搜索结果渲染在所述可视区域。2.如权利要求1所述的方法，其特征在于，在所述检测所述语音搜索信息是否包括所述用户观看的当前视频帧之后，还包括：若获知所述语音搜索信息不包括所述当前视频帧，则从所述语音搜索信息中提取关键搜索词；通过预设的语音数据库识别所述关键搜索词获取对应的第二搜索文本信息；获取与所述第二搜索文本信息对应的搜索结果，并根据所述视频的当前播放模式确定所述网页的可视区域，进而将所述搜索结果渲染在所述可视区域。3.如权利要求1所述的方法，其特征在于，所述从所述语音搜索信息中提取与所述当前视频帧对应的引导搜索词，包括：将所述语音搜索信息转换为文本搜索信息；在预设的指令库中进行匹配与所述文本搜索信息对应的引导搜索词。4.如权利要求1所述的方法，其特征在于，所述根据所述视频的当前播放模式确定所述网页的可视区域，进而将所述搜索结果渲染在所述可视区域，包括：根据所述视频的当前播放模式为竖屏播放，确定所述网页的可视区域为视频屏幕的上半部分/下半部分；将所述搜索结果以浮层形式渲染在所述视频屏幕的上半部分/下半部分。5.如权利要求1所述的方法，其特征在于，所述根据所述视频的当前播放模式确定所述网页的可视区域，进而将所述搜索结果渲染在所述可视区域，包括：根据所述视频的当前播放模式为横屏播放，确定所述网页的可视区域为视频屏幕的左半部分/右半部分；将所述搜索结果以浮层形式渲染在所述视频屏幕的左半部分/右半部分。6.一种基于网页视频的语音搜索装置，其特征在于，包括：第一获取模块，用于通过所述网页中预先设置的语音交互接口获取所述用户输入的语音搜索信息；检测模块，用于检测所述语音搜索信息是否包括所述用户观看的当前视频帧；提取模块，用于若获知所述语音搜索信息包括所述当前视频帧，则从所述语音搜索信息中提取与所述当前视频帧对应的引导搜索词；确定识别模块，用于根据所述引导搜索词在所述当前视频帧中确定目标搜索对象，并通过预设的图像数据库识别所述目标搜索对象获取对应的第一搜索文本信息；第二获取模块，用于获取与所述第一搜索文本信息对应的搜索结果；2CN109697245A权利要求书2/2页渲染模块，用于根据所述视频的当前播放模式确定所述网页的可视区域，进而将所述搜索结果渲染在所述可视区域。7.根据权利要求6所述的装置，其特征在于，还包括：所述提取模块，还用于若获知所述语音搜索信息不包括所述当前视频帧，则从所述语音搜索信息中提取关键搜索词；第三获取模块，用于通过预设的语音数据库识别所述关键搜索词获取对应的第二搜索文本信息；所述第二获取模块，还用于获取与所述第二搜索文本信息对应的搜索结果；所述渲染模块，还用于根据所述视频的当前播放模式确定所述网页的可视区域，进而将所

相关资料

基于网页视频的语音搜索方法和装置.pdf

本申请提出一种基于网页视频的语音搜索方法和装置，其中，方法包括：通过网页中预先设置的语音交互接口获取用户输入的语音搜索信息；检测语音搜索信息是否包括用户观看的当前视频帧；在获知语音搜索信息包括当前视频帧时从语音搜索信息中提取与当前视频帧对应的引导搜索词；根据引导搜索词在当前视频帧中确定目标搜索对象并通过预设的图像数据库识别目标搜索对象获取对应的第一搜索文本信息；获取与第一搜索文本信息对应的搜索结果并根据视频的当前播放模式确定网页的可视区域进而将搜索结果渲染在可视区域。由此，能够在用户观看视频的过程中根据语

2024-01-06

667KB

基于短视频语音的情感识别方法和装置.pdf

本申请公开了一种基于短视频语音的情感识别方法和装置，属于语音情感识别技术领域。该方法包括：创建短视频的语音数据集，对语音数据集进行预处理，对预处理后的语音数据进行计算得到梅尔倒谱系数，作为输入送入CNN模型进行训练，得到声学情感类别C1；将预处理后的语音数据转换为文本数据，进行分词、去除停用词和文本特征抽取操作，再使用预训练的LSTM模型进行训练得到语义情感类别C2；按照预设的比重结合C1和C2，得到最终语音情感类别C。该装置包括：创建模块、预处理模块、声学识别模块、语义识别模块和结合模块。本申请扩展了语

2023-06-25

826KB

基于语音识别的视频播放方法及装置.pdf

本发明是关于一种基于语音识别的视频播放方法及装置，其方法包括：获取语音信号；生成与所述语音信号相对应的特征信息；判断预先建立的特征信息表中是否存在与所述特征信息相匹配的视频信息；当所述预先建立的特征信息表中存在与所述特征信息相匹配的视频信息时，播放与所述视频信息相对应的视频。与传统的方式相比，本发明可以突破儿童用户等语言表达能力不强的限制，迅速搜索并播放用户所需观看的视频节目。

2023-12-07

828KB

视频搜索的方法及装置.pdf

本发明公开了一种视频搜索的方法，包括：实时获取用户在搜索框内输入的搜索内容；根据正在输入的所述搜索内容确定目标词，并搜索与所述目标词相关联的视频，生成该视频的图文信息；将所述图文信息以下拉框列表的形式展示出来；接收用户在所述下拉框列表中对图文信息的选择操作，根据选择的图文信息调取对应的视频并进行播放。本发明还公开了一种视频搜索的装置。所述视频搜索的方法及装置通过将用户的搜索输入的结果直接展示在搜索框的下拉框中，不仅提高了用户搜索的效率和准确性，而且通过获取相应视频的图文信息使得用户可以更加直观地获得视频的

2023-12-07

641KB

一种基于语音的信息搜索方法及相应装置.pdf

本申请公开一种基于语音的信息搜索方法及相应的装置，在该方案中，设置有语音识别服务器，广告服务器能够获取语音识别服务器传输的语音搜索请求对应的语音识别结果，并将语音识别结果相应的广告传输至终端设备，或者，所述广告服务器能够获取信息服务器传输的语音搜索请求对应的语音识别结果，并将语音识别结果相应的广告传输至终端设备，或者，所述广告服务器能够对语音搜索请求进行语音识别，并将语音识别结果相应的广告传输至终端设备，从而使终端设备实现广告的显示，解决了现有技术中，终端设备无法获取到信息关联的广告，导致终端设备无法显示

2023-12-07

619KB