你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

关键字搜索和语音转文本

Azure 内容分发网络
Azure AI 搜索
Azure Media Player
Azure AI 视频索引器
Azure 应用服务

解决方案构想

本文是一种解决方案构想。 如果你希望我们在内容中扩充更多信息,例如潜在用例、备用服务、实现注意事项或定价指南,请通过提供 GitHub 反馈来告知我们。

此解决方案的理念是标识静态视频文件中的语音,以将语音作为标准内容进行管理。

体系结构

Architecture diagram shows the flow from the source through Azure blob storage and live encoder to the streaming endpoint.

下载此体系结构的 Visio 文件

数据流

  • Blob 存储可存储大量非结构化数据,用户可在世界任何地方通过 HTTP 或 HTTPS 访问这些数据。 可以使用 Blob 存储向外公开数据,或者私下存储应用程序数据。
  • Azure 编码可转换媒体文件的编码方式。
  • Azure 流式处理终结点表示一个流服务,该服务可以直接将内容分发给客户端播放器应用程序,也可以直接将内容分发给内容分发网络 (CDN) 以进一步进行分发。
  • 内容分发网络提供可以到达全球并且具有丰富功能集的安全可靠的内容分发。
  • Azure Media Player 使用 HTML5 (MSE/EME) 之类的行业标准来提供扩充的自适应流式处理体验。 无论使用的播放技术是什么,用户都会有用于访问 API 的统一 JavaScript 接口。
  • Azure 认知搜索提供了一种即用型服务,该服务填充了数据,然后用于将搜索功能添加到 Web 或移动应用程序。
  • Web 应用托管网站或 Web 应用程序。
  • Azure Media Indexer 用于使媒体文件内容可供搜索,并为隐藏的字幕和关键字生成全文本脚本。 媒体文件是单独或批量处理的。

组件

  • Blob 存储Azure 存储中的一项服务。 Blob 存储提供针对大量非结构化数据进行了优化的云对象存储。
  • Azure 媒体服务是一个基于云的平台,可用于流式传输视频、增强可访问性和分发以及分析视频内容。
  • 实时和按需流式处理是 Azure 媒体服务的一项功能,可将内容大规模交付到各种设备。
  • Azure 编码提供了方法,可将一种将包含数字视频或音频的文件从一种标准格式转换为另一种标准格式。
  • Azure Media Player 可播放各种格式的视频。
  • Azure 内容分发网络为快速分发内容提供了一个全球解决方案。 此服务让你的用户能够快速、可靠且安全地访问你的应用的静态和动态 Web 内容。
  • Azure 认知搜索是一项云搜索服务,提供基础结构、API 和搜索工具。 可以使用 Azure 认知搜索通过 Web、移动和企业应用程序中的专用异类内容生成搜索体验。
  • 应用服务提供一个用于生成、部署和缩放 Web 应用的框架。 Web 应用功能是一项用于托管 Web 应用程序、REST API 和移动后端的服务。
  • Azure Media Indexer 提供了一种使媒体文件内容可搜索的方法。 它还可以为隐藏式字幕和关键字生成全文转录。

方案详细信息

语音转文本解决方案提供了一种用于识别静态视频文件中的语音的方法,以便你可以将其作为标准内容进行管理。 例如,员工可以使用这项技术在培训视频中搜索口语或短语。 然后,他们可以导航到视频中包含单词或短语的特定时刻。

使用此解决方案时,可以将静态视频上传到 Azure 网站。 Azure Media Indexer 使用语音 API 为视频中的语音编制索引,并将其存储在 Azure 数据库中。 你可以使用 Azure 应用服务的 Web 应用功能搜索单词或短语。 然后,可以检索结果列表。 选择结果时,可以看到视频中提及单词或短语的位置。

此解决方案基于 Azure 托管服务内容分发网络Azure 认知搜索

可能的用例

此解决方案适用于可受益于搜索录制语音的功能的方案。 示例包括:

  • 培训和教育视频。
  • 犯罪调查。
  • 客户服务分析。

后续步骤