キーワード検索と音声テキスト変換

Azure Content Delivery Network
Azure AI Search
Azure Media Player
Azure AI Video Indexer
Azure App Service

ソリューションのアイデア

このアーティクルはソリューションのアイデアです。 このコンテンツにさらに多くの情報 (想定されるユース ケース、代替サービス、実装に関する考慮事項、価格ガイダンスなど) の掲載をご希望の方は、GitHub のフィードバックでお知らせください。

このソリューションのアイデアでは、静的なビデオ ファイル内の音声を識別して、音声を標準コンテンツとして管理します。

アーキテクチャ

Architecture diagram shows the flow from the source through Azure blob storage and live encoder to the streaming endpoint.

このアーキテクチャの Visio ファイルをダウンロードします。

データフロー

  • Azure Blob Storage では、HTTP または HTTPS を使って世界中のどこからでもアクセスできる、大量の非構造化データが格納されます。 Blob Storage を使用すると、データを一般に公開することも、アプリケーション データを公開せずに格納することもできます。
  • Azure Encoding では、メディア ファイルをあるエンコードから別のエンコードに変換します。
  • Azure ストリーミング エンドポイントは、コンテンツをクライアント プレーヤー アプリケーションや、再配布のためのコンテンツ配信ネットワーク (CDN) に直接配信するストリーミング サービスを表します。
  • Content Delivery Network では、グローバル展開によりセキュアで信頼性の高いコンテンツ配信と豊富な機能セットが提供されます。
  • Azure Media Player では、HTML5 (MSE/EME) などの業界標準を使用して、強化されたアダプティブ ストリーミング エクスペリエンスが提供されます。 使用する再生テクノロジにかかわらず、ユーザーは統一された JavaScript インターフェイスを使用して API にアクセスできます。
  • Azure Cognitive Search では、データを取り込んだら、Web サイトやモバイル アプリケーションに検索機能を追加するために使用される、すぐに使用できるサービスが提供されます。
  • Web Apps では Web サイトまたはアプリケーションがホストされます。
  • Azure Media Indexer を使用すると、メディア ファイルのコンテンツを検索対応にしたり、字幕やキーワード用にフルテキストのトランスクリプトを生成したりできます。 メディア ファイルは個別にまたはバッチで処理されます。

コンポーネント

  • Blob Storage は、Azure Storage に含まれるサービスです。 Blob Storage では、大量の非構造化データに対して最適化されたクラウド オブジェクト ストレージを提供します。
  • Azure Media Services は、ビデオをストリーム配信し、アクセス性と配信を強化し、動画コンテンツを分析するために使用できるクラウドベースのプラットフォームです。
  • Live and On-demand Streaming は、さまざまなデバイスに大規模にコンテンツを配信する Azure Media Services の機能です。
  • Azure Encoding では、デジタル ビデオやオーディオを使用したファイルを、ある標準形式から別の標準形式に変換する方法が提供されます。
  • Azure Media Player では、さまざまな形式のビデオが再生されます。
  • Azure Content Delivery Network では、コンテンツを迅速に配信するためのグローバル ソリューションが提供されています。 このサービスでは、アプリの静的および動的な Web コンテンツへの高速で信頼性の高い安全なアクセスがユーザーに提供されます。
  • Azure Cognitive Search は、検索用のインフラストラクチャ、API、ツールを提供するクラウド検索サービスです。 Azure Cognitive Search を使用すると、Web、モバイル、およびエンタープライズアプリケーションのプライベートな異種コンテンツに対する検索エクスペリエンスを構築できます。
  • App Service には、Web アプリの構築、デプロイ、およびスケーリングを行うためのフレームワークが用意されています。 Web Apps 機能は、Web アプリ、REST API、モバイル バックエンドをホストするためのサービスです。
  • Azure Media Indexer では、メディア ファイルのコンテンツを検索可能にする方法が提供されます。 また、字幕やキーワード用にフルテキストのトランスクリプトを生成することもできます。

シナリオの詳細

音声テキスト変換ソリューションを使用すると、静的なビデオ ファイル内の音声を識別し、標準コンテンツとして管理できます。 たとえば、従業員はこのテクノロジを使用して、トレーニング ビデオ内で読み上げられた単語や語句を検索できます。 そして、その単語や語句を含むビデオの特定の瞬間に移動できます。

このソリューションを使用すると、静的なビデオを Azure Web サイトにアップロードできます。 Azure Media Indexer は、Speech API を使用してビデオ内の音声のインデックスを作成し、これを Azure データベースに保存します。 Azure App Service の Web Apps 機能を使用して、単語や語句を検索できます。 その後、結果の一覧を取得できます。 結果を選択すると、その単語や語句がビデオ内で出てくる場所を確認できます。

このソリューションは、Azure マネージド サービス Content Delivery Network および Azure Cognitive Search に基づいて構築されています。

考えられるユース ケース

このソリューションは、録音された音声を検索する機能によってメリットのあるシナリオに適用されます。 たとえば、次のようになります。

  • トレーニングと教育ビデオ。
  • 犯罪捜査。
  • 顧客サービスの分析。

次のステップ