Azure Media Services のライブでの文字起こしのサポート (プレビュー)
公開日: 11月 18, 2019
Azure Media Services では、HLS や MPEG-DASH などの業界標準プロトコルを使用して、ライブ ビデオの取り込み、トランスコード、動的パッケージ作成と暗号化を行い、配信することができるプラットフォームを提供します。ライブでの文字起こしは、v3 API の新機能です。この機能により、オーディオ フィードで話されている言葉から文字に起こされた機械生成テキストを使用して、視聴者に配信するストリームを強化できます。
HLS または MPEG-DASH ストリーミング プロトコルを使用してライブ ストリームを公開すると、サービスは次にビデオとオーディオと一緒に、プロトコル準拠のフラグメントで文字に起こされたテキストも配信します。次に、Azure Media Player の新しいビルド (バージョン 2.3.3 以降) を使用して、このビデオ、オーディオ、テキスト ストリームを再生することができます。文字起こしは Cognitive Services の音声認識機能を利用しています。
よく寄せられる質問
- プレビューでサポートされる内容は?
この機能は、米国西部 2 で利用することができ、英語がサポートされています。詳細については、このドキュメントをご覧ください。
- この機能の使用を開始するにはどうすればよいですか?
Azure Media Service アカウントを米国西部 2 で作成し、プレビュー REST API を使用してアプリケーションを作成します (説明は、Media Services v3 OpenAPI の仕様ドキュメントをご覧ください)。CLI、PowerShell、SDK は、このプレビューではまだサポートされていません。