パブリック プレビュー - Video Indexer による多言語音声識別と文字起こし

2019年9月18日 に投稿済み

ニュース、時事問題、インタビューなどのメディア資産では、話者が異なる言語を使用している音声が含まれる場合があります。既存の文字起こし機能のほとんどは音声認識する言語を前もって指定する必要があるため、多言語の動画を文字起こしする際の障害になっていました。Microsoft の新しい音声言語自動識別は、複数のコンテンツ機能に対応しており、機械学習テクノロジを活用して、メディア資産で使用されているさまざまな言語を識別します。各言語セグメントが検出されると、識別された言語で自動文字起こしプロセスが行われ、すべてのセグメントは統合されて、複数の言語から成る 1 つの文字起こしファイルにまとめられます。

新しい多言語オプションの詳細を参照

  • Media Services
  • Video Indexer
  • Features
  • Services