Azure Media Services:NAB Show 2019 からの Video Indexer の最新情報

2019年4月4日 に投稿済み

Principal Program Manager, Azure Media Services, Video Indexer

更新日 2019 年 4 月16 日:Video Indexer の新しい AI Editor が今年のイベントで AI/ML 部門において NAB Show Product of the Year Award を受賞したことを発表でき、たいへん嬉しく思います。権威あるこの賞では毎年、NAB に展示された "最も重要で見込みのある新しい製品およびテクノロジ" が表彰されます。

マイクロソフトのチームは、Azure Media Services の Video Indexer の一般提供のリリースで、2018 IABM for innovation in content management (コンテンツ管理におけるインベーション) 賞や権威ある Peter Wayne 賞など、数々の賞を受賞しました。その後、さまざまな新機能やモデルの構築に取り組み、大量のメディア コンテンツのアーカイブを持つすべての組織がコンテンツから分析情報を引き出し、それらの分析情報を利用して検索可能性を向上させ、新しいユーザー シナリオやアクセシビリティに対応し、新しい収益化手段を開拓できるようにすることに注力してきました。

マイクロソフトは NAB Show 2019 において、Video Indexer のモデルおよびエクスペリエンスに対する数々の新しい拡張機能を発表します。今週公表を予定している機能としては次のようなものがあります。

  • AI をベースとした新しいエディター。これにより、既存のメディアから数分で新しいコンテンツを作成することができます。
  • カスタム人物認識の拡張機能。モデルの集中管理や画像からモデルをトレーニングする機能が含まれます。
  • トランスクリプト編集に基づいた言語モデル トレーニング。この機能により、業界固有の用語を含めるように言語モデルを効果的に向上させることができます。
  • 新しいシーンのセグメント化モデル (プレビュー)
  • 新しいエンドロール クレジット検出モデル
  • 全世界 9 つのリージョンで利用可能
  • ISO 27001、ISO 27018、SOC 1、2、3、HiTRUST、FedRAMP、HIPAA、および PCI の認定資格
  • トライアル アカウントから有料の Video Indexer アカウントに移行する際にデータとトレーニングしたモデルをそのまま移行する機能

これらの優れた追加機能について、このブログで詳しくご説明します。

このほかにも、マイクロソフトのライブ ストリーミング プラットフォームを使用して、ライブ フィードのインジェストや、業界標準プロトコル (HLS、MPEG-DASH など) を介してそれを配信するためのトランスコーディング、動的パッケージング、および暗号化を行っているお客様にとって素晴らしいお知らせがあります。ライブ トランスクリプションは、v3 API の新機能です。この機能により、ビデオ ストリームで話されている言葉から文字に起こされた機械生成テキストを使用して、視聴者に配信されるストリームを強化できます。このテキストの配信は、最初、MPEG-4 Part 30 (ISO/IEC 14496-30) フラグメントにパッケージされた、IMSC1.1 と互換性のある TTML としてのみ行われ、Azure Media Player の新しいビルドを使用して再生できます。この機能の詳細情報およびプライベート プレビュー プログラムについては、「Live transcription with Azure Media Services v3」をご覧ください。

さらにマルチ言語トランスクリプションとアニメーション検出に関する 2 つのプライベート プレビュー プログラムも発表します。これらのプログラムでは、選ばれたお客様がモデルおよびエクスペリエンスに影響を与えることができます。これらのプログラムへの参加をご希望されるお客様は、NAB Show で弊社担当者に直接お話しいただくか、貴社のアカウント マネージャーまでお問い合わせください。

メディア アーカイブからの新しいコンテンツの抽出がさらに容易になりました

メディア ファイルからの詳細な情報分析を使用する方法の 1 つは、既存のコンテンツから新しいメディアを作成することです。たとえば、予告編用の映画のハイライトを作成する、ニュース番組の中で古いビデオ クリップを使用する、ソーシャル メディアやその他のビジネス ニーズに対応する短いコンテンツを作成する、などが考えられます。

このシナリオを数クリックで実現できるように、マイクロソフトは AI をベースとしたエディターを作成しました。これを使うと、Video Indexer で生成されたメタデータを使用して、適切なメディア コンテンツを検出したり、興味があるパーツを見つけて、それらを使ってまったく新しいビデオを作成したりすることが可能になります。納得のいく結果が得られたら、Video Indexer からレンダリングおよびダウンロードして、自分の編集アプリケーションや下流のワークフローで使用することができます。

Video indexer と Satya Nadella

これらの機能はすべて、更新された REST API からも利用できます。つまり、分析情報に基づいて自動的にクリップを作成するコードを記述できます。この新しいエディター API 呼び出しは、現在パブリック プレビュー段階です。

この新しい AI ベース エディターをお試しになりたい場合は、インデックスの付いたメディア ファイルを見つけて、[エディターで開く] ボタンをクリックするだけで、新しいコンテンツの作成が開始されます。

より直感的なモデルのカスタマイズと管理

Video Indexer には、すぐに使えるモデルが数多く付属しているため、コンテンツをアップロードするとすぐに分析情報を得ることができます。しかし、AI テクノロジーは、それを用いる特定のコンテンツに合わせてカスタマイズした方がより精度が高くなります。そのため、Video Indexer では、厳選したモデルを対象に単純なカスタマイズ機能を用意しています。そのようなカスタマイズ機能の 1 つとして、カスタム人物モデルを、Video Indexer が現在すぐに認識できる 100 万人以上の有名人に追加するというものがあります。このカスタマイズ機能は、ビデオのコンテンツ内の “知らない” 人物をトレーニングするという形で既にありましたが、それを拡張してほしいというリクエストを何人ものお客様からいただき、今回それにお応えするためにこの機能をご用意しました。

人物モデルの容易なカスタマイズ処理を可能にするために、人物認識を集中管理するページを追加しました。このページでは、それぞれ最大 100 万個の異なるエントリを保持できるカスタム人物モデルを 1 アカウントにつき複数個作成することができます。この場所から新しいモデルを作成したり、既存のモデルに新しい人物を追加したり、必要に応じてそれらのモデルのレビュー、名前変更、削除を実行したりすることができます。それに加え、自分のアカウントに最初のビデオをアップロードする前でも、静的画像に基づいてモデルをトレーニングできるようになりました。人物画像のアーカイブが既にある組織は、それらのアーカイブを使ってモデルを事前にトレーニングできるようになりました。操作は簡単で、関連する画像を人物の名前にドラッグ アンド ドロップしたり、Video Indexer REST API (現在プレビュー段階) を介して送信したりするだけで実行できます。

人物の詳細

詳しくお知りになりたい場合は、高度なカスタム顔認証オプションに関する記事をご覧ください。

もう 1 つの重要なカスタマイズは、組織の用語や業界固有のボキャブラリに合わせて言語モデルをトレーニングする機能です。組織における文字起こしをより短時間で改善できるように、Video Indexer は、手動で行われたトランスクリプト編集を自動的に収集して、使用されている特定の言語モデルの新しいエントリに格納するようになりました。その後は、[トレーニング] ボタンをクリックして、カスタマイズした自分のモデルにそれらを追加するだけです。考え方としては、フィードバック ループを作成するというものです。つまり、すぐに使える基本の言語モデルを使って作業を開始してから、特定の業界のボキャブラリや用語に合わせてそのモデルが調整されるまで、手動編集によってモデルの精度を改善していくという方法です。

Video Indexer のタイムライン

Video Indexer パイプラインの新しい追加機能

Video Indexer の主な利点の 1 つは、さまざまなチャネルからの複数の分析情報を 1 つのタイムラインに統合する 1 つのパイプラインを持つことです。マイクロソフトでは、追加の分析情報によってこのパイプラインを強化するための作業を定期的に行っています。

Video Indexer の分析情報セットへの最新の追加機能の 1 つは、ビジュアル キューに基づいてセマンティック シーン (現在プレビュー段階) をセグメント化する機能です。セマンティック シーンは、今ある Video Indexer のショット検出とキーフレーズ抽出モデルに、もう 1 つの細分化レベルを追加するもので、意味的に関連している一連の連続するショットからなる 1 つのイベントを描写することを目的としています。

シーンは、一連の分析情報をグループ化し、そこからより複雑な意味を引き出すために、それらを同じコンテキストの分析情報として参照する目的で使用することができます。たとえば、あるシーンに飛行機、滑走路、手荷物が含まれていれば、お客様はそれが空港で行われていると推論するロジックを構築できます。シーンは、1 つの完全なビデオからクリップとして抽出するためのユニットとしても使用できます。

Video Indexer でのシーン

もう 1 つの Video Indexer の優れた追加機能は、映画またはテレビ番組のエンド ロール クレジットを識別する機能です。これは、視聴者がいつビデオの視聴を完了したかを識別したり、視聴者がチャンネルを変える前に新しい番組や映画を勧めるための適切なタイミングを識別したりするための、放送局にとって便利な機能です。

Video Indexer は信頼に基づいて実行されています (そして実行されるリージョンは増加中です)

Video Indexer は Azure Media Services ファミリの一員であり、あらゆる規模と業界の組織にサービスを提供するように構築されています。したがって、世界各地の規制のある業界や市場でお客様がコンプライアンスの義務を果たせるよう支援することがマイクロソフトにとって不可欠です。その取り組みの一環として、このたび Video Indexer が ISO 27001ISO 27018SOC 1、2、3HIPAAFedRAMPPCI、および HITRUST の認定を取得したことをお知らせします。Video Indexer の最新の認定状況およびその他のすべての Azure サービスの認定状況の詳細をご確認ください。

このほかに、世界中でサービスの提供地域を増加しました。現在は、お客様の便宜のために 9 つのリージョンで展開しています。現在サービスをご利用いただけるリージョンとしては、米国東部 (試用版)、米国東部 2、米国中南部、米国西部 2、北ヨーロッパ、西ヨーロッパ、東南アジア、アジア太平洋、オーストラリア東部があります。この後もサービス提供リージョンは増えていきますので、引き続きご注目ください。Video Indexer の最新のリージョン別提供状況はいつでも、リージョン別の製品に関するページでご確認いただけます。

米国東部では、引き続き Video Indexer の評価版をフルにご利用いただけます。これにより、組織は Azure サブスクリプションを使用して有料アカウントを作成する前に、自社のデータで Video Indexer の全機能を評価することができます。Azure サブスクリプションに移行すると決めたら、アカウント作成ウィザードのコンテンツにある関連チェック ボックスにチェック マークを付けるだけで、試用版アカウントで作成したすべてのビデオとモデルのカスタマイズをコピーできます。

Video Indexer を Azure サブスクリプションに接続する

最新機能を一番にお試しになりませんか?

本日、多くのお客様からご要望があった機能の 3 つのプライベート プレビュー プログラムを発表します。

ライブ文字起こし – ライブ イベントをストリーミング配信する機能で、音声で話された言葉が文字に起こされて、ビデオおよび音声と共に配信されます。

混合言語文字起こし – 1 つのビデオ ファイル内で話されている複数の言語を自動的に識別して、そのファイルの混合言語文字起こしを作成する機能。

アニメーション キャラクター検出 – アニメ化されたコンテンツ内のキャラクターを、あたかも実際に生きている人物であるかのうように識別する機能。

マイクロソフトでは、これらの新しい機能のデザイン パートナーに立候補されたお客様の中から複数選択させていただきます。当選されたお客様は、これらの新しい機能に多大な影響を与えることができ、またお客様のデータ フローおよび組織フローに合わせて高度に調整されたモデルを取得することができます。ぜひ皆様のご応募をお待ちしております。詳細については、NAB Show で弊社のブースにお越しいただくか、貴社のアカウント マネージャーにお問い合わせください。

NAB Show 2019 でお待ちしています

NAB Show 2019 に参加される場合は、ブース #SL6716 に立ち寄って、最新の Azure Media Services のイノベーションをご確認ください。ぜひ会場でお会いして、皆様が構築されているものについてお聞かせいただくとともに、Azure Media Services と私たちのパートナーが NAB Show で発表するさまざまなイノベーションについてもご案内したいと考えております。また、この展示会の期間を通して、ブースで製品のプレゼンテーションを行う予定です。

ご質問やフィードバックなど、 皆様のコメントをお待ちしております。マイクロソフトでは UserVoice から寄せられたフィードバックに基づいて、機能の優先順位を付けております。ご不明な点がございましたら、VISupport@Microsoft.com までお問い合わせください。