画像やビデオから豊富な情報を抽出
Azure Cognitive Services のひとつである Computer Vision を使用してアプリにビジョン機能を埋め込めば、コンテンツの見つけやすさの向上、テキスト抽出の自動化、リアルタイムのビデオ分析、より多くの人が利用できる製品の作成などを実現することができます。ビジュアル データ処理を使用すれば、オブジェクトや概念によるコンテンツのラベル付け、テキスト抽出、画像の説明生成、コンテンツのモデレート、物理空間内の人物の移動の把握などを実現できます。機械学習に関する専門知識は不要です。
テキスト抽出 (OCR)
画像やドキュメントから印刷されたテキストや手書きのテキストを抽出します。言語や書き方が混在していてもかまいません。
画像解釈
1 万を超える概念やオブジェクトの豊富なオントロジーを活用して、お客様のビジュアル資産から価値を創出します。
空間分析
空間内での人々の移動をリアルタイムで分析できます。
柔軟性の高いデプロイ
クラウドまたはエッジで、Computer Vision をコンテナーで実行します。
画期的な Computer Vision を簡単に適用する
シンプルな API 呼び出しを使用して、最先端のビデオおよび写真認識テクノロジをお客様独自のアプリに追加することができます。
動作をご確認ください
プロセスを変革する
お客様の画像に含まれる 10,000 以上のオブジェクトと概念を自動的に識別します。複数の言語や書き方の混在のサポートを活用して、さまざまなタイプの画像やドキュメントから印刷および手書きのテキストを抽出します。Computer Vision のこれらの機能を適用することにより、ロボット プロセスの自動化やデジタル資産管理などのプロセスを合理化できます。
お客様の組織の物理空間を最大限に活用
オフィスであっても店内であっても、物理空間内の人物の移動を把握できます。空間分析機能を使用すると、室内にいる人数のカウント、移動経路の追跡、商品ディスプレイの前に立ち止まっている時間の把握、列での待ち時間の長さの検出などを行えるアプリを作成できます。占有率の管理やソーシャル ディスタンス、店内やオフィスのレイアウトの最適化、チェックアウト プロセスの高速化を実現するソリューションを構築できます。複数のカメラやサイトでサービスを実行します。
この機能の詳細情報クラウドからエッジまで、どこにでも配置
クラウドまたはオンプレミスで、Computer Vision をコンテナーで実行します。これを、医療記録の画像検査、セキュリティで保護されたドキュメントのテキスト抽出、店舗内の人物の移動分析など、データのセキュリティと低遅延が非常に重要な要素となるさまざまなシナリオに適用できます。
コンテナーの Computer Vision について業界最高レベルの Azure のセキュリティ上に構築する
-
Microsoft では、サイバーセキュリティの研究と開発に年間 USD 1 billion を超える投資を行っています。
-
Microsoft には、データ セキュリティとプライバシーを専門とする 3,500 人を超えるセキュリティ エキスパートがいます。
-
Azure は他のクラウド プロバイダーを上回るコンプライアンス認定を受けています。包括的なリストをご確認ください。
競争力のある価格の世界水準の Computer Vision
初期コストは不要で、料金は使用した分だけ発生します。Computer Vision では、料金はトランザクション数に基づく従量課金制です。
3 つの手順で Computer Vision の使用を開始する
無料の Azure アカウントにサインアップすることで、すぐにアクセスできるようになり、$200 のクレジットを獲得できます。
Azure portal にサインインし、Computer Vision を追加します。
Computer Vision を埋め込む方法については、クイック スタートとドキュメントを参照してください。

"We found Cognitive Services to be the missing piece in the equation, the one that we needed to bring this solution to market and really revolutionize the way people look at video."
Prism Skylabs、製造およびエンジニアリング担当部長、Katie McCann 氏

"It didn't take us long to realize Azure Cognitive Services had handed us a powerful set of computer-vision and artificial intelligence tools that we could use to create great apps and new features for our customers in just a few hours."
John Fan 氏 (共同創設者兼 CEO、PicCollage)
Computer Vision についてよく寄せられる質問
-
リージョンごとの提供状況をご覧ください。
-
Computer Vision とその他の Azure Cognitive Services オファリングについて 99.9% の可用性を保証します。Free 価格レベルに対して、SLA は提供されません。SLA の詳細情報をご覧ください。
-
いいえ。Microsoft は処理後にお客様の画像やビデオを自動的に削除します。また、基礎となるモデルを強化するためにお客様のデータをトレーニングすることはありません。ビデオ データはお客様のオンプレミスに留まります。また、ビデオ データがコンテナーが実行されているエッジに保存されることはありません。プライバシーと使用条件の詳細をご確認ください。
-
Computer Vision を使用して画像やビデオからテキストを抽出した後は、お客様は Text Analytics を使用してセンチメントを分析したり、Translator を使用してテキストを希望の言語に翻訳したり、Immersive Reader を使用してテキストを読み上げたりして、よりアクセシビリティを高めることができます。追加の Computer Vision 関連機能には、ドキュメントからキーと値のペアとテーブルを抽出するための Form Recognizer、画像内の顔を検出して認識する Face、独自のコンピューター ビジョン モデルを初めから簡単に作成できる Custom Vision、不要なテキストやイメージを検出する Content Moderator があります。
-
いいえ。空間分析では、人体を取り囲む境界ボックスを使用して、ビデオ映像や出力に含まれる人物の存在の検出と位置特定が行われます。AI モデルにより、顔が検出されたり、個人の ID や人口統計が判断されたりすることはありません。
-
空間分析 AI モデルでは、人体境界ボックスによって 1 人以上の人物の存在を識別するアルゴリズムに基づいて、ビデオ フィード内の動きを検出および追跡します。カメラの視野のゾーン内で検出された境界ボックスの移動それぞれについて、AI モデルはイベント データを出力します。これには、人体の境界ボックスの座標、イベントの種類 (ゾーンの出入り、方向の線の交差など)、境界ボックスを追跡する仮名識別子、検出の信頼度スコアなどが含まれます。このイベント データは、Azure IoT Hub のお客様独自のインスタンスに送信されます。