メイン コンテンツにスキップ

Computer Vision

画像やビデオのコンテンツを分析する AI サービス。

画像やビデオから豊富な情報を抽出

Azure Cognitive Services のひとつである Computer Vision を使用してアプリにビジョン機能を埋め込めば、コンテンツが見つけやすくなり、テキスト抽出の自動化、リアルタイムのビデオ分析、より多くの人が利用できる製品の作成などを実現することができます。ビジュアル データ処理を使用すれば、オブジェクトや概念によるコンテンツのラベル付け、テキスト抽出、画像の説明生成、コンテンツのモデレート、物理空間内の人物の移動の把握などができるようになります。機械学習に関する専門知識は不要です。

テキスト抽出 (OCR)

画像やドキュメントから印刷されたテキストや手書きのテキストを抽出します。言語や書き方が混在していてもかまいません。

画像解釈

10,000 を超える概念とオブジェクトの豊富なオントジーから引き出して、ビジュアル資産から価値を生み出します。

空間分析

空間内での人の動きをリアルタイムで分析し、収容人数やソーシャル ディスタンス、そしてマスク着用の検出を実現できます。

柔軟性の高いデプロイ

クラウドまたはエッジで、Computer Vision をコンテナーで実行します。

プロセスを変革する

お客様の画像に含まれる 10,000 以上のオブジェクトと概念を自動的に識別します。複数の言語と混合書き込みスタイルのサポートを活用して、複数の画像とドキュメントの種類から印刷されたテキストと手書きのテキストを抽出します。Computer Vision のこれらの機能を適用することにより、ロボット プロセスの自動化やデジタル資産管理などのプロセスを合理化できます。

アクティブなユーザー、ユーザーごとの毎日のセッション、セッションの継続時間、上位のデバイスなど、アプリのパフォーマンスと使用状況を監視するデータ。

お客様の組織の物理空間の価値を最大限化

オフィスであっても店内であっても、物理空間内の人物の移動を把握できます。空間分析機能を使用すると、室内にいる人数のカウント、移動経路の追跡、商品ディスプレイの前に立ち止まっている時間の把握、列での待ち時間の長さの検出などを行えるアプリを作成できます。収容人数の管理やソーシャル ディスタンス、マスク着用の遵守、店内やオフィスのレイアウトの最適化、チェックアウト プロセスの高速化を実現するソリューションを構築できます。複数のカメラやサイトでサービスを実行します。

クラウドからエッジまで、どこにでもデプロイ

クラウドまたはオンプレミスで、Computer Vision をコンテナーで実行します。これを、医療記録の画像検査、セキュリティで保護されたドキュメントのテキスト抽出、店舗内の人物の移動分析など、データのセキュリティと低遅延が非常に重要な要素となるさまざまなシナリオに適用できます。

クラウド AI サービスによる燃料アプリのイノベーション

組織が AI を使用して価値を迅速に実現するための 5 つの主要な方法について説明します。

包括的なセキュリティとコンプライアンスの組み込み

  • Microsoft では、サイバーセキュリティの研究と開発に年間 USD10 億を超える投資を行っています。

  • Microsoft には、データ セキュリティとプライバシーを専門とする 3,500 人を超えるセキュリティ エキスパートがいます。

  • Azure は、他のあらゆるクラウド プロバイダーを上回る数の認定を受けています。包括的なリストをご確認ください。

  • 競争力のある価格の世界水準の Computer Vision

    初期コストは不要で、料金は使用した分だけ発生します。Computer Vision では、料金はトランザクション数に基づく従量課金制です。

Azure 無料アカウントで作業を開始する

1

無料で始めましょうUSD200 相当のクレジットを取得して 30 日間使用できます。クレジットを保持している間は、最も人気のあるサービスの多くを無料で利用できるほか、55 以上のその他のサービスを常時無料で利用できます。

2

クレジットがなくなった後に、同じ無料サービスでビルドを続けるには、従量課金制に移行してください。月々の無料使用分を超えた場合にのみ、お支払いいただきます。

3

12 か月が経過した後も、55 以上の常時無料サービスを引き続き利用できます。料金は、月々の無料利用分を超えて使用した分だけをお支払いいただきます。

ドキュメントおよびリソース

使い始める

コード サンプルを参照する

 サンプル アプリを調べる

Computer Vision についてよく寄せられる質問

  •  リージョンごとの提供状況を参照してください。

  • Computer Vision とその他の Azure Cognitive Services オファリングでは、99.9% の可用性が保証されています。Free 価格レベルに対しては SLA は提供されません。 SLA の詳細を参照してください。

  • いいえ。Microsoft はお客様の画像やビデオの処理後に自動的に削除します。また、基礎となるモデルを強化するためにお客様のデータをトレーニングすることはありません。ビデオ データはお客様のオンプレミスに留まります。また、ビデオ データがコンテナーが実行されているエッジに保存されることはありません。詳細については プライバシー 使用条件をご覧ください。

  • Computer Vision を使用して画像やビデオからテキストを抽出した後は、お客様は  Text Analytics  を使用してセンチメントを分析したり、 Translator  を使用してテキストを希望の言語に翻訳したり、 Immersive Reader  を使用してテキストを読み上げたりして、よりユーザー補助性を高めることができます。追加の Computer Vision 関連機能には、ドキュメントからキーと値のペアとテーブルを抽出するための  Form Recognizer 、画像内の顔を検出して認識する  Face 、独自のコンピューター ビジョン モデルを初めから簡単に作成できる  Custom Vision 、不要なテキストやイメージを検出する  Content Moderator  があります。

  • いいえ。空間分析では、人体を取り囲む境界ボックスを使用して、ビデオ映像や出力に含まれる人物の存在の検出と位置特定が行われます。AI モデルにより、顔が検出されたり、個人の ID や人口統計が判断されたりすることはありません。

  • 空間分析 AI モデルでは、人体境界ボックスによって 1 人以上の人物の存在を識別するアルゴリズムに基づいて、ビデオ フィード内の動きを検出して追跡します。カメラの視野のゾーン内で検出された境界ボックスの移動それぞれについて、AI モデルはイベント データを出力します。これには、人体の境界ボックスの座標、イベントの種類 (ゾーンの出入り、方向の線の交差など)、境界ボックスを追跡する仮名識別子、検出の信頼度スコアなどが含まれます。このイベント データは、Azure IoT Hub のお客様独自のインスタンスに送信されます。

Cognitive Services でビルドを開始する

無料で Computer Vision を試す

セールス担当者とチャット