Computer Vision

画像やビデオから豊富な情報を抽出

Azure Cognitive Services のひとつである Computer Vision を使用してアプリにビジョン機能を埋め込めば、コンテンツの見つけやすさの向上、テキスト抽出の自動化、リアルタイムのビデオ分析、より多くの人が利用できる製品の作成などを実現することができます。ビジュアル データ処理を使用すれば、オブジェクトや概念によるコンテンツのラベル付け、テキスト抽出、画像の説明生成、コンテンツのモデレート、物理空間内の人物の移動の把握などを実現できます。機械学習に関する専門知識は不要です。

テキスト抽出 (OCR)

画像やドキュメントから印刷されたテキストや手書きのテキストを抽出します。言語や書き方が混在していてもかまいません。

画像解釈

1 万を超える概念やオブジェクトの豊富なオントロジーを活用して、お客様のビジュアル資産から価値を創出します。

空間分析

空間内での人の動きをリアルタイムで分析し、収容人数やソーシャル ディスタンス、そしてマスク着用の検出を実現できます。

柔軟性の高いデプロイ

クラウドまたはエッジで、Computer Vision をコンテナーで実行します。

画期的な Computer Vision を簡単に適用する

シンプルな API 呼び出しを使用して、最先端のビデオおよび写真認識テクノロジをお客様独自のアプリに追加することができます。

動作をご確認ください

person
person
subway train
特徴名:
オブジェクト [ { "rectangle": { "x": 93, "y": 178, "w": 115, "h": 237 }, "object": "person", "confidence": 0.764 }, { "rectangle": { "x": 0, "y": 229, "w": 101, "h": 206 }, "object": "person", "confidence": 0.624 }, { "rectangle": { "x": 161, "y": 31, "w": 439, "h": 423 }, "object": "subway train", "parent": { "object": "train", "parent": { "object": "Land vehicle", "parent": { "object": "Vehicle", "confidence": 0.926 }, "confidence": 0.923 }, "confidence": 0.917 }, "confidence": 0.801 } ]
タグ [ { "name": "train", "confidence": 0.9974923 }, { "name": "platform", "confidence": 0.9955776 }, { "name": "station", "confidence": 0.9796659 }, { "name": "indoor", "confidence": 0.927235 }, { "name": "subway", "confidence": 0.8388686 }, { "name": "clothing", "confidence": 0.5561277 }, { "name": "person", "confidence": 0.505803 }, { "name": "pulling", "confidence": 0.431911647 } ]
説明 { "tags": [ "train", "platform", "station", "building", "indoor", "subway", "track", "walking", "waiting", "pulling", "board", "people", "man", "luggage", "standing", "holding", "large", "woman", "suitcase" ], "captions": [ { "text": "people waiting at a train station", "confidence": 0.8331445 } ] }
画像形式 "Jpeg"
画像サイズ 462 x 600
モノクロ false
成人向けコンテンツ false
成人スコア 0.009112839
Gory false
Gore Score 0.0461505651
わいせつ性 false
わいせつスコア 0.0143244788
カテゴリ [ { "name": "trans_trainstation", "score": 0.98828125 } ]
[]
背景のドミナント カラー
"Black"
前景のドミナント カラー
"Black"
アクセント カラー
#484C83
{
  "categories": [
    {
      "name": "trans_trainstation",
      "score": 0.98828125
    }
  ],
  "adult": {
    "isAdultContent": false,
    "isGoryContent": false,
    "isRacyContent": false,
    "adultScore": 0.009112839,
    "goreScore": 0.0461505651,
    "racyScore": 0.0143244788
  },
  "tags": [
    {
      "name": "train",
      "confidence": 0.9974923
    },
    {
      "name": "platform",
      "confidence": 0.9955776
    },
    {
      "name": "station",
      "confidence": 0.9796659
    },
    {
      "name": "indoor",
      "confidence": 0.927235
    },
    {
      "name": "subway",
      "confidence": 0.8388686
    },
    {
      "name": "clothing",
      "confidence": 0.5561277
    },
    {
      "name": "person",
      "confidence": 0.505803
    },
    {
      "name": "pulling",
      "confidence": 0.431911647
    }
  ],
  "description": {
    "tags": [
      "train",
      "platform",
      "station",
      "building",
      "indoor",
      "subway",
      "track",
      "walking",
      "waiting",
      "pulling",
      "board",
      "people",
      "man",
      "luggage",
      "standing",
      "holding",
      "large",
      "woman",
      "suitcase"
    ],
    "captions": [
      {
        "text": "people waiting at a train station",
        "confidence": 0.8331445
      }
    ]
  },
  "requestId": "0c131c88-99f8-42a0-ac82-ce9b3f67681b",
  "metadata": {
    "width": 600,
    "height": 462,
    "format": "Jpeg"
  },
  "faces": [],
  "color": {
    "dominantColorForeground": "Black",
    "dominantColorBackground": "Black",
    "accentColor": "484C83",
    "isBWImg": false
  },
  "objects": [
    {
      "rectangle": {
        "x": 93,
        "y": 178,
        "w": 115,
        "h": 237
      },
      "object": "person",
      "confidence": 0.764
    },
    {
      "rectangle": {
        "x": 0,
        "y": 229,
        "w": 101,
        "h": 206
      },
      "object": "person",
      "confidence": 0.624
    },
    {
      "rectangle": {
        "x": 161,
        "y": 31,
        "w": 439,
        "h": 423
      },
      "object": "subway train",
      "parent": {
        "object": "train",
        "parent": {
          "object": "Land vehicle",
          "parent": {
            "object": "Vehicle",
            "confidence": 0.926
          },
          "confidence": 0.923
        },
        "confidence": 0.917
      },
      "confidence": 0.801
    }
  ]
}
{
  "categories": [
    {
      "name": "trans_trainstation",
      "score": 0.98828125
    }
  ],
  "adult": {
    "isAdultContent": false,
    "isGoryContent": false,
    "isRacyContent": false,
    "adultScore": 0.009112839,
    "goreScore": 0.0461505651,
    "racyScore": 0.0143244788
  },
  "tags": [
    {
      "name": "train",
      "confidence": 0.9974923
    },
    {
      "name": "platform",
      "confidence": 0.9955776
    },
    {
      "name": "station",
      "confidence": 0.9796659
    },
    {
      "name": "indoor",
      "confidence": 0.927235
    },
    {
      "name": "subway",
      "confidence": 0.8388686
    },
    {
      "name": "clothing",
      "confidence": 0.5561277
    },
    {
      "name": "person",
      "confidence": 0.505803
    },
    {
      "name": "pulling",
      "confidence": 0.431911647
    }
  ],
  "description": {
    "tags": [
      "train",
      "platform",
      "station",
      "building",
      "indoor",
      "subway",
      "track",
      "walking",
      "waiting",
      "pulling",
      "board",
      "people",
      "man",
      "luggage",
      "standing",
      "holding",
      "large",
      "woman",
      "suitcase"
    ],
    "captions": [
      {
        "text": "people waiting at a train station",
        "confidence": 0.8331445
      }
    ]
  },
  "requestId": "0c131c88-99f8-42a0-ac82-ce9b3f67681b",
  "metadata": {
    "width": 600,
    "height": 462,
    "format": "Jpeg"
  },
  "faces": [],
  "color": {
    "dominantColorForeground": "Black",
    "dominantColorBackground": "Black",
    "accentColor": "484C83",
    "isBWImg": false
  },
  "objects": [
    {
      "rectangle": {
        "x": 93,
        "y": 178,
        "w": 115,
        "h": 237
      },
      "object": "person",
      "confidence": 0.764
    },
    {
      "rectangle": {
        "x": 0,
        "y": 229,
        "w": 101,
        "h": 206
      },
      "object": "person",
      "confidence": 0.624
    },
    {
      "rectangle": {
        "x": 161,
        "y": 31,
        "w": 439,
        "h": 423
      },
      "object": "subway train",
      "parent": {
        "object": "train",
        "parent": {
          "object": "Land vehicle",
          "parent": {
            "object": "Vehicle",
            "confidence": 0.926
          },
          "confidence": 0.923
        },
        "confidence": 0.917
      },
      "confidence": 0.801
    }
  ]
}

プロセスを変革する

お客様の画像に含まれる 10,000 以上のオブジェクトと概念を自動的に識別します。複数の言語や書き方の混在のサポートを活用して、さまざまなタイプの画像やドキュメントから印刷および手書きのテキストを抽出します。Computer Vision のこれらの機能を適用することにより、ロボット プロセスの自動化やデジタル資産管理などのプロセスを合理化できます。

お客様の組織の物理空間を最大限に活用

オフィスであっても店内であっても、物理空間内の人物の移動を把握できます。空間分析機能を使用すると、室内にいる人数のカウント、移動経路の追跡、商品ディスプレイの前に立ち止まっている時間の把握、列での待ち時間の長さの検出などを行えるアプリを作成できます。収容人数の管理やソーシャル ディスタンス、マスク着用の遵守、店内やオフィスのレイアウトの最適化、チェックアウト プロセスの高速化を実現するソリューションを構築できます。複数のカメラやサイトでサービスを実行します。

この機能の詳細情報

クラウドからエッジまで、どこにでも配置

クラウドまたはオンプレミスで、Computer Vision をコンテナーで実行します。これを、医療記録の画像検査、セキュリティで保護されたドキュメントのテキスト抽出、店舗内の人物の移動分析など、データのセキュリティと低遅延が非常に重要な要素となるさまざまなシナリオに適用できます。

コンテナーの Computer Vision について

業界最高レベルの Azure のセキュリティ上に構築する

  • Microsoft では、サイバーセキュリティの研究と開発に年間 USD 1 billion を超える投資を行っています。

  • Microsoft には、データ セキュリティとプライバシーを専門とする 3,500 人を超えるセキュリティ エキスパートがいます。

  • Azure は他のクラウド プロバイダーを上回るコンプライアンス認定を受けています。包括的なリストをご確認ください。

競争力のある価格の世界水準の Computer Vision

初期コストは不要で、料金は使用した分だけ発生します。Computer Vision では、料金はトランザクション数に基づく従量課金制です。

3 つの手順で Computer Vision の使用を開始する

無料の Azure アカウントにサインアップすることで、すぐにアクセスできるようになり、$200 のクレジットを獲得できます。

Azure portal にサインインし、Computer Vision を追加します。

Computer Vision を埋め込む方法については、クイック スタートとドキュメントを参照してください。

ドキュメントおよびリソース

始める

Read the documentation

Take Microsoft Learn courses

コード サンプルを参照する

Explore a sample app

Computer Vision についてよく寄せられる質問

  • リージョンごとの提供状況をご覧ください。
  • Computer Vision とその他の Azure Cognitive Services オファリングについて 99.9% の可用性を保証します。Free 価格レベルに対して、SLA は提供されません。SLA の詳細情報をご覧ください。
  • いいえ。Microsoft は処理後にお客様の画像やビデオを自動的に削除します。また、基礎となるモデルを強化するためにお客様のデータをトレーニングすることはありません。ビデオ データはお客様のオンプレミスに留まります。また、ビデオ データがコンテナーが実行されているエッジに保存されることはありません。プライバシーと使用条件の詳細をご確認ください。
  • Computer Vision を使用して画像やビデオからテキストを抽出した後は、お客様は Text Analytics を使用してセンチメントを分析したり、Translator を使用してテキストを希望の言語に翻訳したり、Immersive Reader を使用してテキストを読み上げたりして、よりアクセシビリティを高めることができます。追加の Computer Vision 関連機能には、ドキュメントからキーと値のペアとテーブルを抽出するための Form Recognizer、画像内の顔を検出して認識する Face、独自のコンピューター ビジョン モデルを初めから簡単に作成できる Custom Vision、不要なテキストやイメージを検出する Content Moderator があります。
  • いいえ。空間分析では、人体を取り囲む境界ボックスを使用して、ビデオ映像や出力に含まれる人物の存在の検出と位置特定が行われます。AI モデルにより、顔が検出されたり、個人の ID や人口統計が判断されたりすることはありません。
  • 空間分析 AI モデルでは、人体境界ボックスによって 1 人以上の人物の存在を識別するアルゴリズムに基づいて、ビデオ フィード内の動きを検出および追跡します。カメラの視野のゾーン内で検出された境界ボックスの移動それぞれについて、AI モデルはイベント データを出力します。これには、人体の境界ボックスの座標、イベントの種類 (ゾーンの出入り、方向の線の交差など)、境界ボックスを追跡する仮名識別子、検出の信頼度スコアなどが含まれます。このイベント データは、Azure IoT Hub のお客様独自のインスタンスに送信されます。

準備が整ったら、Azure の無料アカウントを設定しましょう。