Computer Vision
画像やビデオのコンテンツを分析する AI サービス。
画像やビデオから豊富な情報を抽出
Azure Cognitive Services のひとつである Computer Vision を使用してアプリにビジョン機能を埋め込めば、コンテンツが見つけやすくなり、テキスト抽出の自動化、リアルタイムのビデオ分析、より多くの人が利用できる製品の作成などを実現することができます。ビジュアル データ処理を使用すれば、オブジェクトや概念によるコンテンツのラベル付け、テキスト抽出、画像の説明生成、コンテンツのモデレート、物理空間内の人物の移動の把握などができるようになります。機械学習に関する専門知識は不要です。
テキスト抽出 (OCR)
画像やドキュメントから印刷されたテキストや手書きのテキストを抽出します。言語や書き方が混在していてもかまいません。
画像解釈
10,000 を超える概念とオブジェクトの豊富なオントジーから引き出して、ビジュアル資産から価値を生み出します。
空間分析
空間内での人の動きをリアルタイムで分析し、収容人数やソーシャル ディスタンス、そしてマスク着用の検出を実現できます。
柔軟性の高いデプロイ
クラウドまたはエッジで、Computer Vision をコンテナーで実行します。
プロセスを変革する
お客様の画像に含まれる 10,000 以上のオブジェクトと概念を自動的に識別します。複数の言語と混合書き込みスタイルのサポートを活用して、複数の画像とドキュメントの種類から印刷されたテキストと手書きのテキストを抽出します。Computer Vision のこれらの機能を適用することにより、ロボット プロセスの自動化やデジタル資産管理などのプロセスを合理化できます。
クラウドからエッジまで、どこにでもデプロイ
クラウドまたはオンプレミスで、Computer Vision をコンテナーで実行します。これを、医療記録の画像検査、セキュリティで保護されたドキュメントのテキスト抽出、店舗内の人物の移動分析など、データのセキュリティと低遅延が非常に重要な要素となるさまざまなシナリオに適用できます。
包括的なセキュリティとコンプライアンスの組み込み
-
Microsoft では、サイバーセキュリティの研究と開発に年間 USD10 億を超える投資を行っています。
-
Microsoft には、データ セキュリティとプライバシーを専門とする 3,500 人を超えるセキュリティ エキスパートがいます。
-
Azure は、他のあらゆるクラウド プロバイダーを上回る数の認定を受けています。包括的なリストをご確認ください。
-
競争力のある価格の世界水準の Computer Vision
初期コストは不要で、料金は使用した分だけ発生します。Computer Vision では、料金はトランザクション数に基づく従量課金制です。
Azure 無料アカウントで作業を開始する
1
2
クレジットがなくなった後に、同じ無料サービスでビルドを続けるには、従量課金制に移行してください。月々の無料使用分を超えた場合にのみ、お支払いいただきます。
3
Computer Vision についてよく寄せられる質問
-
リージョンごとの提供状況を参照してください。
-
Computer Vision とその他の Azure Cognitive Services オファリングでは、99.9% の可用性が保証されています。Free 価格レベルに対しては SLA は提供されません。 SLA の詳細を参照してください。
-
いいえ。Microsoft はお客様の画像やビデオの処理後に自動的に削除します。また、基礎となるモデルを強化するためにお客様のデータをトレーニングすることはありません。ビデオ データはお客様のオンプレミスに留まります。また、ビデオ データがコンテナーが実行されているエッジに保存されることはありません。詳細については プライバシー 使用条件をご覧ください。
-
Computer Vision を使用して画像やビデオからテキストを抽出した後は、お客様は Text Analytics を使用してセンチメントを分析したり、 Translator を使用してテキストを希望の言語に翻訳したり、 Immersive Reader を使用してテキストを読み上げたりして、よりユーザー補助性を高めることができます。追加の Computer Vision 関連機能には、ドキュメントからキーと値のペアとテーブルを抽出するための Form Recognizer 、画像内の顔を検出して認識する Face 、独自のコンピューター ビジョン モデルを初めから簡単に作成できる Custom Vision 、不要なテキストやイメージを検出する Content Moderator があります。
-
いいえ。空間分析では、人体を取り囲む境界ボックスを使用して、ビデオ映像や出力に含まれる人物の存在の検出と位置特定が行われます。AI モデルにより、顔が検出されたり、個人の ID や人口統計が判断されたりすることはありません。
-
空間分析 AI モデルでは、人体境界ボックスによって 1 人以上の人物の存在を識別するアルゴリズムに基づいて、ビデオ フィード内の動きを検出して追跡します。カメラの視野のゾーン内で検出された境界ボックスの移動それぞれについて、AI モデルはイベント データを出力します。これには、人体の境界ボックスの座標、イベントの種類 (ゾーンの出入り、方向の線の交差など)、境界ボックスを追跡する仮名識別子、検出の信頼度スコアなどが含まれます。このイベント データは、Azure IoT Hub のお客様独自のインスタンスに送信されます。