メイン コンテンツにスキップ

Azure Cognitive Service for Vision

OCR と AI を使用して、画像とビデオの分析からコンピューター ビジョンの分析情報を検出します。

Computer Vision プロジェクトを昇格させる

Azure Cognitive Service for Vision は、革新的な Computer Vision 機能を提供する統合されたサービスです。事前構築済みの画像タグ付け、光学式文字認識 (OCR) によるテキスト抽出、責任ある顔認識を使用して、アプリで画像の分析、テキストの読み取り、顔の検出を行う機能を提供します。機械学習の経験を必要とせず、ビジョン機能をプロジェクトに組み込みます。

Vision Studio で試す

画像分析 は 10,000 を超える概念とオブジェクトから、検出、分類、キャプション、分析情報の生成を行います。
空間分析 は物理的な領域内の人々の存在と動きをリアルタイムで把握できます。
光学式文字認識 (OCR) は画像から印刷されたテキストや手書きのテキストを抽出します。言語や書き方が混在していてもかまいません。
顔認識 は人間の身元を認識して検証するインテリジェントなアプリケーションの作成に役立ちます。

画像分析を使用してコンテンツの検出可能性を高める

自然言語で画像に自動的にキャプションを付け、スマート トリミングを使用し、画像を分類します (プレビュー)。

空間分析を使用してリアルタイムでビデオをストリーミングする

画像分析と物体検出を使用して、Computer Vision を使用して、動きを追跡し、リアルタイムで環境を分析します。

光学式文字認識 (OCR) を使用して画像からテキストを読み取る

OCR テクノロジを使用して、画像から印刷されたテキストや手書きのテキストを抽出します。言語や書き方が混在していてもかまいません。

光学式文字認識で栄養情報ラベルの属性を検出する

顔認識を使用して ID を確認する

顔認識を使用してアプリを作成し、シームレスで安全性の高いユーザー エクスペリエンスを実現します。

カスタム Computer Vision モデルをトレーニングする

精度を損なうことなく、少数の画像でニーズに合わせて画像分類と物体検出をカスタマイズします (プレビュー)。

Vision Studio でのカスタム モデルの概要

責任を持って AI を適用する

目標を達成し、正確な結果を達成するために責任を持って Computer Vision サービスを使用する方法に関する明確なガイダンスを取得します。

Microsoft、Google、AWS、Clarifai などのリーダーを含む IDC MarketScape 世界規模の汎用 Computer Vision AI Software プラットフォーム グラフ。

Microsoft は IDC MarketScape のリーダーに選ばれています:世界規模の汎用 Computer Vision AI ソフトウェア プラットフォーム 2022 ベンダー評価

IDC MarketScape レポートは、Microsoft の戦略と機能を評価し、Microsoft をリーダー カテゴリに配置しました。この表彰は、あらゆる規模の組織やあらゆる業種の組織に最先端の責任を持ち、顧客中心の AI 製品を提供するという Microsoft の取り組みを強調していると考えています。

書籍『Designing Distributed Systems (分散システムの設計)』のカバー

Cloud AI Services によってアプリのイノベーションを推進する

Forrester Consulting が実施したこの 2022 年の委託調査をお読みになり、事前構築済みの実稼働対応クラウド AI サービスを使用して、組織の任意のスキル レベルの開発者が AI ソリューションを迅速にデプロイできるようにする方法について確認します。

包括的なセキュリティとコンプライアンスの組み込み

  • Microsoft では、サイバーセキュリティの研究と開発に年間 USD10 億を超える投資を行っています。

  • Microsoft には、データ セキュリティとプライバシーを専門とする 3,500 人を超えるセキュリティ エキスパートがいます。

  • Azure は、他のあらゆるクラウド プロバイダーを上回る数の認定を受けています。包括的なリストをご確認ください。

  • Azure Cognitive Service for Vision の価格

    初期費用は不要で、料金は使用した分のみ発生します。Azure Cognitive Service for Vision では、トランザクション数に基づく従量課金制の消費モデルが使用されています。Computer VisionFace API 価格の詳細をご確認ください。

Azure 無料アカウントで作業を開始する

1

無料で始めましょう USD200  相当のクレジットを取得して 30 日間使用できます。クレジットを保持している間は、最も人気のあるサービスの多くを無料で利用できるほか、55 以上のその他のサービスが常に無料です。

2

クレジットがなくなった後に、同じ無料サービスでビルドを続けるには、従量課金制に移行してください。月々の無料使用分を超えた場合にのみ、お支払いいただきます。

3

12 か月が経過した後も、55 以上の常時無料サービスを引き続き利用できます。料金は、月々の無料利用分を超えて使用した分だけをお支払いいただきます。

すべての業界のあらゆる規模の企業に信頼されています

USA Surfing が AI Wave に参加

“コーチは、これらの要素を見ていきます。体の圧迫を確認します。さまざまな動的要因を確認します。これらの機械学習モデルは、サーファーの動作に身体のジョイント間の角度を測定することで、実際にコーチがフィードバックを提供するのに役立ちます。”— Kevin Schulz、空中の天才、サーファー (チーム USA)

波に乗っているサーファー

KPMG は、銀行のお客様が財務上のリスクを特定するのに役立ちます

Vision Services を使用すると、KPMG は画像とビデオを検索して分析し、光学式文字認識 (OCR) API を使用してリスクを特定します。

会話しながら廊下を歩く 3 人

H&R Block は Azure AI を使用して納税申告に変革を起こします

“税金関連ドキュメントの靴箱を提供し、AI と機械学習を使用してデータを適切な場所に配置します。”

Sameer Agarwal 氏:IT ディレクター、H&R Block

H&R Block Web サイトを表示するノート PC を持ってデスクで作業している人

Territorium は、学生が将来に備えるのに役立ちます

リモートプロクター プラットフォームは、顔認識を利用して学生の身元をリアルタイムで確認します。

顔認識のオーバーレイされた人

Boliden が鉱業のための持続可能な未来を構築

Vision Services を使用すると、Boliden はビデオ ストリームやその他のセンサー入力を統合し、AI 支援画像分析を適用して潜在的な危険を特定します。

トンネルで作業しているヘッドランプと反射服を着た鉱業作業員

Uber は顔認識を使用してプラットフォームのセキュリティを大幅に向上

[Face] は、顔検出機能をプラットフォームに組み込む開発作業の数か月を節約しました。Microsoft Azure Cognitive Services とのパートナーシップのおかげで、私たちのビジョンをワープくらいのスピード感で実装できました。そのため、ユーザー エクスペリエンスを最適化するために使う時間を増やすことができました。」

Dima Kovalev:プロダクト マネージャー、Uber

携帯電話で顔認識ソフトウェアを使用して車に座っている人
タブに戻る

ドキュメントおよびリソース

開始する

サンプルの詳細

ガイダンス

Azure Cognitive Service for Vision についてよく寄せられる質問

  • リージョンごとの提供状況をご覧ください。

  • Azure Cognitive Service for Vision とその他の Azure Cognitive Services オファリングでは、99.9% の可用性が保証されています。無料価格レベルに対しては SLA は提供されません。SLA の詳細情報をご覧ください。

  • いいえ。Microsoft はお客様の画像やビデオの処理後に自動的に削除します。また、基礎となるモデルを強化するためにお客様のデータをトレーニングすることはありません。ビデオ データは、ユーザーのプレミスから外には持ち出されず、コンテナーが実行されているエッジには格納されません。プライバシーと使用条件の詳細をご確認ください。

  • いいえ。空間分析では、検出された個別の人物を取り囲む境界ボックスを使用して、ビデオ映像や出力に含まれる人物の存在の検出と位置特定が行われます。AI モデルにより、顔が検出されたり、個人の ID や人口統計が判断されたりすることはありません。

  • 空間分析 AI モデルでは、人体境界ボックスによって 1 人以上の人物の存在を識別するアルゴリズムに基づいて、ビデオ フィード内の動きを検出して追跡します。カメラの視野のゾーン内で検出された人物と境界ボックスそれぞれについて、AI モデルはイベント データを出力します。これには、人体の境界ボックスの座標、イベントの種類 (ゾーンの出入り、方向の線の交差など)、境界ボックスを追跡する仮名識別子、検出の信頼度スコアなどが含まれます。このイベント データは、Azure IoT Hub のお客様独自のインスタンスに送信されます。

  • はい。モデルのカスタマイズはシナリオに合わせてカスタマイズするように設計されているため、モデルをトレーニングするためのラベル付きデータを提供する必要があります。

  • サービスのモデルカスタマイズ機能は、画像間の主な違いをすばやく認識するように最適化されているので、少量のデータを含むモデルでプロトタイプの作成を始めることができます。ラベルごとに画像を 1 つだけでも初められます。ラベル付きの画像が多くお持ちの場合、追加できます。問題の複雑さと必要な精度に応じて、ラベルごとに画像を追加し続けて、モデルを改善できます。

  • どちらもです。サイトを使用して、モデルのデータセット、トレーニング、評価を管理するためのグラフィカル インターフェイスにアクセスしてコードなしのエクスペリエンスを実現したり、代わりにComputer Vision API を使用したりできます。

  • ラベル付けされたデータを簡単にエクスポートするために Vision Studio と統合されている Azure Machine Learning Studio で画像にラベルを付けることができます。COCO ファイル形式でデータにラベルを付け、Vision Studio で COCO ファイルを直接インポートすることもできます。詳細については、ドキュメントを参照してください。

  • Azure Cognitive Service for Vision のモデル カスタマイズ機能は、精度と少数の学習機能を備えた次世代のCustom Visionです。Custom Vision を引き続き使用することも、トレーニング データを移行して、Azure Cognitive Service for Vision のモデルカスタマイズを使用してモデルを再トレーニングすることもできます。詳細については、ドキュメントを参照してください。

  • Azure Cognitive Service for Vision を使用して画像やビデオからテキストを抽出した後は、Text Analytics を使用してセンチメントを分析したり、Translator を使用してテキストを希望の言語に翻訳したり、Immersive Reader を使用してテキストを読み上げたりして、よりアクセシビリティを高めることができます。関連するサービスと機能には、ドキュメントからキーと値のペアとテーブルを抽出する Azure Form Recognizer、オーディオファイルやビデオ ファイルから高度なメタデータを抽出するための Azure Video Indexer、不要なテキストや画像を検出するための Content Moderator などがあります。

準備が整ったら、Azure の無料アカウントを設定しましょう

Azure を無料で試す

セールス担当者とチャット