コンピューター ビジョンとは?
コンピューター ビジョンとは何か、コンピューター ビジョンのしくみ、コンピューター ビジョンの用途について説明します。
コンピューター ビジョン
コンピュータビジョン は、コンピューターが画像やビデオ内のオブジェクトや人物を識別して理解できるようにすることに重点を置くコンピューター サイエンスの分野です。他の種類の AI と同様に、コンピューター ビジョンでは、人間の能力を再現するタスクを実行および自動化することを目指しています。この場合、コンピューター ビジョンは、人間が見る方法と、人間が見ているものを理解する方法の両方を再現しようとします。
コンピューター ビジョン テクノロジーの実用的なアプリケーションの範囲は、多くの最新のイノベーションとソリューションの中心的なコンポーネントになっています。コンピューター ビジョンはクラウドまたはオンプレミスで実行できます。
コンピューター ビジョンのしくみ
コンピューター ビジョン アプリケーションでは、検出デバイス、人工知能、機械学習、ディープ ラーニングからの入力を使用して、人間の視覚システムの動作を再現します。コンピューター ビジョン アプリケーションは、クラウドにある大量のビジュアル データや画像でトレーニングされたアルゴリズムで実行されます。このビジュアル データ内のパターンを認識し、それらのパターンを使用して他の画像のコンテンツを決定します。
コンピューター ビジョンを使用して画像を分析する方法
-
検知デバイスによって画像がキャプチャされます。多くの場合、検出デバイスは単なるカメラですが、ビデオ カメラ、医療画像デバイス、または分析用の画像をキャプチャするその他の種類のデバイスである可能性があります。
-
次に、画像が解釈を行うデバイスに送信されます。解釈を行うデバイスによって、パターン認識を使用した画像の分析が行われ、画像内のパターンが既知のパターンのライブラリと比較されて、画像内のいずれかの内容が一致しているかどうかが判断されます。パターンは、特定の種類の物体の外見といった一般的なものである場合もあれば、顔の特徴のような固有の識別子に基づいている場合もあります。
-
ユーザーは画像に関する特定の情報を要求し、解釈デバイスは画像の分析に基づいて要求された情報を提供します。
ディープ ラーニングとコンピューター ビジョン
-
最新のコンピューター ビジョン アプリケーションは、画像を分析するための統計的手法から移行し、ディープ ラーニングと呼ばれるものにますます依存しています。ディープ ラーニングを使用すると、コンピューター ビジョン アプリケーションはニューラル ネットワークと呼ばれる種類のアルゴリズムで実行されるため、さらにいっそう正確な画像分析を実現できます。さらに、ディープ ラーニングにより、コンピューター ビジョン プログラムは、分析する各画像の情報を保持できるため、使用すればするほど、より正確になります。
コンピューター ビジョンの機能
コンピューター ビジョン プログラムによって画像が処理されて情報が返される方法としては、主に 3 つの機能があります:
システムは、定義されたカテゴリに従ってイメージ内のオブジェクトを分類します。たとえば、物体分類を使用すると、コンピューターで写真内の人物を物体と区別し、写真に写った人の数を特定できます。
システムによって、写真、ビデオ、または画像内の特定の物体が識別されます。たとえば、物体識別を使用すると、システムは写真内の人物を区別するだけでなく、外観を分析してそれらの人物の身元や特徴を判断することもできます。
システムはビデオを分析して、時間の経過と共に移動するオブジェクトの位置を処理します。たとえば、物体追跡を使用すると、駐車場監視カメラは、駐車場内の車を識別し、時間の経過と共にそれらの車の位置と動きに関する情報を提供できます。
システムは、画像内の文字と数字を識別し、そのテキストをコンピューターでエンコードされたテキストに変換して、他のコンピューター アプリケーションで読み取ったり、ユーザーが編集したりできるようにします。
コンピューター ビジョンの用途
コンピューター ビジョンは強力な機能であり、さまざまな種類のアプリケーションや検知デバイスと組み合わせて、多数の実用的なユース ケースをサポートすることができます。さまざまな種類のコンピューター ビジョン アプリケーションのごく一部を以下に示します:
コンテンツの編成
コンピューター ビジョンを使用して、写真内の人物や物体を識別し、その識別に基づいてそれらを整理することができます。このような写真認識アプリケーションは、写真のストレージやソーシャル メディア アプリケーションでよく使用されます。
テキスト抽出
光学式文字認識を使用すると、大量のテキストに含まれる情報の内容の見つけやすさを高め、ロボティック プロセス オートメーションのシナリオにおいてドキュメントの処理を実現できます。
拡張現実
物理的な物体がコンピューター ビジョンによってリアルタイムで検出および追跡されます。そしてこの情報が、物理的環境に仮想物体を現実的に配置するために使用されます。
農業
人工衛星、ドローン、または飛行機から撮影された農作物の画像を分析して、収穫期を監視したり、雑草の発生を検出したり、農作物の栄養不足を特定したりできます。
自律走行車
自動運転車では、リアルタイムの物体識別および追跡を使用して、車の周囲で起こっていることに関する情報が収集され、それに応じて車の走路が決定されます。
医療
他の医療機器によってキャプチャされた写真や画像を分析して、医師が問題を特定し、より迅速かつ正確に診断できるよう支援することが可能です。
スポーツ
物体の検出と追跡は、プレイと戦略の分析に使用されます。
製造
コンピューター ビジョンによって、メンテナンスのために製造機械を監視できます。また、生産ラインにおける製品の品質と梱包の監視にも使用できます。
空間分析
このシステムは、空間内の人やオブジェクト (自動車など) を識別し、その空間内での移動を追跡します。
顔認識
個人を識別するためにコンピューター ビジョンを適用できます。
Azure コンピューター ビジョン ソリューションの参照
Azure でコンピューター ビジョンを探索する
コンテンツの見つけやすさを向上させ、テキストの抽出を迅速化し、より多くの人が利用できる製品を作成するために、アプリにビジョン機能を埋め込みます。