略過導覽

什麼是電腦視覺?

了解什麼是電腦視覺、電腦視覺的運作方式,以及電腦視覺的用途。

電腦視覺

電腦視覺是電腦科學的其中一個範疇,其著重於讓電腦能夠識別並了解影像和影片中的物件和人物。電腦視覺就像其他類型的 AI,可嘗試執行模仿人類能力的工作,並將這類工作自動化。在這種情況中,電腦視覺會嘗試模仿人類視覺的運作方式,以及模仿人類對所見內容的解讀方式。

電腦視覺技術的實際應用範圍很廣,因此成為許多現代化創新和解決方案的核心元件。您可以在雲端或內部部署位置執行電腦視覺。

電腦視覺的運作方式

電腦視覺應用程式可使用來自感應裝置、人工智慧、機器學習和深度學習的輸入,模仿人類視覺系統的運作方式。電腦視覺應用程式會依據已利用雲端中大量視覺資料或影像訓練的演算法執行。這些應用程式會辨識此視覺效果資料中的模式,並使用這些模式判斷其他影像的內容。

如何使用電腦視覺分析影像

  • 感應裝置會擷取影像。感應裝置通常是相機,但可能是錄影機、醫學影像處理裝置,或可擷取影像以供分析的任何其他類型裝置。
  • 系統即會將影像傳送至解譯裝置。解譯裝置會使用模式辨識細分影像,並將影像中的模式與已知模式程式庫進行比對,以判斷影像中的任何內容是否相符。此模式可能是特定類型物件的外觀等一般內容,也可能是臉部特徵等唯一識別項。
  • 當使用者要求影像的特定資訊時,解譯裝置會根據其影像分析結果提供所要求的資訊。

深度學習和電腦視覺

現代化的電腦視覺應用程式已逐漸摒棄統計方法來分析影像,而轉為依賴深度學習方法。透過深度學習,電腦視覺應用程式可依據一種稱為神經網路的演算法執行,以確保電腦視覺應用程式提供更精確的影像分析。此外,深度學習可讓電腦視覺程式保留每個已分析影像中的資訊,隨著您愈常使用電腦視覺程式,就能得到愈精確的結果。

電腦視覺功能

電腦視覺程式依賴下列三個主要功能處理影像和傳回資訊:

系統會根據已定義類別分類影像中的物件。例如,使用物件分類時,電腦可以將相片中的人物與物件區分出來,並判斷相片中出現的人數。

系統會識別相片、影片或影像中的特定物件。例如,使用物件識別時,系統不只能夠區分相片中的人物,也能分析這些人物的外觀,以判斷其身分或特徵。

系統會分析影片,以處理移動物件隨時間產生的位置資訊。例如,使用物件追蹤時,停車場監控攝影機可以識別停車場的車輛,並提供這些車輛隨時間產生的位置和移動資訊。

系統會識別影像中的字母和數字,並將該文字轉換成電腦編碼的文字,以供其他電腦應用程式讀取或供使用者編輯。

電腦視覺的用途

電腦視覺是一項強大的功能,可結合許多類型的應用程式和感應裝置,以支援各種實際使用案例。下列是幾種不同類型的電腦視覺應用程式:

內容整理

電腦視覺可用於識別相片中的人物或物件,並根據該識別結果整理內容。這類相片辨識應用程式通常用於相片儲存和社交媒體應用程式中。

文字擷取

機器人處理自動化案例可使用光學字元辨識,提升大量文字中所含資訊的內容可搜尋性,並啟用文件處理功能。

擴增實境

系統會使用電腦視覺即時偵測和追蹤實體物件,並使用這項資訊將虛擬物件實際放在實體環境中。

農業

您可以分析由衛星、無人機或飛機取得的作物影像,以監視農地、偵測雜草生長情況,或識別作物養分是否不足。

自動型交通工具

自動駕駛汽車會使用即時物件識別和追蹤功能,收集汽車周邊的情況,並據此駕駛車輛。

醫療保健

系統會分析其他醫療裝置擷取的相片或影像,以協助醫生識別問題,並更快速、精確地進行診斷。

運動

物件偵測與追蹤功能可用於比賽和策略分析。

製造業

電腦視覺可監視製造機具以便進行維護,也可以用於監視生產線的產品品質與包裝情況。

空間分析

系統會識別空間中的人物或物件 (例如汽車),並追蹤其在該空間內的移動狀況。

臉部辨識

您可以應用電腦視覺識別人物。

瀏覽 Azure 電腦視覺解決方案

探索 Azure 認知服務,這是一系列完整的 AI 服務和認知 API,可讓您更輕鬆打造含有電腦視覺功能的智慧型應用程式。

探索 Azure 中的電腦視覺

透過在應用程式中內嵌視覺功能,來提高內容的可探索性、加速文字擷取,以及建立可讓更多人使用的產品。

深入了解