Lewati Navigasi

Apa yang dimaksud dengan penglihatan komputer?

Pelajari fungsi penglihatan komputer, cara kerja penglihatan komputer, dan untuk apa penglihatan komputer digunakan.

Penglihatan komputer

Penglihatan komputer adalah bidang ilmu komputer yang berfokus pada memungkinkan komputer untuk mengidentifikasi dan memahami objek dan orang dalam gambar dan video. Seperti jenis AI lainnya, penglihatan komputer berupaya melakukan dan mengotomatisasi tugas yang mereplikasi kemampuan manusia. Dalam hal ini, penglihatan komputer berusaha mereplikasi cara manusia melihat, serta cara manusia memahami apa yang mereka lihat.

Berbagai aplikasi praktis untuk teknologi penglihatan komputer menjadikannya komponen utama dari banyak inovasi dan solusi modern. Penglihatan komputer dapat dijalankan di cloud atau di lokal.

Cara kerja penglihatan komputer

Aplikasi penglihatan komputer menggunakan input dari perangkat penginderaan, kecerdasan buatan, pembelajaran mesin, dan pembelajaran mendalam untuk mereplikasi cara kerja sistem penglihatan manusia. Aplikasi penglihatan komputer berjalan pada sejumlah besar data visual atau gambar di cloud. Aplikasi mengenali pola dalam data visual ini dan menggunakan pola tersebut untuk menentukan konten gambar lainnya.

Cara gambar dianalisis dengan penglihatan komputer

  • Perangkat penginderaan menangkap gambar. Perangkat penginderaan sering kali hanya sebuah kamera, tetapi bisa berupa kamera video, perangkat pencitraan medis, atau jenis perangkat lain yang menangkap gambar untuk dianalisis.
  • Gambar kemudian dikirim ke perangkat penerjemah. Perangkat penerjemah menggunakan pengenalan pola untuk memecah gambar, membandingkan pola pada gambar dengan pustaka pola yang diketahui, dan menentukan apakah ada konten dalam gambar yang cocok. Polanya bisa berupa sesuatu yang umum, seperti penampakan jenis objek tertentu atau bisa juga berdasarkan pengidentifikasi unik, seperti fitur wajah.
  • Pengguna meminta informasi spesifik tentang gambar, lalu perangkat penerjemah memberikan informasi yang diminta berdasarkan analisis gambar tersebut.

Pembelajaran mendalam dan penglihatan komputer

Aplikasi penglihatan komputer modern beralih dari metode statistik untuk menganalisis gambar dan semakin mengandalkan apa yang dikenal sebagai pembelajaran mendalam. Dengan pembelajaran mendalam, aplikasi penglihatan komputer berjalan pada tipe algoritme yang disebut jaringan neural, yang memungkinkannya menghasilkan analisis gambar yang lebih akurat. Selain itu, pembelajaran mendalam memungkinkan program penglihatan komputer mempertahankan informasi dari setiap gambar yang dianalisis—sehingga semakin sering digunakan, semakin akurat hasilnya.

Kemampuan penglihatan komputer

Ada tiga fungsi utama untuk cara program penglihatan komputer memproses gambar dan mengembalikan informasi:

Sistem mengklasifikasikan objek dalam gambar sesuai dengan kategori yang ditentukan. Misalnya, dengan klasifikasi objek, komputer dapat membedakan orang dari objek dalam foto dan menentukan berapa banyak orang yang muncul dalam foto.

Sistem mengidentifikasi objek tertentu dalam foto, video, atau gambar. Misalnya, dengan identifikasi objek, sistem tidak hanya dapat membedakan orang dalam foto, tetapi juga menganalisis penampilan mereka untuk menentukan identitas atau ciri orang tersebut.

Sistem menganalisis video untuk memproses lokasi objek bergerak dari waktu ke waktu. Misalnya, dengan pelacakan objek, kamera pengawas tempat parkir dapat mengidentifikasi mobil di tempat parkir dan memberikan informasi tentang lokasi dan pergerakan mobil tersebut dari waktu ke waktu.

Sistem mengidentifikasi huruf dan angka dalam gambar dan mengonversi teks tersebut menjadi teks yang dikodekan mesin yang dapat dibaca oleh aplikasi komputer lain atau diedit oleh pengguna.

Untuk apa penglihatan komputer digunakan

Penglihatan komputer adalah kemampuan yang canggih, serta dapat dikombinasikan dengan banyak jenis aplikasi dan perangkat penginderaan untuk mendukung sejumlah kasus penggunaan praktis. Berikut adalah beberapa jenis aplikasi penglihatan komputer:

Organisasi konten

Penglihatan komputer dapat digunakan untuk mengidentifikasi orang atau objek dalam foto dan mengaturnya berdasarkan identifikasi tersebut. Aplikasi pengenalan foto seperti ini umumnya digunakan pada aplikasi penyimpanan foto dan media sosial.

Ekstraksi teks

Pengenalan karakter optik dapat digunakan untuk meningkatkan kemudahan konten ditemukan untuk informasi yang terkandung dalam teks dengan jumlah besar dan memungkinkan pemrosesan dokumen untuk skenario otomatisasi pemrosesan robotik.

Realitas tertambah

Objek fisik terdeteksi dan dilacak secara real time dengan penglihatan komputer. Informasi ini kemudian digunakan untuk menempatkan objek virtual secara realistis dalam lingkungan fisik.

Pertanian

Gambar tanaman yang diambil dari satelit, drone, atau pesawatdapat dianalisis untuk memantau panen, mendeteksi kemunculan gulma, atau mengidentifikasi kekurangan nutrisi tanaman.

Kendaraan otonom

Mobil yang mengemudi sendiri menggunakan identifikasi dan pelacakan objek real time untuk mengumpulkan informasi tentang yang terjadi di sekitar mobil dan merutekan mobil berdasarkan informasi tersebut.

Layanan kesehatan

Foto atau gambar yang diambil oleh perangkat medis lain dapat dianalisis untuk membantu dokter mengidentifikasi masalah dan membuat diagnosis dengan lebih cepat dan akurat.

Olahraga

Pelacakan dan deteksi objek digunakan untuk memainkan dan analisis strategi.

Manufaktur

Penglihatan komputer dapat memantau mesin manufaktur untuk tujuan pemeliharaan. Fitur ini juga dapat digunakan untuk memantau kualitas produk dan pengemasan pada lini produksi.

Analisis spasial

Sistem mengidentifikasi orang atau objek, seperti mobil, dalam suatu ruang dan melacak gerakan mereka di dalam ruang tersebut.

Pengenal wajah

Penglihatan komputer dapat diterapkan untuk mengidentifikasi individu.

Telusuri solusi penglihatan komputer Azure

Temukan Azure Cognitive Services—keluarga komprehensif layanan AI dan API kognitif yang mempermudah pembuatan aplikasi cerdas dengan kemampuan visual komputer.

Jelajahi penglihatan komputer di Azure

Tingkatkan kemudahan konten ditemukan, percepat ekstraksi teks, dan buat produk yang dapat digunakan lebih banyak orang dengan menyematkan kemampuan penglihatan di aplikasi Anda.

Pelajari selengkapnya