Ignorar navegação

O que é a pesquisa visual computacional?

Saiba o que é a pesquisa visual computacional, como ela funciona e para que é usada.

Pesquisa visual computacional

A pesquisa visual computacional é um campo da ciência da computação que se concentra em habilitar os computadores para que identifiquem e entendam objetos e pessoas em imagens e vídeos. Como outros tipos de IA, a pesquisa visual computacional busca realizar e automatizar tarefas que replicam as capacidades humanas. Nesse caso, a pesquisa visual computacional busca replicar tanto a maneira como os humanos veem, quanto a maneira como os humanos compreendem o que veem.

A variedade de aplicações práticas da tecnologia de pesquisa visual computacional a torna um componente central de muitas inovações e soluções modernas. A pesquisa visual computacional pode ser executada na nuvem ou no local.

Como funciona a pesquisa visual computacional

Os aplicativos de pesquisa visual computacional usam dados de dispositivos de detecção, de inteligência artificial, de machine learning e de aprendizado profundo para replicar o modo de funcionamento do sistema de visão humana. Os aplicativos de pesquisa visual computacional são executados em algoritmos treinados em grandes quantidades de dados visuais ou imagens na nuvem. Eles reconhecem padrões nesses dados visuais e usam esses padrões para determinar o conteúdo de outras imagens.

Como uma imagem é analisada com a pesquisa visual computacional

  • Um dispositivo de detecção captura uma imagem. O dispositivo de detecção geralmente é só uma câmera, mas pode ser uma câmera de vídeo, um dispositivo de imagem médica ou qualquer outro tipo de dispositivo que capture uma imagem para análise.
  • Em seguida, a imagem é enviada a um dispositivo de interpretação. O dispositivo de interpretação usa reconhecimento de padrão para decompor a imagem, comparar os padrões da imagem com a biblioteca de padrões conhecidos e determinar se algum conteúdo da imagem é compatível. O padrão pode ser algo geral, como a aparência de um certo tipo de objeto, ou pode ser baseado em identificadores exclusivos, como características faciais.
  • Um usuário solicita informações específicas sobre uma imagem e o dispositivo de interpretação fornece as informações solicitadas com base na análise da imagem.

Aprendizado profundo e pesquisa visual computacional

Os aplicativos modernos de pesquisa visual computacional estão se afastando dos métodos estatísticos de análise de imagens e recorrem cada vez mais ao que conhecemos como aprendizado profundo. Com o aprendizado profundo, um aplicativo de pesquisa visual computacional é executado em um tipo de algoritmo chamado rede neural, que permite fornecer análises de imagens ainda mais precisas. Além disso, o aprendizado profundo permite que um programa pesquisa visual computacional retenha as informações de cada imagem que analisa, de modo que se torna cada vez mais preciso à medida que é usado.

Funcionalidades da pesquisa visual computacional

Existem três funções principais para o modo como os programas de pesquisa visual computacional processam imagens e retornam informações:

O sistema classifica os objetos em uma imagem de acordo com uma categoria definida. Por exemplo, com a classificação de objeto, um computador pode distinguir pessoas de objetos em uma foto e determinar quantas pessoas aparecem na foto.

O sistema identifica um objeto específico em uma foto, um vídeo ou uma imagem. Por exemplo, com a identificação de objeto, o sistema seria capaz de não apenas distinguir as pessoas em uma foto, mas também de analisar as respectivas aparências para determinar a identidade ou as características dessas pessoas.

O sistema analisa um vídeo para processar a localização de um objeto em movimento ao longo do tempo. Por exemplo, com o acompanhamento de objeto, uma câmera de vigilância de um estacionamento pode identificar carros em um estacionamento e fornecer informações sobre a localização e as movimentações desses carros ao longo do tempo.

O sistema identifica letras e números em imagens e converte esse texto em texto codificado por computador que pode ser lido por outros aplicativos de computador ou editado pelos usuários.

Para que a pesquisa visual computacional é usada

A pesquisa visual computacional é uma funcionalidade poderosa e pode ser combinada com muitos tipos de aplicativos e dispositivos de detecção para dar suporte a uma série de casos de uso práticos. Seguem abaixo apenas alguns tipos diferentes de aplicativos de pesquisa visual computacional:

Organização de conteúdo

A pesquisa visual computacional pode ser usada para identificar pessoas ou objetos em fotos e organizá-los com base nessa identificação. Os aplicativos de reconhecimento de fotos como esse geralmente são usados em aplicativos de armazenamento de fotos e mídia social.

Extração de texto

O reconhecimento óptico de caracteres pode ser usado para aumentar a capacidade de descoberta de conteúdo para informações contidas em grandes quantidades de texto e para habilitar o processamento de documentos para cenários de automação de processamento robótico.

Realidade aumentada

Os objetos físicos são detectados e rastreados em tempo real com a pesquisa visual computacional. Em seguida, essas informações são usadas para colocar objetos virtuais de modo realista em um ambiente físico.

Agricultura

Imagens de colheitas tiradas de satélites, drones ou aviões podem ser analisadas para monitorar colheitas, detectar a emergência de ervas daninhas ou identificar a deficiência de nutrientes na colheita.

Veículos autônomos

Carros autônomos usam identificação e acompanhamento de objeto em tempo real para coletar informações sobre o que está acontecendo ao redor de um carro e direcioná-lo de modo adequado.

Serviços de saúde

Fotos ou imagens capturadas por outros dispositivos médicos podem ser analisadas para ajudar os médicos a identificar problemas e fazer diagnósticos com mais rapidez e precisão.

Esportes

O acompanhamento e a detecção de objetos são usados para análise de estratégia e reprodução.

Manufatura

A pesquisa visual computacional pode monitorar máquinas de fabricação para fins de manutenção. Ela também pode ser usada para monitorar a qualidade do produto e embalagem em uma linha de produção.

Análise espacial

O sistema identifica pessoas ou objetos, como carros, em um espaço e rastreia a movimentação dentro desse espaço.

Reconhecimento facial

A pesquisa visual computacional pode ser aplicada para identificar pessoas.

Procurar soluções de pesquisa visual computacional do Azure

Descubra os Serviços Cognitivos do Azure, uma família abrangente de serviços de IA e APIs cognitivas que facilitam a criação de aplicativos inteligentes com funcionalidades de pesquisa visual computacional.

Explore a pesquisa visual computacional no Azure

Incorporando funcionalidades de visão em seus aplicativos, aumente a capacidade de descobrir conteúdos, acelere a extração de texto e crie produtos que mais pessoas podem usar.

Saiba mais
Podemos ajudar você?