Pesquisa Visual Computacional

Um serviço de IA que analisa o conteúdo em imagens e vídeos

Extraia informações sofisticadas de imagens e vídeos

Impulsione a detectabilidade de conteúdo, automatize a extração de textos, analise vídeos em tempo real e crie produtos que mais pessoas podem usar inserindo funcionalidades de visão de nuvem nos aplicativos com a Pesquisa Visual Computacional, parte dos Serviços Cognitivos do Azure. Use o processamento de dados visuais para rotular o conteúdo com objetos e conceitos, extrair texto, gerar descrições de imagem, moderar o conteúdo e entender o movimento das pessoas nos espaços físicos. Não é necessário ter experiência com Machine Learning.

Extração de texto (OCR)

Extraia um texto impresso e manuscrito de imagens e documentos com idiomas e estilos de escrita mistos.

Reconhecimento de imagens

Extraia um texto de uma ontologia sofisticada de mais de 10 mil conceitos e objetos para gerar valor dos seus ativos visuais.

Análise espacial

Analise como as pessoas se movem em um espaço físico em tempo real a fim de contar a ocupação, controlar o distanciamento social e detectar o uso de máscara facial.

Implantação flexível

Execute a Pesquisa Visual Computacional na nuvem ou na borda, nos contêineres.

Aplique pesquisa visual computacional inovadora com facilidade

Adicione tecnologias de ponta a aplicativos próprios para o reconhecimento de vídeos e fotos com uma simples chamada à API.

Conheça o recurso

person
person
subway train
Nome do recurso: Valor
Objetos [ { "rectangle": { "x": 93, "y": 178, "w": 115, "h": 237 }, "object": "person", "confidence": 0.764 }, { "rectangle": { "x": 0, "y": 229, "w": 101, "h": 206 }, "object": "person", "confidence": 0.624 }, { "rectangle": { "x": 161, "y": 31, "w": 439, "h": 423 }, "object": "subway train", "parent": { "object": "train", "parent": { "object": "Land vehicle", "parent": { "object": "Vehicle", "confidence": 0.926 }, "confidence": 0.923 }, "confidence": 0.917 }, "confidence": 0.801 } ]
Marcas [ { "name": "train", "confidence": 0.9974923 }, { "name": "platform", "confidence": 0.9955777 }, { "name": "station", "confidence": 0.979665935 }, { "name": "indoor", "confidence": 0.9272351 }, { "name": "subway", "confidence": 0.838868737 }, { "name": "clothing", "confidence": 0.5561282 }, { "name": "person", "confidence": 0.505803 }, { "name": "pulling", "confidence": 0.431911945 } ]
Descrição { "tags": [ "train", "platform", "station", "building", "indoor", "subway", "track", "walking", "waiting", "pulling", "board", "people", "man", "luggage", "standing", "holding", "large", "woman", "suitcase" ], "captions": [ { "text": "people waiting at a train station", "confidence": 0.833144546 } ] }
Formato da imagem "Jpeg"
Dimensões da imagem 462 x 600
Preto e branco false
Conteúdo somente para adultos false
Pontuação de conteúdo somente para adultos 0.009112834
Gory false
Gore Score 0.046150554
Conteúdo sexual false
Pontuação de conteúdo sexual 0.0143244695
Categorias [ { "name": "trans_trainstation", "score": 0.98828125 } ]
Faces []
Tela de fundo de cor predominante
"Black"
Primeiro plano de cor predominante
"Black"
Cor de destaque
#484C83
{
  "categories": [
    {
      "name": "trans_trainstation",
      "score": 0.98828125
    }
  ],
  "adult": {
    "isAdultContent": false,
    "isGoryContent": false,
    "isRacyContent": false,
    "adultScore": 0.009112834,
    "goreScore": 0.046150554,
    "racyScore": 0.0143244695
  },
  "tags": [
    {
      "name": "train",
      "confidence": 0.9974923
    },
    {
      "name": "platform",
      "confidence": 0.9955777
    },
    {
      "name": "station",
      "confidence": 0.979665935
    },
    {
      "name": "indoor",
      "confidence": 0.9272351
    },
    {
      "name": "subway",
      "confidence": 0.838868737
    },
    {
      "name": "clothing",
      "confidence": 0.5561282
    },
    {
      "name": "person",
      "confidence": 0.505803
    },
    {
      "name": "pulling",
      "confidence": 0.431911945
    }
  ],
  "description": {
    "tags": [
      "train",
      "platform",
      "station",
      "building",
      "indoor",
      "subway",
      "track",
      "walking",
      "waiting",
      "pulling",
      "board",
      "people",
      "man",
      "luggage",
      "standing",
      "holding",
      "large",
      "woman",
      "suitcase"
    ],
    "captions": [
      {
        "text": "people waiting at a train station",
        "confidence": 0.833144546
      }
    ]
  },
  "requestId": "4bd436a1-45f6-4c1c-9cab-01af667cc470",
  "metadata": {
    "width": 600,
    "height": 462,
    "format": "Jpeg"
  },
  "faces": [],
  "color": {
    "dominantColorForeground": "Black",
    "dominantColorBackground": "Black",
    "accentColor": "484C83",
    "isBWImg": false
  },
  "objects": [
    {
      "rectangle": {
        "x": 93,
        "y": 178,
        "w": 115,
        "h": 237
      },
      "object": "person",
      "confidence": 0.764
    },
    {
      "rectangle": {
        "x": 0,
        "y": 229,
        "w": 101,
        "h": 206
      },
      "object": "person",
      "confidence": 0.624
    },
    {
      "rectangle": {
        "x": 161,
        "y": 31,
        "w": 439,
        "h": 423
      },
      "object": "subway train",
      "parent": {
        "object": "train",
        "parent": {
          "object": "Land vehicle",
          "parent": {
            "object": "Vehicle",
            "confidence": 0.926
          },
          "confidence": 0.923
        },
        "confidence": 0.917
      },
      "confidence": 0.801
    }
  ]
}
{
  "categories": [
    {
      "name": "trans_trainstation",
      "score": 0.98828125
    }
  ],
  "adult": {
    "isAdultContent": false,
    "isGoryContent": false,
    "isRacyContent": false,
    "adultScore": 0.009112834,
    "goreScore": 0.046150554,
    "racyScore": 0.0143244695
  },
  "tags": [
    {
      "name": "train",
      "confidence": 0.9974923
    },
    {
      "name": "platform",
      "confidence": 0.9955777
    },
    {
      "name": "station",
      "confidence": 0.979665935
    },
    {
      "name": "indoor",
      "confidence": 0.9272351
    },
    {
      "name": "subway",
      "confidence": 0.838868737
    },
    {
      "name": "clothing",
      "confidence": 0.5561282
    },
    {
      "name": "person",
      "confidence": 0.505803
    },
    {
      "name": "pulling",
      "confidence": 0.431911945
    }
  ],
  "description": {
    "tags": [
      "train",
      "platform",
      "station",
      "building",
      "indoor",
      "subway",
      "track",
      "walking",
      "waiting",
      "pulling",
      "board",
      "people",
      "man",
      "luggage",
      "standing",
      "holding",
      "large",
      "woman",
      "suitcase"
    ],
    "captions": [
      {
        "text": "people waiting at a train station",
        "confidence": 0.833144546
      }
    ]
  },
  "requestId": "4bd436a1-45f6-4c1c-9cab-01af667cc470",
  "metadata": {
    "width": 600,
    "height": 462,
    "format": "Jpeg"
  },
  "faces": [],
  "color": {
    "dominantColorForeground": "Black",
    "dominantColorBackground": "Black",
    "accentColor": "484C83",
    "isBWImg": false
  },
  "objects": [
    {
      "rectangle": {
        "x": 93,
        "y": 178,
        "w": 115,
        "h": 237
      },
      "object": "person",
      "confidence": 0.764
    },
    {
      "rectangle": {
        "x": 0,
        "y": 229,
        "w": 101,
        "h": 206
      },
      "object": "person",
      "confidence": 0.624
    },
    {
      "rectangle": {
        "x": 161,
        "y": 31,
        "w": 439,
        "h": 423
      },
      "object": "subway train",
      "parent": {
        "object": "train",
        "parent": {
          "object": "Land vehicle",
          "parent": {
            "object": "Vehicle",
            "confidence": 0.926
          },
          "confidence": 0.923
        },
        "confidence": 0.917
      },
      "confidence": 0.801
    }
  ]
}

Transforme seus processos

Identifique automaticamente mais de 10 mil objetos e conceitos nas suas imagens. Extraia um texto impresso e manuscrito de vários tipos de documentos e imagens, aproveitando o suporte para vários idiomas e estilos de escrita mistos. Aplique esses recursos da Pesquisa Visual Computacional para simplificar processos, como a automação de processo robótico e o gerenciamento de ativos digitais.

Maximize o valor do espaço físico da sua organização

Entenda como as pessoas se movem em um espaço físico, seja em um escritório ou em uma loja. Use o recurso de análise espacial para criar aplicativos capazes de contar as pessoas em um ambiente, rastrear os caminhos percorridos, entender o tempo de permanência em frente a vitrines de varejo e determinar o tempo de espera nas filas. Crie soluções que habilitem o gerenciamento da ocupação e o controle do distanciamento social, o uso de máscara facial, a otimização dos layouts da loja e do escritório e a aceleração do processo de finalizar compra. Execute o serviço em várias câmeras e locais.

Saiba mais sobre essa funcionalidade

Implante em qualquer lugar, da nuvem à borda

Execute a Pesquisa Visual Computacional na nuvem ou no local com contêineres. Aplique-a a cenários diversificados, como exame de imagens de registro de saúde, extração de texto de documentos seguros ou análise de como as pessoas se movem em uma loja, em que a segurança dos dados e a baixa latência são imprescindíveis.

Saiba mais sobre a Pesquisa Visual Computacional em contêineres

Desenvolva aplicativos com toda a segurança do Azure, que é líder do setor

  • A Microsoft investe mais de USD 1 billion anualmente em pesquisa e desenvolvimento de segurança cibernética.

  • Empregamos mais de 3.500 especialistas em segurança totalmente dedicados à privacidade e à segurança de dados.

  • O Azure tem mais certificações de conformidade que qualquer outro provedor de nuvem. Veja a lista completa.

Pesquisa visual computacional de alta qualidade a preços competitivos

Pague apenas pelo que usar sem custos iniciais. Com a Pesquisa Visual Computacional, você paga conforme o uso com base no número de transações.

Introdução à Pesquisa Visual Computacional em 3 etapas

Obtenha acesso instantâneo e um crédito de $200 ao se inscrever para sua conta gratuita do Azure.

Entre no portal do Azure e adicione a Pesquisa Visual Computacional.

Saiba como inserir a Pesquisa Visual Computacional com os inícios rápidos e a documentação.

Documentação e recursos

Primeiros passos

Leia a documentação

Participe dos cursos do Microsoft Learn

Veja exemplos de código

Explore um aplicativo de exemplo

Perguntas frequentes sobre Pesquisa Visual Computacional

  • A Pesquisa Visual Computacional e outras ofertas dos Serviços Cognitivos do Azure garantem 99,9% de disponibilidade. Nenhum SLA é fornecido para o tipo de preço Gratuito. Confira os detalhes de SLA.
  • Não. A Microsoft exclui automaticamente as imagens e vídeos após o processamento e não treina os dados para aprimorar os modelos subjacentes. Os dados dos vídeos não deixam as instalações físicas em questão em nenhum momento e também não são armazenados na borda em que o contêiner é executado. Saiba mais sobre privacidade e termos de uso.
  • Depois de usar a Pesquisa Visual Computacional para extrair textos de imagens e vídeos, você pode usar a Análise de Texto para analisar os sentimentos, o Tradutor para traduzir textos para o idioma desejado ou a Leitura Avançada para ler textos em voz alta, tornando-os mais acessíveis. Funcionalidades adicionais relacionadas à Pesquisa Visual Computacional incluem o Reconhecimento de Formulários para extrair pares chave-valor e tabelas de documentos, a Detecção Facial para detectar e reconhecer rostos em imagens, a Visão Personalizada para criar com facilidade um modelo de visão computacional próprio do zero e o Content Moderator para detectar texto ou imagens indesejados.
  • Não. A análise espacial detecta e localiza presenças humanas em filmagens e saídas usando caixas delimitadoras em torno dos corpos humanos identificados. Os modelos de IA não detectam rostos e nem determinam as identidades ou os dados demográficos dos indivíduos.
  • Os modelos de IA para análise espacial detectam e acompanham os movimentos no feed de vídeo com base em algoritmos que identificam a presença de um ou mais humanos por meio de uma caixa delimitadora de corpo. Para cada movimento detectado na caixa delimitadora em uma zona do campo de visão da câmera, os modelos de IA geram os dados de evento de saída, incluindo: as coordenadas da caixa delimitadora do corpo da pessoa em questão, o tipo de evento (por exemplo, entrada ou saída da zona ou cruzamento de linha direcional), identificador de pseudônimos para acompanhar a caixa delimitadora e pontuação de confiança da detecção. Esses dados de evento são enviados para a sua instância do Hub IoT do Azure.

Estamos prontos para configurar sua conta gratuita do Azure quando você quiser