API da Pesquisa Visual Computacional

Extraia informações avançadas de imagens para categorizar e processar dados visuais – e moderação de imagens assistida por computador para ajudar a organizar seus serviços.

Analisar uma imagem

Este recurso retorna informações sobre o conteúdo visual encontrado em uma imagem. Use marcação, descrições e modelos específicos de domínio para identificar o conteúdo o os rotule com confiança. Aplique as configurações de tipo/adulto para habilitar as restrições de conteúdo somente para adultos. Identifique tipos de imagem e esquemas de cores em fotos.

Veja-a em ação

Sexo Male
Idade 36
Nome do recurso: Valor
Descrição { "tags": [ "water", "swimming", "sport", "pool", "person", "man", "frisbee", "ocean", "blue", "bird", "riding", "top", "standing", "wave", "young", "body", "large", "game", "glass", "pond", "playing", "board", "catch", "clear", "boat", "white" ], "captions": [ { "text": "a man swimming in a pool of water", "confidence": 0.8909298 } ] }
Marcas [ { "name": "water", "confidence": 0.9997857 }, { "name": "swimming", "confidence": 0.955619633 }, { "name": "sport", "confidence": 0.953807831 }, { "name": "pool", "confidence": 0.9515978 }, { "name": "person", "confidence": 0.889862537 }, { "name": "water sport", "confidence": 0.664259 } ]
Formato da imagem "Jpeg"
Dimensões da imagem 462 x 600
Tipo de clip-art 0
Tipo do desenho de linha 0
Preto e branco false
Conteúdo somente para adultos false
Pontuação de conteúdo somente para adultos 0.07518345
Conteúdo sexual false
Pontuação de conteúdo sexual 0.1814024
Categorias [ { "name": "people_swimming", "score": 0.98046875 } ]
Faces [ { "age": 36, "gender": "Male", "faceRectangle": { "top": 133, "left": 298, "width": 121, "height": 121 } } ]
Tela de fundo de cor predominante
"White"
Primeiro plano de cor predominante
"Grey"
Cor de destaque
#19A4B2

Deseja criar isso?

Ler texto em imagens

O OCR (reconhecimento óptico de caracteres) detecta textos em uma imagem e extrai as palavras reconhecidas para um fluxo de caracteres legíveis por computador. Analise imagens para detectar texto inserido, gerar fluxos de caractere e habilitar pesquisa. Tire fotos de texto em vez de copiá-lo para economizar tempo e esforço.

Veja-a em ação

  1. Visualização
  2. JSON

IF WE DID

ALL

THE THINGS

WE ARE

CAPABLÉ•

OF DOING,

WE WOULD

LITERALLY

ASTOUND

QURSELV*S.

{
  "textAngle": 0.0,
  "orientation": "NotDetected",
  "language": "en",
  "regions": [
    {
      "boundingBox": "316,47,284,340",
      "lines": [
        {
          "boundingBox": "319,47,182,24",
          "words": [
            {
              "boundingBox": "319,47,42,24",
              "text": "IF"
            },
            {
              "boundingBox": "375,47,44,24",
              "text": "WE"
            },
            {
              "boundingBox": "435,47,66,23",
              "text": "DID"
            }
          ]
        },
        {
          "boundingBox": "316,74,204,69",
          "words": [
            {
              "boundingBox": "316,74,204,69",
              "text": "ALL"
            }
          ]
        },
        {
          "boundingBox": "318,147,207,24",
          "words": [
            {
              "boundingBox": "318,147,63,24",
              "text": "THE"
            },
            {
              "boundingBox": "397,147,128,24",
              "text": "THINGS"
            }
          ]
        },
        {
          "boundingBox": "316,176,125,23",
          "words": [
            {
              "boundingBox": "316,176,44,23",
              "text": "WE"
            },
            {
              "boundingBox": "375,176,66,23",
              "text": "ARE"
            }
          ]
        },
        {
          "boundingBox": "319,194,281,44",
          "words": [
            {
              "boundingBox": "319,194,281,44",
              "text": "CAPABLÉ•"
            }
          ]
        },
        {
          "boundingBox": "318,243,181,29",
          "words": [
            {
              "boundingBox": "318,243,43,23",
              "text": "OF"
            },
            {
              "boundingBox": "376,243,123,29",
              "text": "DOING,"
            }
          ]
        },
        {
          "boundingBox": "316,271,170,24",
          "words": [
            {
              "boundingBox": "316,272,44,23",
              "text": "WE"
            },
            {
              "boundingBox": "375,271,111,24",
              "text": "WOULD"
            }
          ]
        },
        {
          "boundingBox": "317,300,200,24",
          "words": [
            {
              "boundingBox": "317,300,200,24",
              "text": "LITERALLY"
            }
          ]
        },
        {
          "boundingBox": "316,328,157,24",
          "words": [
            {
              "boundingBox": "316,328,157,24",
              "text": "ASTOUND"
            }
          ]
        },
        {
          "boundingBox": "318,357,214,30",
          "words": [
            {
              "boundingBox": "318,357,214,30",
              "text": "QURSELV*S."
            }
          ]
        }
      ]
    }
  ]
}

Ao carregar dados para esta demonstração, você concorda que a Microsoft pode armazená-los e usá-los para aprimorar os serviços da Microsoft, incluindo esta API. Para ajudar a proteger sua privacidade, realizamos etapas para remover a identificação dos dados e mantê-los seguros. Não publicaremos seus dados nem permitiremos que outras pessoas os utilizem.

Deseja criar isso?

Versão prévia: leia textos manuscritos das imagens

Esta tecnologia (OCR manuscrito) permite que você detecte e extraia textos manuscritos de anotações, cartas, dissertações, quadros brancos, formulários, etc. Ela funciona em diferentes superfícies e telas de fundo, como white papers, notas autoadesivas amarelas e quadros brancos.

O reconhecimento de texto manuscrito economiza tempo e esforço e pode torná-lo mais produtivo ao permitir que você extraia imagens de textos em vez de ter que transcrevê-los. Ela possibilita a digitalização de anotações que, então, permitem que você implemente a pesquisa rápida e fácil. Ela também reduz a desorganização de papéis.

Observação: esta tecnologia está em versão prévia no momento e disponível apenas para textos em inglês.

Para experimentar esta demonstração de reconhecimento de caracteres ópticos, carregue uma imagem armazenada localmente ou forneça uma URL da imagem. Nós não armazenamos as imagens que você forneceu para esta demonstração, a menos que nos dê permissão.

Veja-a em ação

  1. Visualização
  2. JSON

OUR greatest glory is not

i never failing ,

but in rising every

time we fall

{
  "status": "Succeeded",
  "succeeded": true,
  "failed": false,
  "finished": true,
  "recognitionResult": {
    "lines": [
      {
        "boundingBox": [
          67,
          204,
          668,
          210,
          667,
          272,
          66,
          267
        ],
        "text": "OUR greatest glory is not",
        "words": [
          {
            "boundingBox": [
              69,
              206,
              159,
              205,
              155,
              274,
              65,
              275
            ],
            "text": "OUR"
          },
          {
            "boundingBox": [
              192,
              205,
              350,
              204,
              346,
              273,
              188,
              274
            ],
            "text": "greatest"
          },
          {
            "boundingBox": [
              393,
              204,
              509,
              203,
              505,
              272,
              389,
              273
            ],
            "text": "glory"
          },
          {
            "boundingBox": [
              539,
              203,
              588,
              203,
              584,
              272,
              534,
              272
            ],
            "text": "is"
          },
          {
            "boundingBox": [
              601,
              202,
              680,
              202,
              676,
              271,
              597,
              271
            ],
            "text": "not"
          }
        ]
      },
      {
        "boundingBox": [
          540,
          289,
          900,
          302,
          897,
          374,
          538,
          360
        ],
        "text": "i never failing ,",
        "words": [
          {
            "boundingBox": [
              534,
              300,
              558,
              300,
              568,
              376,
              545,
              376
            ],
            "text": "i"
          },
          {
            "boundingBox": [
              589,
              300,
              694,
              300,
              705,
              376,
              600,
              376
            ],
            "text": "never"
          },
          {
            "boundingBox": [
              720,
              300,
              874,
              300,
              885,
              376,
              731,
              376
            ],
            "text": "failing"
          },
          {
            "boundingBox": [
              877,
              300,
              905,
              300,
              916,
              376,
              888,
              376
            ],
            "text": ","
          }
        ]
      },
      {
        "boundingBox": [
          139,
          416,
          572,
          433,
          570,
          491,
          136,
          474
        ],
        "text": "but in rising every",
        "words": [
          {
            "boundingBox": [
              145,
              418,
              215,
              418,
              202,
              491,
              132,
              491
            ],
            "text": "but"
          },
          {
            "boundingBox": [
              227,
              418,
              275,
              418,
              262,
              491,
              214,
              491
            ],
            "text": "in"
          },
          {
            "boundingBox": [
              308,
              418,
              428,
              419,
              415,
              492,
              295,
              491
            ],
            "text": "rising"
          },
          {
            "boundingBox": [
              476,
              419,
              581,
              419,
              568,
              492,
              463,
              492
            ],
            "text": "every"
          }
        ]
      },
      {
        "boundingBox": [
          622,
          413,
          967,
          410,
          968,
          470,
          623,
          472
        ],
        "text": "time we fall",
        "words": [
          {
            "boundingBox": [
              627,
              408,
              722,
              409,
              713,
              470,
              618,
              468
            ],
            "text": "time"
          },
          {
            "boundingBox": [
              765,
              409,
              828,
              410,
              818,
              471,
              756,
              470
            ],
            "text": "we"
          },
          {
            "boundingBox": [
              873,
              410,
              976,
              412,
              967,
              472,
              864,
              471
            ],
            "text": "fall"
          }
        ]
      }
    ]
  }
}

Deseja criar isso?

Reconheça celebridades e pontos de referência

Os Modelos de Celebridades e Pontos de Referência são exemplos de Modelos Específicos de Domínio. Nosso modelo de reconhecimento de celebridades reconhece 200.000 celebridades nas áreas de negócios, políticas, esportes e entretenimento. Nosso modelo de reconhecimento de pontos de referência reconhece 9000 pontos de referência naturais e artificiais do mundo todo. Os Modelos Específicos de Domínio são um recurso em contínua evolução na API da Pesquisa Visual Computacional.

Veja-a em ação

{
  "categories": [
    {
      "name": "people_",
      "score": 0.86328125,
      "detail": {
        "celebrities": [
          {
            "name": "Satya Nadella",
            "faceRectangle": {
              "left": 239,
              "top": 293,
              "width": 138,
              "height": 138
            },
            "confidence": 0.9999974
          }
        ],
        "landmarks": null
      }
    }
  ],
  "adult": null,
  "tags": [
    {
      "name": "person",
      "confidence": 0.99956613779067993
    },
    {
      "name": "suit",
      "confidence": 0.98934584856033325
    },
    {
      "name": "man",
      "confidence": 0.98844343423843384
    },
    {
      "name": "outdoor",
      "confidence": 0.860062301158905
    }
  ],
  "description": {
    "tags": [
      "person",
      "suit",
      "man",
      "necktie",
      "outdoor",
      "building",
      "clothing",
      "standing",
      "wearing",
      "business",
      "looking",
      "holding",
      "black",
      "front",
      "hand",
      "dressed",
      "phone",
      "field"
    ],
    "captions": [
      {
        "text": "Satya Nadella wearing a suit and tie",
        "confidence": 0.99033389849736619
      }
    ]
  },
  "requestId": "a7d62339-e337-456b-ada5-86dfddc069be",
  "metadata": {
    "width": 600,
    "height": 900,
    "format": "Jpeg"
  },
  "faces": [
    {
      "age": 49,
      "gender": "Male",
      "faceRectangle": {
        "left": 239,
        "top": 293,
        "width": 138,
        "height": 138
      }
    }
  ],
  "color": {
    "dominantColorForeground": "Black",
    "dominantColorBackground": "Black",
    "dominantColors": [
      "Black",
      "Grey"
    ],
    "accentColor": "7B5E50",
    "isBWImg": false
  },
  "imageType": {
    "clipArtType": 0,
    "lineDrawingType": 0
  }
}

Deseja criar isso?

Analise vídeos quase em tempo real

Analise vídeos quase em tempo real: use qualquer uma das APIs da Pesquisa Visual Computacional com seus arquivos de vídeo, extraindo os quadros do vídeo do seu dispositivo e, em seguida, enviando-os para as chamadas à API de sua escolha. Obtenha os resultados de seus vídeos mais rapidamente.

Use sua amostra no GitHub para começar e criar seu próprio aplicativo.

Saiba mais

Veja-a em ação

Deseja criar isso?

Gerar uma miniatura

Gere uma miniatura com armazenamento eficiente de alta qualidade com base em qualquer imagem de entrada. Use a geração de miniaturas para modificar imagens que melhor se adéquam às suas necessidades de tamanho, forma e estilo. Aplique corte inteligente para gerar miniaturas que diferente da taxa de aspecto da sua imagem original, mas que ainda preservam a região de interesse.

Veja-a em ação

Ao carregar dados para esta demonstração, você concorda que a Microsoft pode armazená-los e usá-los para aprimorar os serviços da Microsoft, incluindo esta API. Para ajudar a proteger sua privacidade, realizamos etapas para remover a identificação dos dados e mantê-los seguros. Não publicaremos seus dados nem permitiremos que outras pessoas os utilizem.

Deseja criar isso?

Explore a API de Serviços Cognitivos

API da Pesquisa Visual Computacional

Extraia informações acionáveis de imagens

API de Detecção Facial

Detectar, identificar, analisar, organizar e marcar rostos em fotos

Content Moderator

Moderação automática de vídeo, texto e imagem

API de Detecção de Emoções VISUALIZAÇÃO

Personalize experiências dos usuários com o reconhecimento de emoções

API de vídeo VISUALIZAÇÃO

Processamento de vídeo inteligente

Serviço Personalizado de Visão VISUALIZAÇÃO

Personalize facilmente seus próprios modelos visuais de computação modernos de acordo com o seu caso de uso exclusivo

Indexador de Vídeo VISUALIZAÇÃO

Desbloquear informações em vídeos

Serviço Inteligente de Reconhecimento Vocal VISUALIZAÇÃO

Ensine seus aplicativos a entenderem comandos dos usuários

API de Análise de Texto

Avalie sentimentos e tópicos com facilidade para entender o que os usuários querem

API de Verificação Ortográfica do Bing

Detectar e corrigir erros de ortografia em seu aplicativo

API de Tradução de Texto

Faça traduções automáticas com uma simples chamada à API REST

API de Modelo de Linguagem da Web VISUALIZAÇÃO

Use os recursos de modelos preditivos de linguagem treinados com dados na escala da Web

API de Análise Linguística VISUALIZAÇÃO

Simplifique conceitos de idioma complexos e analise texto com a API de Análise Linguística

API de Tradução de Fala

Realize traduções de falas em tempo real com uma simples chamada à API REST

API de Reconhecimento do Locutor VISUALIZAÇÃO

Use a fala para identificar e autenticar locutores individuais

Speech API do Bing

Converta fala em texto e vice-versa para entender a intenção do usuário

Serviço de Fala Personalizado VISUALIZAÇÃO

Supere as barreiras para o reconhecimento de fala como estilo de fala, ruído de fundo e vocabulário

API de Recomendações VISUALIZAÇÃO

Preveja e recomende itens que seus clientes querem

API de Conhecimento Acadêmico VISUALIZAÇÃO

Alcance a riqueza do conteúdo acadêmico no Microsoft Academic Graph

Serviço de Exploração de Conhecimento VISUALIZAÇÃO

Habilitar experiências de pesquisa interativa por dados estruturados via entradas de idioma natural

API do QnA Maker VISUALIZAÇÃO

Transforme informações em respostas com formato de conversação e de fácil navegação

API do Serviço de Inteligência de Vinculação de Entidade VISUALIZAÇÃO

Fortaleça os links de dados do aplicativo com desambiguação e reconhecimento de entidade nomeada

Serviço de Decisão Personalizada VISUALIZAÇÃO

Uma API de tomada de decisão contextual baseada em nuvem que se torna melhor com a experiência

Projeto Praga

Controles baseados em gestos

Projeto Cuzco

Evento associado com entradas da Wikipedia

Projeto Nanjing

Cálculos de isócronas

Projeto Abu Dhabi

Matriz de distância

Projeto Joanesburgo

Logística de rota

Projeto Wollongong

Informações de localização

Pronto para incrementar seu aplicativo?