Computer Vision

Extraiga información muy completa de las imágenes para clasificar y procesar datos visuales y llevar a cabo una moderación automática de las imágenes con el fin de facilitar el mantenimiento de los servicios.

Analizar una imagen

Esta característica devuelve información sobre el contenido visual de una imagen. Use etiquetado, modelos específicos del dominio y descripciones en cuatro idiomas para identificar el contenido y etiquetarlo con confianza. Use la detección de objetos para obtener la ubicación de miles de objetos dentro de una imagen. Aplique configuración de contenido para adultos o subido de tono para facilitar la detección de este tipo de contenido. Identifique los tipos y los esquemas de color de las imágenes.

Véala en acción

person
person
subway train
Nombre de la característica: Valor
Objetos [ { "rectangle": { "x": 93, "y": 178, "w": 115, "h": 237 }, "object": "person", "confidence": 0.764 }, { "rectangle": { "x": 0, "y": 229, "w": 101, "h": 206 }, "object": "person", "confidence": 0.624 }, { "rectangle": { "x": 161, "y": 31, "w": 439, "h": 423 }, "object": "subway train", "parent": { "object": "train", "parent": { "object": "Land vehicle", "parent": { "object": "Vehicle", "confidence": 0.926 }, "confidence": 0.923 }, "confidence": 0.917 }, "confidence": 0.801 } ]
Etiquetas [ { "name": "train", "confidence": 0.9975446 }, { "name": "platform", "confidence": 0.9955431 }, { "name": "station", "confidence": 0.979800761 }, { "name": "indoor", "confidence": 0.9277198 }, { "name": "subway", "confidence": 0.8389395 }, { "name": "clothing", "confidence": 0.5043765 }, { "name": "pulling", "confidence": 0.4317162 } ]
Descripción { "tags": [ "train", "platform", "station", "building", "indoor", "subway", "track", "walking", "waiting", "pulling", "board", "people", "man", "luggage", "standing", "holding", "large", "woman", "yellow", "suitcase" ], "captions": [ { "text": "people waiting at a train station", "confidence": 0.8330992 } ] }
Formato de la imagen "Jpeg"
Dimensiones de la imagen 462 x 600
Tipo de imagen prediseñada 0
Tipo de dibujo lineal 0
Blanco y negro false
Contenido para adultos false
Puntuación de adulto 0.009112834
Subido de tono false
Puntuación de subido de tono 0.0143244695
Categorías [ { "name": "trans_trainstation", "score": 0.98828125 } ]
Caras []
Color predominante de fondo
"Black"
Color predominante de primer plano
"Black"
Color de énfasis
#484C83

¿Desea crear esto?

Ya está disponible con carácter general: lea texto impreso y manuscrito en las imágenes

Use el reconocimiento óptico de caracteres (OCR) de última generación en la operación de lectura para detectar texto impreso y manuscrito insertado, extraer palabras reconocidas en secuencias de caracteres legibles por máquina y habilitar la búsqueda. Ahorre tiempo y esfuerzo haciendo fotos del texto en lugar de copiarlo.

Véala en acción

  1. Vista previa
  2. JSON

Sorry!

Have a

Oops!

nice day !

See you soon !

Bye !

{
  "status": "Succeeded",
  "succeeded": true,
  "failed": false,
  "finished": true,
  "recognitionResults": [
    {
      "page": 1,
      "clockwiseOrientation": 353.71,
      "width": 1138,
      "height": 825,
      "unit": "pixel",
      "lines": [
        {
          "boundingBox": [
            124,
            126,
            399,
            90,
            407,
            199,
            140,
            229
          ],
          "text": "Sorry!",
          "words": [
            {
              "boundingBox": [
                137,
                121,
                397,
                89,
                410,
                198,
                150,
                229
              ],
              "text": "Sorry!"
            }
          ]
        },
        {
          "boundingBox": [
            591,
            173,
            908,
            124,
            921,
            207,
            604,
            256
          ],
          "text": "Have a",
          "words": [
            {
              "boundingBox": [
                598,
                173,
                812,
                140,
                824,
                224,
                610,
                256
              ],
              "text": "Have"
            },
            {
              "boundingBox": [
                834,
                136,
                894,
                127,
                906,
                212,
                846,
                221
              ],
              "text": "a"
            }
          ]
        },
        {
          "boundingBox": [
            199,
            379,
            424,
            365,
            423,
            476,
            209,
            488
          ],
          "text": "Oops!",
          "words": [
            {
              "boundingBox": [
                205,
                377,
                420,
                364,
                426,
                475,
                212,
                488
              ],
              "text": "Oops!"
            }
          ]
        },
        {
          "boundingBox": [
            583,
            267,
            973,
            224,
            982,
            305,
            592,
            348
          ],
          "text": "nice day !",
          "words": [
            {
              "boundingBox": [
                584,
                271,
                762,
                251,
                771,
                330,
                593,
                344
              ],
              "text": "nice"
            },
            {
              "boundingBox": [
                810,
                245,
                940,
                229,
                949,
                310,
                819,
                325
              ],
              "text": "day"
            },
            {
              "boundingBox": [
                954,
                227,
                973,
                225,
                982,
                306,
                963,
                308
              ],
              "text": "!"
            }
          ]
        },
        {
          "boundingBox": [
            166,
            628,
            662,
            599,
            667,
            683,
            170,
            712
          ],
          "text": "See you soon !",
          "words": [
            {
              "boundingBox": [
                172,
                628,
                295,
                624,
                300,
                704,
                178,
                712
              ],
              "text": "See"
            },
            {
              "boundingBox": [
                312,
                623,
                446,
                618,
                449,
                692,
                316,
                702
              ],
              "text": "you"
            },
            {
              "boundingBox": [
                463,
                617,
                620,
                611,
                620,
                680,
                465,
                691
              ],
              "text": "soon"
            },
            {
              "boundingBox": [
                636,
                610,
                659,
                609,
                658,
                677,
                636,
                679
              ],
              "text": "!"
            }
          ]
        },
        {
          "boundingBox": [
            824,
            498,
            1003,
            489,
            1014,
            594,
            834,
            607
          ],
          "text": "Bye !",
          "words": [
            {
              "boundingBox": [
                830,
                497,
                961,
                489,
                967,
                598,
                837,
                606
              ],
              "text": "Bye"
            },
            {
              "boundingBox": [
                982,
                488,
                1004,
                486,
                1011,
                595,
                989,
                597
              ],
              "text": "!"
            }
          ]
        }
      ]
    }
  ]
}

Los resultados de la demostración son solo para fines ilustrativos. Debido a las pequeñas manipulaciones de imagen aplicadas, los resultados reales de la API pueden ser diferentes.

¿Desea crear esto?

Reconocimiento de marcas, celebridades y lugares emblemáticos

Reconozca más de 1.500 marcas y logotipos mundiales, a un millón de celebridades del mundo de los negocios, la política, el deporte y el ocio, así como 9.000 lugares emblemáticos naturales o creados por el hombre.

Véala en acción

{
  "categories": [
    {
      "name": "people_",
      "score": 0.86328125,
      "detail": {
        "celebrities": [
          {
            "name": "Satya Nadella",
            "faceRectangle": {
              "left": 240,
              "top": 294,
              "width": 135,
              "height": 135
            },
            "confidence": 0.99984323978424072
          }
        ],
        "landmarks": null
      }
    }
  ],
  "adult": null,
  "tags": [
    {
      "name": "person",
      "confidence": 0.99956607818603516
    },
    {
      "name": "suit",
      "confidence": 0.98934578895568848
    },
    {
      "name": "man",
      "confidence": 0.98844337463378906
    },
    {
      "name": "tie",
      "confidence": 0.959053635597229
    },
    {
      "name": "human face",
      "confidence": 0.95430314540863037
    },
    {
      "name": "clothing",
      "confidence": 0.860575795173645
    },
    {
      "name": "smile",
      "confidence": 0.8601078987121582
    },
    {
      "name": "outdoor",
      "confidence": 0.86006265878677368
    },
    {
      "name": "glasses",
      "confidence": 0.68438893556594849
    }
  ],
  "description": {
    "tags": [
      "person",
      "suit",
      "man",
      "necktie",
      "outdoor",
      "building",
      "clothing",
      "standing",
      "wearing",
      "business",
      "looking",
      "holding",
      "black",
      "front",
      "hand",
      "dressed",
      "phone",
      "field"
    ],
    "captions": [
      {
        "text": "Satya Nadella wearing a suit and tie",
        "confidence": 0.99032749706305134
      }
    ]
  },
  "requestId": "1a999a7e-71d7-494a-a03a-a814ec9245fd",
  "metadata": {
    "width": 600,
    "height": 900,
    "format": "Jpeg"
  },
  "faces": [
    {
      "age": 49,
      "gender": "Male",
      "faceRectangle": {
        "left": 240,
        "top": 294,
        "width": 135,
        "height": 135
      }
    }
  ],
  "color": {
    "dominantColorForeground": "Black",
    "dominantColorBackground": "Black",
    "dominantColors": [
      "Black",
      "Grey"
    ],
    "accentColor": "7B5E50",
    "isBWImg": false
  },
  "imageType": {
    "clipArtType": 0,
    "lineDrawingType": 0
  },
  "brands": []
}

¿Desea crear esto?

Analice vídeo prácticamente tiempo real

Analice vídeo casi en tiempo real. Utilice cualquiera de las Computer Vision API con sus archivos de vídeo mediante la extracción de fotogramas del vídeo del dispositivo y el envío posterior de dichos fotogramas a las llamadas API que prefiera. Obtenga resultados de sus vídeos más rápido.

Utilice nuestro ejemplo en GitHub para empezar y crear su propia aplicación.

Más información

Véala en acción

¿Desea crear esto?

Generar una miniatura

Genere miniaturas de alta calidad de cualquier tipo de imágenes para un almacenamiento eficiente y modifique imágenes para adaptarlas a sus necesidades de tamaño, forma y estilo. Aplique recorte inteligente para generar miniaturas distintas de la relación de aspecto de su imagen original, conservando la región de interés.

Véala en acción

¿Desea crear esto?

"We can use the Computer Vision API to prove to our clients the reliability of the data, so they can be confident making important business decisions based on that information"

Leendert de Voogd: consejero delegado | Vigiglobe
vigiglobe

"It didn't take us long to realize Microsoft Cognitive Services had handed us a powerful set of computer-vision and artificial-intelligence tools that we could use to create great apps and new features for our customers in just a few hours"

John Fan: cofundador y consejero delegado | Cardinal Blue Software
Pic Collage

"Because the Cognitive Services APIs harness the power of machine learning, we were able to bring advanced intelligence into our product without the need to have a team of data scientists on hand"

Aaron Edell: responsable de productos | GrayMeta
GrayMeta

"We found Cognitive Services to be the missing piece in the equation, the one that we needed to bring this solution to market and really revolutionize the way people look at video"

Katie McCann: vicepresidenta de productos e ingeniería | Prism Skylabs
Prism Skylabs

"Microsoft Cognitive Services gives us a huge range of opportunities. It's a perfect match for us now, and in the future when we want to add more features to our app"

Jaan Apajalahti: consejero delegado | Blucup
Blucup

"Using the Cognitive Services APIs, it took us three months to develop a test pair of glasses that can translate text and images into speech, identify emotions, and describe scenery.If we had been working full time, we could have done it in two weeks"

Benoit Chirouter: director de I+D | Pivothead
Pivothead

Vea las API de Cognitive Services

Computer Vision

Condense información de aplicación práctica a partir de imágenes

Face

Detecte, identifique, analice, organice y etiquete caras en las fotos

Ink Recognizer

Servicio de inteligencia artificial que reconoce contenido de lápiz digital, como escritura manual, formas y el diseño de documentos en tinta digital

Video Indexer

Obtenga conocimiento de sus vídeos

Custom Vision

Personalice fácilmente los novedosos modelos de visión artificial para adaptarlos a su caso particular

Form Recognizer

Servicio de extracción de documentos basado en inteligencia artificial que reconoce sus formularios

Análisis de texto

Evaluar fácilmente las opiniones y temas para comprender lo que los usuarios quieren

Translator Text

Realice fácilmente una traducción automática con una llamada a la API de REST sencilla

QnA Maker

Convierta la información en respuestas de conversación de fácil navegación

Language Understanding

Enseñe a las aplicaciones a entender los comandos de sus usuarios

Immersive Reader

Dé capacidad para leer y comprender textos a usuarios de todas las edades y capacidades

Servicios de voz

Servicios de voz unificados para la conversión de voz en texto y de texto en voz, y para la traducción de voz.

Speaker Recognition

Use la voz para la identificación y verificación de hablantes individuales

Traducción de voz

Integre fácilmente traducción de voz en tiempo real en sus aplicaciones

Conversión de voz en texto

Speech to Text API forma parte de los servicios de voz de Azure Cognitive Services.

Text to Speech

Convierta texto en voz para crear interfaces más naturales y accesibles

Content Moderator

Moderación automatizada de imágenes, texto y vídeo

Anomaly Detector

Agregue funcionalidades de detección de anomalías a sus aplicaciones con facilidad.

Personalizer

Servicio de inteligencia artificial que ofrece una experiencia del usuario personalizada

¿Preparado para aumentar el potencial de su aplicación?