Computer Vision

Extraiga información muy completa de las imágenes para clasificar y procesar datos visuales y llevar a cabo una moderación automática de las imágenes con el fin de facilitar el mantenimiento de los servicios.

Analizar una imagen

Esta característica devuelve información sobre el contenido visual de una imagen. Use etiquetado, modelos específicos del dominio y descripciones en cuatro idiomas para identificar el contenido y etiquetarlo con confianza. Use la detección de objetos para obtener la ubicación de miles de objetos dentro de una imagen. Aplique configuración de contenido para adultos o subido de tono para facilitar la detección de este tipo de contenido. Identifique los tipos y los esquemas de color de las imágenes.

Véala en acción

Nombre de la característica: Valor
Objetos [ { "rectangle": { "x": 93, "y": 178, "w": 115, "h": 237 }, "object": "person", "confidence": 0.764 }, { "rectangle": { "x": 0, "y": 229, "w": 101, "h": 206 }, "object": "person", "confidence": 0.624 }, { "rectangle": { "x": 161, "y": 31, "w": 439, "h": 423 }, "object": "subway train", "parent": { "object": "train", "parent": { "object": "Land vehicle", "parent": { "object": "Vehicle", "confidence": 0.926 }, "confidence": 0.923 }, "confidence": 0.917 }, "confidence": 0.801 } ]
Etiquetas [ { "name": "train", "confidence": 0.9975446 }, { "name": "platform", "confidence": 0.995543063 }, { "name": "station", "confidence": 0.9798007 }, { "name": "indoor", "confidence": 0.9277198 }, { "name": "subway", "confidence": 0.838939548 }, { "name": "clothing", "confidence": 0.504376 }, { "name": "pulling", "confidence": 0.4317156 } ]
Descripción { "tags": [ "train", "platform", "station", "building", "indoor", "subway", "track", "walking", "waiting", "pulling", "board", "people", "man", "luggage", "standing", "holding", "large", "woman", "yellow", "suitcase" ], "captions": [ { "text": "people waiting at a train station", "confidence": 0.8330993 } ] }
Formato de la imagen "Jpeg"
Dimensiones de la imagen 462 x 600
Tipo de imagen prediseñada 0
Tipo de dibujo lineal 0
Blanco y negro false
Contenido para adultos false
Puntuación de adulto 0.009112834
Subido de tono false
Puntuación de subido de tono 0.0143244695
Categorías [ { "name": "trans_trainstation", "score": 0.98828125 } ]
Caras []
Color predominante de fondo
"Black"
Color predominante de primer plano
"Black"
Color de énfasis
#484C83

¿Desea crear esto?

Lectura de texto de las imágenes

Detect text in an image using optical character recognition (OCR) and extract the recognized words into a machine-readable character stream. Analyze images to detect embedded text, generate character streams, and enable searching. Save time and effort by taking photos of text instead of copying it.

Get started with the OCR service in general availability, and discover below a sneak peek of the new preview OCR engine (through "Recognize Text" API operation) with even better text recognition results for English.

Véala en acción

  1. Vista previa
  2. JSON

Sorry!

Have a

Oops!

nice day !

See you soon !

Bye !

{
  "status": "Succeeded",
  "succeeded": true,
  "failed": false,
  "finished": true,
  "recognitionResult": {
    "lines": [
      {
        "boundingBox": [
          124,
          126,
          399,
          90,
          407,
          199,
          140,
          229
        ],
        "text": "Sorry!",
        "words": [
          {
            "boundingBox": [
              137,
              121,
              397,
              89,
              410,
              198,
              150,
              229
            ],
            "text": "Sorry!"
          }
        ]
      },
      {
        "boundingBox": [
          591,
          173,
          908,
          124,
          921,
          207,
          604,
          256
        ],
        "text": "Have a",
        "words": [
          {
            "boundingBox": [
              598,
              173,
              812,
              140,
              824,
              224,
              610,
              256
            ],
            "text": "Have"
          },
          {
            "boundingBox": [
              834,
              136,
              894,
              127,
              906,
              212,
              846,
              221
            ],
            "text": "a"
          }
        ]
      },
      {
        "boundingBox": [
          199,
          379,
          424,
          365,
          423,
          476,
          209,
          488
        ],
        "text": "Oops!",
        "words": [
          {
            "boundingBox": [
              205,
              377,
              420,
              364,
              426,
              475,
              212,
              488
            ],
            "text": "Oops!"
          }
        ]
      },
      {
        "boundingBox": [
          583,
          267,
          973,
          224,
          982,
          305,
          592,
          348
        ],
        "text": "nice day !",
        "words": [
          {
            "boundingBox": [
              584,
              271,
              762,
              251,
              771,
              330,
              593,
              344
            ],
            "text": "nice"
          },
          {
            "boundingBox": [
              810,
              245,
              940,
              229,
              949,
              310,
              819,
              325
            ],
            "text": "day"
          },
          {
            "boundingBox": [
              954,
              227,
              973,
              225,
              982,
              306,
              963,
              308
            ],
            "text": "!"
          }
        ]
      },
      {
        "boundingBox": [
          166,
          628,
          662,
          599,
          667,
          683,
          170,
          712
        ],
        "text": "See you soon !",
        "words": [
          {
            "boundingBox": [
              172,
              628,
              295,
              624,
              300,
              704,
              178,
              712
            ],
            "text": "See"
          },
          {
            "boundingBox": [
              312,
              623,
              446,
              618,
              449,
              692,
              316,
              702
            ],
            "text": "you"
          },
          {
            "boundingBox": [
              463,
              617,
              620,
              611,
              620,
              680,
              465,
              691
            ],
            "text": "soon"
          },
          {
            "boundingBox": [
              636,
              610,
              659,
              609,
              658,
              677,
              636,
              679
            ],
            "text": "!"
          }
        ]
      },
      {
        "boundingBox": [
          824,
          498,
          1003,
          489,
          1014,
          594,
          834,
          607
        ],
        "text": "Bye !",
        "words": [
          {
            "boundingBox": [
              830,
              497,
              961,
              489,
              967,
              598,
              837,
              606
            ],
            "text": "Bye"
          },
          {
            "boundingBox": [
              982,
              488,
              1004,
              486,
              1011,
              595,
              989,
              597
            ],
            "text": "!"
          }
        ]
      }
    ]
  }
}

Demo results are for illustrative purposes only - due to minor image manipulations applied, actual API results may differ.

¿Desea crear esto?

Vista previa: Lea texto manuscrito de imágenes

Detecte y extraiga texto escrito a mano de notas, cartas, ensayos, pizarras, formularios y otros orígenes. Reduzca el desorden de papeles y sea más productivo tomando fotos de las notas manuscritas en lugar de transcribirlas; y facilite la búsqueda de las notas digitales implementando funcionalidad de búsqueda. El OCR de escritura a mano funciona con diferentes superficies y fondos, como papel blanco, notas adhesivas amarillas y pizarras.

Nota: Esta tecnología está actualmente en versión preliminar y solo está disponible para textos en inglés.

Los resultados de la demostración son solo para fines ilustrativos. Debido a las pequeñas manipulaciones de imagen aplicadas, los resultados reales de la API pueden ser diferentes.

Véala en acción

  1. Vista previa
  2. JSON

OUR greatest glory is not

in never failing

but in rising every time we fall

{
  "status": "Succeeded",
  "succeeded": true,
  "failed": false,
  "finished": true,
  "recognitionResult": {
    "lines": [
      {
        "boundingBox": [
          62,
          199,
          673,
          204,
          672,
          257,
          62,
          253
        ],
        "text": "OUR greatest glory is not",
        "words": [
          {
            "boundingBox": [
              66,
              200,
              168,
              202,
              167,
              254,
              66,
              254
            ],
            "text": "OUR"
          },
          {
            "boundingBox": [
              196,
              202,
              360,
              204,
              360,
              255,
              195,
              255
            ],
            "text": "greatest"
          },
          {
            "boundingBox": [
              395,
              205,
              510,
              206,
              510,
              255,
              394,
              255
            ],
            "text": "glory"
          },
          {
            "boundingBox": [
              545,
              206,
              598,
              207,
              597,
              255,
              545,
              255
            ],
            "text": "is"
          },
          {
            "boundingBox": [
              608,
              207,
              671,
              208,
              671,
              254,
              608,
              255
            ],
            "text": "not"
          }
        ]
      },
      {
        "boundingBox": [
          520,
          305,
          873,
          300,
          874,
          358,
          521,
          362
        ],
        "text": "in never failing",
        "words": [
          {
            "boundingBox": [
              524,
              315,
              561,
              313,
              562,
              354,
              526,
              353
            ],
            "text": "in"
          },
          {
            "boundingBox": [
              600,
              311,
              701,
              306,
              703,
              357,
              602,
              355
            ],
            "text": "never"
          },
          {
            "boundingBox": [
              733,
              305,
              871,
              301,
              872,
              359,
              735,
              358
            ],
            "text": "failing"
          }
        ]
      },
      {
        "boundingBox": [
          133,
          412,
          971,
          407,
          972,
          461,
          134,
          467
        ],
        "text": "but in rising every time we fall",
        "words": [
          {
            "boundingBox": [
              137,
              416,
              214,
              417,
              216,
              461,
              139,
              458
            ],
            "text": "but"
          },
          {
            "boundingBox": [
              228,
              418,
              272,
              418,
              274,
              462,
              230,
              461
            ],
            "text": "in"
          },
          {
            "boundingBox": [
              308,
              419,
              424,
              419,
              425,
              464,
              309,
              463
            ],
            "text": "rising"
          },
          {
            "boundingBox": [
              474,
              419,
              579,
              418,
              580,
              464,
              475,
              465
            ],
            "text": "every"
          },
          {
            "boundingBox": [
              623,
              417,
              720,
              415,
              720,
              463,
              624,
              464
            ],
            "text": "time"
          },
          {
            "boundingBox": [
              767,
              414,
              828,
              412,
              828,
              460,
              767,
              462
            ],
            "text": "we"
          },
          {
            "boundingBox": [
              877,
              411,
              971,
              407,
              971,
              455,
              877,
              459
            ],
            "text": "fall"
          }
        ]
      }
    ]
  }
}

¿Desea crear esto?

Reconocimiento de celebridades y puntos de referencia

Reconozca a más de 1.000.000 celebridades del mundo de los negocios, la política, el deporte y el ocio, así como 9.000 lugares emblemáticos naturales o creados por el hombre.

Véala en acción

{
  "categories": [
    {
      "name": "people_",
      "score": 0.86328125,
      "detail": {
        "celebrities": [
          {
            "name": "Satya Nadella",
            "faceRectangle": {
              "left": 240,
              "top": 294,
              "width": 135,
              "height": 135
            },
            "confidence": 0.99984323978424072
          }
        ],
        "landmarks": null
      }
    }
  ],
  "adult": null,
  "tags": [
    {
      "name": "person",
      "confidence": 0.99956613779067993
    },
    {
      "name": "suit",
      "confidence": 0.98934584856033325
    },
    {
      "name": "man",
      "confidence": 0.98844343423843384
    },
    {
      "name": "tie",
      "confidence": 0.95905411243438721
    },
    {
      "name": "human face",
      "confidence": 0.95430314540863037
    },
    {
      "name": "clothing",
      "confidence": 0.86057531833648682
    },
    {
      "name": "smile",
      "confidence": 0.8601078987121582
    },
    {
      "name": "outdoor",
      "confidence": 0.860062301158905
    },
    {
      "name": "glasses",
      "confidence": 0.68438893556594849
    }
  ],
  "description": {
    "tags": [
      "person",
      "suit",
      "man",
      "necktie",
      "outdoor",
      "building",
      "clothing",
      "standing",
      "wearing",
      "business",
      "looking",
      "holding",
      "black",
      "front",
      "hand",
      "dressed",
      "phone",
      "field"
    ],
    "captions": [
      {
        "text": "Satya Nadella wearing a suit and tie",
        "confidence": 0.99032750982666984
      }
    ]
  },
  "requestId": "fb7a47fb-f770-4349-bb32-d809cc72433f",
  "metadata": {
    "width": 600,
    "height": 900,
    "format": "Jpeg"
  },
  "faces": [
    {
      "age": 49,
      "gender": "Male",
      "faceRectangle": {
        "left": 240,
        "top": 294,
        "width": 135,
        "height": 135
      }
    }
  ],
  "color": {
    "dominantColorForeground": "Black",
    "dominantColorBackground": "Black",
    "dominantColors": [
      "Black",
      "Grey"
    ],
    "accentColor": "7B5E50",
    "isBWImg": false
  },
  "imageType": {
    "clipArtType": 0,
    "lineDrawingType": 0
  }
}

¿Desea crear esto?

Analice vídeo prácticamente tiempo real

Analice vídeo casi en tiempo real. Utilice cualquiera de las Computer Vision API con sus archivos de vídeo mediante la extracción de fotogramas del vídeo del dispositivo y el envío posterior de dichos fotogramas a las llamadas API que prefiera. Obtenga resultados de sus vídeos más rápido.

Utilice nuestro ejemplo en GitHub para empezar y crear su propia aplicación.

Más información

Véala en acción

¿Desea crear esto?

Generar una miniatura

Genere miniaturas de alta calidad de cualquier tipo de imágenes para un almacenamiento eficiente y modifique imágenes para adaptarlas a sus necesidades de tamaño, forma y estilo. Aplique recorte inteligente para generar miniaturas distintas de la relación de aspecto de su imagen original, conservando la región de interés.

Véala en acción

¿Desea crear esto?

Vea las API de Cognitive Services

Computer Vision

Condense información de aplicación práctica a partir de imágenes

Face

Detecte, identifique, analice, organice y etiquete caras en las fotos

Ink Recognizer VERSIÓN PRELIMINAR

Servicio de inteligencia artificial que reconoce contenido de lápiz digital, como escritura manual, formas y el diseño de documentos en tinta digital

Video Indexer

Obtenga conocimiento de sus vídeos

Custom Vision

Personalice fácilmente los novedosos modelos de visión artificial para adaptarlos a su caso particular

Form Recognizer VERSIÓN PRELIMINAR

Servicio de extracción de documentos basado en inteligencia artificial que reconoce sus formularios

Análisis de texto

Evaluar fácilmente las opiniones y temas para comprender lo que los usuarios quieren

Translator Text

Realice fácilmente una traducción automática con una llamada a la API de REST sencilla

Bing Spell Check

Detecte y corrija errores ortográficos en las aplicaciones

QnA Maker

Convierta la información en respuestas de conversación de fácil navegación

Content Moderator

Moderación automatizada de imágenes, texto y vídeo

Language Understanding

Enseñe a las aplicaciones a entender los comandos de sus usuarios

Servicios de voz

Servicios de voz unificados para la conversión de voz en texto y de texto en voz, y para la traducción de voz.