Computer Vision

Servicio de inteligencia artificial que analiza el contenido de imágenes y vídeos

Extraiga información muy completa de las imágenes y los vídeos

Incorpore funcionalidad de visión en la nube a sus aplicaciones con Computer Vision, que forma parte de Azure Cognitive Services, para impulsar la detectabilidad del contenido, automatizar la extracción de texto, analizar contenido de vídeo en tiempo real y crear productos que pueda usar un público más amplio. Use el procesamiento de datos visuales para etiquetar el contenido con objetos y conceptos, extraer texto, generar descripciones de imágenes, moderar contenido y reconocer el movimiento de personas en espacios físicos. No es necesario tener conocimientos de aprendizaje automático.

Extracción de texto (OCR)

Extraiga texto impreso y manuscrito de imágenes y documentos en varios idiomas y estilos de escritura.

Reconocimiento de imágenes

Aproveche una ontología muy completa que incluye más de 10 000 conceptos y objetos para generar valor con sus recursos visuales.

Análisis espacial

Analice el modo en el que se mueven las personas en un espacio en tiempo real para controlar el aforo, la distancia social y el uso de mascarillas.

Implementación flexible

Ejecute Computer Vision en la nube o en el perímetro, en contenedores.

Aplicar fácilmente la visión artificial innovadora

Agregue tecnología vanguardista de reconocimiento de imágenes y vídeo a sus propias aplicaciones con una sencilla llamada API.

Véala en acción

person
person
subway train
Nombre de la característica: Valor
Objetos [ { "rectangle": { "x": 93, "y": 178, "w": 115, "h": 237 }, "object": "person", "confidence": 0.764 }, { "rectangle": { "x": 0, "y": 229, "w": 101, "h": 206 }, "object": "person", "confidence": 0.624 }, { "rectangle": { "x": 161, "y": 31, "w": 439, "h": 423 }, "object": "subway train", "parent": { "object": "train", "parent": { "object": "Land vehicle", "parent": { "object": "Vehicle", "confidence": 0.926 }, "confidence": 0.923 }, "confidence": 0.917 }, "confidence": 0.801 } ]
Etiquetas [ { "name": "train", "confidence": 0.9974923 }, { "name": "platform", "confidence": 0.9955776 }, { "name": "station", "confidence": 0.9796659 }, { "name": "indoor", "confidence": 0.927235 }, { "name": "subway", "confidence": 0.8388686 }, { "name": "clothing", "confidence": 0.5561277 }, { "name": "person", "confidence": 0.505803 }, { "name": "pulling", "confidence": 0.431911647 } ]
Descripción { "tags": [ "train", "platform", "station", "building", "indoor", "subway", "track", "walking", "waiting", "pulling", "board", "people", "man", "luggage", "standing", "holding", "large", "woman", "suitcase" ], "captions": [ { "text": "people waiting at a train station", "confidence": 0.8331445 } ] }
Formato de la imagen "Jpeg"
Dimensiones de la imagen 462 x 600
Blanco y negro false
Contenido para adultos false
Puntuación de adulto 0.009112843
Escenas sangrientas false
Puntuación en cuanto a escenas sangrientas 0.0461505651
Subido de tono false
Puntuación de subido de tono 0.0143244732
Categorías [ { "name": "trans_trainstation", "score": 0.98828125 } ]
Caras []
Color predominante de fondo
"Black"
Color predominante de primer plano
"Black"
Color de énfasis
#484C83
{
  "categories": [
    {
      "name": "trans_trainstation",
      "score": 0.98828125
    }
  ],
  "adult": {
    "isAdultContent": false,
    "isGoryContent": false,
    "isRacyContent": false,
    "adultScore": 0.009112843,
    "goreScore": 0.0461505651,
    "racyScore": 0.0143244732
  },
  "tags": [
    {
      "name": "train",
      "confidence": 0.9974923
    },
    {
      "name": "platform",
      "confidence": 0.9955776
    },
    {
      "name": "station",
      "confidence": 0.9796659
    },
    {
      "name": "indoor",
      "confidence": 0.927235
    },
    {
      "name": "subway",
      "confidence": 0.8388686
    },
    {
      "name": "clothing",
      "confidence": 0.5561277
    },
    {
      "name": "person",
      "confidence": 0.505803
    },
    {
      "name": "pulling",
      "confidence": 0.431911647
    }
  ],
  "description": {
    "tags": [
      "train",
      "platform",
      "station",
      "building",
      "indoor",
      "subway",
      "track",
      "walking",
      "waiting",
      "pulling",
      "board",
      "people",
      "man",
      "luggage",
      "standing",
      "holding",
      "large",
      "woman",
      "suitcase"
    ],
    "captions": [
      {
        "text": "people waiting at a train station",
        "confidence": 0.8331445
      }
    ]
  },
  "requestId": "c5d4c5b4-7405-4cf9-b5cd-fa90ecb28945",
  "metadata": {
    "width": 600,
    "height": 462,
    "format": "Jpeg"
  },
  "faces": [],
  "color": {
    "dominantColorForeground": "Black",
    "dominantColorBackground": "Black",
    "accentColor": "484C83",
    "isBWImg": false
  },
  "objects": [
    {
      "rectangle": {
        "x": 93,
        "y": 178,
        "w": 115,
        "h": 237
      },
      "object": "person",
      "confidence": 0.764
    },
    {
      "rectangle": {
        "x": 0,
        "y": 229,
        "w": 101,
        "h": 206
      },
      "object": "person",
      "confidence": 0.624
    },
    {
      "rectangle": {
        "x": 161,
        "y": 31,
        "w": 439,
        "h": 423
      },
      "object": "subway train",
      "parent": {
        "object": "train",
        "parent": {
          "object": "Land vehicle",
          "parent": {
            "object": "Vehicle",
            "confidence": 0.926
          },
          "confidence": 0.923
        },
        "confidence": 0.917
      },
      "confidence": 0.801
    }
  ]
}
{
  "categories": [
    {
      "name": "trans_trainstation",
      "score": 0.98828125
    }
  ],
  "adult": {
    "isAdultContent": false,
    "isGoryContent": false,
    "isRacyContent": false,
    "adultScore": 0.009112843,
    "goreScore": 0.0461505651,
    "racyScore": 0.0143244732
  },
  "tags": [
    {
      "name": "train",
      "confidence": 0.9974923
    },
    {
      "name": "platform",
      "confidence": 0.9955776
    },
    {
      "name": "station",
      "confidence": 0.9796659
    },
    {
      "name": "indoor",
      "confidence": 0.927235
    },
    {
      "name": "subway",
      "confidence": 0.8388686
    },
    {
      "name": "clothing",
      "confidence": 0.5561277
    },
    {
      "name": "person",
      "confidence": 0.505803
    },
    {
      "name": "pulling",
      "confidence": 0.431911647
    }
  ],
  "description": {
    "tags": [
      "train",
      "platform",
      "station",
      "building",
      "indoor",
      "subway",
      "track",
      "walking",
      "waiting",
      "pulling",
      "board",
      "people",
      "man",
      "luggage",
      "standing",
      "holding",
      "large",
      "woman",
      "suitcase"
    ],
    "captions": [
      {
        "text": "people waiting at a train station",
        "confidence": 0.8331445
      }
    ]
  },
  "requestId": "c5d4c5b4-7405-4cf9-b5cd-fa90ecb28945",
  "metadata": {
    "width": 600,
    "height": 462,
    "format": "Jpeg"
  },
  "faces": [],
  "color": {
    "dominantColorForeground": "Black",
    "dominantColorBackground": "Black",
    "accentColor": "484C83",
    "isBWImg": false
  },
  "objects": [
    {
      "rectangle": {
        "x": 93,
        "y": 178,
        "w": 115,
        "h": 237
      },
      "object": "person",
      "confidence": 0.764
    },
    {
      "rectangle": {
        "x": 0,
        "y": 229,
        "w": 101,
        "h": 206
      },
      "object": "person",
      "confidence": 0.624
    },
    {
      "rectangle": {
        "x": 161,
        "y": 31,
        "w": 439,
        "h": 423
      },
      "object": "subway train",
      "parent": {
        "object": "train",
        "parent": {
          "object": "Land vehicle",
          "parent": {
            "object": "Vehicle",
            "confidence": 0.926
          },
          "confidence": 0.923
        },
        "confidence": 0.917
      },
      "confidence": 0.801
    }
  ]
}

Transformar los procesos

Identifique más de 10 000 objetos y conceptos en las imágenes de manera automática. Extraiga texto impreso y manuscrito de varios tipos de imágenes y documentos, aprovechando la compatibilidad con múltiples idiomas y estilos de escritura. Aplique estas características de Computer Vision para optimizar los procesos, como la automatización de procesos robóticos y la administración de activos digitales.

Maximice el valor del espacio físico de su organización

Conozca el movimiento de las personas en un espacio físico, ya sea una oficina o una tienda. Utilice la característica de análisis espacial para crear aplicaciones que puedan contar el número de personas que hay en una sala, seguir rutas, reconocer el tiempo que permanece la gente delante de un expositor y determinar el tiempo de espera en las colas. Cree soluciones que permitan controlar el número de personas que hay en un espacio, la distancia social y el uso de mascarillas, optimizar la distribución de las tiendas y las oficinas, así como acelerar el proceso de pago. Ejecute el servicio en varias cámaras y lugares.

Más información acerca de esta característica

Implemente soluciones en cualquier parte, desde la nube hasta el perímetro

Ejecute Computer Vision en la nube o en el entorno local con contenedores. Aplíquelo a diversos escenarios, como el examen de imágenes de historias clínicas, la extracción de texto de documentos protegidos o el análisis de cómo se mueven las personas en una tienda, donde la seguridad de los datos y la baja latencia son primordiales.

Aprender sobre Computer Vision en contenedores

Básese en la seguridad destacada de Azure

  • Microsoft invierte más de USD 1 billion al año en la investigación y el desarrollo de la ciberseguridad.

  • Contamos con más de 3500 expertos en seguridad que se dedican a proteger la seguridad y la privacidad de los datos.

  • Azure tiene más certificaciones de cumplimiento normativo que cualquier otro proveedor de nube. Vea la lista completa.

Visión artificial de talla mundial a precios competitivos

Pague solo por lo que usa, sin costos por adelantado. Con Computer Vision, tan solo paga por lo que usa en función del número de transacciones.

Introducción a Computer Vision en tres pasos

Consiga acceso inmediato y un crédito por valor de $200 al registrarse para obtener una cuenta gratuita de Azure.

Inicie sesión en Azure Portal y agregue Computer Vision.

Aprenda cómo insertar Computer Vision con inicios rápidos y documentación.

Documentación y recursos

Introducción

Read the documentation

Take Microsoft Learn courses

Ver ejemplos de código

Explore a sample app

Preguntas más frecuentes sobre Computer Vision

  • Computer Vision y otras ofertas de Azure Cognitive Services garantizan una disponibilidad del 99,9 %. No se proporciona ningún Acuerdo de Nivel de Servicio para el plan de tarifa Gratis. Consulte los detalles del Acuerdo de Nivel de Servicio.
  • No. Microsoft elimina automáticamente sus imágenes y vídeos después de procesarlos y no utiliza sus datos para mejorar los modelos subyacentes. Los datos de vídeo no salen de su entorno local ni se almacenan en el perímetro donde se ejecuta el contenedor. Obtenga más información sobre la privacidad y los términos de uso.
  • Después de usar Computer Vision para extraer texto de imágenes y vídeo, puede usar Text Analytics para analizar la opinión, Translator para traducir el texto al idioma que desee o el Lector inmersivo para que lea el texto en voz alta, lo que aumenta la accesibilidad. Las características adicionales relacionadas con Computer Vision incluyen Form Recognizer para extraer pares clave-valor y tablas de documentos, Face para detectar y reconocer caras en imágenes, Custom Vision para crear fácilmente su propio modelo de visión artificial desde cero y Content Moderator para detectar imágenes o texto no deseados.
  • No. El análisis espacial detecta y localiza la presencia de personas en contenido de vídeo con un rectángulo de selección alrededor del cuerpo. Los modelos de inteligencia artificial no detectan caras ni determinan la identidad ni los datos demográficos de las personas.
  • Los modelos de inteligencia artificial de análisis espacial detectan y realizan un seguimiento de los movimientos de la fuente de vídeo en función de algoritmos que identifican la presencia de una o varias personas con un rectángulo de selección alrededor del cuerpo. Para cada movimiento del rectángulo de selección detectado en una zona del campo de visión de la cámara, los modelos de inteligencia artificial generan datos de evento, entre los que se incluyen las coordenadas del rectángulo de selección del cuerpo de una persona, el tipo de evento (por ejemplo, entrada o salida de una zona, o cruce direccional de una línea), un identificador seudónimo para el seguimiento del rectángulo de selección y una puntuación del nivel de confianza de la detección. Estos datos de evento se envían a su propia instancia de Azure IoT Hub.

Cuando quiera, podemos configurar su cuenta gratuita de Azure