Computer Vision

Servicio de inteligencia artificial que analiza el contenido de imágenes y vídeos

Extraiga información muy completa de las imágenes y los vídeos

Incorpore funcionalidad de visión a sus aplicaciones para impulsar la detectabilidad del contenido, automatizar la extracción de texto, analizar contenido de vídeo en tiempo real y crear productos que pueda usar un público más amplio. Use el procesamiento de datos visuales para etiquetar el contenido con objetos y conceptos, extraer texto, generar descripciones de imágenes, moderar contenido y reconocer el movimiento de personas en espacios físicos. No es necesario tener conocimientos de aprendizaje automático.

Extracción de texto (OCR)

Extraiga texto impreso y manuscrito de imágenes y documentos en varios idiomas y estilos de escritura.

Reconocimiento de imágenes

Aproveche una ontología muy completa que incluye más de 10 000 conceptos y objetos para generar valor con sus recursos visuales.

Análisis espacial

Analice el movimiento de las personas en un espacio en tiempo real.

Implementación flexible

Ejecute Computer Vision en la nube o en el perímetro, en contenedores.

Aplicar fácilmente la visión artificial innovadora

Agregue tecnología de visión artificial de vanguardia a sus propias aplicaciones con una simple llamada API.

Véala en acción

person
person
subway train
Nombre de la característica: Valor
Objetos [ { "rectangle": { "x": 93, "y": 178, "w": 115, "h": 237 }, "object": "person", "confidence": 0.764 }, { "rectangle": { "x": 0, "y": 229, "w": 101, "h": 206 }, "object": "person", "confidence": 0.624 }, { "rectangle": { "x": 161, "y": 31, "w": 439, "h": 423 }, "object": "subway train", "parent": { "object": "train", "parent": { "object": "Land vehicle", "parent": { "object": "Vehicle", "confidence": 0.926 }, "confidence": 0.923 }, "confidence": 0.917 }, "confidence": 0.801 } ]
Etiquetas [ { "name": "train", "confidence": 0.9974923 }, { "name": "platform", "confidence": 0.9955777 }, { "name": "station", "confidence": 0.979665935 }, { "name": "indoor", "confidence": 0.9272351 }, { "name": "subway", "confidence": 0.838868737 }, { "name": "clothing", "confidence": 0.5561282 }, { "name": "person", "confidence": 0.505803 }, { "name": "pulling", "confidence": 0.431911945 } ]
Descripción { "tags": [ "train", "platform", "station", "building", "indoor", "subway", "track", "walking", "waiting", "pulling", "board", "people", "man", "luggage", "standing", "holding", "large", "woman", "suitcase" ], "captions": [ { "text": "people waiting at a train station", "confidence": 0.833144546 } ] }
Formato de la imagen "Jpeg"
Dimensiones de la imagen 462 x 600
Blanco y negro false
Contenido para adultos false
Puntuación de adulto 0.009112834
Escenas sangrientas false
Puntuación en cuanto a escenas sangrientas 0.046150554
Subido de tono false
Puntuación de subido de tono 0.0143244695
Categorías [ { "name": "trans_trainstation", "score": 0.98828125 } ]
Caras []
Color predominante de fondo
"Black"
Color predominante de primer plano
"Black"
Color de énfasis
#484C83
  1. Vista previa
  2. JSON
{
  "categories": [
    {
      "name": "trans_trainstation",
      "score": 0.98828125
    }
  ],
  "adult": {
    "isAdultContent": false,
    "isGoryContent": false,
    "isRacyContent": false,
    "adultScore": 0.009112834,
    "goreScore": 0.046150554,
    "racyScore": 0.0143244695
  },
  "tags": [
    {
      "name": "train",
      "confidence": 0.9974923
    },
    {
      "name": "platform",
      "confidence": 0.9955777
    },
    {
      "name": "station",
      "confidence": 0.979665935
    },
    {
      "name": "indoor",
      "confidence": 0.9272351
    },
    {
      "name": "subway",
      "confidence": 0.838868737
    },
    {
      "name": "clothing",
      "confidence": 0.5561282
    },
    {
      "name": "person",
      "confidence": 0.505803
    },
    {
      "name": "pulling",
      "confidence": 0.431911945
    }
  ],
  "description": {
    "tags": [
      "train",
      "platform",
      "station",
      "building",
      "indoor",
      "subway",
      "track",
      "walking",
      "waiting",
      "pulling",
      "board",
      "people",
      "man",
      "luggage",
      "standing",
      "holding",
      "large",
      "woman",
      "suitcase"
    ],
    "captions": [
      {
        "text": "people waiting at a train station",
        "confidence": 0.833144546
      }
    ]
  },
  "requestId": "fa6051bf-3758-4dbc-ab06-d3c6a5793840",
  "metadata": {
    "width": 600,
    "height": 462,
    "format": "Jpeg"
  },
  "faces": [],
  "color": {
    "dominantColorForeground": "Black",
    "dominantColorBackground": "Black",
    "accentColor": "484C83",
    "isBWImg": false
  },
  "objects": [
    {
      "rectangle": {
        "x": 93,
        "y": 178,
        "w": 115,
        "h": 237
      },
      "object": "person",
      "confidence": 0.764
    },
    {
      "rectangle": {
        "x": 0,
        "y": 229,
        "w": 101,
        "h": 206
      },
      "object": "person",
      "confidence": 0.624
    },
    {
      "rectangle": {
        "x": 161,
        "y": 31,
        "w": 439,
        "h": 423
      },
      "object": "subway train",
      "parent": {
        "object": "train",
        "parent": {
          "object": "Land vehicle",
          "parent": {
            "object": "Vehicle",
            "confidence": 0.926
          },
          "confidence": 0.923
        },
        "confidence": 0.917
      },
      "confidence": 0.801
    }
  ]
}
{
  "categories": [
    {
      "name": "trans_trainstation",
      "score": 0.98828125
    }
  ],
  "adult": {
    "isAdultContent": false,
    "isGoryContent": false,
    "isRacyContent": false,
    "adultScore": 0.009112834,
    "goreScore": 0.046150554,
    "racyScore": 0.0143244695
  },
  "tags": [
    {
      "name": "train",
      "confidence": 0.9974923
    },
    {
      "name": "platform",
      "confidence": 0.9955777
    },
    {
      "name": "station",
      "confidence": 0.979665935
    },
    {
      "name": "indoor",
      "confidence": 0.9272351
    },
    {
      "name": "subway",
      "confidence": 0.838868737
    },
    {
      "name": "clothing",
      "confidence": 0.5561282
    },
    {
      "name": "person",
      "confidence": 0.505803
    },
    {
      "name": "pulling",
      "confidence": 0.431911945
    }
  ],
  "description": {
    "tags": [
      "train",
      "platform",
      "station",
      "building",
      "indoor",
      "subway",
      "track",
      "walking",
      "waiting",
      "pulling",
      "board",
      "people",
      "man",
      "luggage",
      "standing",
      "holding",
      "large",
      "woman",
      "suitcase"
    ],
    "captions": [
      {
        "text": "people waiting at a train station",
        "confidence": 0.833144546
      }
    ]
  },
  "requestId": "fa6051bf-3758-4dbc-ab06-d3c6a5793840",
  "metadata": {
    "width": 600,
    "height": 462,
    "format": "Jpeg"
  },
  "faces": [],
  "color": {
    "dominantColorForeground": "Black",
    "dominantColorBackground": "Black",
    "accentColor": "484C83",
    "isBWImg": false
  },
  "objects": [
    {
      "rectangle": {
        "x": 93,
        "y": 178,
        "w": 115,
        "h": 237
      },
      "object": "person",
      "confidence": 0.764
    },
    {
      "rectangle": {
        "x": 0,
        "y": 229,
        "w": 101,
        "h": 206
      },
      "object": "person",
      "confidence": 0.624
    },
    {
      "rectangle": {
        "x": 161,
        "y": 31,
        "w": 439,
        "h": 423
      },
      "object": "subway train",
      "parent": {
        "object": "train",
        "parent": {
          "object": "Land vehicle",
          "parent": {
            "object": "Vehicle",
            "confidence": 0.926
          },
          "confidence": 0.923
        },
        "confidence": 0.917
      },
      "confidence": 0.801
    }
  ]
}

Transformar los procesos

Identifique más de 10 000 objetos y conceptos en las imágenes de manera automática. Extraiga texto impreso y manuscrito de varios tipos de imágenes y documentos, aprovechando la compatibilidad con múltiples idiomas y estilos de escritura. Aplique estas características de Computer Vision para optimizar los procesos, como la automatización de procesos robóticos y la administración de activos digitales.

Maximice el valor del espacio físico de su organización

Habilite el reconocimiento del movimiento de personas en un espacio físico, ya sea una oficina o una tienda. Cree aplicaciones que puedan contar el número de personas que hay en una sala, seguir rutas, reconocer el tiempo que permanece la gente delante de un expositor y determinar el tiempo de espera en las colas. Use estas características para crear soluciones que permitan administrar el aforo y el distanciamiento social, optimizar la distribución de las tiendas y las oficinas, así como acelerar el proceso de pago. Ejecute el servicio en varias cámaras y lugares.

Más información acerca de esta característica

Implemente soluciones en cualquier parte, desde la nube hasta el perímetro

Ejecute Computer Vision en la nube o en el entorno local con contenedores. Aplíquelo a diversos escenarios, como el examen de imágenes de historias clínicas, la extracción de texto de documentos protegidos o el análisis de cómo se mueven las personas en una tienda, donde la seguridad de los datos y la baja latencia son primordiales.

Aprender sobre Computer Vision en contenedores

Básese en la seguridad destacada de Azure

  • Microsoft invierte más de USD 1 billion al año en la investigación y el desarrollo de la ciberseguridad.

  • Tenemos contratados más de 3500 expertos en seguridad dedicados exclusivamente a la seguridad y la privacidad de sus datos.

  • Azure tiene más certificaciones que cualquier otro proveedor en la nube. Vea la lista completa.

Visión artificial de talla mundial a precios competitivos

Pague solo por lo que usa, sin costos por adelantado. Con Computer Vision, tan solo paga por lo que usa en función del número de transacciones.

Introducción a Computer Vision en tres pasos

Consiga acceso inmediato y un crédito por valor de $200 al registrarse para obtener una cuenta gratuita de Azure.

Inicie sesión en Azure Portal y agregue Computer Vision.

Aprenda cómo insertar Computer Vision con inicios rápidos y documentación.

Documentación y recursos

Introducción

Consulte la documentación

Realice cursos de Microsoft Learn

Explore nuestros ejemplos de código

Eche un vistazo a nuestro código de ejemplo

Actualizaciones, blogs y anuncios de Computer Vision

Preguntas más frecuentes sobre Computer Vision

  • Computer Vision y otras ofertas de Cognitive Services garantizan una disponibilidad del 99,9 por ciento. No se proporciona ningún Acuerdo de Nivel de Servicio para el plan de tarifa Gratis. Consulte los detalles del Acuerdo de Nivel de Servicio.
  • Las imágenes y los vídeos se eliminan automáticamente después de procesarlos. Microsoft no entrena en sus datos para mejorar los modelos subyacentes. Los datos de vídeo no salen de su entorno local ni se almacenan en la puerta de enlace perimetral donde se ejecuta el contenedor. Obtenga más información sobre la privacidad y los términos de uso.
  • Sí, puede extraer imágenes únicas del contenido de vídeo. Con el “análisis espacial”, puede analizar transmisiones de vídeo a una velocidad de fotogramas alta usando cámaras conectadas mediante el protocolo RTSP.
  • El “análisis espacial” solo detecta y localiza la presencia de personas en contenido de vídeo con un rectángulo de selección alrededor del cuerpo. Los modelos de inteligencia artificial no detectan caras ni descubren la identidad ni los datos demográficos de las personas.
  • Los modelos de inteligencia artificial detectan y realizan un seguimiento de los movimientos de la fuente de vídeo en función de algoritmos que identifican la presencia de una o varias personas con un rectángulo de selección alrededor del cuerpo. Para cada movimiento del rectángulo de selección detectado en una zona del campo de visión de la cámara, los modelos de inteligencia artificial generan datos de evento, entre los que se incluyen las coordenadas del rectángulo de selección del cuerpo de la persona, el tipo de evento (por ejemplo, entrada o salida de una zona, cruce direccional de una línea), un identificador seudónimo para el seguimiento del rectángulo de selección y una puntuación del nivel de confianza de la detección. Estos datos de evento se envían a su propia instancia de Azure IoT Hub.

Cuando quiera, podemos configurar su cuenta gratuita de Azure