Análisis multimedia

Servicios de voz y de visión a escala empresarial, con seguridad, cumplimiento normativo y cobertura global

Análisis multimedia de Azure es una colección de componentes de voz y visión que las empresas y organizaciones usan para obtener conocimiento útil de sus archivos de vídeo usando tecnología avanzada de aprendizaje automático. Los servicios de Análisis multimedia se hospedan en la plataforma Azure Media Services, que es la solución multimedia de Azure para codificar, cifrar y hacer streaming de audio o vídeo a escala, en vivo o a petición (VoD). Análisis multimedia se ofrece a escala empresarial y proporciona el cumplimiento normativo, la seguridad y la cobertura global que las grandes organizaciones necesitan.

¿Qué sectores pueden usar Análisis multimedia?

Seguridad pública

  • Analizar pruebas. Recopile contenido multimedia de cámaras de la policía (adheridas al cuerpo), cámaras de vehículos (colocadas en el salpicadero) y otros dispositivos, y analícelo para extraer inteligencia, al tiempo que cumple los requisitos de la cadena de custodia.
  • Proteger la identidad. Edite vídeos para proteger la identidad de las personas y cumplir los requisitos de la Ley de libertad de información.
  • Acelerar las investigaciones. Extraiga datos de contenido multimedia y úselos para crear índices de búsqueda inteligentes que ayuden a agilizar las investigaciones.

Vigilancia

  • Investigar crímenes. Procese vídeo y eventos recopilados de cámaras de vigilancia a escala.
  • Reducir falsos positivos. Lleve a cabo análisis exhaustivos de fragmentos de vídeo asociados a eventos de movimiento procedentes de cámaras de vigilancia para reducir falsos positivos.
  • Resumir la superficie de vigilancia. Genere un resumen inteligente de la superficie de vigilancia mediante Hyperlapse para suavizar vídeos con time-lapse.

Venta al por menor

  • Analizar llamadas de clientes. Utilice Media Indexer para convertir en texto la voz de los datos de audio de las llamadas de soporte al cliente y encontrar patrones.
  • Analizar patrones de clientes. Ponga en correlación los movimientos de clientes por una tienda con datos de ventas para tomar decisiones sobre la ubicación de los productos.

Otros sectores

  • Voz a texto. Es importante para cualquier negocio que proporcione soporte al cliente a través de un centro de llamadas. Utilice el texto extraído de las llamadas de soporte al cliente para crear un índice de búsqueda o analizar el tono del cliente y del representante de este.
  • Reconocimiento óptico de caracteres (OCR). Para cualquier empresa que tenga vídeo que contenga texto, como vídeos con presentaciones de PowerPoint o vídeos de personas con etiquetas de nombre.
  • Reconocimiento de emociones faciales. Para cualquier empresa que tenga vídeos que contengan clientes. Ponga en correlación expresiones faciales con texto extraído mediante Indexer para tomar decisiones sobre interacciones futuras con el cliente.

Componentes disponibles

Indizador

  • Genere automáticamente archivos de subtítulos estándares para sus vídeos.
  • Elija entre una amplia selección de idiomas en constante crecimiento.
  • Extraiga palabras clave del lenguaje hablado para facilitar las búsquedas y las recomendaciones.
  • Use la adaptación de vocabulario personalizado para reconocer contenido de voz específico de un dominio

Más información

Hyperlapse (vista preliminar)

  • Tecnología integrada en más de 20 años de investigación en fotografía computacional.
  • Cree time-lapses homogéneos y estabilizados desde vídeo en primera persona.
  • Compatibilidad para diferentes factores de aumento de velocidad desde x1 a x25.

Más información

Motion Detection (Detección de movimiento) (versión preliminar)

  • Detecte cuando se produce movimiento en vídeos con diseños de fondo.
  • Elimine falsos positivos provocados por cambios de luz, sombras, pequeños insectos y otros problemas.

Más información

Face Detection (Detección de caras) (versión preliminar)

  • Detecte caras que aparecen en vídeos.
  • Realice un seguimiento del movimiento de caras a lo largo de varios fotogramas.
  • Analice los metadatos de salida que proporcionan información sobre marcas de tiempo y ubicaciones de caras.

Más información

Face Emotion Detection (Detección de emociones de caras) (versión preliminar)

  • Reconozca las emociones de una persona o una multitud a lo largo del tiempo basándose en las expresiones faciales del vídeo.
  • Identifique emociones basándose en expresiones que una búsqueda psicológica ha identificado como universales.
  • Reconozca emociones específicas como felicidad, tristeza, sorpresa, ira, desprecio, miedo, asimilación y neutralidad.

Más información

Video Summarization (Resumen de vídeo) (versión preliminar)

  • Cree resúmenes de vídeo largos para permitir a los clientes obtener una vista previa rápida del vídeo.
  • Elija crear entre vistas previas cortas que duran unos pocos segundos o vistas previas ligeramente más largas que duran unos pocos minutos.
  • Elija si se deben aplicar transiciones atenuadas entre disparos en los vídeos resumidos.
  • Ideal para crear una página web similar a la página de búsqueda Vídeos de Bing.

Más información

Video Optical Character Recognition (Reconocimiento de caracteres ópticos de vídeo) (versión preliminar)

  • Extraiga palabras compuestas del contenido de vídeo.
  • Seleccione su propia velocidad de muestreo para encontrar el equilibrio entre rendimiento y calidad.
  • Especifique dónde buscar subtítulos en el vídeo.

Más información

Content Moderation (Moderación de contenido) (versión preliminar)

  • Detecte pornografía, racismo, blasfemia, violencia y otro contenido que desee moderar en un vídeo.
  • Ahorre dinero y reduzca los errores: ya no tendrá que contratar a moderadores para filtrar el contenido ofensivo, ilícito e inapropiado.

Más información

Cree una solución multimedia hoy mismo