Azure Media Services: las últimas actualizaciones de Video Indexer desde NAB Show 2019

Publicado el 4 abril, 2019

Principal Program Manager, Azure Media Services, Video Indexer

Actualizado el 16 de abril de 2019: Estamos encantados de anunciar que el nuevo editor basado en inteligencia artificial de Video Indexer obtuvo el premio Producto del año de NAB Show en la categoría de IA/ML en la edición de este año. Este prestigioso galardón es un reconocimiento de “los nuevos productos y tecnologías más importantes y prometedores” expuestos en NAB Show este año.

Después de recoger varios premios con la versión de disponibilidad general de Video Indexer de Azure Media Services, incluidos el 2018 IABM por su innovación en cuanto a la administración de contenido y el prestigioso premio Peter Wayne, el equipo ha seguido centrado en crear una gran cantidad de nuevas características y modelos que permitan a cualquier organización con un gran archivo de contenido multimedia desbloquear la información de su contenido. El uso de dicha información mejora la capacidad de búsqueda, permite nuevos escenarios de usuario y accesibilidad, y abre nuevas oportunidades de monetización.

En NAB Show 2019, nos complace presentar una gran cantidad de nuevas mejoras en modelos y experiencias de Video Indexer que se distribuirán esta semana, incluyéndose lo siguiente:

  • Un nuevo editor basado en inteligencia artificial que le permite crear contenido nuevo a partir de los elementos multimedia existentes en cuestión de minutos
  • Mejoras en nuestro sistema de reconocimiento de personas personalizado, incluidas la administración central de modelos y la capacidad de entrenar modelos a partir de imágenes
  • Entrenamiento de modelos de lenguaje basado en ediciones de transcripción, el cual le permite mejorar de forma eficaz su modelo de lenguaje para incluir sus términos específicos del sector
  • Nuevo modelo de segmentación de escenas (versión preliminar)
  • Nuevos modelos de detección de créditos graduales finales
  • Disponibilidad en nueve regiones del mundo diferentes
  • Certificaciones ISO 27001, ISO 27018, SOC 1,2,3, HiTRUST, FedRAMP, HIPAA y PCI
  • Capacidad de llevar sus datos y modelos entrenados con usted al pasar de la evaluación gratuita a la cuenta de pago de Video Indexer

Obtenga más información sobre todas esas maravillosas incorporaciones en este blog.

Además, tenemos noticias increíbles para los clientes que usan nuestra plataforma de streaming en vivo para la ingesta de fuentes en vivo, la transcodificación y el cifrado y empaquetado dinámicos para la entrega a través de protocolos estándar del sector como HLS y MPEG-DASH. Las transcripciones en vivo son una nueva característica en nuestras API v3, donde puede mejorar las transmisiones ofrecidas a sus visores con texto generado por las máquinas que se transcribe a partir de palabras habladas en la secuencia de vídeo. Este texto solo se ofrecerá inicialmente como TTML compatible con IMSC1.1 empaquetado en fragmentos MPEG-4, parte 30 (ISO/IEC 14496-30), que se pueden volver a reproducir a través de una nueva compilación de Azure Media Player. Hay más información sobre esta característica y el programa en versión preliminar privada disponible en la documentación, “Live transcription with Azure Media Services v3” (Transcripción en vivo con Azure Media Services v3).

También presentamos dos programas más en versión preliminar privada para la transcripción de varios idiomas y la detección de animaciones, donde los clientes seleccionados podrán influir en los modelos y experiencias que les rodean. Venga a hablar con nosotros a NAB Show o póngase en contacto con su administrador de cuentas para solicitar su adhesión a estos increíbles programas.

La extracción de contenido nuevo de su archivo multimedia nunca ha resultado tan sencilla

Una de las formas de usar información detallada de archivos multimedia es crear nuevos elementos multimedia a partir del contenido existente. Esto puede hacerse para crear vídeos destacados de películas para clips finales, usar clips de vídeos antiguos en conversiones de noticias, crear contenido más corto para las redes sociales, o bien para cualquier otra necesidad del negocio.

A fin de facilitar este escenario con solo unos clics, creamos un editor basado en inteligencia artificial que le permite encontrar el contenido multimedia adecuado, localizar los elementos que le interesan y usarlos para crear un vídeo completamente nuevo, mediante los metadatos generados por Video Indexer. Una vez que esté satisfecho con el resultado, se puede representar y descargar desde Video Indexer y usar en sus propias aplicaciones de edición o flujos de trabajo descendentes.

Video Indexer con Satya Nadella

Todas estas funcionalidades también están disponibles a través de nuestra API de REST actualizada. Esto significa que puede escribir código que cree clips automáticamente en función de la información. Las nuevas llamadas API del editor están abiertas actualmente en la versión preliminar pública.

¿Desea probar el nuevo editor basado en inteligencia artificial? Solo tiene que ir a uno de sus archivos multimedia indexados y hacer clic en el botón "Abrir en el editor" para empezar a crear nuevo contenido.

Administración y personalización de modelos más intuitivas

Video Indexer trae consigo un completo conjunto de modelos listos para usar de modo que pueda cargar su contenido y obtener información inmediatamente. Sin embargo, la tecnología de inteligencia artificial siempre se vuelve más precisa al personalizarla para el contenido específico para el que se emplea. Por lo tanto, Video Indexer proporciona funcionalidades de personalización para los modelos seleccionados. Una personalización de ese tipo es la capacidad de agregar modelos de personas personalizados a las más de 1 millón de celebridades que Video Indexer puede identificar actualmente como listas para usar. Esta funcionalidad de personalización ya existía en forma de aprendizaje de personas "desconocidas" sobre el contenido de un vídeo, pero recibimos varias solicitudes del cliente para mejorarla todavía más, así que eso hicimos.

Para ajustar un proceso de personalización sencillo a los modelos de personas, agregamos una página de administración central de reconocimiento de personas que le permite crear varios modelos de personas personalizados por cuenta, cada uno de los cuales puede incluir hasta un millón de entradas diferentes. En esta ubicación puede crear nuevos modelos, agregar nuevas personas a los modelos existentes, revisarlos, cambiar su nombre y eliminarlos en caso necesario. Además de eso, ahora puede entrenar modelos en función de sus imágenes estáticas incluso antes de haber cargado el primer vídeo en su cuenta. Las organizaciones que ya tienen un archivo de imágenes de personas ahora pueden usar esos archivos para entrenar previamente sus modelos. Es tan sencillo como arrastrar y colocar las imágenes pertinentes en el nombre de la persona o enviarlas a través de la API de REST de Video Indexer (actualmente en versión preliminar).

Datos de la persona

¿Qué más queda por aprender? Obtenga información sobre nuestras opciones de reconocimiento facial personalizadas avanzadas.

Otra importante personalización es la capacidad de entrenar modelos de lenguaje para la terminología o el vocabulario específico del sector de su organización. Para permitirle mejorar la transcripción para su organización de forma más rápida, ahora Video Indexer recopilará automáticamente ediciones de transcripción realizadas de manera manual en una nueva entrada en el modelo de lenguaje específico que use. A continuación, todo lo que debe hacer es hacer clic en el botón "Entrenar" para su incorporación a su propio modelo personalizado. La idea es crear un bucle de comentarios donde las organizaciones empiecen con un modelo de lenguaje base listo para usar y mejoren su precisión a través de ediciones manuales durante un período de tiempo hasta que se alinee con sus términos y vocabulario verticales del sector específicos.

Escala de tiempo en Video Indexer

Nuevas incorporaciones a la canalización de Video Indexer

Una de las ventajas principales de Video Indexer es contar con una canalización que orquesta varias conclusiones de diversos canales en una escala de tiempo. Trabajamos periódicamente para enriquecer esta canalización con información adicional.

Una de las últimas incorporaciones al conjunto de conclusiones de Video Indexer es la capacidad de segmentar el vídeo por escenas semánticas (actualmente en versión preliminar) en función de las pistas visuales. Las escenas semánticas agregan otro nivel de granularidad a los modelos de extracción de fotogramas clave y detección de cortes existentes en Video Indexer y tratan de mostrar un solo evento compuesto de una serie de cortes consecutivos semánticamente relacionados.

Se pueden usar las escenas para agrupar un conjunto de conclusiones y hacer referencia a las mismas como conclusiones del mismo contexto para deducir de ellas un significado más complejo. Por ejemplo, si una escena incluye un avión, una pista y equipaje, el cliente puede crear una lógica que deduzca que está ocurriendo en un aeropuerto. Las escenas también se pueden usar como unidad que se va a extraer como clip de un vídeo completo.

Escenas en Video Indexer

Otra incorporación interesante a Video Indexer es la capacidad de identificar los créditos graduales finales de una película o un programa de televisión. Esto puede resultar útil a los emisores a la hora de identificar cuándo terminaron sus visores de ver el vídeo y cuál es el momento adecuado para recomendar el nuevo programa o película que no hay que dejar de ver antes de perder audiencia.

Video Indexer se basa en la confianza (y se ejecuta en más regiones)

Como Video Indexer forma parte de la familia de productos Azure Media Services y está pensado para servir a organizaciones de todos los tamaños y sectores, para nosotros es fundamental ayudar a nuestros clientes a cumplir sus obligaciones de cumplimiento en sectores y mercados regulados de todo el mundo. Como parte de ese esfuerzo, nos complace anunciar que Video Indexer cuenta ahora con las certificaciones ISO 27001, ISO 27018SOC 1,2,3HIPAAFedRAMPPCI e HITRUST. Obtenga más información sobre el estado más actual de las certificaciones de Video Indexer y todos los demás servicios de Azure.

Además, aumentamos nuestra disponibilidad de servicios en todo el mundo y actualmente nos hemos establecido en nueve regiones para su comodidad. Ahora las regiones disponibles son Este de EE. UU. (prueba), Este de EE. UU. 2, Centro-sur de EE. UU., Oeste de EE. UU. 2, Norte de Europa, Oeste de Europa, Sudeste Asiático, Asia Oriental y Este de Australia. En breve habrá más regiones disponibles, así que permanezca atento. Siempre puede encontrar la disponibilidad regional más reciente de Video Indexer visitando la página de productos por región.

La evaluación gratuita de Video Indexer sigue estando totalmente disponible en Este de EE. UU. Esto permite a las organizaciones evaluar la funcionalidad íntegra de Video Indexer en sus propios datos antes de crear una cuenta de pago mediante su propia suscripción a Azure. Una vez que las organizaciones decidan migrar a su suscripción a Azure, pueden copiar todos los vídeos y personalizaciones de modelos que crearon en su cuenta de evaluación gratuita simplemente marcando la casilla pertinente en el contenido del asistente para crear una cuenta.

Conectar Video Indexer a una suscripción a Azure

¿Quiere ser el primero en probar nuestras últimas funcionalidades?

Hoy estamos entusiasmados de presentar tres programas en versión preliminar privada para características por las que muchos clientes distintos nos han preguntado.

Transcripción en vivo: capacidad de transmitir un evento en vivo donde las palabras habladas del audio se traducen a texto y se envían junto con vídeo y audio.

Transcripción mixta de idiomas: capacidad de identificar varios idiomas hablados automáticamente en un archivo de vídeo y de crear una transcripción mixta de idiomas para ese archivo.

Detección de personajes de animación: capacidad de identificar personajes en contenido animado como si fueran personas de verdad.

Seleccionaremos un conjunto de clientes de una lista de los que desean ser nuestros asociados de diseño para estas nuevas funcionalidades. Los clientes seleccionados podrán tener una gran influencia en estas nuevas funcionalidades y obtener modelos que se ajusten en gran medida a sus flujos de organización y de datos. ¿Quiere formar parte de esto? Visítenos en NAB Show o póngase en contacto con su administrador de cuentas para obtener más información.

Visítenos en NAB Show 2019

Si va a asistir a NAB Show 2019, deténgase en el puesto #SL6716 para ver las últimas innovaciones de Azure Media Services. Estaremos encantados de verle, saber más sobre sus creaciones y guiarle por las diferentes innovaciones que Azure Media Services y nuestros asociados están presentando en NAB Show. También tendremos presentaciones de productos en el puesto durante todo el evento.

¿Tiene preguntas o comentarios? Estaríamos encantados de ayudarle. Use nuestro UserVoice para ayudarnos a priorizar las características o envíe un correo electrónico a VISupport@Microsoft.com si tiene alguna pregunta.