Speech to Text

Característica del servicio de voz que convierte audio hablado en texto de manera precisa.

Convierta el audio hablado en un recurso útil

Transcriba audio de forma rápida y precisa en más de 30 idiomas. Personalice los modelos para mejorar la precisión de la terminología específica de cada dominio. Obtenga más valor del audio hablado habilitando la búsqueda o el análisis en el texto transcrito o facilitando acciones, todo ello en el lenguaje de programación que prefiera.

Transcripción de alta calidad

Obtenga transcripciones precisas con un reconocimiento de voz de vanguardia.

Modelos personalizables

Agregue palabras específicas al vocabulario base o cree sus propios modelos.

Implementación flexible

Ejecute Speech to Text en cualquier lugar: en la nube o en el perímetro en contenedores.

Preparado para producción

Acceda a la misma tecnología sólida que proporciona reconocimiento de voz en los productos de Microsoft.

Oraciones de ejemplo

Línea de base

Habla personalizada

¿Desea crear esto?

Transcriba voz de varios orígenes con precisión

Convierta en texto el audio procedente de una amplia gama de orígenes, como micrófonos, archivos de audio y Blob Storage. Use la diarización del hablante para determinar quién dijo qué y cuándo. Obtenga transcripciones legibles con formato y puntuación automáticos.

Personalice los modelos de voz según sus necesidades

Personalice sus modelos de voz para que reconozcan la terminología específica de la organización y del sector. Supere las barreras del reconocimiento de voz, como el ruido de fondo, los acentos o el vocabulario único. Personalice sus modelos cargando datos de audio y transcripciones. Genere automáticamente modelos personalizados usando datos de Office 365 con el fin de optimizar la precisión del reconocimiento de voz para su organización.

Implemente soluciones en cualquier parte, desde la nube hasta el perímetro

Ejecute Speech to Text donde estén los datos. Cree aplicaciones de voz que estén optimizadas tanto para características sólidas en la nube como para el perímetro usando contenedores (en versión preliminar). Los contenedores de voz admiten voces tanto estándar como personalizadas.

Privacidad y seguridad completas

  • El servicio de voz, que forma parte de Azure Cognitive Services, cuenta con las certificaciones de SOC, FedRAMP, PCI DSS, HIPAA, HITECH e ISO.
  • Sus datos siguen siendo suyos. Los datos de entrada de audio y transcripción no se registran durante el procesamiento del audio.
  • Puede ver y eliminar sus modelos y datos de voz personalizados en cualquier momento. Los datos se cifran mientras están en el almacenamiento.
  • Gracias al respaldo de la infraestructura de Azure, el servicio de voz ofrece una seguridad, una disponibilidad, un cumplimiento normativo y una manejabilidad de nivel empresarial.

Los precios flexibles ofrecen la capacidad y el control que necesita

Pague solo por lo que usa, sin costos por adelantado. Con Speech to Text, solo paga por lo que usa en función del número de horas de audio que transcriba.

Documentación y recursos

Explore ejemplos de código

Vea recursos de personalización

Personalice su solución de voz con Speech Studio. No requiere trabajo de programación.

KPMG

KPMG utiliza la funcionalidad de personalización de Speech to Text para optimizar la transcripción y la traducción de las llamadas, y consigue una precisión de las transcripciones de un 90 % o superior.

Get started with Speech