Conversión de voz en texto

Speech to Text API forma parte de los servicios de voz de Azure Cognitive Services.

Escriba con su voz

Use Speech to Text, que forma parte del servicio Voz, para convertir audio de una gran variedad de orígenes en texto de forma fluida. Personalice los modelos para eliminar barreras habituales en el reconocimiento de voz, como el vocabulario específico, los estilos de habla o el ruido de fondo. Haga que el audio sea más accesible al permitir que todos puedan seguir y participar en las conversaciones en tiempo real.

Innovación revolucionaria

Aproveche una precisión de reconocimiento de voz extraordinaria basada en modelos de red neuronal profunda.

Interacción en tiempo real

Transcriba audio en tiempo real para que todos los participantes de una conversación participen plenamente.

Reconocimiento de voz personalizado

Adapte el reconocimiento de voz a diferentes estilos de habla y a la terminología específica del contexto.

Implementación flexible

Ejecute Speech to Text en cualquier parte: en la nube, en el entorno local o en el perímetro en contenedores.

Use tecnología de voz muy avanzada

Enhance your apps with speech capabilities powered by decades of breakthrough research. Microsoft was the first to reach human parity on the Switchboard conversational speech recognition task, and continues to drive cutting-edge research in speech recognition.

Más información acerca de la paridad humana en el reconocimiento de voz

Para probar la demostración con su propia voz a través de un micrófono, cambie a un explorador distinto con compatibilidad para WebRTC, por ejemplo una versión reciente de Microsoft Edge, Firefox o Chrome.

¿Desea crear esto?

Optimice el reconocimiento de voz con modelos adaptados

Personalice sus modelos de reconocimiento de voz para eliminar las barreras habituales. Adapte los modelos de lenguaje al estilo de habla de los usuarios, su acento o su vocabulario específico, como los nombres de lugares, los productos y las expresiones específicas del sector. Genere automáticamente modelos personalizados usando sus datos de Office 365 para optimizar la precisión del reconocimiento de voz en cuanto a términos específicos de la organización.

Comience a usar Custom Speech

Oraciones de ejemplo

Línea de base

Custom Speech

¿Desea crear esto?

Obtenga conclusiones de sus conversaciones

Transcriba conversaciones de varios usuarios en tiempo real para que los participantes puedan centrarse en la discusión. Identifique quién dijo qué, cuándo y continúe rápidamente con los pasos siguientes. Optimice la experiencia para dispositivos con varios micrófonos. Habilite el análisis del texto transcrito para obtener más conclusiones de las conversaciones.

Más información acerca de la transcripción de conversaciones

Implemente soluciones en cualquier parte, desde la nube hasta el perímetro

Ejecute Speech to Text en la nube o en el entorno local con contenedores para escenarios donde la seguridad de los datos y una baja latencia son fundamentales.

Más información acerca del servicio Voz

Seguridad para la empresa

  • Microsoft invierte más de mil millones de USD al año en la investigación y el desarrollo de la ciberseguridad.

  • Tenemos contratados más de 3500 expertos en seguridad dedicados exclusivamente a la seguridad y la privacidad de sus datos.

  • Azure tiene más certificaciones de cumplimiento normativo que cualquier otro proveedor de nube. Vea la lista completa.

Obtenga el potencial, el control y el nivel de personalización que necesita con precios flexibles

Pague solo por lo que usa, sin costos por adelantado. Con Speech to Text, solo paga por las horas de audio transcritas.

Consulte los precios de Speech to Text

Comience a usar Speech to Text en tres pasos

Consiga acceso inmediato y un crédito por valor de 200 USD al registrarse para obtener una cuenta gratuita de Azure.
Inicie sesión en Azure Portal y agregue Voz.
Consulte el tutorial y la documentación para aprender a insertar Speech to Text.

Recursos de Speech to Text para desarrolladores

Documentación y tutoriales

Comience a usar Speech to Text.

Cursos

Realice un curso de Pluralsight para aprender a usar Speech to Text.

Casos de uso

Más información acerca de los escenarios de uso de Speech to Text, como la transcripción de conversaciones o de un centro de llamadas.

Preguntas más frecuentes sobre Speech to Text

  • Para ver una lista completa de los idiomas que admite Speech to Text, consulte la documentación.
  • Puede capturar audio desde un micrófono fácilmente, leer una secuencia o acceder a archivos de audio desde el almacenamiento con el SDK de Voz y API REST. El SDK de Voz admite WAV/PCM de 16 bits, 16 kHz u 8 kHz y audio de un solo canal para el reconocimiento de voz. Se admiten más formatos de audio si se utiliza el punto de conexión REST para conversión de voz en texto o el servicio de transcripción por lotes.

Comience a usar Speech to Text