Saltar al contenido principal

Conversión de voz en texto

Una característica del servicio de voz que convierte audio hablado en texto de manera precisa.

Convierta el audio hablado en un recurso útil

Transcriba audio a texto en más de 100 idiomas y variedades de forma rápida y precisa. Personalice los modelos para mejorar la precisión de la terminología específica de cada dominio. Obtenga más valor del audio hablado habilitando la búsqueda o el análisis en el texto transcrito o facilitando acciones, todo ello en el lenguaje de programación que prefiera.

Transcripción de alta calidad

Obtenga transcripciones precisas de audio en texto con un reconocimiento de voz de vanguardia.

Modelos personalizables

Agregue palabras específicas al vocabulario base o cree sus propios modelos de conversión de voz en texto.

Implementación flexible

Ejecute Speech to Text en cualquier lugar: en la nube o en el perímetro en contenedores.

Preparado para producción

Acceda a la misma tecnología sólida que proporciona reconocimiento de voz en los productos de Microsoft.

Transcriba voz de varios orígenes con precisión

Convierta en texto el audio procedente de una amplia gama de orígenes, como micrófonosarchivos de audioBlob Storage. Use la diarización del hablante para determinar quién dijo qué y cuándo. Obtenga transcripciones legibles con formato y puntuación automáticos.

Personalizar los modelos de voz según sus necesidades

Personalice sus modelos de voz para que reconozcan la terminología específica de la organización y del sector. Supere las barreras del reconocimiento de voz, como el ruido de fondo, los acentos o el vocabulario único. Personalice sus modelos cargando datos de audio y transcripciones.  Genere automáticamente modelos personalizados usando datos de Office 365 con el fin de optimizar la precisión del reconocimiento de voz para su organización.

Implementar en cualquier parte

Ejecute Speech to Text donde estén los datos. Cree aplicaciones de voz que estén optimizadas tanto para características sólidas en la nube como para el entorno local mediante el uso de contenedores.

Impulsar la innovación de aplicaciones con Cloud AI Services

Obtenga información sobre 5 formas clave en las que su organización puede comenzar a usar la inteligencia artificial para obtener valor rápidamente.

El informe titulado Impulsar la innovación en las aplicaciones con servicios de inteligencia artificial en la nube

Privacidad y seguridad completas

  • Servicio de voz, que forma parte de Azure Cognitive Services, cuenta con las certificaciones de SOC, FedRAMP, PCI DSS, HIPAA, HITECH e ISO.

  • Puede ver y eliminar sus modelos y datos de voz personalizados en cualquier momento. Los datos se cifran mientras están en el almacenamiento.

  • Sus datos siguen siendo suyos. Los datos de entrada de audio y transcripción no se registran durante el procesamiento del audio.

  • Gracias al respaldo de la infraestructura de Azure, el servicio de voz ofrece una seguridad, una disponibilidad, un cumplimiento normativo y una manejabilidad de nivel empresarial.

Seguridad y cumplimiento exhaustivos e integrados

  • Microsoft invierte más de USD$1 000 000 000 al año en la investigación y el desarrollo de la ciberseguridad.

  • Contamos con más de 3500 expertos en seguridad que se dedican a proteger la seguridad y la privacidad de los datos.

  • Azure tiene más certificaciones que cualquier otro proveedor de nube. Consulta la lista completa.

  • Los precios flexibles le dan el control que necesita

    Con Speech to Text, solo paga por lo que usa en función del número de horas de audio que transcriba, sin costes iniciales.

Empezar a utilizar una cuenta gratuita de Azure

1

Empieza gratis. Obtén un crédito de  USD$200  para usar durante 30 días. Mientras tengas el crédito, obtendrás cantidades gratuitas de muchos de nuestros servicios más populares y cantidades gratuitas de otros 55 servicios que son siempre gratis.

2

Después del crédito, cambia a un plan de pago por uso para seguir creando con los mismos servicios gratuitos. Paga solamente si tu uso supera la cantidad gratuita mensual.

3

Transcurridos 12 meses, seguirá obteniendo más de 55 servicios que siempre son gratuitos y pagará solo por lo que use más allá de las cantidades gratuitas mensuales.

Empresas que confían en Speech to Text

Motorola ayuda a los servicios de emergencia a acceder a datos vitales mediante voz

Motorola Solutions ayuda a la policía y a otros servicios de emergencia a acceder a información importante con más rapidez mediante un asistente virtual con reconocimiento de voz.

Una persona hablando en un Walkie-talkie en su cuello
Volver a las pestañas

Documentación y recursos

Comenzar

Examine la documentación

Crear un servicio de voz con el curso de Microsoft Learn

Explorar ejemplos de código

Echar un vistazo a nuestro código de ejemplo

Ver recursos de personalización

Explore y personalice su solución de voz a texto con Speech Studio. No requiere trabajo de programación.

Preguntas más frecuentes sobre Speech to Text

  • Es una característica dentro del servicio de voz que transcribe audio a texto de forma rápida y precisa.

  • Cognitive Services es una colección de modelos de inteligencia artificial precompilados y personalizables que se pueden usar para agregar inteligencia artificial a las aplicaciones. Hay una gran variedad de dominios, como voz, decisión, idioma y visión. Speech to Text es una característica dentro del servicio de voz. Otras características relacionadas con el servicio de voz son Text to SpeechSpeech TranslationSpeaker Recognition. Un ejemplo de un servicio de decisión es Personalizer, que permite ofrecer experiencias personalizadas y pertinentes. Algunos ejemplos de servicios de lenguaje son Language UnderstandingText Analytics para el procesamiento del lenguaje natural, QnA Maker para experiencias de preguntas más frecuentes y Traductor para traducción de idiomas.

Comenzar a crear con Cognitive Services