Saltar al contenido principal

Conversión de voz en texto

Una característica del servicio de voz que convierte audio hablado en texto de manera precisa.

Convierta el audio hablado en un recurso útil

Transcriba audio a texto en más de 100 idiomas y variedades de forma rápida y precisa. Personalice los modelos para mejorar la precisión de la terminología específica de cada dominio. Obtenga más valor del audio hablado habilitando la búsqueda o el análisis en el texto transcrito o facilitando acciones, todo ello en el lenguaje de programación que prefiera.

Transcripción de alta calidad

Obtenga transcripciones precisas de audio en texto con un reconocimiento de voz de vanguardia.

Modelos personalizables

Agregue palabras específicas al vocabulario base o cree sus propios modelos de conversión de voz en texto.

Implementación flexible

Ejecute Speech to Text en cualquier lugar: en la nube o en el perímetro en contenedores.

Preparado para producción

Acceda a la misma tecnología sólida que proporciona reconocimiento de voz en los productos de Microsoft.

Transcriba voz de varios orígenes con precisión

Convierta en texto el audio procedente de una amplia gama de orígenes, como micrófonosarchivos de audioBlob Storage. Use la diarización del hablante para determinar quién dijo qué y cuándo. Obtenga transcripciones legibles con formato y puntuación automáticos.

Personalizar los modelos de voz según sus necesidades

Personalice sus modelos de voz para que reconozcan la terminología específica de la organización y del sector. Supere las barreras del reconocimiento de voz, como el ruido de fondo, los acentos o el vocabulario único. Personalice sus modelos cargando datos de audio y transcripciones.  Genere automáticamente modelos personalizados usando datos de Office 365 con el fin de optimizar la precisión del reconocimiento de voz para su organización.

Implementar en cualquier parte

Ejecute Speech to Text donde estén los datos. Cree aplicaciones de voz que estén optimizadas tanto para características sólidas en la nube como para el entorno local mediante el uso de contenedores.

Impulsar la innovación de aplicaciones con Cloud AI Services

Obtenga información sobre 5 formas clave en las que su organización puede comenzar a usar la inteligencia artificial para obtener valor rápidamente.
El informe titulado Impulsar la innovación en las aplicaciones con servicios de inteligencia artificial en la nube

Privacidad y seguridad completas

  • Servicio de voz, que forma parte de Azure Cognitive Services, cuenta con las certificaciones de SOC, FedRAMP, PCI DSS, HIPAA, HITECH e ISO.

  • Puede ver y eliminar sus modelos y datos de voz personalizados en cualquier momento. Los datos se cifran mientras están en el almacenamiento.

  • Sus datos siguen siendo suyos. Los datos de entrada de audio y transcripción no se registran durante el procesamiento del audio.

  • Gracias al respaldo de la infraestructura de Azure, el servicio de voz ofrece una seguridad, una disponibilidad, un cumplimiento normativo y una manejabilidad de nivel empresarial.

Seguridad y cumplimiento exhaustivos e integrados

  • Microsoft invierte más de USD$1 000 000 000 al año en la investigación y el desarrollo de la ciberseguridad.

  • Contamos con más de 3500 expertos en seguridad que se dedican a proteger la seguridad y la privacidad de los datos.

  • Azure tiene más certificaciones que cualquier otro proveedor de nube. Consulta la lista completa.

  • Los precios flexibles le dan el control que necesita

    Con Speech to Text, solo paga por lo que usa en función del número de horas de audio que transcriba, sin costes iniciales.

Empezar a utilizar una cuenta gratuita de Azure

1

Empieza gratis. Obtén un crédito de  USD$200  para usar durante 30 días. Mientras tengas el crédito, obtendrás cantidades gratuitas de muchos de nuestros servicios más populares y cantidades gratuitas de otros 55 servicios que son siempre gratis.

2

Después del crédito, cambia a un plan de pago por uso para seguir creando con los mismos servicios gratuitos. Paga solamente si tu uso supera la cantidad gratuita mensual.

3

Transcurridos 12 meses, seguirá obteniendo más de 55 servicios que siempre son gratuitos y pagará solo por lo que use más allá de las cantidades gratuitas mensuales.

Empresas que confían en Speech to Text

KPMG simplifica la transcripción de llamadas

KPMG usa Speech to Text para transcribir y catalogar miles de horas de llamadas, lo que reduce los costes de cumplimiento normativo de sus clientes hasta en un 80 %.

Dos personas sentadas y teniendo una conversación en una galería de arte

Motorola ayuda a los servicios de emergencia a acceder a datos vitales mediante voz

Motorola Solutions ayuda a la policía y a otros servicios de emergencia a acceder a información importante con más rapidez mediante un asistente virtual con reconocimiento de voz.

Una persona hablando en un Walkie-talkie en su cuello



Universal Electronics ofrece experiencias domésticas inteligentes con reconocimiento de voz

Universal Electronics ayuda a las marcas a ofrecer funcionalidades de navegación y control con reconocimiento de voz compatibles con los dispositivos cotidianos que se encuentran en el hogar, lo que ofrece una experiencia de consumidor realmente única.

 

Un dispositivo doméstico inteligente con reconocimiento de voz que se enciende mientras una persona usa una tableta en segundo plano
Hochtief documenta los defectos de construcción mediante la voz

Hochtief ayuda a los jefes de proyectos a identificar y documentar defectos de construcción en sitios de proyectos mediante un asistente virtual con reconocimiento de voz.
Un puente entre dos edificios
NTT DATA agiliza la toma de decisiones con la información de las reuniones

NTT DATA extrae la información de los datos de voz mediante la transcripción de reuniones en tiempo real. Con Habla personalizada, pueden personalizar los modelos de reconocimiento de voz para entender los términos específicos de la organización.
Dos personas de NTT Data sonriendo
Insight impulsa las experiencias bancarias de conversación

Insight Enterprises ayuda a los bancos a ofrecer una velocidad y comodidad digitales a sus sucursales con una solución bancaria con tecnología de IA de conversación. Speech to Text convierte lo que los clientes dicen en datos que se pueden procesar y analizar para que los clientes puedan obtener respuestas oportunas y relevantes.
Una persona que usa un dispositivo de pantalla táctil grande en una pared
Volver a las pestañas

Documentación y recursos

Comenzar

Examine la documentación

Crear un servicio de voz con el curso de Microsoft Learn

Explorar ejemplos de código

Echar un vistazo a nuestro código de ejemplo

Ver recursos de personalización

Explore y personalice su solución de voz a texto con Speech Studio. No requiere trabajo de programación.

Preguntas más frecuentes sobre Speech to Text

  • Es una característica dentro del servicio de voz que transcribe audio a texto de forma rápida y precisa.

  • Cognitive Services es una colección de modelos de inteligencia artificial precompilados y personalizables que se pueden usar para agregar inteligencia artificial a las aplicaciones. Hay una gran variedad de dominios, como voz, decisión, idioma y visión. Speech to Text es una característica dentro del servicio de voz. Otras características relacionadas con el servicio de voz son Text to SpeechSpeech TranslationSpeaker Recognition. Un ejemplo de un servicio de decisión es Personalizer, que permite ofrecer experiencias personalizadas y pertinentes. Algunos ejemplos de servicios de lenguaje son Language UnderstandingText Analytics para el procesamiento del lenguaje natural, QnA Maker para experiencias de preguntas más frecuentes y Traductor para traducción de idiomas.

Comenzar a crear con Cognitive Services

Probar Speech to Text gratis

Chatear con el equipo de ventas