Convierta el audio hablado en un recurso útil
Transcriba audio a texto en más de 100 idiomas y variedades de forma rápida y precisa. Personalice los modelos para mejorar la precisión de la terminología específica de cada dominio. Obtenga más valor del audio hablado habilitando la búsqueda o el análisis en el texto transcrito o facilitando acciones, todo ello en el lenguaje de programación que prefiera.
Transcripción de alta calidad
Obtenga transcripciones precisas de audio en texto con un reconocimiento de voz de vanguardia.
Modelos personalizables
Agregue palabras específicas al vocabulario base o cree sus propios modelos de conversión de voz en texto.
Implementación flexible
Ejecute Speech to Text en cualquier lugar: en la nube o en el perímetro en contenedores.
Preparado para producción
Acceda a la misma tecnología sólida que proporciona reconocimiento de voz en los productos de Microsoft.
Transcriba voz de varios orígenes con precisión
Convierta en texto el audio procedente de una amplia gama de orígenes, como micrófonos, archivos de audioy Blob Storage. Use la diarización del hablante para determinar quién dijo qué y cuándo. Obtenga transcripciones legibles con formato y puntuación automáticos.
Personalizar los modelos de voz según sus necesidades
Personalice sus modelos de voz para que reconozcan la terminología específica de la organización y del sector. Supere las barreras del reconocimiento de voz, como el ruido de fondo, los acentos o el vocabulario único. Personalice sus modelos cargando datos de audio y transcripciones. Genere automáticamente modelos personalizados usando datos de Office 365 con el fin de optimizar la precisión del reconocimiento de voz para su organización.
Implementar en cualquier parte
Ejecute Speech to Text donde estén los datos. Cree aplicaciones de voz que estén optimizadas tanto para características sólidas en la nube como para el entorno local mediante el uso de contenedores.
Impulsar la innovación de aplicaciones con Cloud AI Services
Obtenga información sobre 5 formas clave en las que su organización puede comenzar a usar la inteligencia artificial para obtener valor rápidamente.
Privacidad y seguridad completas
-
Servicio de voz, que forma parte de Azure Cognitive Services, cuenta con las certificaciones de SOC, FedRAMP, PCI DSS, HIPAA, HITECH e ISO.
-
Puede ver y eliminar sus modelos y datos de voz personalizados en cualquier momento. Los datos se cifran mientras están en el almacenamiento.
-
Sus datos siguen siendo suyos. Los datos de entrada de audio y transcripción no se registran durante el procesamiento del audio.
-
Gracias al respaldo de la infraestructura de Azure, el servicio de voz ofrece una seguridad, una disponibilidad, un cumplimiento normativo y una manejabilidad de nivel empresarial.
Seguridad y cumplimiento exhaustivos e integrados
-
Microsoft invierte más de USD$1 000 000 000 al año en la investigación y el desarrollo de la ciberseguridad.
-
Contamos con más de 3500 expertos en seguridad que se dedican a proteger la seguridad y la privacidad de los datos.
-
Azure tiene más certificaciones que cualquier otro proveedor de nube. Consulta la lista completa.
-
Los precios flexibles le dan el control que necesita
Con Speech to Text, solo paga por lo que usa en función del número de horas de audio que transcriba, sin costes iniciales.
Empezar a utilizar una cuenta gratuita de Azure
1
2
Después del crédito, cambia a un plan de pago por uso para seguir creando con los mismos servicios gratuitos. Paga solamente si tu uso supera la cantidad gratuita mensual.
3
Empresas que confían en Speech to Text
Motorola ayuda a los servicios de emergencia a acceder a datos vitales mediante voz
Motorola Solutions ayuda a la policía y a otros servicios de emergencia a acceder a información importante con más rapidez mediante un asistente virtual con reconocimiento de voz.
Documentación y recursos
Comenzar
Examine la documentación
Crear un servicio de voz con el curso de Microsoft Learn
Explorar ejemplos de código
Echar un vistazo a nuestro código de ejemplo
Ver recursos de personalización
Explore y personalice su solución de voz a texto con Speech Studio. No requiere trabajo de programación.
Preguntas más frecuentes sobre Speech to Text
-
Es una característica dentro del servicio de voz que transcribe audio a texto de forma rápida y precisa.
-
Cognitive Services es una colección de modelos de inteligencia artificial precompilados y personalizables que se pueden usar para agregar inteligencia artificial a las aplicaciones. Hay una gran variedad de dominios, como voz, decisión, idioma y visión. Speech to Text es una característica dentro del servicio de voz. Otras características relacionadas con el servicio de voz son Text to Speech, Speech Translationy Speaker Recognition. Un ejemplo de un servicio de decisión es Personalizer, que permite ofrecer experiencias personalizadas y pertinentes. Algunos ejemplos de servicios de lenguaje son Language Understanding, Text Analytics para el procesamiento del lenguaje natural, QnA Maker para experiencias de preguntas más frecuentes y Traductor para traducción de idiomas.