Speech to Text

Característica del servicio de voz que convierte audio hablado en texto de manera precisa.

Convierta el audio hablado en un recurso útil

Quickly and accurately transcribe audio to text in more than 85 languages and variants. Customize models to enhance accuracy for domain-specific terminology. Get more value from spoken audio by enabling search or analytics on transcribed text or facilitating action—all in your preferred programming language.

Transcripción de alta calidad

Obtenga transcripciones precisas con un reconocimiento de voz de vanguardia.

Modelos personalizables

Agregue palabras específicas al vocabulario base o cree sus propios modelos.

Implementación flexible

Ejecute Speech to Text en cualquier lugar: en la nube o en el perímetro en contenedores.

Preparado para producción

Acceda a la misma tecnología sólida que proporciona reconocimiento de voz en los productos de Microsoft.

Pruebe Speech to Text con esta aplicación de demostración, creada con nuestro SDK de JavaScript

Para probar la demostración con su propia voz a través de un micrófono, cambie a un explorador distinto con compatibilidad para WebRTC, por ejemplo una versión reciente de Microsoft Edge, Firefox o Chrome.

Los datos de voz no se almacenan

Transcriba voz de varios orígenes con precisión

Convierta en texto el audio procedente de una amplia gama de orígenes, como micrófonos, archivos de audio y Blob Storage. Use la diarización del hablante para determinar quién dijo qué y cuándo. Obtenga transcripciones legibles con formato y puntuación automáticos.

Personalice los modelos de voz según sus necesidades

Personalice sus modelos de voz para que reconozcan la terminología específica de la organización y del sector. Supere las barreras del reconocimiento de voz, como el ruido de fondo, los acentos o el vocabulario único. Personalice sus modelos cargando datos de audio y transcripciones. Genere automáticamente modelos personalizados usando datos de Office 365 con el fin de optimizar la precisión del reconocimiento de voz para su organización.

Implemente soluciones en cualquier parte, desde la nube hasta el perímetro

Run Speech to Text wherever your data resides. Build speech applications that are optimized for both robust cloud capabilities and edge locality using containers and language detection (preview). Speech containers support both standard and custom speech.

Privacidad y seguridad completas

  • El servicio de voz, que forma parte de Azure Cognitive Services, cuenta con las certificaciones de SOC, FedRAMP, PCI DSS, HIPAA, HITECH e ISO.
  • Sus datos siguen siendo suyos. Los datos de entrada de audio y transcripción no se registran durante el procesamiento del audio.
  • Puede ver y eliminar sus modelos y datos de voz personalizados en cualquier momento. Los datos se cifran mientras están en el almacenamiento.
  • Gracias al respaldo de la infraestructura de Azure, el servicio de voz ofrece una seguridad, una disponibilidad, un cumplimiento normativo y una manejabilidad de nivel empresarial.

Los precios flexibles ofrecen la capacidad y el control que necesita

Pague solo por lo que usa, sin costos por adelantado. Con Speech to Text, solo paga por lo que usa en función del número de horas de audio que transcriba.

Documentación y recursos

Introducción

Consulte la documentación

Realice un curso de Microsoft Learn

Explore ejemplos de código

Eche un vistazo a nuestro código de ejemplo

Vea recursos de personalización

Personalice su solución de voz con Speech Studio. No requiere trabajo de programación.

Creado con Speech to Text

KPMG simplifica la transcripción de llamadas

KPMG usa Speech to Text para transcribir y catalogar miles de horas de llamadas, lo que reduce los costos de cumplimiento normativo de sus clientes hasta en un 80 %.

KPMG

Motorola ayuda a los servicios de emergencia a acceder a datos vitales mediante voz

Motorola Solutions ayuda a la policía y a otros servicios de emergencia a acceder a información importante con más rapidez mediante un asistente virtual con reconocimiento de voz.

Motorola Solutions

Universal Electronics ofrece experiencias domésticas inteligentes con reconocimiento de voz

Universal Electronics ayuda a las marcas a ofrecer funcionalidades de navegación y control con reconocimiento de voz compatibles con los dispositivos cotidianos que se encuentran en el hogar, lo que ofrece una experiencia de consumidor realmente única.

Universal Electronics

Hochtief documenta los defectos de construcción mediante la voz

Hochtief ayuda a los jefes de proyectos a identificar y documentar defectos de construcción en sitios de proyectos mediante un asistente virtual con reconocimiento de voz.

Cheetah Mobile

NTT DATA agiliza la toma de decisiones con la información de las reuniones

NTT DATA extrae la información de los datos de voz mediante la transcripción de reuniones en tiempo real. Con Habla personalizada, pueden personalizar los modelos de reconocimiento de voz para entender los términos específicos de la organización.

NTTDATA

Insight impulsa las experiencias bancarias de conversación

Insight Enterprises ayuda a los bancos a ofrecer una velocidad y comodidad digitales a sus sucursales con una solución de banca con tecnología de IA de conversación. Speech to Text convierte lo que los clientes dicen en datos que se pueden procesar y analizar para que los clientes puedan obtener respuestas oportunas y relevantes.

Insight Enterprise, Inc.

Introducción a Voz