Omitir navegación

Servicios de voz

Convierta audio en texto, traduzca voz y convierta texto en voz con los servicios de voz unificados

Desarrolle rápidamente aplicaciones habilitadas para voz de alta calidad

cree aplicaciones habilitadas para voz de forma segura y rápida con Speech SDK. Transcriba voz a texto con alta precisión, produzca voces de texto a voz naturales, traduzca audio hablado y use el reconocimiento de altavoces durante las conversaciones. Explore con una experiencia sin código y cree modelos personalizados adaptados a su aplicación con Speech Studio.

Calidad líder del sector

Obtenga una conversión de voz en texto de última generación, una conversación de texto en voz realista y un reconocimiento del hablante ganador.

Compatible y seguro

Sus datos son suyos: durante el procesamiento, la entrada de voz no se registra.

Voces y modelos personalizables

Cree voces personalizadas, agregue palabras específicas a su vocabulario base o cree sus propios modelos.

Implementación flexible

Ejecutar voz en cualquier lugar, en la nube o en el perímetro en contenedores.

Convierta voz en texto

Transcriba audios de forma rápida y precisa en más de 100 idiomas y variantes. Obtenga información de los clientes con la transcripción del centro de llamadas, mejore las experiencias con asistentes habilitados para voz, capture debates importantes en reuniones y mucho más.

Déle voz a su aplicación

Use Text to Speech para crear aplicaciones y servicios que hablen como en una conversación, escogiendo entre más de 270 voces neurales entre los 119 idiomas. Cree contenido de audio natural que mejore la accesibilidad con la capacidad de leer en alto, además de asistentes para voz personalizados.

Traduzca voz en tiempo real

Traduzca audio desde más de 30 idiomas y personalice las traducciones para las necesidades específicas de su organización: todo en su lenguaje de programación preferido.

Comprobar y reconocer altavoces

Confirme la identidad de una persona o reconozca quién habla en una reunión añadiendo identificación y verificación del hablante a su aplicación.

Activar el asistente o dispositivo IoT con una palabra clave personalizada

Cree una palabra clave personalizada para dispositivos IoT y asistentes para voz, destacando su marca y haciéndola más personal, humana y segura.

Agregar comandos de voz para escenarios de manos libres

Cree una experiencia sin contacto y por voz para mejorar la seguridad y apoyar los escenarios de vuelta al trabajo.

Seguridad y cumplimiento integrales e integrados

  • Microsoft invierte más de USD 1 millardo al año en la investigación y el desarrollo de la ciberseguridad.

  • Contamos con más de 3,500 expertos en seguridad dedicados a proteger la seguridad y la privacidad de los datos.

  • Azure tiene más certificaciones que cualquier otro proveedor en la nube. Vea la lista completa.

Los precios flexibles le dan la potencia y el control que necesita

Sin costes iniciales. Con Voz, pague solo por lo que use basándose en:

  • Número de horas de audio que transcribe o traduce para la conversión de voz en texto y traducción de voz.
  • El número de caracteres que se convierten en audio para la conversación de texto a voz
  • El número de transacciones para Speaker Recognition

Recursos y documentación de voz

Introducción a los servicios de Voz

Examine la documentación

Siga el curso Microsoft Learn Speech

Explore recursos populares para desarrolladores

Eche un vistazo a nuestro código de ejemplo y SDK

Cree rápidamente modelos de voz con Speech Studio Stack Overflow

La herramienta de confianza para empresas de todos los tamaños

AT&T deleita a los clientes con experiencias inmersivas

AT&T está mostrando su red 5G con una experiencia inmersiva que permite a sus clientes hablar directamente con Bugs Bunny.*

*LOONEY TUNES y todos los personajes y elementos relacionados © & ™ Warner Bros. Entertainment Inc. (s21)

ATT

Progressive lleva Flo directamente a los clientes

Progressive usó Voz neuronal personalizada para crear una versión virtual de Flo que sonara natural para ayudar a los clientes con cualquier cosa, desde conseguir un presupuesto gratuito del seguro del coche hasta resolver dudas generales sobre seguros.

Progressive

KPMG simplifica la transcripción de llamadas

KPMG usa Speech to Text para transcribir y catalogar miles de llamadas, reduciendo los costes de cumplimiento de sus clientes hasta un 80 por ciento.

KPMG

Motorla ayuda a los primeros respondedores a acceder a datos vitales

Motorola Solutions ayuda a los trabajadores de primera línea a acceder a información vital con un asistente virtual por voz.

Motorola Solutions

Hochtief documenta defectos de construcción usando la voz

Un asistente virtual habilitado para voz ayuda a los administradores de proyectos de construcción a identificar y documentar defectos en los emplazamientos de construcción.

HOCHTIEF

Zencity mejora la calidad de vida con soluciones de IA

La startup de análisis de datos Zencity analiza, con Speech Translation, datos de diversos orígenes (redes sociales, solicitudes de mantenimiento y más), para ayudar a los gobiernos a tomar decisiones fundamentadas en datos y que puedan prestar mejores servicios a sus residentes.

Zencity

Actualizaciones de voz, blogs y anuncios

Estamos preparados: configuremos su cuenta gratuita de Azure

¿Podemos ayudarle?