Omitir navegación

Servicios de voz

Convierta audio en texto, traduzca voz y convierta texto en voz con los servicios de voz unificados

Desarrolle rápidamente aplicaciones habilitadas para voz de alta calidad

cree aplicaciones habilitadas para voz de forma segura y rápida con Speech SDK. Transcriba voz a texto con alta precisión, produzca voces de texto a voz naturales, traduzca audio hablado y use el reconocimiento de altavoces durante las conversaciones. Explore con una experiencia sin código y cree modelos personalizados adaptados a su aplicación con Speech Studio.

Calidad líder del sector

Obtenga una conversión de voz en texto de última generación, una conversación de texto en voz realista y un reconocimiento del hablante ganador.

Compatible y seguro

Sus datos son suyos: durante el procesamiento, la entrada de voz no se registra.

Voces y modelos personalizables

Cree voces personalizadas, agregue palabras específicas a su vocabulario base o cree sus propios modelos.

Implementación flexible

Ejecutar voz en cualquier lugar, en la nube o en el perímetro en contenedores.

Convierta voz en texto

Transcriba audios de forma rápida y precisa en más de 100 idiomas y variantes. Obtenga información de los clientes con la transcripción del centro de llamadas, mejore las experiencias con asistentes habilitados para voz, capture debates importantes en reuniones y mucho más.

Déle voz a su aplicación

Use texto a voz para crear aplicaciones y servicios que hablen de forma conversacional. Cree contenidos de audio que suenan naturales, optimice la accesibilidad con funcionalidad de lectura en voz alta y cree asistentes de voz personalizados.

Traduzca voz en tiempo real

Traduzca audio desde más de 30 idiomas y personalice las traducciones para las necesidades específicas de su organización: todo en su lenguaje de programación preferido.

Comprobar y reconocer altavoces

Confirme la identidad de una persona o reconozca quién habla en una reunión añadiendo identificación y verificación del hablante a su aplicación.

Activar el asistente o dispositivo IoT con una palabra clave personalizada

Cree una palabra clave personalizada para dispositivos IoT y asistentes para voz, destacando su marca y haciéndola más personal, humana y segura.

Agregar comandos de voz para escenarios de manos libres

Cree una experiencia sin contacto y por voz para mejorar la seguridad y apoyar los escenarios de vuelta al trabajo.

Seguridad y cumplimiento normativo completos e integrados

  • Microsoft invierte más de USD 1 millardo al año en la investigación y el desarrollo de la ciberseguridad.

  • Contamos con más de 3,500 expertos en seguridad dedicados a proteger la seguridad y la privacidad de los datos.

  • Azure tiene más certificaciones que cualquier otro proveedor en la nube. Vea la lista completa.

Los precios flexibles ofrecen la capacidad y el control que necesita

Sin costes iniciales. Con Voz, pague solo por lo que use basándose en:

  • Número de horas de audio que transcribe o traduce para la conversión de voz en texto y traducción de voz.
  • El número de caracteres que se convierten en audio para la conversación de texto a voz
  • El número de transacciones para Speaker Recognition

Recursos y documentación de voz

Introducción a los servicios de Voz

Browse the documentation

Take the Microsoft Learn Speech course

Explore recursos populares para desarrolladores

Checkout our sample code and SDKs

Build speech models quickly with Speech studio Stack Overflow

Compañías de todos los tamaños confían en él

AT&T deleita a los clientes con experiencias inmersivas

AT&T is showcasing its 5G network with an immersive experience that allows customers to talk directly to Bugs Bunny.*

*LOONEY TUNES and all related characters and elements © & ™ Warner Bros. Entertainment Inc. (s21)

ATT

Progressive lleva Flo directamente a los clientes

Progressive usó Voz neuronal personalizada para crear una versión virtual de Flo que sonara natural para ayudar a los clientes con cualquier cosa, desde conseguir un presupuesto gratuito del seguro del coche hasta resolver dudas generales sobre seguros.

Progressive

KPMG simplifica la transcripción de llamadas

KPMG usa Speech to Text para transcribir y catalogar miles de llamadas, reduciendo los costes de cumplimiento de sus clientes hasta un 80 por ciento.

KPMG

Motorla ayuda a los primeros respondedores a acceder a datos vitales

Motorola Solutions ayuda a los trabajadores de primera línea a acceder a información vital con un asistente virtual por voz.

Motorola Solutions

Hochtief documenta defectos de construcción usando la voz

Un asistente virtual habilitado para voz ayuda a los administradores de proyectos de construcción a identificar y documentar defectos en los emplazamientos de construcción.

HOCHTIEF

Zencity mejora la calidad de vida con soluciones de inteligencia artificial

La startup de análisis de datos Zencity analiza, con Speech Translation, datos de diversos orígenes (redes sociales, solicitudes de mantenimiento y más), para ayudar a los gobiernos a tomar decisiones fundamentadas en datos y que puedan prestar mejores servicios a sus residentes.

Zencity

Cuando quiera, podemos configurar su cuenta gratuita de Azure

¿Podemos ayudarle?