Voz de Azure AI
Servicio administrado que ofrece extraordinarias características de voz, como la conversión de voz en texto, la conversión de texto en voz, la traducción de voz y el reconocimiento del hablante.
Desarrolle aplicaciones habilitadas para voz de alta calidad en nada de tiempo
Cree aplicaciones habilitadas para voz de IA generativa con confianza y de forma rápida con Voz de Azure AI. Transcriba voz con una gran precisión, produzca voces con un sonido natural al convertir texto en voz, traduzca audio oral y use el reconocimiento del hablante durante las conversaciones. Cree soluciones más rápidas con modelos de inteligencia artificial pregenerados y personalizables en Inteligencia artificial de Azure Studio.
Calidad líder del sector
Obtenga una conversión de voz en texto de última generación, una conversión de texto en voz muy realista y un reconocimiento del hablante que ha sido galardonado.
Seguro y conforme a la normativa
Sus datos siguen siendo suyos: la entrada de voz no se registra mientras se procesa.
Voces y modelos personalizables
Cree voces personalizadas, agregue palabras específicas al vocabulario base o cree sus propios modelos.
Implementación flexible
Ejecute el servicio de voz en cualquier lugar: en la nube o en el perímetro en contenedores.
Conversión de voz en texto
Transcriba audio de forma rápida y precisa en más de 100 idiomas y variantes. Obtenga información de los clientes con la transcripción del centro de llamadas, mejore la experiencia con asistentes habilitados para voz, capture las conversaciones más importantes de las reuniones, etc.
Dé voz a sus aplicaciones
Use texto a voz para crear aplicaciones y servicios que hablen de forma conversacional. Cree contenido de audio que suene natural, mejore la accesibilidad con la funcionalidad de lectura en voz alta y cree asistentes de voz personalizados.
Traducir voz en tiempo real
Traduzca audio en más de 30 idiomas y personalice la traducción de los términos específicos de su organización, todo ello con su lenguaje de programación preferido.
Compruebe y reconozca a los hablantes
Agregue características de verificación e identificación del hablante a sus aplicaciones para confirmar la identidad de una persona o reconocer quién habla en una reunión.
Active su asistente o dispositivo IoT con una palabra clave personalizada
Cree una palabra clave personalizada para dispositivos IoT y asistentes habilitados con voz para diferenciar su marca y lograr así una experiencia más personal, agradable y segura.
Agregue comandos de voz para habilitar escenarios de manos libres
Cree una experiencia por voz, sin contacto, para mejorar la seguridad y sustentar la vuelta al trabajo.
Seguridad y cumplimiento integrales, integrados
-
Microsoft invierte más de 1 000 000 000 USD al año en la investigación y el desarrollo de la ciberseguridad.
-
Contamos con más de 3500 expertos en seguridad que se dedican a proteger la seguridad y la privacidad de los datos.
-
Los precios flexibles ofrecen la capacidad y el control que necesita
Pague solo por lo que use, sin costes iniciales. Con el servicio de voz, paga solo por lo que usa en función de lo siguiente:
- Número de horas de audio que transcribe o traduce para la conversión de voz en texto y la traducción de voz.
- Número de caracteres que se convierten en audio para la conversión de texto en voz
- Número de transacciones de reconocimiento del hablante
Comenzar con una cuenta gratuita de Azure
1
Empieza gratis. Obtén un crédito de 200 USD para usar durante 30 días. Mientras dispongas de tu crédito, puedes obtener de forma gratuita muchos de nuestros servicios más populares, además de otros 55 servicios que siempre son gratuitos.
2
Después del crédito, cambia a un plan de pago por uso para seguir creando con los mismos servicios gratuitos. Paga solamente si tu uso supera la cantidad gratuita mensual.
3
Avalado por compañías de todos los tamaños
AT&T deleita a sus clientes con experiencias envolventes
AT&T presenta su red 5G con una experiencia envolvente que permite a los clientes comunicarse directamente con Bugs Bunny*.
*LOONEY TUNES y todos los personajes y elementos relacionados son marcas comerciales o protegidas con copyright de Warner Bros. Entertainment Inc. (s21)
Progressive ofrece Flo directamente a sus clientes
Progressive usó la característica Voz neuronal personalizada para crear una versión virtual de Flo que suena natural, para que ayude a los clientes en todo, desde conseguir un presupuesto gratuito de un seguro de automóvil hasta preguntas generales sobre seguros.
KPMG simplifica la transcripción de llamadas
KPMG utiliza Speech to Text para transcribir y catalogar miles de llamadas, lo que reduce los costes de cumplimiento normativo de sus clientes hasta en un 80 %.
Motorola ayuda a los servicios de emergencia a acceder a datos vitales
Las soluciones de Motorola ayudan a los servicios de emergencia a acceder a información vital con un asistente virtual por voz.
Documentación y recursos del servicio de voz
Introducción a Voz de Azure AI
Examinar la documentación
Realice el curso del servicio de voz de Microsoft Learn
Explorar recursos populares para desarrolladores
Eche un vistazo al código de ejemplo y los SDK
Cree modelos de voz rápidamente con Speech Studio Stack Overflow