Desarrollo de aplicaciones de inteligencia artificial generativas multimodal con modelos de voz
Transcribir conversión de voz en texto
Transcriba el centro de llamadas o las conversaciones de reuniones. Globalícese con el subtitulado de audio en más de 100 idiomas.
Convertir texto en voz
Cree bots que hablen de forma natural. Diferencie su marca con voces personalizadas y realistas y estilos de habla.
Análisis de voz
Analice las grabaciones de llamadas de audio o vídeo para obtener información detallada. Resuma los temas clave y extraiga o redacte información de identificación personal.
Transcribir el audio con OpenAI Whisper
Transforme sus centros de llamadas utilizando el último modelo OpenAI Whisper en Voz de Azure AI o Azure OpenAI Service.
Crear voces personalizadas
Cree voces naturales con voz neuronal personalizada.
Crear sus avatares
De vida a su marca con avatares preconfigurados o personalizados con voces naturales.
Comprobar y reconocer hablantes
Confirme la identidad de una persona o reconozca quién habla en una reunión agregando a su aplicación la verificación e identificación del hablante.
Habilitar la comunicación multilingüe
Traduzca datos de audio o vídeo desde y hacia una lista cada vez mayor de idiomas compatibles. Personalice las traducciones a su sector.
Voz insertada
Use la voz insertada para activar la conversión de voz en texto en el dispositivo y la conversión de texto a voz en escenarios en los que la conectividad en la nube es intermitente o no está disponible.
"Nuestro mayor caso de uso para Azure se encuentra en las áreas de inteligencia artificial, Cognitive Services y voz. Toca casi todas las partes de nuestra plataforma”.
Jeff Gallino, cofundador y director de tecnología, CallMiner
"Somos pioneros aquí en Brasil. Hemos realizado una elección excelente invirtiendo en el uso de una voz neuronal sintetizada cuando nadie más lo estaba haciendo. Hablamos con millones de clientes cada año, así que cambiar nuestra voz es un acto de valor".
Olimpio Fernandes, director del centro de experiencia cognitiva, TIM
"Es bastante difícil ofrecer voces de alta calidad a escala, pero Microsoft nos ha ayudado mucho a dar el pistoletazo de salida en el extremo TTS y a hacer llegar las voces a nuestros clientes".
Moad Ben-Suleiman, ingeniero de software, NaturalReader
Azure AI Speech ofrece una serie de características y capacidades, como la conversión de voz a texto, de texto a voz y la traducción de voz. Se ofrecen a través de SDK en varios lenguajes de programación, como C#, C++ y Java, entre otros.
Voz de Azure AI admite un conjunto cada vez mayor de idiomas. Para obtener la lista actual de idiomas admitidos, consulte esta lista.
Los clientes están creando aplicaciones interesantes mediante Servicios de Azure AI. Introducción al Análisis de voz en Azure AI Foundry para IA de conversación, análisis posterior a la llamada, resumen de vídeo y más casos de uso.
Pasos siguientes
Elija la cuenta de Azure adecuada para usted
Paga por uso o prueba Azure gratis durante un máximo de 30 días.
Examina el centro de soluciones empresariales de Microsoft para encontrar los productos y soluciones que pueden ayudar a tu organización a alcanzar tus objetivos.