Desarrollo de aplicaciones de inteligencia artificial generativas con modelos de voz
Creación de agentes habilitados para voz
Use modelos básicos junto con modelos personalizados de entrada y salida de audio para potenciar los agentes con voz.
Transcribir conversión de voz en texto
Transcriba el centro de llamadas o las conversaciones de reuniones. Global con subtítulos de audio en más de 100 idiomas.
Convertir texto en voz
Cree bots que hablen de forma natural. Diferencie su marca con voces personalizadas y realistas y estilos de habla.
Uso del análisis posterior a la llamada
Analice las grabaciones de llamadas de audio o vídeo para obtener información detallada con los modelos básicos de Servicio de comprensión de contenido de IA de Azure.
Transcribir el audio con OpenAI Whisper
Transforme sus centros de llamadas utilizando el último modelo OpenAI Whisper en Voz de Azure AI o Servicio OpenAI Azure.
Crear voces personalizadas
Cree voces naturales con voz neuronal personalizada.
Crear sus avatares
De vida a su marca con avatares preconfigurados o personalizados con voces naturales.
Habilitar la comunicación multilingüe
Traduzca datos de audio o vídeo desde y hacia una lista cada vez mayor de idiomas compatibles. Personalice las traducciones a su sector.
Insertar voz
Use la voz insertada para activar escenarios de voz a texto y texto a voz en el dispositivo en los que la conectividad en la nube es intermitente o no está disponible.
"Nuestro mayor caso de uso para Azure se encuentra en las áreas de inteligencia artificial, Cognitive Services y voz. Toca casi todas las partes de nuestra plataforma”.
Jeff Gallino, cofundador y director de tecnología, CallMiner
"Somos pioneros aquí en Brasil. Hemos realizado una elección excelente invirtiendo en el uso de una voz neuronal sintetizada cuando nadie más lo estaba haciendo. Hablamos con millones de clientes cada año, así que cambiar nuestra voz es un acto de valor".
Olimpio Fernandes, director del centro de experiencia cognitiva, TIM
"Es bastante difícil ofrecer voces de alta calidad a escala, pero Microsoft nos ha ayudado mucho a dar el pistoletazo de salida en el extremo TTS y a hacer llegar las voces a nuestros clientes".
Moad Ben-Suleiman, ingeniero de software, NaturalReader
Azure AI Speech ofrece una serie de características y capacidades, como la conversión de voz a texto, de texto a voz y la traducción de voz. Se ofrecen a través de SDK en varios lenguajes de programación, como C#, C++, Java, etc.
Voz admite un conjunto de idiomas en constante crecimiento. Para los idiomas admitidos, consulte la lista actual.
Los clientes están creando aplicaciones interesantes mediante Servicios de Azure AI. Introducción con Análisis de Voz de Azure AI en Fundición de IA de Azure para casos de uso, como la inteligencia artificial conversacional, el análisis posterior a las llamadas y el resumen de vídeo.
Pasos siguientes
Elija la cuenta de Azure adecuada para usted
Paga por uso o prueba Azure gratis durante un máximo de 30 días.
Examina el centro de soluciones empresariales de Microsoft para encontrar los productos y soluciones que pueden ayudar a tu organización a alcanzar tus objetivos.