Настраивайте голосовые функции в приложении для своих целей, в том числе с использованием модели OpenAI Whisper, или выберите для помощника фирменный голос.
Разрабатывайте мультимодальные приложения генеративного ИИ с помощью речевых моделей
Преобразуйте речь в текст
Транскрибируйте беседы клиентов с сотрудниками центра обработки звонков и ход собраний. Выйдите на глобальный рынок, используя субтитры на более чем 100 языках.
Преобразуйте текст в речь
Создавайте боты, которые говорят естественно. Выделите свой бренд на фоне конкурентов благодаря настраиваемым, реалистичным голосам и стилям речи.
Аналитика речи
Анализируйте записи аудио- и видеозвонков, чтобы получить значимые выводы. Обобщайте основные темы и извлекайте или маскируйте данные, позволяющие идентифицировать личность.
Преобразуйте центры обработки звонков на основе последней модели OpenAI Whisper в Речи ИИ Azure или службы Azure OpenAI.
Создавайте пользовательские голоса
Создавайте естественно звучащие голоса на основе пользовательского нейронного голоса.
Создавайте собственные аватары
Оживите свой бренд с помощью готовых или настраиваемых аватаров с естественно звучащими голосами.
Подтверждайте личность и распознавайте говорящих
Добавляйте в свои приложения проверку личности человека и узнавание говорящих, чтобы распознавать выступающих на собрании и подтверждать их личность.
Обеспечивайте общение на нескольких языках
Переводите звуковые и видеофайлы (список поддерживаемых языков постоянно растет). Настраивайте переводы для конкретной отрасли.
Используйте встроенные речевые функции
Используйте встроенные речевые функции для сценариев перевода речи в текст и текста в речь на основе устройств там, где облачное подключение прерывается или недоступно.
Встроенные средства обеспечения безопасности и соответствия требованиям
Платите только за то, что используете, без дополнительных фиксированных сборов. Расценки на распознавание речи ИИ Azure по мере использования базируются на следующих факторах.
Создавайте комплексные решения с использованием Речи ИИ Azure и других продуктов ИИ Azure.
Служба Azure OpenAI
Расширяйте возможности приложений и добавляйте мультимодальность с помощью моделей, сочетающих несколько типов данных, например текст, изображения, видео и звук.
"Наш самый большой пример использования Azure относится к области ИИ, Cognitive Services и речи. Он затрагивает практически каждый компонент нашей платформы".
Джефф Галлино (Jeff Gallino), соучредитель и главный технический директор CallMiner
"Мы первые в Бразилии занялись этой областью. Мы сделали смелый выбор, вложив средства в использование синтезированного нейронного голоса, когда такого еще никто не делал. Каждый год мы общаемся с миллионами клиентов, поэтому изменение нашего голоса — это для нас смелый шаг".
Олимпио Фернандес (Olimpio Fernandes), директор Центра когнитивного опыта, TIM
"Очень трудно предлагать высококачественные голоса в широком масштабе, но корпорация Майкрософт действительно помогла нам быстро реализовать преобразование текста в речь и ввести голоса в обслуживание клиентов".
Речь ИИ Azure предоставляет ряд функций и возможностей, в том числе преобразования речи в текст и текста в речь, а также перевода речи. Эти функции доступны через SDK на нескольких языках программирования, в том числе C#, C++, Java и др.
Речь ИИ Azure поддерживает постоянно растущий набор языков. Список поддерживаемых языков см. здесь.
Клиенты используют службы ИИ Azure для создания интересных приложений. Начните работу со службой Аналитика речи в Azure AI Foundry для ИИ-разговоров, аналитики после звонков, резюмирования видео и других вариантов использования.
Дальнейшие шаги
Выберите учетную запись Azure, которая подходит именно вам
Оплачивайте по мере использования или попробуйте Azure бесплатно в течение 30 дней.