Пропустить навигацию

Преобразование текста в речь

Оживите свои приложения с помощью естественно звучащих голосов

Создавайте приложения и службы, которые говорят естественно. Выделите свой бренд с помощью генератора настроенного реалистичного голоса и получите доступ к голосам с разными стилями речи и эмоциональными тонами в соответствии с вашим вариантом использования — от средств чтения текста и общения до чат-ботов службы поддержки клиентов.

Синтезированная речь, похожая на настоящую

Синтезируйте плавную и естественную речь, которая соответствует интонации и эмоции человеческих голосов.

Настраиваемые голоса

Создайте уникальный генератор голоса ИИ, отражающий сущность вашей торговой марки.

Детальные элементы управления звуком для преобразования текста в речь

Точно настройте голосовой вывод для своих сценариев с помощью таких атрибутов, как скорость, высота тона, произношение, паузы и других.

Гибкое развертывание

Запускайте службу "Преобразование текста в речь" где угодно — в облаке, локально или в контейнерах на периферии.

Доступ к широкому спектру голосов для каждого сценария

Расширьте глобальную аудиторию, используя 400 нейронных голосов для 140 языков и диалектов. Воплотите в жизнь свои проекты, такие как средства чтения текста и голосовые помощники с выразительными человеческими голосами. Нейронное преобразование текста в речь поддерживает несколько стилей речи, включая выпуск новостей, поддержку клиентов, громкую речь, шепот, а также такие эмоции, как радость и грусть.

Попробуйте выполнить преобразование текста в речь с помощью этого демонстрационного приложения, созданного с применением нашего пакета SDK для JavaScript

Примечание. Ваши данные не будут сохранены.

Узнайте, как выполнять сборку

Примечание. Ваши данные не будут сохранены.

Узнайте, как выполнять сборку

Настройка речевого вывода

Точная настройка звука синтезированной речи в соответствии со сценарием. Определите лексиконы и управляйте такими параметрами речи, как произношение, высота звука, скорость, паузы и интонация с помощью Speech Synthesis Markup Language (SSML) или инструмента для создания аудиосодержимого.

Развертывание преобразования текста в речь в любом месте — от облака до пограничной зоны

Запускайте Преобразование текста в речь в любом расположении данных. Встраивайте реалистичный синтез речи в приложения, оптимизированные как для надежных облачных возможностей, так и пограничных расположений с помощью контейнеров.

Создание настраиваемого голоса для торговой марки

Подчеркните оригинальность вашей торговой марки с помощью уникальных настраиваемых голосов. Разрабатывайте высокореалистичные голоса для более естественных диалоговых интерфейсов с помощью возможности "Пользовательский нейронный голос". Рекомендуется начать со звукового файла продолжительностью 30 минут. Вот несколько примеров организаций, которые сейчас применяют генерацию голоса ИИ:

Компания Swisscom улучшает взаимодействие с клиентами с помощью многоязычного голосового помощника

Компания Swisscom использовала службу "Речь" для создания настраиваемого голосового помощника, преобразующего текст в речь, с уникальными естественно звучащими голосами на английском, французском, немецком и итальянском языках.

Читать историю

AT&T впечатляет клиентов с использованием иммерсивных интерфейсов

AT&T демонстрирует возможности сети 5G с эффектом погружения, которая позволяет клиентам напрямую общаться с Багзом Банни*.

*Товарный знак LOONEY TUNES и все связанные с ним персонажи и элементы принадлежат корпорации Warner Bros. Entertainment, Inc. (s21)

Смотреть видео

В Progressive реализовали возможность непосредственного общения клиентов с Flo

Компания Progressive с помощью пользовательского нейронного голоса создала виртуальную версию Flo с поддержкой естественной речи, чтобы помогать клиентам на всех этапах — от получения бесплатной страховой котировки автомобилей до ответов на общие вопросы о страховании.

Читать историю

Развитие инноваций в приложениях с помощью облачных служб ИИ

Узнайте пять ключевых способов, с помощью которых ваша организация сможет приступить к работе с ИИ, чтобы быстро реализовать его потенциал.

Комплексная конфиденциальность и безопасность

  • Служба "Речь", входящая в состав Azure Cognitive Services, соответствует требованиям сертификатов SOC, FedRAMP, PCI DSS, HIPAA, HITECH и ISO.
  • Ваши данные остаются у вас. Текстовые данные не сохраняются во время обработки данных или создания голоса.
  • Вы можете просмотреть и удалить свои пользовательские данные голоса и модели синтезированной речи в любое время. В хранилище данные шифруются.
  • Основанная на инфраструктуре Azure служба "Речь" предоставляет функции защиты, доступности, соответствия требованиям и управления корпоративного уровня.

Гибкая ценовая политика обеспечивает необходимые возможности и управление

Платите только за то, что вы используете, без каких-либо предварительных расходов. Плата за службу "Преобразование текста в речь" взимается по мере использования в зависимости от количества символов, преобразуемых в аудио.

Рекомендации по созданию искусственных голосов, вызывающих доверие

Сведения об ответственном развертывании

Синтетические голоса должны звучать так, чтобы завоевать доверие пользователей. Изучите принципы создания синтетических голосов, которые формируют доверие к вашей компании и услугам.

Получение согласия от актеров озвучивания

Помогите актеру озвучивания понять, как работает нейронное преобразование текста в речь (TTS), и получите информацию о рекомендуемых вариантах использования.

Прозрачность

Прозрачность является основой ответственного использования генераторов компьютерных голосов и синтетических голосов. Позаботьтесь о том, чтобы пользователи понимали, когда слышат синтетический голос, а актеры озвучивания знали, как будут использоваться их голоса. Узнайте больше благодаря нашим рекомендациям по проектированию для раскрытия информации.

Документация и ресурсы

Изучите примеры кода

Ознакомиться с примерами кода

Ознакомьтесь с ресурсами по настройке

Настройте свое решение речи с помощью Speech Studio. Вам не нужно уметь программировать.

Решения на основе службы "Преобразование текста в речь"

BBC разрабатывает инновационный способ доставки проверенного контента

На основе Azure Cognitive Services и Службы Azure Bot в BBC разработан комплексный настраиваемый цифровой голосовой помощник. Он передает фирменную идентичность компании и формирует интерактивную связь с широкой аудиторией.

BBC

Компания Swisscom улучшает взаимодействие с клиентами с помощью многоязычного помощника

Компания Swisscom использовала службу "Речь" для создания настраиваемого голосового помощника с уникальными естественно звучащими голосами на английском, французском, немецком и итальянском языках.

Swisscom

Motorola помогает сотрудникам экстренных служб получать доступ к важным данным

Компания Motorola Solutions помогает полицейским и сотрудникам других экстренных служб быстрее получать доступ к важной информации с помощью виртуального голосового помощника.

Motorola Solutions

Universal Electronics расширяет возможности "умного дома"

Universal Electronics помогает производителям предоставлять возможности голосовой навигации и управления на интеллектуальных домашних устройствах.

Universal Electronics

Cheetah Mobile расширяет доступность своего решения для перевода на международных рынках

Компания Cheetah Mobile, предоставляющая мобильный Интернет, с пользователями приложений в более чем 200 странах и регионах при помощи службы "Преобразование текста в речь" расширяет доступность своего устройства и приложения для перевода на международных рынках.

Cheetah Mobile

Бесплатная учетная запись Azure готова к настройке в любой момент