Пропустить навигацию

Службы речи

Преобразование звука в текст, перевод речи и преобразование текста в речь с помощью унифицированных служб речи

Быстрая разработка высококачественных голосовых приложений

Легко и уверенно создавайте голосовые приложения с помощью пакета SDK службы "Речь". Преобразуйте речь в текст с высокой точностью и создавайте естественно звучащие голоса, преобразуя текст в речь, а также переводите разговорные аудиоматериалы и используйте функцию распознавания говорящего во время бесед. Исследуйте модели без использования кода или создавайте собственные модели, адаптированные к вашему приложению, с помощью Speech Studio.

Лучшее качество в отрасли

Удобные функции преобразования речи в текст, преобразования текста в речь и распознавания говорящего.

Безопасность и соответствие требованиям

Вы сохраняете контроль над своими данными, так как данные речевого ввода не регистрируется во время обработки.

Настраиваемые голоса и модели

Создавайте пользовательские голоса, добавляйте необходимые слова в основной словарь или создавайте свои собственные модели.

Гибкое развертывание

Запускайте службу "Речь" где угодно, в облаке или на границе в контейнерах.

Преобразование речи в текст

Быстро и точно транскрибируйте аудиозаписи на более чем 100 языках и языковых вариантах. Получайте аналитические сведения о клиентах с помощью транскрибирования в центре обработки вызовов, улучшайте взаимодействие с голосовыми помощниками, записывайте ключевые обсуждения на собраниях и т. д.

Предоставьте приложению голосовые возможности

Используйте преобразование текста в речь для создания разговорных приложений и служб. Создавайте аудиоматериалы с естественным звучанием, улучшайте специальные возможности с помощью функций чтения вслух и разрабатывайте настраиваемые голосовые помощники.

Перевод речи в режиме реального времени

Переводите аудиоматериалы с более чем 30 языков и настраивайте переводы в соответствии с конкретными требованиями вашей организации — все на вашем любимом языке программирования.

Проверка и распознавание динамиков

Подтвердите личность пользователя или узнайте, кто выступает на собрании, добавив в свое приложение возможность подтверждения или идентификации говорящего.

Активация помощника или устройства Интернета вещей с помощью пользовательского ключевого слова

Создайте пользовательское ключевое слово для устройств IoT и помощников, поддерживающих голосовые команды, чтобы выделить торговую марку вашей организации, сделав ее более индивидуальной, узнаваемой и надежной.

Добавление голосовых команд для сценариев работы без использования рук

Создайте голосовой интерфейс, не требующий касания, для повышения безопасности и поддержки сценариев возвращения к работе

Комплексные встроенные средства обеспечения безопасности и соответствия требованиям

  • Корпорация Майкрософт ежегодно инвестирует более USD 1 млрд долларов США в научные исследования и разработку решений для обеспечения кибербезопасности.

  • У нас работает более 3,500 специалистов по обеспечению безопасности и конфиденциальности данных.

  • У Azure больше сертификатов, чем у любого другого поставщика облачных служб. Просмотрите полный список.

Гибкая ценовая политика обеспечивает необходимые возможности и управление

Платите только за те ресурсы, которые вы используете, без каких-либо предварительных затрат. Платите за службы “Речь” по мере их использования, учитывая следующие факторы.

  • Количество часов аудиозаписей, которые транскрибируются или переводятся для преобразования речи в текст и перевода речи.
  • Количество символов, преобразуемых в звук для функции преобразования текста в речь
  • Количество транзакций для функции распознавания говорящего

Документация и ресурсы службы "Речь"

Начало работы со службами "Речь"

Обзор документации

Пройти курс по службе "Речь" в Microsoft Learn

Ознакомьтесь с популярными ресурсами для разработчиков

Просмотреть примеры кода и пакеты SDK

Быстро создать речевую модель с помощью Stack Overflow Speech Studio

Нам доверяют компании всех размеров

AT&T предлагает клиентам иммерсивный интерфейс

AT&T демонстрирует сеть 5G с эффектом погружения, которая позволяет клиентам напрямую общаться с Багзом Банни.*

*Торговая марка LOONEY TUNES и все связанные с ней персонажи и элементы принадлежат корпорации Warner Bros. Entertainment, Inc. (s21)

ATT

Progressive приближает чат-бот Flo к клиентам

Progressive использует пользовательский нейронный голос для создания виртуальной версии Flo с естественным звучанием, чтобы помогать своим клиентам во всем — от бесплатного получения расценок на страхование автомобиля до отправки общих вопросов по страхованию.

Progressive

KPMG оптимизирует транскрибирование звонков

KPMG использует преобразование речи в текст для расшифровки и каталогизации множества звонков. Благодаря этому компании удалось снизить затраты своих клиентов на соблюдение требований законодательства на 80%.

KPMG

Motorola помогает первым отвечающим устройствам получать доступ к важным данным

Motorola Solutions помогает сотрудникам служб экстренного реагирования на местах получать доступ к жизненно важной информации с помощью виртуального помощника с голосовым управлением.

Motorola Solutions

Hochtief регистрирует дефекты строительства с помощью голоса

Виртуальный помощник с голосовым управлением помогает руководителям строительных проектов выявлять и документировать дефекты на строительных площадках.

HOCHTIEF

Zencity повышает качество жизни с помощью решений искусственного интеллекта

Стартап по обработке данных Zencity использует перевод речи для анализа данных из различных источников — социальных сетей, запросов на обслуживание и т. д. Это позволяет правительствам принимать обоснованные решения и предоставлять своим гражданам наилучшие услуги.

Zencity

Обновления речи, блоги и объявления

Бесплатная учетная запись Azure готова к настройке в любой момент