Преобразование речи в текст

Преобразуйте устную речь в текст для более естественного взаимодействия

Современные технологии распознавания речи

Используйте преобразование речи в текст в рамках служб "Речь" для оперативного преобразования речи из разнообразных источников в текст. Настраивайте модели, чтобы преодолеть такие распространенные препятствия при распознавании речи, как уникальные словарные запасы, стили речи или фоновые помехи. Сделайте речь более доступной и помогите всем следить за беседами в режиме реального времени и участвовать в них.

Беспрецедентные инновации

Воспользуйтесь преимуществами передовой точности распознавания речи на основе моделей глубокой нейронной сети.

Взаимодействие в режиме реального времени

Транскрибируйте аудио в текст в режиме реального времени, чтобы все участники беседы могли в полной мере участвовать в обсуждении.

Настраиваемое распознавание речи

Адаптируйте распознавание речи с учетом разговорного стиля и терминологии определенной отрасли.

Гибкое развертывание

Запускайте службу распознавания речи где угодно: в облаке, локально или в контейнерах на периферии.

Использование передовых технологий распознавания речи

Совершенствуйте свои приложения за счет функций преобразования речи, созданных на основе результатов десятилетий революционных исследований. Корпорация Майкрософт первой реализовала возможности ИИ, сравнимые с возможностями человека, в виде коммутационной панели для задач по распознаванию разговорной речи, а также продолжает способствовать проведению передовых исследований в сфере распознавания речи.

Подробнее о современных технологиях распознавания речи

Чтобы оценить демонстрационную версию, записав с помощью микрофона собственный голос, используйте браузер с поддержкой WebRTC, например последнюю версию Microsoft Edge, Firefox или Chrome.

Хотите создать подобное?

Оптимизация распознавания речи с помощью адаптированных моделей

Настройте модели распознавания речи, чтобы преодолеть распространенные препятствия при распознавании речи. Адаптируйте языковые модели, чтобы подстроиться под стили речи пользователей, их акценты или уникальный словарь, например названия мест, товаров и отраслевые выражения. Автоматически создавайте пользовательские модели с помощью данных Office 365, чтобы оптимизировать точность распознавания речи с учетом терминологии, характерной для организации.

Начало использования пользовательского распознавания речи

Примеры предложений

Базовый показатель

Пользовательское распознавание речи

Хотите создать подобное?

Получайте ценные сведения из бесед

Транскрибируйте многопользовательские беседы в режиме реального времени и позвольте участникам сосредоточиться на обсуждении. Определяйте, кто, что и когда сказал, и быстро переходите к дальнейшим действиям. Оптимизируйте взаимодействие при использовании устройств с несколькими микрофонами. Включите аналитику транскрибированного текста, чтобы получить дополнительные ценные сведения из бесед.

Подробнее о функции транскрибирования бесед

Развертывание в любом месте — от облака до пограничной зоны

Выполняйте преобразование речи в текст в облаке или локально с помощью контейнеров для сценариев, в которых первоочередная роль отводится безопасности данных и низкой задержке.

Подробнее о распознавании речи в контейнерах

Безопасность для организации

  • Корпорация Майкрософт ежегодно инвестирует более 1 млрд долларов США в научные исследования и разработку решений для обеспечения кибербезопасности.

  • На нас работает более 3500 экспертов по безопасности, которые полностью посвятили себя обеспечению безопасности и конфиденциальности ваших данных.

  • У Azure есть больше сертификатов соответствия требованиям, чем у решения любого другого поставщика облачных служб. Просмотрите полный список.

Необходимая мощность, контроль и настройка с гибкими ценами

Платите только за то, что вы используете, без каких-либо предварительных расходов. Работая со службой преобразования речи в текст, вы платите по мере использования в зависимости от количества часов транскрибированной речи.

См. цены на преобразование речи в текст

Начало работы со службой преобразования речи в текст в три этапа

Получите мгновенный доступ и 200 долл. США на счет, зарегистрировав бесплатную учетную запись Azure.
Войдите на портал Azure и добавьте службы "Речь".
Узнайте, как внедрить в систему Преобразование речи в текст, из этих кратких руководств и документации.

Ресурсы преобразования речи в текст для разработчиков

Документация и учебники

Начните работать со службой преобразования речи в текст.

Курсы

Пройдите курс Pluralsight, в котором описано использование преобразования речи в текст.

Примеры использования

Получите дополнительные сведения о преобразовании речи в текст, например о транскрибировании бесед и звонков в центр обработки вызовов.

Часто задаваемые вопросы о преобразовании речи в текст

  • Полный список языков, которые поддерживает служба преобразования речи в текст, см. в нашей документации.
  • Вы можете запросто записывать аудио на микрофон, читать из потока или получать доступ к аудиофайлам с помощью пакета SDK для служб "Речь" и REST API. Пакет SDK для служб "Речь" поддерживает распознавание речи для одноканальных 16-битных аудиофайлов в формате WAV/PCM с частотой 16 кГц/8 кГц. Дополнительные аудиоформаты поддерживаются при использовании конечных точек REST для преобразования речи в текст или службы пакетного транскрибирования.

Начало работы со службой преобразования речи в текст