Преобразование речи в текст

Функция службы "Речь", которая точно преобразует звуки речи в текст

Преобразование устной речи в действие

Быстрое и точное транскрибирование аудио в текст на более чем 30 языках. Настройка моделей для повышения точности терминологии определенной отрасли. Получайте больше преимуществ от устной речи, включив поиск или аналитику в транскрибированном тексте или упростив действие. Все это можно выполнить на предпочитаемом языке программирования.

Высококачественное транскрибирование

Обеспечьте точное транскрибирование с помощью современной технологии распознавания речи.

Настраиваемые модели

Добавьте определенные слова в базовый словарь или создайте собственные модели.

Гибкое развертывание

Запускайте службу преобразования речи в текст где угодно: в облаке или в контейнерах на периферии.

Готовность к выпуску

Получите доступ к такой же надежной технологии, которая обеспечивает распознавание речи в продуктах Майкрософт.

Попробуйте выполнить преобразование речи в текст с помощью этого демонстрационного приложения, созданного с применением нашего пакета SDK для JavaScript

Чтобы оценить демонстрационную версию, записав с помощью микрофона собственный голос, используйте браузер с поддержкой WebRTC, например последнюю версию Microsoft Edge, Firefox или Chrome.

Ваши речевые данные не будут сохранены

Точность транскрибирования речи из различных источников

Преобразуйте звук в текст из разнообразных источников, включая микрофоны, аудиофайлы и хранилища BLOB-объектов. Используйте диаризацию динамика, чтобы определить, кто, что и когда сказал. Получайте читаемые расшифровки с автоматическим форматированием и знаками препинания.

Настройка нужных моделей речи

Подготовьте свои модели речи к распознаванию терминологии определенной организации и отрасли. Устраняйте препятствия при распознавании речи, такие как фоновый шум, акцент или уникальный словарь. Настройте модели путем отправки звуковых данных и расшифровок. Автоматически создавайте настраиваемые модели с помощью данных Office 365, чтобы оптимизировать точность распознавания речи для организации.

Развертывание в любом месте — от облака до пограничной зоны

Запускайте службу преобразования речи в текст в любом расположении, в котором находятся ваши данные. Создавайте речевые приложения, оптимизированные как для надежных облачных возможностей, так и для пограничного размещения, с помощью контейнеров (предварительная версия). Контейнеры служб "Речь" теперь поддерживают как стандартные, так и настраиваемые голоса.

Комплексная конфиденциальность и безопасность

  • Служба "Речь", входящая в состав Azure Cognitive Services, соответствует требованиям сертификатов SOC, FedRAMP, PCI DSS, HIPAA, HITECH и ISO.
  • Ваши данные остаются у вас. Данные голосового ввода и транскрибирования не протоколируются во время обработки звука.
  • Вы можете просмотреть и удалить свои данные речи и модели в любое время. В хранилище данные шифруются.
  • Основанная на инфраструктуре Azure служба "Речь" предоставляет функции защиты, доступности, соответствия требованиям и управления корпоративного уровня.

Гибкая ценовая политика обеспечивает необходимые возможности и управление

Платите только за то, что вы используете, без каких-либо предварительных расходов. Работая со службой преобразования речи в текст, вы платите по мере использования в зависимости от количества часов транскрибированной речи.

Документация и ресурсы

Ознакомьтесь с ресурсами по настройке

Настройте свое решение речи с помощью Speech Studio. Вам не нужно уметь программировать.

KPMG

KPMG использует возможности настройки службы преобразования речи в текст для упрощения транскрибирования и преобразования вызовов, обеспечивая точность транскрибирования в 90 % и выше.

Начало работы со службами "Речь"