Преобразование речи в текст

Функция службы "Речь", которая точно преобразует звуки речи в текст

Преобразование устной речи в действие

Быстрое и точное транскрибирование аудио в текст на более чем 85 языках и вариантах. Настройка моделей для повышения точности терминологии определенной отрасли. Получайте больше преимуществ от устной речи, включив поиск или аналитику в транскрибированном тексте или упростив действие. Все это можно выполнить на предпочитаемом языке программирования.

Высококачественное транскрибирование

Обеспечьте точное транскрибирование с помощью современной технологии распознавания речи.

Настраиваемые модели

Добавьте определенные слова в базовый словарь или создайте собственные модели.

Гибкое развертывание

Запускайте службу преобразования речи в текст где угодно: в облаке или в контейнерах на периферии.

Готовность к выпуску

Получите доступ к такой же надежной технологии, которая обеспечивает распознавание речи в продуктах Майкрософт.

Попробуйте выполнить преобразование речи в текст с помощью этого демонстрационного приложения, созданного с применением нашего пакета SDK для JavaScript

Чтобы оценить демонстрационную версию, записав с помощью микрофона собственный голос, используйте браузер с поддержкой WebRTC, например последнюю версию Microsoft Edge, Firefox или Chrome.

Ваши речевые данные не будут сохранены

Точность транскрибирования речи из различных источников

Преобразуйте звук в текст из разнообразных источников, включая микрофоны, аудиофайлы и хранилища BLOB-объектов. Используйте диаризацию динамика, чтобы определить, кто, что и когда сказал. Получайте читаемые расшифровки с автоматическим форматированием и знаками препинания.

Настройка нужных моделей речи

Подготовьте свои модели речи к распознаванию терминологии определенной организации и отрасли. Устраняйте препятствия при распознавании речи, такие как фоновый шум, акцент или уникальный словарь. Настройте модели путем отправки звуковых данных и расшифровок. Автоматически создавайте настраиваемые модели с помощью данных Office 365, чтобы оптимизировать точность распознавания речи для организации.

Развертывание в любом месте — от облака до пограничной зоны

Запускайте службу преобразования речи в текст в любом расположении, в котором находятся ваши данные. Создавайте речевые приложения, оптимизированные как для надежной работы через облако, так и для пограничного размещения, с помощью контейнеров и обнаружения языка (предварительная версия). Контейнеры служб "Речь" теперь поддерживают как стандартные, так и настраиваемые голоса.

Комплексная конфиденциальность и безопасность

  • Служба "Речь", входящая в состав Azure Cognitive Services, соответствует требованиям сертификатов SOC, FedRAMP, PCI DSS, HIPAA, HITECH и ISO.
  • Ваши данные остаются у вас. Данные голосового ввода и транскрибирования не протоколируются во время обработки звука.
  • Вы можете просмотреть и удалить свои данные речи и модели в любое время. В хранилище данные шифруются.
  • Основанная на инфраструктуре Azure служба "Речь" предоставляет функции защиты, доступности, соответствия требованиям и управления корпоративного уровня.

Гибкая ценовая политика обеспечивает необходимые возможности и управление

Платите только за то, что вы используете, без каких-либо предварительных расходов. Работая со службой преобразования речи в текст, вы платите по мере использования в зависимости от количества часов транскрибированной речи.

Документация и ресурсы

Начать

Ознакомьтесь с нашей документацией

Пройдите курс Microsoft Learn

Изучите примеры кода

Ознакомьтесь с нашими примерами кода

Ознакомьтесь с ресурсами по настройке

Настройте свое решение речи с помощью Speech Studio. Вам не нужно уметь программировать.

Решения, созданные с помощью службы "Преобразование речи в текст"

KPMG оптимизирует транскрибирование звонков

Профессиональная сеть KPMG использует службу "Преобразование речи в текст" для расшифровки и каталогизации тысяч часов телефонных звонков, помогая клиентам уменьшить затраты на выполнение нормативных требований на 80 %.

KPMG

Motorola помогает сотрудникам экстренных служб получать доступ к важным данным с помощью голоса

Компания Motorola Solutions помогает полицейским и сотрудникам других экстренных служб быстрее получать доступ к важной информации с помощью виртуального голосового помощника.

Motorola Solutions

Компания Universal Electronics предоставляет поддержку голоса для интеллектуальных домашних устройств

Universal Electronics помогает компаниям предоставлять возможности голосовой навигации и управления для поистине уникального взаимодействия потребителей с домашними устройствами.

Universal Electronics

Hochtief документирует конструктивные дефекты с использованием голосового ввода

Компания Hochtief помогает менеджерам проектов выявлять и документировать конструктивные дефекты на проектных объектах с помощью виртуального помощника с поддержкой голоса.

Cheetah Mobile

NTT DATA ускоряет принятие решений благодаря анализу данных встреч

Компания NTT DATA извлекает полезные сведения из речевых данных, выполняя транскрибирование на встречах в реальном времени. Набор инструментов "Пользовательское распознавание речи" позволяет ее специалистам настроить модели распознавания речи для выявления специфических для организации терминов.

NTTDATA

Компания Insight внедряет в банковские системы виртуальных собеседников

Компания Insight Enterprises помогает банкам сделать работу филиалов быстрее и удобнее с помощью решения для выполнения банковских операций на основе ИИ для общения. Служба "Преобразование речи в текст" позволяет предоставлять клиентам своевременные и актуальные ответы благодаря преобразованию их речи в данные, которые можно обрабатывать и анализировать.

Insight Enterprise, Inc.

Начало работы со службами "Речь"