Пропустить навигацию

Преобразование речи в текст

Функция службы "Речь", которая точно транскрибирует звуки речи в текст

Преобразование устной речи в действие

Быстрое и точное транскрибирование аудио в текст на более чем 85 языках и вариантах. Настройка моделей для повышения точности терминологии определенной отрасли. Получайте больше преимуществ от устной речи, включив поиск или аналитику в транскрибированном тексте или упростив действие. Все это можно выполнить на предпочитаемом языке программирования.

Высококачественное транскрибирование

Обеспечьте точное транскрибирование с помощью современной технологии распознавания речи.

Настраиваемые модели

Добавляйте определенные слова в базовый словарь или создавайте собственные модели преобразования речи в текст.

Гибкое развертывание

Запускайте службу преобразования речи в текст где угодно: в облаке или в контейнерах на периферии.

Готовность к выпуску

Получите доступ к такой же надежной технологии, которая обеспечивает распознавание речи в продуктах Майкрософт.

Попробуйте выполнить преобразование речи в текст с помощью этого демонстрационного приложения, созданного с применением нашего пакета SDK для JavaScript

Чтобы оценить демонстрационную версию, записав с помощью микрофона собственный голос, используйте браузер с поддержкой WebRTC, например последнюю версию Microsoft Edge, Firefox или Chrome.

Ваши речевые данные не будут сохранены

Обеспечьте точное транскрибирование речи из различных источников

Преобразуйте звук в текст из разнообразных источников, включая микрофоны, аудиофайлы и хранилища BLOB-объектов. Используйте диаризацию динамика, чтобы определить, кто, что и когда сказал. Получайте читаемые расшифровки с автоматическим форматированием и знаками препинания.

Настройка нужных моделей речи

Подготовьте свои модели речи к распознаванию терминологии определенной организации и отрасли. Устраняйте препятствия при распознавании речи, такие как фоновый шум, акцент или уникальный словарь. Настройте модели путем отправки звуковых данных и расшифровок. Автоматически создавайте настраиваемые модели с помощью данных Office 365, чтобы оптимизировать точность распознавания речи для организации.

Развертывание в любом месте

Запускайте службу преобразования речи в текст в любом расположении, в котором находятся ваши данные. Создавайте речевые приложения, оптимизированные как для надежных облачных, так и для локальных ресурсов, с помощью контейнеров.

Комплексная конфиденциальность и безопасность

  • Служба "Речь", входящая в состав Azure Cognitive Services, соответствует сертификационным требованиям SOC, FedRAMP, PCI DSS, HIPAA, HITECH и ISO.
  • Ваши данные остаются у вас. Данные голосового ввода и транскрибирования не протоколируются во время обработки звука.
  • Вы можете просмотреть и удалить свои данные речи и модели в любое время. В хранилище данные шифруются.
  • Основанная на инфраструктуре Azure служба "Речь" предоставляет защиту, доступность, соответствие требованиям и средства управления корпоративного уровня.

Гибкая ценовая политика обеспечивает необходимые возможности управления

Работая со службой преобразования речи в текст, вы платите по мере использования службы в зависимости от количества часов транскрибированной речи без каких-либо первоначальных затрат.

Документация и ресурсы

Начать

Просмотрите документацию

Создание службы речи с помощью курса Microsoft Learn

Изучите примеры кода

Ознакомьтесь с нашими примерами кода

Ознакомьтесь с ресурсами по настройке

Настройте свое решение для преобразования речи в текст с помощью Speech Studio. Вам не нужно уметь программировать.

Компании, которые доверяют службе "Преобразование речи в текст"

KPMG оптимизирует транскрибирование звонков

Профессиональная сеть KPMG использует службу "Преобразование речи в текст" для расшифровки и каталогизации тысяч часов телефонных звонков, помогая клиентам уменьшить затраты на выполнение нормативных требований на 80 %.

KPMG

Motorola помогает сотрудникам экстренных служб получать доступ к важным данным с помощью голоса

Компания Motorola Solutions помогает полицейским и сотрудникам других экстренных служб быстрее получать доступ к важной информации с помощью виртуального голосового помощника.

Motorola Solutions

Компания Universal Electronics предоставляет поддержку голоса для интеллектуальных домашних устройств

Universal Electronics помогает компаниям предоставлять возможности голосовой навигации и управления для поистине уникального взаимодействия потребителей с домашними устройствами.

Universal Electronics

Hochtief документирует конструктивные дефекты с использованием голосового ввода

Компания Hochtief помогает менеджерам проектов выявлять и документировать конструктивные дефекты на проектных объектах с помощью виртуального помощника с поддержкой голоса.

Cheetah Mobile

NTT DATA ускоряет принятие решений благодаря анализу данных встреч

Компания NTT DATA извлекает полезные сведения из речевых данных, выполняя транскрибирование на встречах в реальном времени. Набор инструментов "Пользовательское распознавание речи" позволяет ее специалистам настроить модели распознавания речи для выявления специфических для организации терминов.

NTTDATA

Компания Insight внедряет в банковские системы виртуальных собеседников

Компания Insight Enterprises помогает банкам сделать работу филиалов быстрее и удобнее с помощью решения для выполнения банковских операций на основе ИИ для общения. Служба "Преобразование речи в текст" позволяет предоставлять клиентам своевременные и актуальные ответы благодаря преобразованию их речи в данные, которые можно обрабатывать и анализировать.

Insight Enterprise, Inc.

Часто задаваемые вопросы о преобразовании речи в текст

  • Это функция службы "Речь", которая точно и быстро транскрибирует аудио в текст.
  • Cognitive Services — это коллекция настраиваемых предварительно созданных моделей ИИ, которые можно использовать для добавления ИИ в приложения. Существует множество доменов, в том числе "Речь", "Решение", "Язык" и "Визуальное распознавание". Преобразование речи в текст — это одна из функций службы "Речь". К другим функциям, связанным с речью, относятся Преобразование текста в речь, Перевод речи и Распознавание говорящего. Примером службы "Решение" является Персонализатор, который обеспечивает индивидуально настроенные и релевантные возможности. Примерами службы "Язык" являются Распознавание речи и Анализ текста для обработки естественного языка, QnA Maker для ответов на часто задаваемые вопросы и Переводчик для выполнения перевода.

Начало работы со службами "Речь"