Пропустить навигацию

Службы речи

Преобразование звука в текст, перевод речи и преобразование текста в речь с помощью унифицированных служб речи

Преобразование речи в текст конвертирует разговорное аудио в текст с целью интуитивного взаимодействия

Легко добавляйте функцию преобразования речи в текст в реальном времени в приложениях для таких случаев, как голосовые команды, транскрипции в режиме реального времени или анализ журнала кол-центров.

Создайте свои модели распознавания речи, чтобы адаптироваться к стилям, выражениям или уникальному словарю пользователей, а также учитывать специфические фоновые шумы, акцент и тембр голоса в зависимости от вашего сценария.

Дополнительные сведения
Преобразование речи в текст

Преобразование текста в речь. Предоставление приложениям естественного голоса

Создавайте интеллектуальные приложения и службы, которые естественно озвучивают пользователям текст, с помощью службы преобразования текста в речь. Преобразование текста в аудио в режиме реального времени, адаптация для изменения скорости речи, высоты тона, громкости и многое другое.

Предоставьте приложению уникальный, узнаваемый голос, используя настраиваемые модели голоса. Просто запишите и загрузите образец данных для обучения, и служба создаст уникальный голос в соответствии с вашей записью.

Дополнительные сведения
Преобразование текста в речь

Перевод речи

Предоставьте приложению возможности перевода в режиме реального времени на любой из поддерживаемых языков и получите перевод текста или речи. Модели перевода речи основаны на передовых методах распознавания речи и нейронного машинного перевода (NMT). Они оптимизированы с целью разъяснения того, каким образом люди говорят в реальной жизни, а также для предоставления переводов исключительного качества.

Дополнительные сведения
Перевод речи
"We are impressed with the initial transcription accuracy of Custom Speech and Speaker Recognition. We are now working to optimise for a live environment which would be breakthrough for British Telecom Sport versus the current manual process."

Kevin Blyth, British Telecom Research and Innovation

Знакомство с API-интерфейсами Cognitive Services

Компьютерное зрение

Извлечение важнейшей информации из изображений

API распознавания лиц

Распознает, опознает, анализирует, группирует и помечает тегами лица на фотографиях

Индексатор видео

Получите все преимущества анализа видео

Content Moderator

Автоматическая модерация изображений, текста и видео

Custom Vision ПРЕДВАРИТЕЛЬНАЯ ВЕРСИЯ

Простая настройка новейших моделей компьютерного зрения для конкретных вариантов использования

Анализ текста

Легко оценивайте мнение и темы, чтобы узнать желания пользователей

Translator Text

Легко выполняйте машинный перевод текста с помощью простого вызова REST API

API проверки орфографии Bing

Обеспечьте обнаружение и исправление орфографических ошибок в своем приложении

Content Moderator

Автоматическая модерация изображений, текста и видео

Распознавание речи

Научите свои приложения понимать команды пользователей

Службы речи

Унифицированные службы речи для преобразования речи в текст, текста в речь и перевода речи

API распознавания говорящего ПРЕДВАРИТЕЛЬНАЯ ВЕРСИЯ

Используйте речь, чтобы идентифицировать и проверить отдельных говорящих

QnA Maker

Преобразуйте информацию в ответы, представленные в режиме диалога с удобной навигацией

Готовы ускорить работу своего приложения по максимуму?