Распознавание говорящего

Определение отдельных говорящих и использование речи в качестве проверки с помощью Распознавания говорящего

Идентификация говорящего

Определение говорящего. API может использоваться для определения личности неизвестного говорящего. Входные аудиоданные с неопознанным голосом сопоставляются с группой выбранных говорящих, и в случае нахождения соответствия возвращается личность говорящего.

Мы выбрали 5 разных президентов и зарегистрировали их в службе, используя одно из их выступлений. Чтобы протестировать демонстрационную версию и оценить возможность автоматического определения президента по голосу, выберите выступление одного из президентов, щелкнув пример аудио ниже или загрузив собственный пример.

Оцените работу решения в действии

На выбранном аудио идентифицирован президент Барак Обама.
На выбранном аудио идентифицирован президент Джордж Уокер Буш.
На выбранном аудио идентифицирован президент Билл Клинтон.
На выбранном аудио идентифицирован президент Джордж Герберт Уокер Буш.
На выбранном аудио идентифицирован президент Рональд Рейган.
На выбранном аудио идентифицирован президент Джимми Картер.

Хотите создать подобное?

Знакомство с API-интерфейсами Cognitive Services

Компьютерное зрение

Извлечение важнейшей информации из изображений

Распознавание лиц

Распознает, опознает, анализирует, группирует и помечает тегами лица на фотографиях

Распознаватель рукописного текста

Служба ИИ, распознающая содержимое рукописного ввода, включая записи от руки, фигуры и документы

Индексатор видео

Получите все преимущества анализа видео

Пользовательское визуальное распознавание

Простая настройка новейших моделей компьютерного зрения для конкретных вариантов использования

Распознаватель документов

Служба извлечения документов с поддержкой АА, распознающая формы

Анализ текста

Легко оценивайте мнение и темы, чтобы узнать желания пользователей

Перевод текстов

Легко выполняйте машинный перевод текста с помощью простого вызова REST API

QnA Maker

Преобразуйте информацию в ответы, представленные в режиме диалога с удобной навигацией

Распознавание речи

Научите свои приложения понимать команды пользователей

Иммерсивное средство чтения

Упростите чтение и понимание текста для пользователей разных возрастов и с разными возможностями

Службы речи

Унифицированные службы речи для преобразования речи в текст, текста в речь и перевода речи

Распознавание говорящего

Используйте речь, чтобы идентифицировать и проверить отдельных говорящих

Перевод речи

Простая интеграция перевода речи в режиме реального времени в приложение

Преобразование речи в текст

Преобразуйте устную речь в текст для более естественного взаимодействия

Преобразование текста в речь

Преобразуйте текст в речь, чтобы создавать более естественные и доступные интерфейсы

Content Moderator

Автоматическая модерация изображений, текста и видео

Детектор аномалий

Без труда внедряйте возможности обнаружения аномалий в свои приложения.

Персонализатор

Служба ИИ, которая обеспечивает персонализированную работу

Готовы существенно расширить возможности своего приложения?