Распознавание говорящего

Определение отдельных говорящих и использование речи в качестве проверки с помощью распознавания говорящего

Проверка говорящего

Используйте свой голос для проверки подлинности. Этот API может использоваться для оснащения приложений интеллектуальным средством проверки подлинности. Если говорящий представляется тем или иным образом, его голос может использоваться для проверки соответствия этому.

Чтобы проверить, как это работает, выберите парольную фразу в предоставленном списке. Используйте эту фразу и запишите три примера аудио, чтобы зарегистрировать свой голос в службе. Этот этап называется регистрацией. После регистрации вы можете проверить службу. Для этого запустите дополнительный шаг проверки, используя другую запись речи или фразу.

Оцените работу решения в действии

"i am going to make him an offer he cannot refuse"

Чтобы зарегистрировать свой голос, прочтите фразу выше три раза.

1
2
3

Хотите создать подобное?

Идентификация говорящего

Определение говорящего. API может использоваться для определения личности неизвестного говорящего. Входные аудиоданные с неопознанным голосом сопоставляются с группой выбранных говорящих, и в случае нахождения соответствия возвращается личность говорящего.

Мы выбрали 5 разных президентов и зарегистрировали их в службе, используя одно из их выступлений. Чтобы протестировать демонстрационную версию и оценить возможность автоматического определения президента по голосу, выберите выступление одного из президентов, щелкнув пример аудио ниже или загрузив собственный пример.

Оцените работу решения в действии

На выбранном аудио идентифицирован президент Барак Обама.
На выбранном аудио идентифицирован президент Джордж Уокер Буш.
На выбранном аудио идентифицирован президент Билл Клинтон.
На выбранном аудио идентифицирован президент Джордж Герберт Уокер Буш.
На выбранном аудио идентифицирован президент Рональд Рейган.
На выбранном аудио идентифицирован президент Джимми Картер.

Хотите создать подобное?

Знакомство с API-интерфейсами Cognitive Services

Компьютерное зрение

Извлечение важнейшей информации из изображений

Распознавание лиц

Распознает, опознает, анализирует, группирует и помечает тегами лица на фотографиях

Распознаватель рукописного текста

Служба ИИ, распознающая содержимое рукописного ввода, включая записи от руки, формы и документы

Индексатор видео

Получите все преимущества анализа видео

Пользовательское визуальное распознавание

Простая настройка новейших моделей компьютерного зрения для конкретных вариантов использования

Распознаватель документов

Служба извлечения документов с поддержкой АА, распознающая формы

Анализ текста

Легко оценивайте мнение и темы, чтобы узнать желания пользователей

Перевод текстов

Легко выполняйте машинный перевод текста с помощью простого вызова REST API

QnA Maker

Преобразуйте информацию в ответы, представленные в режиме диалога с удобной навигацией

Распознавание речи

Научите свои приложения понимать команды пользователей

Иммерсивное средство чтения

Упростите чтение и понимание текста для пользователей разных возрастов и с разными возможностями

Службы речи

Унифицированные службы речи для преобразования речи в текст, текста в речь и перевода речи

Распознавание говорящего

Используйте речь, чтобы идентифицировать и проверить отдельных говорящих

Перевод речи

Простая интеграция перевода речи в режиме реального времени в приложение

Преобразование речи в текст

Преобразуйте устную речь в текст для более естественного взаимодействия

Преобразование текста в речь

Преобразуйте текст в речь, чтобы создавать более естественные и доступные интерфейсы

Content Moderator

Автоматическая модерация изображений, текста и видео

Детектор аномалий

Без труда внедряйте возможности обнаружения аномалий в свои приложения.

Персонализатор

Служба ИИ, которая обеспечивает персонализированную работу

Готовы ускорить работу своего приложения по максимуму?