Службы мультимедиа Azure теперь поддерживают предварительную версию динамического транскрибирования
Дата публикации: 18 ноября, 2019
Службы мультимедиа Azure — это платформа для приема, перекодировки, динамической упаковки и шифрования данных видеотрансляции для доставки с помощью таких стандартных отраслевых протоколов, как HLS и MPEG-DASH. Динамическое транскрибирование — это новая функция API-интерфейсов версии 3. Она позволяет добавлять в потоки, доставляемые зрителям, текст, который создается машинными средствами и транскрибируется из произнесенных слов в звуковом веб-канале.
Когда вы публикуете прямую трансляцию с помощью протоколов потоковой передачи HLS или MPEG-DASH, вместе с видео и аудио служба доставляет транскрибированный текст, разбитый на фрагменты, которые соответствуют требованиям протокола. Благодаря этому вы можете воспроизвести этот поток видео, аудио и текста с помощью новой сборки (версия 2.3.3 или более поздняя) Проигрывателя мультимедиа Azure. Транскрибирование выполняется на основе функции преобразования речи в текст в Cognitive Services.
Часто задаваемые вопросы
- Какие регионы и языки поддерживает предварительная версия?
Функция доступна в регионе "Западная часть США 2" и поддерживает английский язык. Дополнительные сведения можно найти в этом документе.
- Как приступить к использованию этой функции?
В можете создать учетную запись Служб мультимедиа Azure в регионе "Западная часть США 2" и разработать приложение с помощью предварительной версии интерфейсов REST API, описанных в спецификации OpenAPI Служб мультимедиа версии 3. Эта предварительная версия пока не поддерживает CLI, PowerShell и пакеты SDK.