Цены на Cognitive Services. Пользовательская служба распознавания речи Предварительная версия

Использование интерфейсов API аналитики для настройки компьютерного зрения, распознавания речи, обработки голосовых запросов и знаний

Пользовательская служба распознавания речи позволяет создавать настраиваемые модели распознавания речи и развертывать их на конечную точку преобразования речи в текст, созданную с учетом особенностей приложения. При помощи этой службы вы можете настроить языковую модель распознавателя речи, что позволяет ему изучать словарь приложения и разговорный стиль пользователей. Кроме того, вы можете более эффективно настроить акустическую модель распознавателя речи, подходящую для целевой среды и аудитории пользователей приложения.

Сведения о ценах

Адаптация модели осуществляется бесплатно.

Free S1
Развертывания модели Модель 1 Число моделей в месяц: $-
Адаптация модели 3 ч/мес. Неограниченная
Тестирование точности 2 ч/мес. 2 ч бесплатного использования, затем $-
Развертывание Н/Д $- за единицу в день (каждая единица позволяет отправить пять одновременных запросов)
Без трассировки Н/Д Число моделей в месяц: $-
Запрос на цены 2 ч/мес. 2 ч бесплатного использования, затем $-

Поддержка и соглашение об уровне обслуживания

  • Бесплатная поддержка по вопросам выставления счетов и управления подписками.
  • Требуется техническая поддержка для предварительных версий служб? Посетите наши форумы
  • Мы гарантируем, что Cognitive Services уровня Standard будут доступны 99,9 % времени. Для уровня Free соглашение об уровне обслуживания отсутствует. Ознакомьтесь с соглашением об уровне обслуживания
  • На период действия предварительной версии соглашение об уровне обслуживания не применяется. Подробнее

Часто задаваемые вопросы

Пользовательская служба распознавания речи

  • На уровне 1 служба одновременно обрабатывает до 4 звуковых фрагментов (т. е. до 4 транскрипций) и отвечает на них в режиме реального времени. Если пользователь одновременно отправляет более 4 звуковых фрагментов, каждый последующий фрагмент отклоняется и возвращается ошибка, указывающая на наличие слишком большого количества одновременных запросов. То же самое касается и уровня 2, где служба одновременно обрабатывает 12 транскрипций. На уровне "Бесплатный" параллельно обрабатывается одна транскрипция. Предполагается, что аудиозапись передается в режиме реального времени. Если аудиозапись передается быстрее, с целью обеспечения параллелизма запрос по-прежнему будет рассматриваться как выполняющийся до полной передачи аудиозаписи (даже если результат распознавания отправлен раньше).

    Примечание. Если требуется более высокая степень параллелизма, свяжитесь с нами.

  • Языковая модель — это случайное распределение последовательностей слов. Она помогает системе определить из числа последовательностей слова, которые звучат одинаково, на основе вероятности самих этих последовательностей. Например, фразы recognize speech и wreck a nice beach звучат похоже, но вероятность использования первого предположения выше, поэтому языковая модель назначит первой фразе более высокий рейтинг. Если голосовые запросы к приложению будут содержать определенные языковые элементы, например имена продуктов или жаргонизмы, которые редко используются в обычной речи, настройка языковой модели позволит улучшить производительность. Например, при создании приложения для голосового поиска в MSDN вероятно, что такие термины, как объектно-ориентированный, пространство имен или .NET, будут звучать чаще, чем в других обычных программах распознавания речи. Настройка языковой модели позволит системе запомнить эти термины.

  • Акустическая модель — это классификатор, сопоставляющий краткие звуковые фрагменты с одной из нескольких фонем или звуковыми единицами каждого языка. Затем эти фонемы можно объединить в слова. Например, слово "речь" состоит из трех фонем: [р’эч’]. Эти классификации выполняются приблизительно 100 раз в секунду. Настройка акустической модели позволяет системе эффективнее распознавать речь в нетипичных средах. Например, если приложение предназначено для работников складов или заводов, настройка акустической модели помогает более точно распознать речь в шумных средах.

  • Функция распознавания кратких голосовых запросов поддерживает фразы продолжительностью до 15 секунд. При использовании этой функции с клиентской библиотекой распознавания речи после отправки данных на сервер клиент получит несколько промежуточных результатов и один конечный (самый лучший вариант среди нескольких других вариантов).

  • Функция распознавания длинных речевых сообщений поддерживает фразы продолжительностью до 2 минут. При использовании этой функции с клиентской библиотекой распознавания речи после отправки данных на сервер клиент получит несколько промежуточных и несколько конечных результатов в зависимости от того, как сервер разбивает предложение.

  • Например, если для обработки миллиона транскрипций пользователь использует уровень S1, цена выставляется с учетом уровня ($-), первые 100,000 оплачиваются по цене $- за 1,000 транскрипций, а оставшиеся 900,000 — по $- за 1,000 транскрипций. Итого: $- + 100,000 * ($- / 1,000) + 900,000 * ($- / 1,000) = $4500.

  • Сведения о пользовательской службе распознавания речи см. на странице Microsoft Cognitive Services или на сайте www.cris.ai.

  • Развертывание пользовательской модели — это процесс помещения пользовательской модели в оболочку с последующим предоставлением в качестве услуги. При этом развертываемая пользовательская модель предоставляет конечную точку, через которую можно получить доступ к данной модели. Пользователи могут развертывать столько моделей, сколько потребуется.

  • Пользовательская служба распознавания речи позволяет пользователям адаптировать базовые модели на основе акустических и языковых данных. Мы называем этот процесс настройкой модели.

  • После создания пользовательской модели пользователи могут отправить проверочные данные для оценки созданной модели. Они могут проверить новые пользовательские модели, используя максимальное количество данных (т. е. выполнить тестирование точности неограниченное число раз).

  • После развертывания пользовательской модели URI может обрабатывать один аудио-запрос за раз. Для сценариев, отправляющих в URI несколько аудио-запросов одновременно, пользователи могут развернуть пять одновременных запросов за раз. Это обеспечивается путем приобретения единиц масштабирования. Каждая единица масштабирования гарантирует до пяти одновременных аудио-запросов из расчета $200 на каждую единицу. Например, если пользователь намерен использовать конечную точку с 23 аудио-запросами одновременно, ему понадобится приобрести пять единиц масштабирования для обеспечения до 25 одновременных запросов.

  • Управление журналом позволяет пользователям отключить ведение журнала для развертываемых моделей. Пользователи, уделяющие внимание проблемам конфиденциальности, могут отключить ведение журнала для развертываемой модели из расчета $20 в месяц.

  • Под запросом на цены подразумевается стоимость обработки аудио-запросов конечной точкой развертываемой пользовательской модели.

Общие

  • API распознавания эмоций, API распознавания лиц, API службы Language Understanding Intelligent Service, API Bing для преобразования речи в текст и для преобразования текста в речь оплачиваются из расчета за 1000 вызовов транзакций API с активной обработкой вызова производственного API. Сумма счета рассчитывается пропорционально, исходя из количества вызовов транзакций API.

    Служба API Bing распознавания длинных речевых сообщений оплачивается из расчета за час анализируемой речи. Сумма счета рассчитывается пропорционально, исходя из количества минут.

    Для API рекомендаций и анализа текста приобретаются единицы стандартных уровней по фиксированной цене. Каждая единица уровня включает определенное количество транзакций API. Превышение количества транзакций, включенного в единицу, оплачивается по ставке, указанной в таблице с ценами выше. Стоимость дополнительных единиц рассчитывается пропорционально. Счета за пользование службой выставляются помесячно. Неиспользованные транзакции не переносятся на следующий месяц.

  • При достижении лимита транзакций для уровня "Бесплатный" возможность использования API блокируется. Превышение установленного лимита на уровне "Бесплатный" невозможно.

  • Если учетная запись превышает лимит использования на стандартном уровне, стоимость дополнительных транзакций рассчитывается по ставке за превышение. Счета за превышение выставляются помесячно и рассчитываются по ставке, определенной для каждого уровня отдельно.

  • Любой вызов API (за исключением вызовов пакетной оценки) считается транзакцией. Стоимость вызова пакетной оценки рассчитывается, исходя из количества элементов, которые нужно оценить в соответствующей транзакции.

  • При достижении лимита транзакций для уровня "Бесплатный" возможность использования API блокируется. Превышение установленного лимита на уровне "Бесплатный" невозможно. Пакетная оценка не поддерживается на уровне "Бесплатный".

  • Для API рекомендаций приобретаются единицы стандартных уровней по фиксированной цене. Каждая единица уровня включает определенное количество транзакций API. Превышение количества транзакций, включенного в единицу, оплачивается по ставке, указанной в таблице с ценами выше. Стоимость дополнительных единиц рассчитывается пропорционально. Счета за пользование службой выставляются помесячно. Неиспользованные транзакции не переносятся на следующий месяц.

  • Плата за API-интерфейсы поиска Bing, API автозаполнения Bing и API проверки орфографии Bing взимается ежемесячно. Каждый приобретенный уровень предусматривает определенное количество транзакций, которые называются вызовами API. Это количество всегда привязано к календарному месяцу и не зависит от даты начала использования. Превышение количества транзакций, включенных в единицу, оплачивается по ставке, указанной в таблице с ценами. Стоимость дополнительных единиц не рассчитывается пропорционально. Счета за пользование службой выставляются помесячно. Неиспользованные транзакции каждого уровня не переносятся на следующий месяц.

  • Чтобы подать заявку на бесплатную пробную версию, посетите страницу подписки на Cognitive Services.

  • Вы можете в любое время повысить уровень. Условия оплаты и количество транзакций более высокого уровня начнут применяться сразу.

Ресурсы

Калькулятор

Оцените ежемесячные затраты на службы Azure

Часто задаваемые вопросы по приобретению

Ознакомьтесь с часто задаваемыми вопросами по ценам Azure

Сведения о продукте

Узнайте подробнее о Cognitive Services

Документация

Ознакомьтесь с техническими учебными пособиями, видеороликами и дополнительными ресурсами

Зарегистрируйтесь сейчас и получите $200 в кредитах Azure

Начните уже сегодня