Цены на Cognitive Services. Пользовательская служба распознавания речи Предварительная версия

Использование интерфейсов API аналитики для настройки компьютерного зрения, распознавания речи, обработки голосовых запросов и знаний

Пользовательская служба распознавания речи позволяет создавать настраиваемые модели распознавания речи и развертывать их на конечную точку преобразования речи в текст, созданную с учетом особенностей приложения. При помощи этой службы вы можете настроить языковую модель распознавателя речи, что позволяет ему изучать словарь приложения и разговорный стиль пользователей. Кроме того, вы можете более эффективно настроить акустическую модель распознавателя речи, подходящую для целевой среды и аудитории пользователей приложения.

Сведения о ценах

Для каждой ценовой категории выставляется определенная ставка за количество параллельно обрабатывающихся транскрипций. Пользователи могут импортировать текстовые данные для создания пользовательской языковой модели или акустические данные (аудиозапись и транскрипции) для создания пользовательской акустической модели.

Приведенные ниже цены указаны с учетом скидки на предварительную версию.

Цены до 30 июня 2017 г.

Уровень 1 Уровень 2
Цена (за месяц) $- $-
Количество параллельных транскрипций 4 12
Акустические адаптации
Ставка за час звуковых данных $- $-
Распознавание кратких голосовых запросов
0–100 000 транскрипций (ставка за 1 000 транскрипций) $- $-
100 000+ транскрипций (ставка за 1 000 транскрипций) $- $-
Распознавание длинных речевых сообщений
0–10 ч (ставка за час) $- $-
10–100 ч (ставка за час) $- $-
100+ ч (ставка за час) $- $-

Уровень "Бесплатный"

Количество параллельных транскрипций 1
Транскрипции (краткие голосовые запросы или длинные речевые сообщения) 5 000
Акустические адаптации модели 3 ч/мес.
Языковые адаптации модели 5

* Обратите внимание, что при обнаружении длительного периода бездействия развертывание моделей пользователей уровня "Бесплатный" отменяется.

Цены с 1 июля 2017 г.

Развертывание пользовательской модели 0–1 — Free
Более 1 — $- за модель в месяц
Настройка модели Free
Автономное тестирование 0–2 ч — Free
Более 2 — $- в час
Развертывание $- за единицу в месяц (каждая единица позволяет отправить пять одновременных запросов)
Управление журналом Число моделей в месяц: $-
Запрос на цены 0–2 ч — Free
Более 2 — $- в час

Поддержка и соглашение об уровне обслуживания

  • Бесплатная поддержка по вопросам выставления счетов и управления подписками.
  • Требуется техническая поддержка для предварительных версий служб? Посетите наши форумы
  • Мы гарантируем, что Cognitive Services уровня Standard будут доступны 99,9 % времени. Для уровня Free соглашение об уровне обслуживания отсутствует. Ознакомьтесь с соглашением об уровне обслуживания
  • На период действия предварительной версии соглашение об уровне обслуживания не применяется. Подробнее

Часто задаваемые вопросы

Пользовательская служба распознавания речи

  • На уровне 1 служба одновременно обрабатывает до 4 звуковых фрагментов (т. е. до 4 транскрипций) и отвечает на них в режиме реального времени. Если пользователь одновременно отправляет более 4 звуковых фрагментов, каждый последующий фрагмент отклоняется и возвращается ошибка, указывающая на наличие слишком большого количества одновременных запросов. То же самое касается и уровня 2, где служба одновременно обрабатывает 12 транскрипций. На уровне "Бесплатный" параллельно обрабатывается одна транскрипция. Предполагается, что аудиозапись передается в режиме реального времени. Если аудиозапись передается быстрее, с целью обеспечения параллелизма запрос по-прежнему будет рассматриваться как выполняющийся до полной передачи аудиозаписи (даже если результат распознавания отправлен раньше).

    Примечание. Если требуется более высокая степень параллелизма, свяжитесь с нами.

  • Языковая модель — это случайное распределение последовательностей слов. Она помогает системе определить из числа последовательностей слова, которые звучат одинаково, на основе вероятности самих этих последовательностей. Например, фразы recognize speech и wreck a nice beach звучат похоже, но вероятность использования первого предположения выше, поэтому языковая модель назначит первой фразе более высокий рейтинг. Если голосовые запросы к приложению будут содержать определенные языковые элементы, например имена продуктов или жаргонизмы, которые редко используются в обычной речи, настройка языковой модели позволит улучшить производительность. Например, при создании приложения для голосового поиска в MSDN вероятно, что такие термины, как объектно-ориентированный, пространство имен или .NET, будут звучать чаще, чем в других обычных программах распознавания речи. Настройка языковой модели позволит системе запомнить эти термины.

  • Акустическая модель — это классификатор, сопоставляющий краткие звуковые фрагменты с одной из нескольких фонем или звуковыми единицами каждого языка. Затем эти фонемы можно объединить в слова. Например, слово "речь" состоит из трех фонем: [р’эч’]. Эти классификации выполняются приблизительно 100 раз в секунду. Настройка акустической модели позволяет системе эффективнее распознавать речь в нетипичных средах. Например, если приложение предназначено для работников складов или заводов, настройка акустической модели помогает более точно распознать речь в шумных средах.

  • Функция распознавания кратких голосовых запросов поддерживает фразы продолжительностью до 15 секунд. При использовании этой функции с клиентской библиотекой распознавания речи после отправки данных на сервер клиент получит несколько промежуточных результатов и один конечный (самый лучший вариант среди нескольких других вариантов).

  • Функция распознавания длинных речевых сообщений поддерживает фразы продолжительностью до 2 минут. При использовании этой функции с клиентской библиотекой распознавания речи после отправки данных на сервер клиент получит несколько промежуточных и несколько конечных результатов в зависимости от того, как сервер разбивает предложение.

  • Например, если для обработки миллиона транскрипций пользователь использует уровень S1, цена выставляется с учетом уровня ($-), первые 100,000 оплачиваются по цене $- за 1,000 транскрипций, а оставшиеся 900,000 — по $- за 1,000 транскрипций. Итого: $- + 100,000 * ($- / 1,000) + 900,000 * ($- / 1,000) = $4500.

  • Сведения о пользовательской службе распознавания речи см. на странице Microsoft Cognitive Services или на сайте www.cris.ai.

  • Развертывание пользовательской модели — это процесс помещения пользовательской модели в оболочку с последующим предоставлением в качестве услуги. При этом развертываемая пользовательская модель предоставляет конечную точку, через которую можно получить доступ к данной модели. Пользователи могут развертывать столько моделей, сколько потребуется.

  • Пользовательская служба распознавания речи позволяет пользователям адаптировать базовые модели на основе акустических и языковых данных. Мы называем этот процесс настройкой модели.

  • После создания пользовательской модели пользователи могут отправить проверочные данные для оценки созданной модели. Они могут проверить новые пользовательские модели, используя максимальное количество данных (т. е. выполнить автономное тестирование неограниченное число раз).

  • После развертывания пользовательской модели URI может обрабатывать один аудио-запрос за раз. Для сценариев, отправляющих в URI несколько аудио-запросов одновременно, пользователи могут развернуть пять одновременных запросов за раз. Это обеспечивается путем приобретения единиц масштабирования. Каждая единица масштабирования гарантирует до пяти одновременных аудио-запросов из расчета $200 на каждую единицу. Например, если пользователь намерен использовать конечную точку с 23 аудио-запросами одновременно, ему понадобится приобрести пять единиц масштабирования для обеспечения до 25 одновременных запросов.

  • Управление журналом позволяет пользователям отключить ведение журнала для развертываемых моделей. Пользователи, уделяющие внимание проблемам конфиденциальности, могут отключить ведение журнала для развертываемой модели из расчета $20 в месяц.

  • Под запросом на цены подразумевается стоимость обработки аудио-запросов конечной точкой развертываемой пользовательской модели.

Общие

  • API распознавания эмоций, API распознавания лиц, API службы Language Understanding Intelligent Service, API Bing для преобразования речи в текст и для преобразования текста в речь оплачиваются из расчета за 1000 вызовов транзакций API с активной обработкой вызова производственного API. Сумма счета рассчитывается пропорционально, исходя из количества вызовов транзакций API.

    Служба API Bing распознавания длинных речевых сообщений оплачивается из расчета за час анализируемой речи. Сумма счета рассчитывается пропорционально, исходя из количества минут.

    Для API рекомендаций и анализа текста приобретаются единицы стандартных уровней по фиксированной цене. Каждая единица уровня включает определенное количество транзакций API. Превышение количества транзакций, включенного в единицу, оплачивается по ставке, указанной в таблице с ценами выше. Стоимость дополнительных единиц рассчитывается пропорционально. Счета за пользование службой выставляются помесячно. Неиспользованные транзакции не переносятся на следующий месяц.

  • При достижении лимита транзакций для уровня "Бесплатный" возможность использования API блокируется. Превышение установленного лимита на уровне "Бесплатный" невозможно.

  • Если учетная запись превышает лимит использования на стандартном уровне, стоимость дополнительных транзакций рассчитывается по ставке за превышение. Счета за превышение выставляются помесячно и рассчитываются по ставке, определенной для каждого уровня отдельно.

  • Любой вызов API (за исключением вызовов пакетной оценки) считается транзакцией. Стоимость вызова пакетной оценки рассчитывается, исходя из количества элементов, которые нужно оценить в соответствующей транзакции.

  • При достижении лимита транзакций для уровня "Бесплатный" возможность использования API блокируется. Превышение установленного лимита на уровне "Бесплатный" невозможно. Пакетная оценка не поддерживается на уровне "Бесплатный".

  • Для API рекомендаций приобретаются единицы стандартных уровней по фиксированной цене. Каждая единица уровня включает определенное количество транзакций API. Превышение количества транзакций, включенного в единицу, оплачивается по ставке, указанной в таблице с ценами выше. Стоимость дополнительных единиц рассчитывается пропорционально. Счета за пользование службой выставляются помесячно. Неиспользованные транзакции не переносятся на следующий месяц.

  • Оплата за API Bing для поиска, автозаполнения и проверки орфографии взимается ежемесячно. Каждый приобретенный уровень предусматривает определенное количество транзакций, которые называются вызовами API. Оно всегда привязано к календарному месяцу и не зависит от даты начала использования. Превышение количества транзакций, включенных в единицу, оплачивается по ставке, указанной в таблице с ценами. Стоимость дополнительных единиц не рассчитывается пропорционально. Счета за пользование службой выставляются помесячно. Неиспользованные транзакции каждого уровня не переносятся на следующий месяц.

  • Перейдите по ссылке https://www.microsoft.com/cognitive-services/en-US/subscriptions, чтобы запросить бесплатную пробную версию.

  • Вы можете в любое время повысить уровень. Условия оплаты и количество транзакций более высокого уровня начнут применяться сразу.

  • API-интерфейсы распознавания речи Bing лицензируются отдельно, а их использование регулируется следующими условиями.

Ресурсы

Калькулятор

Оцените ежемесячные затраты на службы Azure

Часто задаваемые вопросы по приобретению

Ознакомьтесь с часто задаваемыми вопросами по ценам Azure

Сведения о продукте

Узнайте подробнее о Cognitive Services

Документация

Ознакомьтесь с техническими учебными пособиями, видеороликами и дополнительными ресурсами

Зарегистрируйтесь сейчас и получите $200 в кредитах Azure

Начните уже сегодня