Цены на Cognitive Services. Пользовательская служба распознавания речи Предварительная версия

Использование интерфейсов API аналитики для настройки компьютерного зрения, распознавания речи, обработки голосовых запросов и знаний

Пользовательская служба распознавания речи позволяет создавать настраиваемые модели распознавания речи и развертывать их на конечную точку преобразования речи в текст, созданную с учетом особенностей приложения. При помощи этой службы вы можете настроить языковую модель распознавателя речи, что позволяет ему изучать словарь приложения и разговорный стиль пользователей. Кроме того, вы можете более эффективно настроить акустическую модель распознавателя речи, подходящую для целевой среды и аудитории пользователей приложения.

Сведения о ценах

Адаптация модели осуществляется бесплатно.

Free S1
Развертывания модели Модель 1 Число моделей в месяц: $-
Адаптация модели 3 ч/мес. Неограниченная
Тестирование точности 2 ч/мес. 2 ч бесплатного использования, затем $-
Развертывание Н/Д $- за единицу в день (каждая единица позволяет отправить пять одновременных запросов)
Без трассировки Н/Д Число моделей в месяц: $-
Запрос на цены 2 ч/мес. 2 ч бесплатного использования, затем $-

Поддержка и соглашение об уровне обслуживания

  • Включена бесплатная поддержка по вопросам выставления счетов и управления подписками.
  • Требуется техническая поддержка для предварительных версий служб? Посетите наши форумы.
  • Мы гарантируем, что службы Cognitive Services уровня "Стандартный" будут доступны в течение 99,9 % времени. Для уровня Free соглашение об уровне обслуживания отсутствует. Ознакомьтесь с соглашением об уровне обслуживания.
  • На период действия предварительной версии соглашение об уровне обслуживания не применяется. Подробнее.

Часто задаваемые вопросы

Пользовательская служба распознавания речи

  • На уровне 1 служба одновременно обрабатывает до 4 звуковых фрагментов (т. е. до 4 транскрипций) и отвечает на них в режиме реального времени. Если пользователь одновременно отправляет более 4 звуковых фрагментов, каждый последующий фрагмент отклоняется и возвращается ошибка, указывающая на наличие слишком большого количества одновременных запросов. То же самое касается и уровня 2, где служба одновременно обрабатывает 12 транскрипций. На уровне "Бесплатный" параллельно обрабатывается одна транскрипция. Предполагается, что аудиозапись передается в режиме реального времени. Если аудиозапись передается быстрее, с целью обеспечения параллелизма запрос по-прежнему будет рассматриваться как выполняющийся до полной передачи аудиозаписи (даже если результат распознавания отправлен раньше).

    Примечание. Если требуется более высокая степень параллелизма, свяжитесь с нами.

  • Языковая модель — это случайное распределение последовательностей слов. Она помогает системе определить из числа последовательностей слова, которые звучат одинаково, на основе вероятности самих этих последовательностей. Например, фразы recognize speech и wreck a nice beach звучат похоже, но вероятность использования первого предположения выше, поэтому языковая модель назначит первой фразе более высокий рейтинг. Если голосовые запросы к приложению будут содержать определенные языковые элементы, например имена продуктов или жаргонизмы, которые редко используются в обычной речи, настройка языковой модели позволит улучшить производительность. Например, при создании приложения для голосового поиска в MSDN вероятно, что такие термины, как объектно-ориентированный, пространство имен или .NET, будут звучать чаще, чем в других обычных программах распознавания речи. Настройка языковой модели позволит системе запомнить эти термины.

  • Акустическая модель — это классификатор, сопоставляющий краткие звуковые фрагменты с одной из нескольких фонем или звуковыми единицами каждого языка. Затем эти фонемы можно объединить в слова. Например, слово "речь" состоит из трех фонем: [р’эч’]. Эти классификации выполняются приблизительно 100 раз в секунду. Настройка акустической модели позволяет системе эффективнее распознавать речь в нетипичных средах. Например, если приложение предназначено для работников складов или заводов, настройка акустической модели помогает более точно распознать речь в шумных средах.

  • Функция распознавания кратких голосовых запросов поддерживает фразы продолжительностью до 15 секунд. При использовании этой функции с клиентской библиотекой распознавания речи после отправки данных на сервер клиент получит несколько промежуточных результатов и один конечный (самый лучший вариант среди нескольких других вариантов).

  • Функция распознавания длинных речевых сообщений поддерживает фразы продолжительностью до 2 минут. При использовании этой функции с клиентской библиотекой распознавания речи после отправки данных на сервер клиент получит несколько промежуточных и несколько конечных результатов в зависимости от того, как сервер разбивает предложение.

  • Например, если для обработки миллиона транскрипций пользователь использует уровень S1, цена выставляется с учетом уровня ($-), первые 100,000 оплачиваются по цене $- за 1,000 транскрипций, а оставшиеся 900,000 — по $- за 1,000 транскрипций. Итого: $- + 100,000 * ($- / 1,000) + 900,000 * ($- / 1,000) = $4500.

  • Сведения о пользовательской службе распознавания речи см. на странице Microsoft Cognitive Services или на сайте www.cris.ai.

  • Развертывание пользовательской модели — это процесс помещения пользовательской модели в оболочку с последующим предоставлением в качестве услуги. При этом развертываемая пользовательская модель предоставляет конечную точку, через которую можно получить доступ к данной модели. Пользователи могут развертывать столько моделей, сколько потребуется.

  • Пользовательская служба распознавания речи позволяет пользователям адаптировать базовые модели на основе акустических и языковых данных. Мы называем этот процесс настройкой модели.

  • После создания пользовательской модели пользователи могут отправить проверочные данные для оценки созданной модели. Они могут проверить новые пользовательские модели, используя максимальное количество данных (т. е. выполнить тестирование точности неограниченное число раз).

  • После развертывания пользовательской модели URI может обрабатывать один аудио-запрос за раз. Для сценариев, отправляющих в URI несколько аудио-запросов одновременно, пользователи могут развернуть пять одновременных запросов за раз. Это обеспечивается путем приобретения единиц масштабирования. Каждая единица масштабирования гарантирует до пяти одновременных аудио-запросов из расчета $200 на каждую единицу. Например, если пользователь намерен использовать конечную точку с 23 аудио-запросами одновременно, ему понадобится приобрести пять единиц масштабирования для обеспечения до 25 одновременных запросов.

  • Управление журналом позволяет пользователям отключить ведение журнала для развертываемых моделей. Пользователи, уделяющие внимание проблемам конфиденциальности, могут отключить ведение журнала для развертываемой модели из расчета $20 в месяц.

  • Под запросом на цены подразумевается стоимость обработки аудио-запросов конечной точкой развертываемой пользовательской модели.

Общие

  • The Emotion API, Face API, Language Understanding Intelligent Service API, Bing Speech-to-Text API, and Bing Text-to-Speech API are billed per 1 000 API transaction calls when a production API call is being actively executed. Billing is prorated for production API transaction call quantities.

    The Bing Long Form Speech API service is billed per hour of speech that is analyzed. The billing is prorated on a per-minute basis.

    The Recommendations API and Text Analytics API can be purchased in units of the standard tiers at a fixed price. Each unit of a tier comes with included quantities of API transactions. If the user exceeds the included quantities, overages are charged at the rate specified in the pricing table above. These overages are prorated, and the service is billed on a monthly basis. The included quantities in a tier are reset each month.

  • При достижении лимита транзакций для уровня "Бесплатный" возможность использования API начинает регулироваться. Превышение установленного лимита на уровне "Бесплатный" невозможно.

  • Any annotation to a document counts as a transaction. Batch scoring calls will also take into consideration the number of documents that need to be scored in that transaction. So for instance, if 1 000 documents are sent for sentiment analysis in a single API call, that will count for 1 000 transactions. If an API supports more than one annotation operation, that will also be considered. Let’s say an API call performs both sentiment analysis and key-phrase extraction on 1 000 documents, that will count for 2 000 transactions (2 annotations * 1 000 documents).

  • Если учетная запись превышает лимит использования на стандартном уровне, стоимость дополнительных транзакций рассчитывается по ставке за превышение. Счета за превышение выставляются помесячно и рассчитываются по ставке, определенной отдельно для каждого уровня.

  • Любой вызов API (за исключением вызовов пакетной оценки) считается транзакцией. Стоимость вызова пакетной оценки рассчитывается, исходя из количества элементов, которые нужно оценить в соответствующей транзакции.

  • При достижении лимита транзакций для уровня "Бесплатный" возможность использования API начинает регулироваться. Превышение установленного лимита на уровне "Бесплатный" невозможно. Пакетная оценка не поддерживается на уровне "Бесплатный".

  • Для API рекомендаций приобретаются единицы стандартных уровней по фиксированной цене. Каждая единица уровня включает определенное количество транзакций API. Превышение количества транзакций, включенного в единицу, оплачивается по ставке, указанной в таблице с ценами выше. Стоимость дополнительных единиц рассчитывается пропорционально. Счета за пользование службой выставляются помесячно. Неиспользованные транзакции не переносятся на следующий месяц.

  • Вы можете в любое время повысить уровень. Условия оплаты и количество транзакций более высокого уровня начнут применяться сразу.

Ресурсы

Оцените ежемесячные затраты на службы Azure

Ознакомьтесь с часто задаваемыми вопросами по ценам Azure

Узнайте подробнее о Cognitive Services

Ознакомьтесь с техническими учебными пособиями, видеороликами и дополнительными ресурсами

Обучайтесь и создавайте, используя деньги на счете ($200), а также продолжайте использовать продукты бесплатно

Бесплатная учетная запись