Пропустить навигацию

Цены на Cognitive Services, службы речи

Использование интерфейсов API аналитики для настройки компьютерного зрения, распознавания речи, обработки голосовых запросов и знаний

Унифицированные службы "Речь" предоставляют широкий диапазон возможностей распознавания и создания речи, включая транскрибирование речи, преобразование текста в речь и перевод речи.

Сведения о ценах

Экземпляр Одновременный запрос Компоненты Цена
Бесплатные Число одновременных запросов: 1 Перевод речи Бесплатно предоставляется 5 ч в месяц
Преобразование речи в текст Бесплатно предоставляется 5 ч в месяц
Преобразование речи в текст с помощью настраиваемой модели речи Бесплатно предоставляется 5 ч в месяц
Размещение конечной точки для службы "Речь"1 Бесплатно предоставляется 1 модель в месяц
Text to Speech with Standard Voices Бесплатно предоставляется 5 млн символов в месяц
Преобразование текста в речь с помощью настраиваемого голоса Бесплатно предоставляется 5 млн символов в месяц
Text to Speech with Neural Voices 0.5M characters free per month
Размещение настраиваемого голоса1 Бесплатно предоставляется 1 модель в месяц
Стандартный Одновременных запросов: 20 Перевод речи $- в час
Преобразование речи в текст $- в час
Преобразование речи в текст с помощью настраиваемой модели речи $- в час
Размещение конечной точки для службы "Речь" Число моделей в месяц: $-
Text to Speech with Standard Voices $- на 1 млн символов
Преобразование текста в речь с помощью настраиваемого голоса $- на 1 млн символов
Text to Speech with Neural Voices $- на 1 млн символов2
Размещение настраиваемого голоса Число моделей в месяц: $-
1Неиспользованные модели будут автоматически списаны через семь дней.
2This is a public preview price for Text to Speech with Neural Voices.

Поддержка и соглашение об уровне обслуживания

  • Включена бесплатная поддержка по вопросам выставления счетов и управления подписками.
  • Мы гарантируем, что службы Cognitive Services уровня "Стандартный" будут доступны в течение как минимум 99,9 % времени. Для бесплатной пробной версии соглашение об уровне обслуживания отсутствует. Ознакомьтесь с соглашением об уровне обслуживания.

Часто задаваемые вопросы

Службы речи

    • Для перевода речи, преобразования речи в текст и преобразования речи в текст с помощью настраиваемой модели речи: использование тарифицируется с шагом в одну секунду
    • Для преобразования текста в речь и преобразования текста в речь с помощью настраиваемого голоса: использование тарифицируется на один символ
    • Для размещения настраиваемых моделей речи и размещения настраиваемого голоса: использование тарифицируется ежедневно
  • Служба "Речь" позволяет пользователям адаптировать базовые модели с учетом собственных акустических и языковых данных. Благодаря этому они получают настраиваемые модели речи, которые можно использовать в преобразовании речи в текст и переводе речи.

  • Языковая модель — это случайное распределение последовательностей слов. Она помогает системе определить из числа последовательностей слова, которые звучат одинаково, на основе вероятности самих этих последовательностей. Например, фразы recognize speech и wreck a nice beach звучат похоже, но вероятность использования первого предположения выше, поэтому языковая модель назначит первой фразе более высокий рейтинг. Если голосовые запросы к приложению будут содержать определенные языковые элементы, например имена продуктов или жаргонизмы, которые редко используются в обычной речи, настройка языковой модели позволит улучшить производительность. Например, при создании приложения для голосового поиска в MSDN вероятно, что такие термины, как объектно-ориентированный, пространство имен или .NET, будут звучать чаще, чем в других обычных программах распознавания речи. Настройка языковой модели позволит системе запомнить эти термины.

  • Акустическая модель — это классификатор, сопоставляющий краткие звуковые фрагменты с одной из нескольких фонем или звуковыми единицами каждого языка. Затем эти фонемы можно объединить в слова. Например, слово "речь" состоит из трех фонем: [р’эч’]. Эти классификации выполняются приблизительно 100 раз в секунду. Настройка акустической модели позволяет системе эффективнее распознавать речь в нетипичных средах. Например, если приложение предназначено для работников складов или заводов, настройка акустической модели помогает более точно распознать речь в шумных средах.

  • Службы "Речь" корпорации Майкрософт предоставляют более 70 голосов по умолчанию на более чем 40 языках для преобразования текста в аудиоданные. Виртуальные помощники и различные приложения с поддержкой речи набирают все большую популярность. Однако для представления множеству компаний требуется уникальный голос, который бы точно передавал их лицо. Например, при разработке чат-бота для службы обслуживания клиента вы можете связать его с уникальным голосом компании для разработки клиентского вложения. Аналогично разработчик внутренних навигационных автомобильных программ может включить преобразование текста в речь на разных настраиваемых голосах для повышения удобства использования.

    С этой задачей сможет быстро справиться Voice Studio, пользовательский портал для создания голоса. Используя собственные аудиоданные (записанный голос человека со связанными сценариями), вы можете создать настраиваемый голос, который затем развертывается в службе преобразования текста в речь корпорации Майкрософт и легко реализуется в ваших программах с помощью собственной конечной точки API.

Общие

  • Сумма счета за API-интерфейсы поиска Bing зависит от количества транзакций (другое название — вызовы API). Это планы с оплатой по мере использования, и при их применении не взимается дополнительная плата за создание сложных запросов и получение более чем 10 результатов (в большинстве случаев — до 50 результатов).

  • При превышении указанного количества транзакций в секунду (TPS) использование ресурсов будет регулироваться для соблюдения этого ограничения. Если для вашего приложения требуется больше TPS, чем указано на этой странице, обратитесь в службу поддержки Azure.

  • В контексте выставления счетов транзакцией считается успешный запрос на вызов API Bing (хотя в случае атак типа "отказ в обслуживании" есть определенные оговорки). В контексте ведения журналов и создания отчетов, например для надстройки "Статистика Bing", транзакцией считается любой вызов API Bing (не обязательно успешный).

  • Уровень службы можно изменить в любое время. Обязательно используйте в вызовах API соответствующие ключи. Если вы заключили с корпорацией Майкрософт Соглашение Enterprise, обратитесь к менеджеру по работе с клиентами.

Ресурсы

Оцените ежемесячные затраты на службы Azure

Ознакомьтесь с часто задаваемыми вопросами по ценам Azure

Узнайте подробнее о Cognitive Services

Ознакомьтесь с техническими учебными пособиями, видеороликами и дополнительными ресурсами

Добавлено для расчета. Щелкните v для просмотра на калькуляторе Просмотр на калькуляторе

Обучайтесь и создавайте, используя деньги на счете ($200), а также продолжайте использовать продукты бесплатно