Пропустить навигацию

Цены на Службы речи

Унифицированные службы речи для преобразования речи в текст, текста в речь и перевода речи

Унифицированные службы "Речь" предоставляют широкий диапазон возможностей распознавания и создания речи, включая транскрибирование речи, преобразование текста в речь и перевод речи. Службы "Речь" предоставляют широкий диапазон возможностей распознавания и создания речи, включая транскрибирование речи, преобразование текста в речь, перевод речи и распознавание говорящего.

Изучите варианты оплаты

Примените фильтры, чтобы настроить варианты оплаты в соответствии со своими потребностями.

Указаны ориентировочные цены, которые не могут рассматриваться в качестве окончательного ценового предложения. Фактические цены могут отличаться в зависимости от типа соглашения, заключенного с Майкрософт, даты покупки и курса валюты. Цены рассчитываются в долларах США и конвертируются по ставкам-ориентирам Thomson Reuters, обновляемым в первый день каждого календарного месяца. Войдите в Калькулятор цен Azure, чтобы просмотреть цены исходя из вашей текущей программы или предложения от корпорации Майкрософт. Обратитесь к специалисту по продажам Azure, чтобы получить дополнительные сведения о ценах или запросить ценовое предложение. Дополнительную информацию о ценах Azure см. в разделе вопросов и ответов.

Бесплатные

Экземпляр Категория Компоненты Цена
Бесплатные - Веб/контейнер
Число одновременных запросов: 11
Преобразование речи в текст Стандартная2 Бесплатно предоставляется 5 ч аудио в месяц
Пользовательские Бесплатно предоставляется 5 ч аудио в месяц
Размещение конечной точки: Бесплатно предоставляется 1 модель в месяц 3
Транскрибирование бесед с многоканальным аудио ПРЕДВАРИТЕЛЬНАЯ ВЕРСИЯ 4 Бесплатно предоставляется 5 ч аудио в месяц
Преобразование текста в речь Нейронный Бесплатно предоставляется 0.5 million символов в месяц
Перевод речи Стандартный Бесплатно предоставляется 5 ч аудио в месяц
Распознавание говорящего Проверка говорящего Бесплатных транзакций в месяц: 10,000
Идентификация говорящего Бесплатных транзакций в месяц: 10,000
Хранилище голосовых данных Бесплатных транзакций в месяц: 10,000

Дополнительные сведения о квотах и ограничениях для всех ценовых категорий см. в документации.

1Чтобы увеличить количество параллельных запросов, ознакомьтесь с инструкциями.

2Преобразование речи в текст теперь включает оценку произношения для экземпляра уровня "Бесплатный" (например, 5 часов аудиозаписей в месяц), а также для экземпляра уровня "Стандартный" по тарифу $1 за час аудиозаписи.

3Неиспользуемые модели будут автоматически списаны через семь дней.

4Для многоканального транскрибирования бесед рекомендуется использовать всенаправленный микрофон. Дополнительные сведения см. в пакете SDK Microsoft для голосовых устройств.

Оплата по мере использования: платите только за то, что используете.

Экземпляр Категория Компоненты Цена
Ценовая категория "Стандартный" — Интернет, контейнер
100 параллельных запросов для базовой модели
20 параллельных запросов для настраиваемой модели1
Преобразование речи в текст Стандартная2 $- за час аудио
Пользовательские $- за час аудио
Размещение конечной точки: $- на модель в час
Транскрибирование бесед с многоканальным аудио ПРЕДВАРИТЕЛЬНАЯ ВЕРСИЯ $- за час аудио3
Преобразование текста в речь Нейронный4 Синтез в реальном времени: $- за 1 млн символы4
Создание длинного аудиоматериала: $- за 1 млн символов
Создание пользовательского нейронного4, 5 Обучение: от $- за час вычислений до $- за обучение
Синтез в реальном времени: $- за 1 млн символов
Размещение конечной точки: $- на модель в час
Создание длинного аудиоматериала: $- за 1 млн символов
Перевод речи Стандартный $- за час аудио
Распознавание говорящего Проверка говорящего $- за 1,000 транзакций
Идентификация говорящего $- за 1,000 транзакций
Хранилище голосовых данных $- за 1,000 речевых профилей (10,000 бесплатных речевых профилей в месяц)

Дополнительные сведения о квотах и ограничениях для всех ценовых категорий см. в документации.

1 Чтобы увеличить количество параллельных запросов, ознакомьтесь с инструкциями.

2 Преобразование речи в текст теперь включает оценку произношения для экземпляра уровня "Бесплатный" (например, 5 часов аудиозаписей в месяц), а также для экземпляра уровня "Стандартный" по тарифу $1 за час аудиозаписи.

3 Цены представлены для общедоступной предварительной версии. О ценах на общедоступную версию будет сообщено позже, ближе к ее выпуску.

4 Счета за преобразование текста в речь выставляются с тарификацией за каждый символ, преобразованный в речь, включая знаки препинания. Подробнее.

5 Пользовательский нейронный голос (CNV) — это возможность с ограниченным доступом с версиями Pro и Lite. С помощью CNV Lite (общедоступная предварительная версия) клиент может записать собственный голос и создать модель для демонстрации или оценки, прежде чем подать заявку на доступ к версии Pro. Узнайте, где доступна возможность CNV.

Уровни обязательств

Доступ к этим ценам ограничен. Подайте заявку здесь.

Экземпляр Категория Компоненты Цена (за месяц) Превышение
Azure — “Стандартный” Преобразование речи в текст Стандартная $- — часы (2,000) $- в час
$- — часы (10,000) $- в час
$- — часы (50,000) $- в час
Преобразование текста в речь Нейронный1 $- — млн символов (80) $- на млн символов (1)
$- — млн символов (400) $- на млн символов (1)
$- — млн символов (2,000) $- на млн символов (1)
Подключенный контейнер — "Стандартный" Преобразование речи в текст Стандартная $- — часы (2,000) $- в час
$- — часы (10,000) $- в час
$- — часы (50,000) $- в час
Преобразование текста в речь Нейронный1 $- — млн символов (80) $- на млн символов (1)
$- — млн символов (400) $- на млн символов (1)
$- — млн символов (2,000) $- на млн символов (1)
Отключенный контейнер Преобразование речи в текст Стандартная Зарегистрируйтесь, чтобы получить доступ
Подробнее
Преобразование текста в речь Нейронный1 Зарегистрируйтесь, чтобы получить доступ
Подробнее
1 Только синтез в режиме реального времени, не включает длительное создание звука.

Эти функции перестают использоваться и сейчас доступны только существующим клиентам. Ознакомьтесь с подробными сведениями и узнайте, как перейти на новые функции.

Экземпляр Категория Компоненты Цена
Бесплатные - Веб/контейнер
Число одновременных запросов: 1
Преобразование текста в речь Стандартная Бесплатно предоставляется 5 million символов в месяц
Пользовательские Бесплатно предоставляется 5 million символов в месяц
Размещение конечной точки: Бесплатно предоставляется 1 модель в месяц
Ценовая категория "Стандартный" — Интернет, контейнер
100 параллельных запросов для базовой модели
20 параллельных запросов для настраиваемой модели
Преобразование текста в речь Стандартная $- за 1 млн символов
Пользовательские $- за 1 млн символов
Размещение конечной точки: $- на модель в час

Azure: цены и варианты приобретения

Свяжитесь с нами напрямую

Получите пошаговое руководство по ценам на Azure. Ознакомьтесь с ценами на интересующее вас облачное решение, узнайте об оптимизации затрат и запросите индивидуальное предложение.

Обратитесь к специалисту по продажам

Узнайте о способах приобретения

Приобрести службы Azure можно на веб-сайте Azure, у представителя Майкрософт или у партнера Azure.

Изучить доступные варианты

Дополнительные ресурсы

Службы речи

Узнайте больше о функциях и возможностях службы "Службы речи".

Калькулятор цен

Оцените приблизительные ежемесячные затраты при использовании любого сочетания продуктов Azure.

Документация

Ознакомьтесь с техническими руководствами, видеороликами и дополнительными ресурсами по службе "Службы речи".

Часто задаваемые вопросы

    • Для перевода речи, преобразования речи в текст и преобразования речи в текст с помощью модели Пользовательского распознавания речи: использование тарифицируется посекундно.
    • Для Преобразования текста в речь с нейронными или Пользовательскими нейронными голосами: плата за взимается за символ. Ознакомьтесь с определением символа в примечании к расценкам.
    • Для размещения настраиваемых моделей речи использование тарифицируется на почасовой основе, а для размещения настраиваемого голоса — ежедневно.
    • Для настраиваемых команд: при выставлении счетов использование отслеживается так же, как и для преобразования речи в текст, преобразования текста в речь и распознавания речи. Новые единицы выставления счетов не добавляются.
    • Плата за обучение моделей речи не взимается. Плата взимается только за размещение модели после обучения, а также за каждый час транскрибирования речи.
  • Служба "Речь" позволяет пользователям адаптировать базовые модели с учетом собственных акустических и языковых данных. Благодаря этому они получают настраиваемые модели речи, которые можно использовать в преобразовании речи в текст и переводе речи.

  • Языковая модель — это случайное распределение последовательностей слов. Она помогает системе определить из числа последовательностей слова, которые звучат одинаково, на основе вероятности самих этих последовательностей. Например, фразы recognize speech и wreck a nice beach звучат похоже, но вероятность использования первого предположения выше, поэтому языковая модель назначит первой фразе более высокий рейтинг. Если голосовые запросы к приложению будут содержать определенные языковые элементы, например имена продуктов или жаргонизмы, которые редко используются в обычной речи, настройка языковой модели позволит улучшить производительность. Например, при создании приложения для голосового поиска в MSDN вероятно, что такие термины, как объектно-ориентированный, пространство имен или .NET, будут звучать чаще, чем в других обычных программах распознавания речи. Настройка языковой модели позволит системе запомнить эти термины.

  • Акустическая модель — это классификатор, сопоставляющий краткие звуковые фрагменты с одной из нескольких фонем или звуковыми единицами каждого языка. Затем эти фонемы можно объединить в слова. Например, слово “речь” состоит из трех фонем: [р’эч’]. Эти классификации выполняются приблизительно 100 раз в секунду. Настройка акустической модели позволяет системе эффективнее распознавать речь в нетипичных средах. Например, если приложение предназначено для работников складов или заводов, настройка акустической модели помогает более точно распознать речь в шумных средах.

  • Служба "Речь" предлагает широкий спектр голосов для преобразования текста в речь, при этом Пользовательский нейронный голос позволяет создавать собственные голоса, которые соответствуют вашим потребностям и торговой марке. Ознакомиться с дополнительными сведениями можно в блоге.

  • Иногда докладчик или несколько докладчиков говорят на разных языках в одном аудиофайле или выступлении в реальном времени. Функция непрерывного распознавания языка позволяет обнаруживать изменение в речи и точно транскрибировать ее. Эта функция бесплатно предоставляется в закрытой предварительной версии и доступна через пакет SDK для службы "Речь". Дополнительные сведения см. в документации.

Обратитесь к специалисту по продажам, чтобы узнать, как формируются цены в Azure. Составьте предоставление о цене на свое облачное решение.

К вашим услугам бесплатные облачные службы и кредит в сумме $200 для изучения Azure в течение 30 дней.

Добавлено для расчета. Щелкните v для просмотра на калькуляторе