Пропустить и перейти к основному содержимому

Цены на Службы речи

Унифицированные службы речи для преобразования речи в текст, текста в речь и перевода речи

Унифицированные службы "Речь" предоставляют широкий диапазон возможностей распознавания и создания речи, включая транскрибирование речи, преобразование текста в речь и перевод речи. Службы "Речь" предоставляют широкий диапазон возможностей распознавания и создания речи, включая транскрибирование речи, преобразование текста в речь, перевод речи и распознавание говорящего.

Изучите варианты оплаты

Примените фильтры, чтобы настроить варианты оплаты в соответствии со своими потребностями.

Указаны ориентировочные цены, которые не могут рассматриваться в качестве окончательного ценового предложения. Фактические цены могут отличаться в зависимости от типа соглашения, заключенного с Майкрософт, даты покупки и курса валюты. Цены рассчитываются в долларах США и конвертируются по ставкам-ориентирам Thomson Reuters, обновляемым в первый день каждого календарного месяца. Войдите в Калькулятор цен Azure, чтобы просмотреть цены исходя из вашей текущей программы или предложения от корпорации Майкрософт. Обратитесь к специалисту по продажам Azure, чтобы получить дополнительные сведения о ценах или запросить ценовое предложение. Дополнительную информацию о ценах Azure см. в разделе вопросов и ответов.

Бесплатно (F0)

Категория Компоненты Цена
Преобразование речи в текст
(посекундная тарификация)
Стандартная Бесплатно предоставляется 5 ч аудио в месяц
Пользовательские Бесплатно предоставляется 5 ч аудио в месяц
Размещение конечной точки: Бесплатно предоставляется 1 модель в месяц1
Транскрибирование бесед с многоканальным аудио ПРЕДВАРИТЕЛЬНАЯ ВЕРСИЯ Бесплатно предоставляется 5 ч аудио в месяц
Преобразование текста в речь
(посимвольная тарификация)
Нейронный Бесплатно предоставляется 0.5 million символов в месяц
Перевод речи
(посекундная тарификация)
Стандартный Бесплатно предоставляется 5 ч аудио в месяц
Распознавание говорящего
(тарификация за транзакцию)
Проверка говорящего2 Бесплатных транзакций в месяц: 10,000
Идентификация говорящего2 Бесплатных транзакций в месяц: 10,000
Хранение профиля голосовой связи Бесплатных транзакций в месяц: 10,000

См. документацию для получения сведений о квотах, ограничениях и инструкциях по увеличению количества одновременных запросов.

1Неиспользуемые модели будут автоматически списаны через семь дней.

2Распознавание говорящего — это функция с ограниченным доступом. Требуется подать заявку на доступ.

Оплата по мере использования: платите только за то, что используете.

Категория Компоненты Цена
Преобразование речи в текст
(посекундная тарификация)
Стандартная $- за час аудио
Пользовательские $- за час аудио
Размещение конечной точки: $- на модель в час
Расширенные функции надстройки:
  • Идентификация языка
  • Пакетная диаризация для 3 и более дикторов
$- на каждый звуковой час на функцию
Транскрибирование бесед с многоканальным аудио ПРЕДВАРИТЕЛЬНАЯ ВЕРСИЯ $- за час аудио1
Преобразование текста в речь
(посимвольная тарификация)
Нейронный Синтез пакетов в реальном времени: $- за 1 млн символы
Создание длинного аудиоматериала: $- за 1 млн символов
Создание пользовательского нейронного2 Обучение: от $- за час вычислений до $- за обучение
Синтез пакетов в реальном времени: $- за 1 млн символов
Размещение конечной точки: $- на модель в час
Создание длинного аудиоматериала: $- за 1 млн символов
Перевод речи
(посекундная тарификация)
Стандартный $- за час аудио
Распознавание говорящего
(тарификация за транзакцию)
Проверка говорящего3 $- за 1,000 транзакций
Идентификация говорящего3 $- за 1,000 транзакций
Хранение профиля голосовой связи $- за 1,000 речевых профилей (10,000 бесплатных речевых профилей в месяц)

См. документацию для получения сведений о квотах, ограничениях и инструкциях по увеличению количества одновременных запросов.

1 Цены представлены для общедоступной предварительной версии. О ценах на общедоступную версию будет сообщено позже, ближе к ее выпуску.

2 Пользовательский нейронный голос (CNV) — это возможность с ограниченным доступом с версиями Pro и Lite. С помощью CNV Lite (общедоступная предварительная версия) клиент может записать собственный голос и создать модель для демонстрации или оценки, прежде чем подать заявку на доступ к версии Pro. Узнайте, где доступна возможность CNV.

3 Распознавание говорящего — это функция с ограниченным доступом. Требуется подать заявку на доступ.

Уровни обязательств

Экземпляр Категория Компоненты Цена (за месяц) Превышение
Azure — “Стандартный” Преобразование речи в текст Стандартная $- — часы (2,000) $- в час
$- — часы (10,000) $- в час
$- — часы (50,000) $- в час
Пользовательские $- — часы (2,000) $- в час
$- — часы (10,000) $- в час
$- — часы (50,000) $- в час
Преобразование текста в речь Нейронный1 $- — млн символов (80) $- на млн символов (1)
$- — млн символов (400) $- на млн символов (1)
$- — млн символов (2,000) $- на млн символов (1)
Подключенный контейнер — "Стандартный" Преобразование речи в текст Стандартная $- — часы (2,000) $- в час
$- — часы (10,000) $- в час
$- — часы (50,000) $- в час
Пользовательские $- — часы (2,000) $- в час
$- — часы (10,000) $- в час
$- — часы (50,000) $- в час
Преобразование текста в речь Нейронный1 $- — млн символов (80) $- на млн символов (1)
$- — млн символов (400) $- на млн символов (1)
$- — млн символов (2,000) $- на млн символов (1)
Отключенный контейнер Преобразование речи в текст Стандартная Зарегистрируйтесь, чтобы получить доступ
Подробнее
Пользовательские Зарегистрируйтесь, чтобы получить доступ
Подробнее
Преобразование текста в речь Нейронный1 Зарегистрируйтесь, чтобы получить доступ
Подробнее
1 Только синтез в режиме реального времени, не включает длительное создание звука.

Эти функции перестают использоваться и сейчас доступны только существующим клиентам. Ознакомьтесь с подробными сведениями и узнайте, как перейти на новые функции.

Экземпляр Категория Компоненты Цена
Бесплатные - Веб/контейнер
Число одновременных запросов: 1
Преобразование текста в речь Стандартная Бесплатно предоставляется 5 million символов в месяц
Пользовательские Бесплатно предоставляется 5 million символов в месяц
Размещение конечной точки: Бесплатно предоставляется 1 модель в месяц
Ценовая категория "Стандартный" — Интернет, контейнер
100 параллельных запросов для базовой модели
20 параллельных запросов для настраиваемой модели
Преобразование текста в речь Стандартная $- за 1 млн символов
Пользовательские $- за 1 млн символов
Размещение конечной точки: $- на модель в час

Azure: цены и варианты приобретения

Свяжитесь с нами напрямую

Изучите пошаговое руководство по ценам на Azure. Ознакомьтесь с ценами на интересующее вас облачное решение, узнайте об оптимизации затрат и запросите индивидуальное предложение.

Обратитесь к специалисту по продажам

Узнайте о способах приобретения

Приобрести службы Azure можно на веб-сайте Azure, у представителя Майкрософт или у партнера Azure.

Изучить доступные варианты

Дополнительные ресурсы

Службы речи

Узнайте больше о функциях и возможностях службы "Службы речи".

Калькулятор цен

Оцените приблизительные ежемесячные затраты при использовании любого сочетания продуктов Azure.

Документация

Ознакомьтесь с техническими руководствами, видеороликами и дополнительными ресурсами по службе “Службы речи”.

Часто задаваемые вопросы

    • При использовании «Преобразование речи в текст» и «Преобразование речи» плата взимается с шагом в одну секунду.
    • Преобразование текста в речь: плата за взимается за символ. Ознакомьтесь с определением символа в примечании к расценкам.
    • При использовании «Преобразование речи в текст» и «Преобразование текста в речь» размещение конечной точки для пользовательских моделей оплачивается посекундно для каждой модели.
    • Для настраиваемых команд: при выставлении счетов использование отслеживается так же, как и для преобразования речи в текст, преобразования текста в речь и распознавания речи. Новые единицы выставления счетов не добавляются.
    • Плата за обучение моделей преобразования речи в текст не взимается. Единственными затратами являются размещение конечной точки для каждой развернутой модели с последующей оплатой аудио-часа пользовательского преобразования речи в текст.
  • Служба "Речь" позволяет пользователям адаптировать базовые модели с учетом собственных акустических и языковых данных. Благодаря этому они получают настраиваемые модели речи, которые можно использовать в преобразовании речи в текст и переводе речи.

  • Языковая модель — это случайное распределение последовательностей слов. Она помогает системе определить из числа последовательностей слова, которые звучат одинаково, на основе вероятности самих этих последовательностей. Например, фразы recognize speech и wreck a nice beach звучат похоже, но вероятность использования первого предположения выше, поэтому языковая модель назначит первой фразе более высокий рейтинг. Если голосовые запросы к приложению будут содержать определенные языковые элементы, например имена продуктов или жаргонизмы, которые редко используются в обычной речи, настройка языковой модели позволит улучшить производительность. Например, при создании приложения для голосового поиска в MSDN вероятно, что такие термины, как объектно-ориентированный, пространство имен или .NET, будут звучать чаще, чем в других обычных программах распознавания речи. Настройка языковой модели позволит системе запомнить эти термины.

  • Акустическая модель — это классификатор, сопоставляющий краткие звуковые фрагменты с одной из нескольких фонем или звуковыми единицами каждого языка. Затем эти фонемы можно объединить в слова. Например, слово “речь” состоит из трех фонем: [р’эч’]. Эти классификации выполняются приблизительно 100 раз в секунду. Настройка акустической модели позволяет системе эффективнее распознавать речь в нетипичных средах. Например, если приложение предназначено для работников складов или заводов, настройка акустической модели помогает более точно распознать речь в шумных средах.

  • Служба "Речь" предлагает широкий спектр голосов для преобразования текста в речь, при этом Пользовательский нейронный голос позволяет создавать собственные голоса, которые соответствуют вашим потребностям и торговой марке. Ознакомиться с дополнительными сведениями можно в блоге.

  • Распознавание языка позволяет определить изменение языка речи и соответствующим образом транскрибировать речь. Это можно применять к сценариям, когда язык речи неизвестен или когда докладчики могут говорить на нескольких языках. Распознавание одного языка доступно бесплатно. Непрерывное распознавание языка — это улучшенная надстройка. Дополнительные сведения см. в документации.

Обратитесь к специалисту по продажам, чтобы узнать, как формируются цены в Azure. Составьте предоставление о цене на свое облачное решение.

К вашим услугам бесплатные облачные службы и кредит в сумме $200 для изучения Azure в течение 30 дней.

Добавлено для расчета. Щелкните v для просмотра на калькуляторе