Унифицированные службы речи для преобразования речи в текст, текста в речь и перевода речи
Унифицированные службы "Речь" предоставляют широкий диапазон возможностей распознавания и создания речи, включая транскрибирование речи, преобразование текста в речь и перевод речи. Службы "Речь" предоставляют широкий диапазон возможностей распознавания и создания речи, включая транскрибирование речи, преобразование текста в речь, перевод речи и распознавание говорящего.
Изучите варианты оплаты
Примените фильтры, чтобы настроить варианты оплаты в соответствии со своими потребностями.
Указаны ориентировочные цены, которые не могут рассматриваться в качестве окончательного ценового предложения. Фактические цены могут отличаться в зависимости от типа соглашения, заключенного с Майкрософт, даты покупки и курса валюты. Цены рассчитываются в долларах США и конвертируются по ставкам-ориентирам Thomson Reuters, обновляемым в первый день каждого календарного месяца. Войдите в Калькулятор цен Azure, чтобы просмотреть цены исходя из вашей текущей программы или предложения от корпорации Майкрософт. Обратитесь к специалисту по продажам Azure, чтобы получить дополнительные сведения о ценах или запросить ценовое предложение. Дополнительную информацию о ценах Azure см. в разделе вопросов и ответов.
Государственные структуры США могут приобрести службы “Azure для государственных организаций” у поставщика решений по лицензированию без предварительных финансовых обязательств или непосредственно через онлайн-подписку с оплатой по мере использования.
Важно! Цена в R$ лишь ориентировочная. Так как это предмет международных транзакций, окончательная цена зависит от курсов валют и налогов на финансовые операции (IOF). Форма eNF выдаваться не будет.
Государственные структуры США могут приобрести службы “Azure для государственных организаций” у поставщика решений по лицензированию без предварительных финансовых обязательств или непосредственно через онлайн-подписку с оплатой по мере использования.
Важно! Цена в R$ лишь ориентировочная. Так как это предмет международных транзакций, окончательная цена зависит от курсов валют и налогов на финансовые операции (IOF). Форма eNF выдаваться не будет.
Бесплатно (F0)
Категория | Компоненты | Цена |
---|---|---|
Преобразование речи в текст (посекундная тарификация) |
Стандартная | Бесплатно предоставляется 5 ч аудио в месяц |
Пользовательские |
Бесплатно предоставляется 5 ч аудио в месяц Размещение конечной точки: Бесплатно предоставляется 1 модель в месяц1 |
|
Транскрибирование бесед с многоканальным аудио ПРЕДВАРИТЕЛЬНАЯ ВЕРСИЯ | Бесплатно предоставляется 5 ч аудио в месяц | |
Преобразование текста в речь (посимвольная тарификация) |
Нейронный | Бесплатно предоставляется 0.5 million символов в месяц |
Перевод речи (посекундная тарификация) |
Стандартный | Бесплатно предоставляется 5 ч аудио в месяц |
Распознавание говорящего (тарификация за транзакцию) |
Проверка говорящего2 | Бесплатных транзакций в месяц: 10,000 |
Идентификация говорящего2 | Бесплатных транзакций в месяц: 10,000 | |
Хранение профиля голосовой связи | Бесплатных транзакций в месяц: 10,000 |
Оплата по мере использования: платите только за то, что используете.
Категория | Компоненты | Цена |
---|---|---|
Преобразование речи в текст (посекундная тарификация) |
Стандартная | $- за час аудио |
Пользовательские |
$- за час аудио Размещение конечной точки: $- на модель в час |
|
Расширенные функции надстройки:
|
$- на каждый звуковой час на функцию | |
Транскрибирование бесед с многоканальным аудио ПРЕДВАРИТЕЛЬНАЯ ВЕРСИЯ | $- за час аудио1 | |
Преобразование текста в речь (посимвольная тарификация) |
Нейронный |
Синтез пакетов в реальном времени: $- за 1 млн
символы Создание длинного аудиоматериала: $- за 1 млн символов |
Создание пользовательского нейронного2 |
Обучение: от $- за час вычислений до $- за обучение Синтез пакетов в реальном времени: $- за 1 млн символов Размещение конечной точки: $- на модель в час Создание длинного аудиоматериала: $- за 1 млн символов |
|
Перевод речи (посекундная тарификация) |
Стандартный | $- за час аудио |
Распознавание говорящего (тарификация за транзакцию) |
Проверка говорящего3 | $- за 1,000 транзакций |
Идентификация говорящего3 | $- за 1,000 транзакций | |
Хранение профиля голосовой связи | $- за 1,000 речевых профилей (10,000 бесплатных речевых профилей в месяц) |
Уровни обязательств
Экземпляр | Категория | Компоненты | Цена (за месяц) | Превышение |
---|---|---|---|---|
Azure — “Стандартный” | Преобразование речи в текст | Стандартная | $- — часы (2,000) | $- в час |
$- — часы (10,000) | $- в час | |||
$- — часы (50,000) | $- в час | |||
Пользовательские | $- — часы (2,000) | $- в час | ||
$- — часы (10,000) | $- в час | |||
$- — часы (50,000) | $- в час | |||
Преобразование текста в речь | Нейронный1 | $- — млн символов (80) | $- на млн символов (1) | |
$- — млн символов (400) | $- на млн символов (1) | |||
$- — млн символов (2,000) | $- на млн символов (1) | |||
Подключенный контейнер — "Стандартный" | Преобразование речи в текст | Стандартная | $- — часы (2,000) | $- в час |
$- — часы (10,000) | $- в час | |||
$- — часы (50,000) | $- в час | |||
Пользовательские | $- — часы (2,000) | $- в час | ||
$- — часы (10,000) | $- в час | |||
$- — часы (50,000) | $- в час | |||
Преобразование текста в речь | Нейронный1 | $- — млн символов (80) | $- на млн символов (1) | |
$- — млн символов (400) | $- на млн символов (1) | |||
$- — млн символов (2,000) | $- на млн символов (1) | |||
Отключенный контейнер | Преобразование речи в текст | Стандартная |
Зарегистрируйтесь, чтобы получить доступ
Подробнее |
|
Пользовательские |
Зарегистрируйтесь, чтобы получить доступ
Подробнее |
|||
Преобразование текста в речь | Нейронный1 |
Зарегистрируйтесь, чтобы получить доступ
Подробнее |
Эти функции перестают использоваться и сейчас доступны только существующим клиентам. Ознакомьтесь с подробными сведениями и узнайте, как перейти на новые функции.
Экземпляр | Категория | Компоненты | Цена |
---|---|---|---|
Бесплатные - Веб/контейнер Число одновременных запросов: 1 |
Преобразование текста в речь | Стандартная | Бесплатно предоставляется 5 million символов в месяц |
Пользовательские |
Бесплатно предоставляется 5 million символов в месяц Размещение конечной точки: Бесплатно предоставляется 1 модель в месяц |
||
Ценовая категория "Стандартный" — Интернет, контейнер 100 параллельных запросов для базовой модели 20 параллельных запросов для настраиваемой модели |
Преобразование текста в речь | Стандартная | $- за 1 млн символов |
Пользовательские |
$- за 1 млн символов Размещение конечной точки: $- на модель в час |
Azure: цены и варианты приобретения

Свяжитесь с нами напрямую
Изучите пошаговое руководство по ценам на Azure. Ознакомьтесь с ценами на интересующее вас облачное решение, узнайте об оптимизации затрат и запросите индивидуальное предложение.
Обратитесь к специалисту по продажамУзнайте о способах приобретения
Приобрести службы Azure можно на веб-сайте Azure, у представителя Майкрософт или у партнера Azure.
Изучить доступные вариантыДополнительные ресурсы
Службы речи
Узнайте больше о функциях и возможностях службы "Службы речи".
Калькулятор цен
Оцените приблизительные ежемесячные затраты при использовании любого сочетания продуктов Azure.
Документация
Ознакомьтесь с техническими руководствами, видеороликами и дополнительными ресурсами по службе “Службы речи”.
Часто задаваемые вопросы
-
- При использовании «Преобразование речи в текст» и «Преобразование речи» плата взимается с шагом в одну секунду.
- Преобразование текста в речь: плата за взимается за символ. Ознакомьтесь с определением символа в примечании к расценкам.
- При использовании «Преобразование речи в текст» и «Преобразование текста в речь» размещение конечной точки для пользовательских моделей оплачивается посекундно для каждой модели.
- Для настраиваемых команд: при выставлении счетов использование отслеживается так же, как и для преобразования речи в текст, преобразования текста в речь и распознавания речи. Новые единицы выставления счетов не добавляются.
- Плата за обучение моделей преобразования речи в текст не взимается. Единственными затратами являются размещение конечной точки для каждой развернутой модели с последующей оплатой аудио-часа пользовательского преобразования речи в текст.
-
Служба "Речь" позволяет пользователям адаптировать базовые модели с учетом собственных акустических и языковых данных. Благодаря этому они получают настраиваемые модели речи, которые можно использовать в преобразовании речи в текст и переводе речи.
-
Языковая модель — это случайное распределение последовательностей слов. Она помогает системе определить из числа последовательностей слова, которые звучат одинаково, на основе вероятности самих этих последовательностей. Например, фразы recognize speech и wreck a nice beach звучат похоже, но вероятность использования первого предположения выше, поэтому языковая модель назначит первой фразе более высокий рейтинг. Если голосовые запросы к приложению будут содержать определенные языковые элементы, например имена продуктов или жаргонизмы, которые редко используются в обычной речи, настройка языковой модели позволит улучшить производительность. Например, при создании приложения для голосового поиска в MSDN вероятно, что такие термины, как объектно-ориентированный, пространство имен или .NET, будут звучать чаще, чем в других обычных программах распознавания речи. Настройка языковой модели позволит системе запомнить эти термины.
-
Акустическая модель — это классификатор, сопоставляющий краткие звуковые фрагменты с одной из нескольких фонем или звуковыми единицами каждого языка. Затем эти фонемы можно объединить в слова. Например, слово “речь” состоит из трех фонем: [р’эч’]. Эти классификации выполняются приблизительно 100 раз в секунду. Настройка акустической модели позволяет системе эффективнее распознавать речь в нетипичных средах. Например, если приложение предназначено для работников складов или заводов, настройка акустической модели помогает более точно распознать речь в шумных средах.
-
Служба "Речь" предлагает широкий спектр голосов для преобразования текста в речь, при этом Пользовательский нейронный голос позволяет создавать собственные голоса, которые соответствуют вашим потребностям и торговой марке. Ознакомиться с дополнительными сведениями можно в блоге.
-
Распознавание языка позволяет определить изменение языка речи и соответствующим образом транскрибировать речь. Это можно применять к сценариям, когда язык речи неизвестен или когда докладчики могут говорить на нескольких языках. Распознавание одного языка доступно бесплатно. Непрерывное распознавание языка — это улучшенная надстройка. Дополнительные сведения см. в документации.
Обратитесь к специалисту по продажам, чтобы узнать, как формируются цены в Azure. Составьте предоставление о цене на свое облачное решение.
К вашим услугам бесплатные облачные службы и кредит в сумме $200 для изучения Azure в течение 30 дней.