Преобразование текста в речь

Преобразуйте текст в речь, чтобы создавать более естественные и доступные интерфейсы

Речь человека, а не робота

Создавайте приложения и службы, которые общаются с пользователями на естественном языке, расширяя специальные возможности и повышая удобство использования. Текст преобразуется в речь практически в реальном времени, воспроизводится и сохраняется в виде файла для дальнейшего использования. API Преобразования текста в речь доступен в двух версиях — нейронной и стандартной.

Нейронное преобразование текста в речь, в котором применяются последние инновации в области цифровой обработки речи, делает голоса ваших приложений практически неотличимыми от записей живых людей. Естественная интонация и четкая артикуляция существенно уменьшают слуховое утомление при взаимодействии с системами на базе ИИ. С помощью нейронного преобразования текста в речь можно сделать взаимодействие с чат-ботами и виртуальными помощниками более естественным и приятным. Кроме того, эта функция позволяет преобразовать цифровой текст из электронных книг в аудиокниги, а также помогает усовершенствовать автомобильные системы навигации.

Нейронное преобразование текста в речь в действии

Английский (США): Джесса

Предложение Образец голоса
The third type, a logarithm of the unsigned fold change, is undoubtedly the most tractable.
As the name suggests, the original submarines came from Yugoslavia.
This is easy enough if you have an unfinished attic directly above the bathroom.

Английский (США): Гай

Предложение Образец голоса
Susan Candiotti reports they've given up their trip.
Carol knows my lifestyle.
The seagrass fiber is tough, durable, and smooth.

Китайский (CN): Xiaoxiao

Предложение Образец голоса
您好,欢迎致电客服中心。我是华北地区的客服人员,工号0165。请问有什么可以帮您?
想和你表白,试了一万种方式,找了一千次时机,但都放弃了,最终只能原地踏步。
负责人Michael透露,新推出的紧凑型SUV搭载了智能的音响系统,可以语音控制volume大小。不过,车身的整体造型还是个secret。

Немецкий (DE): Катя (Katja)

Предложение Образец голоса
Bestimmte Berufsgruppen sind nur noch schwer zu rekrutieren.
Sein Gedicht steckt voller Übertreibungen, die für den Schriftsteller allerdings typisch sind.
Er organisiert eine Unterstützung der schwächeren durch die stärksten Bundesländer.

Итальянский (IT): Эльза (Elsa)

Предложение Образец голоса
Tenete conto di un fattore importante.
Alcuni prodotti in gran parte sono di buona qualità.
Crisi? Vietato rilassarsi, siamo ancora in emergenza.

Хотите создать подобное?

Функция стандартного преобразования текста в речь обеспечивает общение с пользователями на разных языках. Вы можете выбрать один из 75 голосов на более чем 45 языках, включая варианты мужского и женского голоса. Также можно настроить параметры, например скорость, тон, громкость, произношение и дополнительные паузы.

Стандартное преобразование текста в речь в действии

Чтобы оценить синтез речи в действии, нажмите кнопку воспроизведения.*

Язык Образец текста Образец голоса
English (US) An airport spokesman said more than 110 planes were damaged by hail.
Chinese (CN) 广告收入的比例高达90%以上
Japanese (JP) 皆様のご協力のたまものと
German (DE) Der Anstieg der Verbraucherpreise in der Eurozone verlangsamt sich weiter.
Spanish (ES) El alcalde de Santiago convoca a los medios para inaugurar dos semáforos.
Turkish (ES) Tren durduğu sırada vagonun ortasında bir patlama meydana geldi.

Хотите создать подобное?

Преобразование текста в речь с помощью настраиваемых голосовых моделей

Хотите придать своему голосовому агенту узнаваемое фирменное звучание? Функция настройки голоса при преобразовании текста в речь позволяет легко создавать уникальные приложения с голосовым управлением, не имея опыта в этой области.

Оцените работу решения в действии

Язык

Качество

Образец текста Образец голоса

Хотите создать собственную голосовую модель?

Простое создание голосовых моделей

Чтобы настроить голосовой агент, просто запишите и загрузите образец данных для обучения, и служба создаст уникальный голос в соответствии с вашей записью. Для подтверждения концепции на начальном этапе достаточно небольшого количества данных. Система легко масштабируется по мере увеличения объема данных, улучшая качество естественного голоса.

Согласованность и интеграция

Пользовательские голосовые модели полностью интегрированы с другими службами распознавания речи Cognitive Services. Писать код не требуется, и вы можете легко развернуть пользовательскую голосовую модель в API.

Скорость и безопасность

Благодаря уникальной конечной точке API и безопасному управлению аутентификацией вы можете быстро подключить голос на любой платформе. Модели находятся под вашим полным контролем.

Ознакомьтесь со сценарием службы "Речь"

Интеллектуальный киоск

Службы "Речь" в сочетании со службой LUIS обеспечивают естественное взаимодействие приложений и пользователей. С помощью преобразования речи в текст можно зафиксировать вопрос пользователя, с помощью службы "Распознавание речи" — проанализировать намерение и сформулировать подходящий ответ, а благодаря преобразованию текста в речь — синтезировать из текста устный ответ. Создавайте диалоговые интерфейсы для различных сфер применения, таких как банковское дело, туризм или развлечения.

Commerce chatbotTogether, the Azure Bot Service and Language Understanding service enable developers to create conversational interfaces for various scenarios like banking, travel, and entertainment. For example, a hotel’s concierge can use a bot to enhance traditional e-mail and phone call interactions by validating a customer via Azure Active Directory and using Cognitive Services to better contextually process customer requests using text and voice. The Speech recognition service can be added to support voice commands.1234567
  1. Обзор
  2. Поток

Чат-бот для коммерческих операций

Обзор

Одновременное использование служб Azure Bot и Language Understanding дает разработчикам возможность создавать разговорные интерфейсы для различных предприятий, например для банков, туристических компаний, развлекательных заведений и др. Например, администратор гостиницы может использовать бот для улучшения стандартного общения с клиентами по электронной почте и телефону. В частности, с помощью Azure Active Directory можно установить личность гостя, а с помощью Cognitive Services лучше обработать его голосовые или текстовые запросы с учетом контекста. Для поддержки голосовых команд можно добавить службу распознавания речи.

Поток

  1. 1 Пользователь открывает ваше мобильное приложение.
  2. 2 Пользователь проходить аутентификацию с помощью AD B2C.
  3. 3 С помощью настраиваемого приложения-бота пользователь запрашивает нужную ему информацию.
  4. 4 Служба Cognitive Services помогает обработать созданный на естественном языке запрос.
  5. 5 Пользователь просматривает ответ и в форме обычной беседы, при необходимости, уточняет свой вопрос.
  6. 6 Когда пользователь удовлетворен результатом, приложение-бот вносит изменения в заказ.
  7. 7 Служба Application Insights собирает телеметрические данные среды выполнения, чтобы помочь разработчикам сведениями о производительности бота и его использовании.

"ROOBO is an AI solution provider. Now with Microsoft’s world leading Text to Speech technology, we are able to provide the best custom voice building service to our customers."

Ю Лей (Yu Lei): Технический директор, ROOBO

Знакомство с API-интерфейсами Cognitive Services

Компьютерное зрение

Извлечение важнейшей информации из изображений

Распознавание лиц

Распознает, опознает, анализирует, группирует и помечает тегами лица на фотографиях

Распознаватель рукописного текста ПРЕДВАРИТЕЛЬНАЯ ВЕРСИЯ

Служба ИИ, распознающая содержимое рукописного ввода, включая записи от руки, формы и документы

Индексатор видео

Получите все преимущества анализа видео

Пользовательское визуальное распознавание

Простая настройка новейших моделей компьютерного зрения для конкретных вариантов использования

Распознаватель документов ПРЕДВАРИТЕЛЬНАЯ ВЕРСИЯ

Служба извлечения документов с поддержкой АА, распознающая формы

Анализ текста

Легко оценивайте мнение и темы, чтобы узнать желания пользователей

Перевод текстов

Легко выполняйте машинный перевод текста с помощью простого вызова REST API

QnA Maker

Преобразуйте информацию в ответы, представленные в режиме диалога с удобной навигацией

Распознавание речи

Научите свои приложения понимать команды пользователей

Иммерсивное средство чтения ПРЕДВАРИТЕЛЬНАЯ ВЕРСИЯ

Упростите чтение и понимание текста для пользователей разных возрастов и с разными возможностями

Службы речи

Унифицированные службы речи для преобразования речи в текст, текста в речь и перевода речи

Распознавание говорящего ПРЕДВАРИТЕЛЬНАЯ ВЕРСИЯ

Используйте речь, чтобы идентифицировать и проверить отдельных говорящих

Content Moderator

Автоматическая модерация изображений, текста и видео

Детектор аномалий ПРЕДВАРИТЕЛЬНАЯ ВЕРСИЯ

Без труда внедряйте возможности обнаружения аномалий в свои приложения.

Персонализатор ПРЕДВАРИТЕЛЬНАЯ ВЕРСИЯ

Служба ИИ, которая обеспечивает персонализированную работу

Используйте пакет SDK для речевых устройств, чтобы создать интеллектуальное устройство, реагирующее на окружающую среду, и настроить слово для активации

Подробнее…