Text to Speech

より自然でアクセシビリティの高いインターフェイスを実現

ロボットではなく、人と話す

ユーザーに自然に話しかけるアプリやサービスを構築して、アクセシビリティと使いやすさを向上させましょう。ほぼリアルタイムでテキストを音声に変換して再生し、後で使用できるようにファイルとして保存できます。Text to Speech には、Neural バージョンと Standard バージョンが用意されています。

最新のデジタル音声イノベーションを適用した Neural Text to Speech 機能を使用すると、アプリの音声が人による録音とほとんど区別がつかないものになります。自然な抑揚と明瞭な発音により、AI システムと対話する際のリスニング疲労が大幅に軽減されます。Neural Text to Speech を使用して、チャットボットや仮想アシスタントとの対話をより自然で魅力的なものにしましょう。また、電子書籍からオーディオブックへの変換など、デジタル テキストの変換や、カーナビゲーション システムの強化にも使用できます。

Neural Text to Speech の実例

英語 (米国): 女性

音声サンプル
The third type, a logarithm of the unsigned fold change, is undoubtedly the most tractable.
As the name suggests, the original submarines came from Yugoslavia.
This is easy enough if you have an unfinished attic directly above the bathroom.

英語 (米国): 男性

音声サンプル
Susan Candiotti reports they've given up their trip.
Carol knows my lifestyle.
The seagrass fiber is tough, durable, and smooth.

中国語 (CN):Xiaoxiao

音声サンプル
您好,欢迎致电客服中心。我是华北地区的客服人员,工号0165。请问有什么可以帮您?
想和你表白,试了一万种方式,找了一千次时机,但都放弃了,最终只能原地踏步。
负责人Michael透露,新推出的紧凑型SUV搭载了智能的音响系统,可以语音控制volume大小。不过,车身的整体造型还是个secret。

ドイツ語 (DE):Katja

音声サンプル
Bestimmte Berufsgruppen sind nur noch schwer zu rekrutieren.
Sein Gedicht steckt voller Übertreibungen, die für den Schriftsteller allerdings typisch sind.
Er organisiert eine Unterstützung der schwächeren durch die stärksten Bundesländer.

イタリア語 (IT):Elsa

音声サンプル
Tenete conto di un fattore importante.
Alcuni prodotti in gran parte sono di buona qualità.
Crisi? Vietato rilassarsi, siamo ancora in emergenza.

使ってみたいですか?

Standard Text to Speech 機能では、複数の言語でユーザーに話しかけることができます。45 種類以上の言語 (ロケール) の 75 種類以上の音声の中からお選びいただけます。 また、男性の声にするか女性の声にするかを選択することもできます。速度、ピッチ (声の高さ)、音量、発音、休止の追加などの パラメーターも調整できます。

Standard Text to Speech の実例

音声合成の動作を確認するには、再生ボタンを押してください。*

言語 サンプル テキスト 音声サンプル
English (US) An airport spokesman said more than 110 planes were damaged by hail.
Chinese (CN) 广告收入的比例高达90%以上
Japanese (JP) 皆様のご協力のたまものと
German (DE) Der Anstieg der Verbraucherpreise in der Eurozone verlangsamt sich weiter.
Spanish (ES) El alcalde de Santiago convoca a los medios para inaugurar dos semáforos.
Turkish (ES) Tren durduğu sırada vagonun ortasında bir patlama meydana geldi.

使ってみたいですか?

カスタム音声モデルを使ったテキスト読み上げ

音声エージェントに、貴社のブランドを明確に打ち出した独自の音声を反映することができます。テキスト読み上げ音声カスタマイズ機能を使えば、専門知識がなくても簡単に、独自の音声対応アプリを作成できます。

アクションからご覧ください

言語

画質

サンプル テキスト 音声サンプル

独自の音声モデルの構築を開始しますか?

使いやすくなった音声モデル

音声エージェントをカスタマイズするには、トレーニング データを録音してアップロードするだけです。そうすれば、録音内容に合わせてチューニングされた独自の音声フォントが自動的に作成されます。まずは少量のデータで概念実証を行いましょう。データが増加するにつれ、システムはシームレスにスケーリングし、自然音声の品質が強化されます。

一貫性と統合

カスタム音声モデルは、他の Cognitive Services 音声認識サービスと完全に統合されます。カスタマイズした音声モデルは、コーディングなしで簡単に API にデプロイすることができます。

迅速で安全

固有の API エンドポイントと安全な認証管理を通じてすぐに、音声フォントを全プラットフォームに組み込むことができます。モデルはお客様が管理することになります。

音声認識シナリオの考察

インテリジェント キオスク

音声認識サービスと Language Understanding を組み合わせると、アプリとユーザーの自然な対話が可能になります。ユーザーの質問は、音声テキスト変換を使ってキャプチャします。次に、Language Understanding を使って意図を解析して、適切な応答を組み立てます。その後、テキスト読み上げを使って、テキストから音声による応答を合成します。 銀行、旅行、エンターテイメントなど、さまざまなシナリオ向けに、会話型のインターフェイスを作成することができます。

Commerce chatbotTogether, the Azure Bot Service and Language Understanding service enable developers to create conversational interfaces for various scenarios like banking, travel, and entertainment. For example, a hotel’s concierge can use a bot to enhance traditional e-mail and phone call interactions by validating a customer via Azure Active Directory and using Cognitive Services to better contextually process customer requests using text and voice. The Speech recognition service can be added to support voice commands.1234567
  1. 概要
  2. フロー

商用チャットボット

概要

Azure Bot Service と Language Understanding サービスを組み合わせることで、開発者は銀行、旅行、エンターテイメントなどのさまざまなシナリオに合わせた会話型のインターフェイスを作成できます。たとえば、ホテルのコンシェルジュは、ボットを使用して Azure Active Directory で顧客を認証し、Cognitive Services でテキストや音声を使用して顧客の要求を文脈から処理することで、従来の電子メールや電話でのやりとりを強化できます。音声認識サービスを追加すると、音声コマンドに対応できるようになります。

フロー

  1. 1 ユーザーがお客様のモバイル アプリを使用します
  2. 2 Azure AD B2C を使用して、ユーザーが認証します
  3. 3 カスタム Application Bot を使用して、ユーザーが情報を要求します
  4. 4 Cognitive Services が自然言語の要求を処理します
  5. 5 自然な会話を使用して質問を改善できるユーザーが応答をレビューします
  6. 6 ユーザーが結果に満足すれば、Application Bot がユーザーの予約を更新します
  7. 7 Application Insights が、ランタイム テレメトリを収集して、ボットのパフォーマンスと使用方法により開発をサポートします

"ROOBO is an AI solution provider. Now with Microsoft’s world leading Text to Speech technology, we are able to provide the best custom voice building service to our customers."

Yu Lei: CTO、roobo

Cognitive Services APIs を詳しく見る

Computer Vision

Distill actionable information from images

Face

Detect, identify, analyze, organize, and tag faces in photos

Ink Recognizer プレビュー

An AI service that recognizes digital ink content, such as handwriting, shapes, and ink document layout

Video Indexer

Unlock video insights

Custom Vision

Easily customize your own state-of-the-art computer vision models for your unique use case

Form Recognizer プレビュー

The AI-powered document extraction service that understands your forms

Text Analytics

Easily evaluate sentiment and topics to understand what users want

Translator Text

Easily conduct machine translation with a simple REST API call

Bing Spell Check

Detect and correct spelling mistakes in your app

QnA Maker

Distill information into conversational, easy-to-navigate answers

Language Understanding

Teach your apps to understand commands from your users

Speech Services

Unified speech services for speech-to-text, text-to-speech and speech translation

Speaker Recognition プレビュー

Use speech to identify and verify individual speakers

Content Moderator

Automated image, text, and video moderation

Anomaly Detector プレビュー

Easily add anomaly detection capabilities to your apps.

Personalizer プレビュー

An AI service that delivers a personalized user experience

アンビエント デバイスを構築したり、カスタム ウェイク ワードを作成したりするには、Speech Devices SDK を使用します。

詳細情報