Text to Speech

より自然でアクセシビリティの高いインターフェイスを実現

ロボットではなく、人と話す

ユーザーに自然に話しかけるアプリやサービスを構築して、アクセシビリティと使いやすさを向上させましょう。ほぼリアルタイムでテキストを音声に変換して再生し、後で使用できるようにファイルとして保存できます。Text to Speech には、Neural バージョンと Standard バージョンが用意されています。

最新のデジタル音声イノベーションを適用した Neural Text to Speech 機能を使用すると、アプリの音声が人による録音とほとんど区別がつかないものになります。自然な抑揚と明瞭な発音により、AI システムと対話する際のリスニング疲労が大幅に軽減されます。Neural Text to Speech を使用して、チャットボットや仮想アシスタントとの対話をより自然で魅力的なものにしましょう。また、電子書籍からオーディオブックへの変換など、デジタル テキストの変換や、カーナビゲーション システムの強化にも使用できます。

Neural Text to Speech の実例

英語 (米国): 女性

音声サンプル
The third type, a logarithm of the unsigned fold change, is undoubtedly the most tractable.
As the name suggests, the original submarines came from Yugoslavia.
This is easy enough if you have an unfinished attic directly above the bathroom.

英語 (米国): 男性

音声サンプル
Susan Candiotti reports they've given up their trip.
Carol knows my lifestyle.
The seagrass fiber is tough, durable, and smooth.

中国語 (CN):Xiaoxiao

音声サンプル
您好,欢迎致电客服中心。我是华北地区的客服人员,工号0165。请问有什么可以帮您?
想和你表白,试了一万种方式,找了一千次时机,但都放弃了,最终只能原地踏步。
负责人Michael透露,新推出的紧凑型SUV搭载了智能的音响系统,可以语音控制volume大小。不过,车身的整体造型还是个secret。

ドイツ語 (DE):Katja

音声サンプル
Bestimmte Berufsgruppen sind nur noch schwer zu rekrutieren.
Sein Gedicht steckt voller Übertreibungen, die für den Schriftsteller allerdings typisch sind.
Er organisiert eine Unterstützung der schwächeren durch die stärksten Bundesländer.

イタリア語 (IT):Elsa

音声サンプル
Tenete conto di un fattore importante.
Alcuni prodotti in gran parte sono di buona qualità.
Crisi? Vietato rilassarsi, siamo ancora in emergenza.

使ってみたいですか?

Standard Text to Speech 機能では、複数の言語でユーザーに話しかけることができます。45 種類以上の言語 (ロケール) の 75 種類以上の音声の中からお選びいただけます。 また、男性の声にするか女性の声にするかを選択することもできます。速度、ピッチ (声の高さ)、音量、発音、休止の追加などの パラメーターも調整できます。

Standard Text to Speech の実例

音声合成の動作を確認するには、再生ボタンを押してください。*

言語 サンプル テキスト 音声サンプル
English (US) An airport spokesman said more than 110 planes were damaged by hail.
Chinese (CN) 广告收入的比例高达90%以上
Japanese (JP) 皆様のご協力のたまものと
German (DE) Der Anstieg der Verbraucherpreise in der Eurozone verlangsamt sich weiter.
Spanish (ES) El alcalde de Santiago convoca a los medios para inaugurar dos semáforos.
Turkish (ES) Tren durduğu sırada vagonun ortasında bir patlama meydana geldi.

使ってみたいですか?

カスタム音声モデルを使ったテキスト読み上げ

音声エージェントに、貴社のブランドを明確に打ち出した独自の音声を反映することができます。テキスト読み上げ音声カスタマイズ機能を使えば、専門知識がなくても簡単に、独自の音声対応アプリを作成できます。

アクションからご覧ください

言語

画質

サンプル テキスト 音声サンプル

独自の音声モデルの構築を開始しますか?

使いやすくなった音声モデル

音声エージェントをカスタマイズするには、トレーニング データを録音してアップロードするだけです。そうすれば、録音内容に合わせてチューニングされた独自の音声フォントが自動的に作成されます。まずは少量のデータで概念実証を行いましょう。データが増加するにつれ、システムはシームレスにスケーリングし、自然音声の品質が強化されます。

一貫性と統合

カスタム音声モデルは、他の Cognitive Services 音声認識サービスと完全に統合されます。カスタマイズした音声モデルは、コーディングなしで簡単に API にデプロイすることができます。

迅速で安全

固有の API エンドポイントと安全な認証管理を通じてすぐに、音声フォントを全プラットフォームに組み込むことができます。モデルはお客様が管理することになります。

音声認識シナリオの考察

インテリジェント キオスク

音声認識サービスと Language Understanding を組み合わせると、アプリとユーザーの自然な対話が可能になります。ユーザーの質問は、音声テキスト変換を使ってキャプチャします。次に、Language Understanding を使って意図を解析して、適切な応答を組み立てます。その後、テキスト読み上げを使って、テキストから音声による応答を合成します。 銀行、旅行、エンターテイメントなど、さまざまなシナリオ向けに、会話型のインターフェイスを作成することができます。

Commerce chatbotTogether, the Azure Bot Service and Language Understanding service enable developers to create conversational interfaces for various scenarios like banking, travel and entertainment. For example, a hotel’s concierge can use a bot to enhance traditional e-mail and phone call interactions by validating a customer via Azure Active Directory and using Cognitive Services to better contextually process customer requests using text and voice. The Speech recognition service can be added to support voice commands.1234567
  1. 概要
  2. フロー

商用チャットボット

概要

Azure Bot Service と Language Understanding サービスを組み合わせることで、開発者は銀行、旅行、エンターテイメントなどのさまざまなシナリオに合わせた会話型のインターフェイスを作成できます。たとえば、ホテルのコンシェルジュは、ボットを使用して Azure Active Directory で顧客を認証し、Cognitive Services でテキストや音声を使用して顧客の要求を文脈から処理することで、従来の電子メールや電話でのやりとりを強化できます。音声認識サービスを追加すると、音声コマンドに対応できるようになります。

フロー

  1. 1 ユーザーがお客様のモバイル アプリを使用します
  2. 2 Azure AD B2C を使用して、ユーザーが認証します
  3. 3 カスタム Application Bot を使用して、ユーザーが情報を要求します
  4. 4 Cognitive Services が自然言語の要求を処理します
  5. 5 自然な会話を使用して質問を改善できるユーザーが応答をレビューします
  6. 6 ユーザーが結果に満足すれば、Application Bot がユーザーの予約を更新します
  7. 7 Application Insights が、ランタイム テレメトリを収集して、ボットのパフォーマンスと使用方法により開発をサポートします

"ROOBO is an AI solution provider. Now with Microsoft’s world leading Text to Speech technology, we are able to provide the best custom voice building service to our customers."

Yu Lei: CTO、roobo

Cognitive Services APIs を詳しく見る

Computer Vision

画像から意思決定に役立つ情報を抽出

Face

写真に含まれる顔の検出、識別、分析、グループ化、タグ付け

Ink Recognizer プレビュー

手書きの文字、図形、インク ドキュメントのレイアウトなどのデジタル インク コンテンツを認識できる AI サービス

Video Indexer

動画の分析情報を解明

Custom Vision

貴社の最先端のコンピューター ビジョン モデルを、独自の用途向けに簡単にカスタマイズできます

Form Recognizer プレビュー

フォームを解釈し、ドキュメントを抽出できる AI サービス

Text Analytics

センチメントとトピックを簡単に評価して、ユーザーが求めるものを理解

Translator Text

シンプルな REST API 呼び出しで機械翻訳を簡単に実行

QnA Maker

情報から会話形式のナビゲーションしやすい回答を抽出

Language Understanding

ユーザーが入力したコマンドをアプリが理解できるようにします。

Immersive Reader プレビュー

あらゆる年齢や能力のユーザーがテキストを読み理解できるようにサポート

Speech Services

音声テキスト変換、テキスト読み上げ、音声翻訳のための統合Speech Services

Speaker Recognition プレビュー

音声を使用して個々の話者を識別および検証

Content Moderator

画像、テキスト、ビデオを自動モデレート

Anomaly Detector プレビュー

異常検出機能をアプリに簡単に追加します。

Personalizer プレビュー

パーソナライズされたユーザー エクスペリエンスを提供する AI サービス

アンビエント デバイスを構築したり、カスタム ウェイク ワードを作成したりするには、Speech Devices SDK を使用します。

詳細情報