ナビゲーションをスキップする

Text to Speech

自然な響きの音声でアプリに命を吹き込む

自然に話すアプリとサービスを構築します。カスタマイズされたリアルな音声ジェネレーターでブランドを差別化し、テキスト リーダーやテキスト トーカーからカスタマー サポートのチャットボットまで、ユース ケースに合わせて、さまざまな話し方や感情のトーンを持つ音声にアクセスできます。

本物のような合成音声

人間の声のイントネーションや感情と一致する、滑らかで自然に聞こえるテキスト読み上げを実現します。

カスタマイズ可能なテキスト読み上げ音声

ブランドのアイデンティティを反映する独自の AI 音声ジェネレーターを作成します。

きめ細かいテキスト トーク オーディオ コントロール

スピード、声の高さ、発音、間などを簡単に調節し、シナリオに合わせて音声出力を調整できます。

柔軟性の高いデプロイ

クラウド、オンプレミス、コンテナーを使用したエッジで、どこでも Text to Speech を実行できます。

あらゆるシナリオに対応するさまざまな音声にアクセス

140 の言語とバリアントにわたる 400 ものニューラル音声を使用して、世界中の視聴者を引き付けましょう。表現力豊かな、人間に近い声で、テキスト リーダーや音声対応アシスタントなどのシナリオを活性化できます。ニューラル テキスト読み上げは、ニュース放送、カスタマー サービス、叫び声、ささやき声、感情 (快活さや、悲しさなど) などの話し方をサポートしています。

この JavaScript SDK に基づいて作成されたデモ アプリで Text to Speech をお試しください

メモ:お客様のデータは保存されません。

これを構築する方法についての詳細情報

メモ:お客様のデータは保存されません。

これを構築する方法についての詳細情報

クラウドからエッジまで、テキスト読み上げをどこにでも配置

データが存在する場所であればどこでも Text to Speech を実行します。コンテナーを使用して、堅牢なクラウド機能とエッジローカリティの両方に最適化されたアプリケーションにリアルな音声合成を構築します

企業ブランドに合わせてカスタム音声を構築する

独自のカスタム音声でブランドを差別化します。カスタム ニューラル音声機能を使用して、より自然な会話型インターフェイス用の非常にリアルな音声を開発できます。これは、30 分の音声から始めることができます。現在 AI 音声生成を実践している組織の例を、いくつか次に示します。

Swisscom は、多言語音声アシスタントでカスタマー エクスペリエンスを強化

Swisscom は Speech サービスを利用して、英語、フランス語、ドイツ語、イタリア語の Swisscom 独自のペルソナ音声を持つ、自然音のカスタムテキスト読み上げ音声アシスタントを作成しました。

事例を読む

AT&T は没入型エクスペリエンスでお客様に喜びを与える

AT&T は、Bugs Bunny* と直接対話できるというイマーシブ エクスペリエンスで同社の 5G ネットワークの能力を紹介しています。

*LOONEY TUNES および関連するすべてのキャラクターと要素 © & ™ Warner Bros. Entertainment Inc. (s21)

ビデオを見る

Progressive は顧客に直接 Flo を届ける

Progressive は、カスタム ニューラル音声を使用して、自然なサウンドの仮想版 Flo を構築し、自動車保険の無料見積もりから一般的な保険に関する質問まで、顧客を支援しています。

事例を読む

クラウド AI サービスを使用してアプリのイノベーションを促進する

AI を使用して組織が価値を迅速に実現するための 5 つの主要な方法について説明します。

包括的なプライバシーとセキュリティ

  • Azure Cognitive Services の一部である Speech サービスは、SOC、FedRAMP、PCI DSS、HIPAA、HITECH、ISO により認定を受けています。
  • お客様のデータはお客様が管理します。テキスト データは、データ処理中またはオーディオ音声生成中に保存されることはありません。
  • お客様のカスタム音声データと合成された音声モデルは、いつでも表示および削除することができます。データはストレージに格納されている間、暗号化されます。
  • Azure インフラストラクチャを基盤とする Speech サービスは、エンタープライズ級のセキュリティ、可用性、コンプライアンス、管理性を提供します。

柔軟な価格設定により必要な能力とコントロールを提供

初期コストは不要で、料金は使用した分だけ発生します。Text to Speech の価格は、音声に変換する文字数に基づく従量課金制です。

責任ある合成音声を作成するためのガイドライン

責任あるデプロイについて学ぶ

合成音声は、他者の信頼を得るために設計する必要があります。会社とサービスに信頼をもたらす、合成された音声を構築するための原則を学びましょう。

ボイス タレントから同意を得る

ニューラルテキスト読み上げ (TTS) がどのように機能するかを声優が理解し、推奨されるユース ケースに関する情報を入手できるようにします。

透明性を保つ

透明性は、コンピューター音声ジェネレーターと合成音声を責任を持って使用するための基礎となります。ユーザーが合成音声を聞いていることを理解できるようにし、声優が自分の音声がどのように使用されるかを認識できるようにします。詳細については、開示設計のガイドラインを参照してください。

ドキュメントおよびリソース

コード サンプルを確認する

サンプル コードを確認する

カスタマイズのリソースを見る

Speech Studio を使用して音声ソリューションをカスタマイズできます。コードは不要です。

Text to Speech で構築

信頼できるコンテンツの配信方法を BBC が刷新

BBC は、Azure Cognitive Services と Azure Bot Service を使用して、そのブランド アイデンティティを表現し、幅広い視聴者との会話による関係性を確立する、エンドツーエンドのカスタマイズされたデジタル音声アシスタントを作成しました。

BBC

Swisscom は、多言語音声アシスタントでカスタマー エクスペリエンスを強化

Swisscom は Speech サービスを利用して、英語、フランス語、ドイツ語、イタリア語の Swisscom 独自のペルソナ音声を持つ、自然音のカスタム音声アシスタントを作成しました。

Swisscom

緊急対応要員による重要なデータへのアクセスを Motorola が支援

Motorola Solutions は、音声を使用した仮想アシスタントによって、警察官や他の緊急対応要員が重要な情報により迅速にアクセスできるよう支援しています。

モトローラソリューションズ

接続されたスマート ホームを Universal Electronics が強化

Universal Electronics は、スマート ホーム デバイス間で有効な音声対応のナビゲーションおよび制御機能を製造元が提供できるよう支援しています。

Universal Electronics

国際的な翻訳を Cheetah Mobile が拡大

Cheetah Mobile は、200 を超える国や地域にアプリ ユーザーがいるモバイル インターネット企業で、翻訳デバイスとアプリの提供先を国際市場に拡大するために Text to Speech を使用しています。

Cheetah Mobile

準備が整ったら、Azure の無料アカウントを設定しましょう。

どのようなご用件ですか?