ナビゲーションをスキップする

Text to Speech

より自然でアクセシビリティの高いインターフェイスを実現

自然な音声をアプリに取り入れる

ユーザーに自然に話し掛けるアプリやサービスを作りましょう。Cognitive Services Speech Servicesの一部である Text to Speech API が、ほぼリアルタイムでテキストを音声に変換し、顧客のアクセシビリティとユーザビリティを高めます。この API は、アプリによって生成されたテキストを音声に変換します。その音声は、後で使用するためにファイルとして保存したり、再生したりすることができます。

このサービスは、複数言語での発話に対応しています。男性の声にするか女性の声にするかを含め、45 を超える言語 (ロケール) の 75 を超える音声からお選びいただけます。速度、音程、音量、発音、休止の追加など、各種パラメーターを調整することもできます。

アクションからご覧ください

音声合成の動作を確認するには、再生ボタンを押してください。*

言語 サンプル テキスト サンプル音声
English (US) An airport spokesman said more than 110 planes were damaged by hail.
Chinese (CN) 广告收入的比例高达90%以上
Japanese (JP) 皆様のご協力のたまものと
German (DE) Der Anstieg der Verbraucherpreise in der Eurozone verlangsamt sich weiter.
Spanish (ES) El alcalde de Santiago convoca a los medios para inaugurar dos semáforos.
Turkish (ES) Tren durduğu sırada vagonun ortasında bir patlama meydana geldi.

使ってみたいですか?

カスタム音声モデルを使ったテキスト読み上げ

音声エージェントに、貴社のブランドを明確に打ち出した独自の音声を反映することができます。テキスト読み上げ音声カスタマイズ機能を使えば、専門知識がなくても簡単に、独自の音声対応アプリを作成できます。

アクションからご覧ください

言語

品質

サンプル テキスト サンプル音声

独自の音声モデルの構築を開始しますか?

使いやすくなった音声モデル

音声エージェントをカスタマイズするには、トレーニング データを録音してアップロードするだけです。そうすれば、録音内容に合わせてチューニングされた独自の音声フォントが自動的に作成されます。まずは少量のデータで概念実証を行いましょう。データが増加するにつれ、システムはシームレスにスケーリングし、自然音声の品質が強化されます。

一貫性と統合

カスタム音声モデルは、他の Cognitive Services 音声認識サービスと完全に統合されます。カスタマイズした音声モデルは、コーディングなしで簡単に API にデプロイすることができます。

迅速で安全

固有の API エンドポイントと安全な認証管理を通じてすぐに、音声フォントを全プラットフォームに組み込むことができます。モデルはお客様が管理することになります。

音声認識シナリオの考察

インテリジェント キオスク

音声認識サービスと Language Understanding を組み合わせると、アプリとユーザーの自然な対話が可能になります。ユーザーの質問は、音声テキスト変換を使ってキャプチャします。次に、Language Understanding を使って意図を解析して、適切な応答を組み立てます。その後、テキスト読み上げを使って、テキストから音声による応答を合成します。 銀行、旅行、エンターテイメントなど、さまざまなシナリオ向けに、会話型のインターフェイスを作成することができます。

商用チャットボット

Commerce chatbotTogether, the Azure Bot Service and Language Understanding service enable developers to create conversational interfaces for various scenarios like banking, travel, and entertainment. For example, a hotel’s concierge can use a bot to enhance traditional e-mail and phone call interactions by validating a customer via Azure Active Directory and using Cognitive Services to better contextually process customer requests using text and voice. The Speech recognition service can be added to support voice commands.1237456
  1. 概要
  2. フロー

Azure Bot Service と Language Understanding サービスを組み合わせることで、開発者は銀行、旅行、エンターテイメントなどのさまざまなシナリオに合わせた会話型のインターフェイスを作成できます。たとえば、ホテルのコンシェルジュは、ボットを使用して Azure Active Directory で顧客を認証し、Cognitive Services でテキストや音声を使用して顧客の要求を文脈から処理することで、従来の電子メールや電話でのやりとりを強化できます。音声認識サービスを追加すると、音声コマンドに対応できるようになります。

  1. 1 ユーザーがお客様のモバイル アプリを使用します
  2. 2 Azure AD B2C を使用して、ユーザーが認証します
  3. 3 カスタム Application Bot を使用して、ユーザーが情報を要求します
  4. 4 Cognitive Services が自然言語の要求を処理します
  5. 5 自然な会話を使用して質問を改善できるユーザーが応答をレビューします
  6. 6 ユーザーが結果に満足すれば、Application Bot がユーザーの予約を更新します
  7. 7 Application Insights が、ランタイム テレメトリを収集して、ボットのパフォーマンスと使用方法により開発をサポートします
"Microsoft Cognitive Services gives us a huge range of opportunities. It's a perfect match for us now and in the future, when we want to add more features to our app."

CEO、Jaan Apajalahti 氏

Cognitive Services APIs を詳しく見る

Computer Vision

画像から意思決定に役立つ情報を抽出

Face

写真に含まれる顔の検出、識別、分析、グループ化、タグ付け

Video Indexer

動画の洞察を解放

Content Moderator

画像、テキスト、ビデオを自動モデレート

Custom Vision プレビュー

貴社の最先端のコンピューター ビジョン モデルを、独自の用途向けに簡単にカスタマイズできます

Text Analytics

センチメントとトピックを簡単に評価して、ユーザーが求めるものを理解

Translator Text

シンプルな REST API 呼び出しで機械翻訳を簡単に実行

Bing Spell Check

アプリでのスペル ミスを検出して修正

Content Moderator

画像、テキスト、ビデオを自動モデレート

Language Understanding

ユーザーが入力したコマンドをアプリが理解できるようにします。

Speech Services

音声テキスト変換、テキスト読み上げ、音声翻訳のための統合Speech Services

Speaker Recognition プレビュー

音声を使用して個々の話者を識別および検証

QnA Maker

情報から会話形式のナビゲーションしやすい回答を抽出

アンビエント デバイスを構築したり、カスタム ウェイク ワードを作成したりするには、Speech Devices SDK を使用します。

詳細情報