ナビゲーションをスキップする

Speech Services

統合Speech Servicesで音声をテキストに変換し、音声翻訳と音声合成を実行

高品質な音声対応アプリをすばやく開発する

Speech SDK を使用して、音声対応アプリを自信を持ってスピーディに構築できます。高精度の音声テキスト変換、自然なテキスト読み上げ、音声言語翻訳、会話中の話者認識を実現できます。コード不要のエクスペリエンスで試し、Speech Studio を使用して、作成したいアプリに合わせたカスタム モデルを作成できます。

業界最高水準の品質

最先端の音声テキスト変換、リアルなテキスト読み上げ、賞を取った話者認識を利用します。

コンプライアンスへの準拠と安全性

データがそのまま残り、処理中の音声入力は記録されません。

カスタマイズ可能な音声とモデル

カスタム音声を作成したり、特定の単語を基本ボキャブラリに追加したり、独自のモデルを構築することができます。

柔軟性の高いデプロイ

クラウド内の任意の場所、またはコンテナー内のエッジで音声を実行します。

音声テキスト変換

100 を超える言語とバリアントで、オーディオをすばやく正確に文字起こしします。コール センターの文字起こしを使用して顧客の分析情報を取得します。音声対応アシスタント、会議での重要なディスカッションのキャプチャなどの機能を使用して、エクスペリエンスを向上させます。

アプリが発話できるようにする

Text to Speech を使用して、会話するアプリやサービスを作成しましょう。自然な響きの音声コンテンツを作成したり、テキスト読み上げ機能を使用してアクセシビリティを向上させたり、カスタム音声アシスタントを作成したりできます。

音声をリアルタイムに翻訳

30 を超える言語から音声を翻訳し、すべて優先プログラミング言語で組織特定の用語の翻訳をカスタマイズします。

話者の確認と認識

アプリに話者認証と本人確認を追加することで、ユーザーの ID を確認したり、会議で発言しているユーザーを認識したりすることができます。

カスタム キーワードを使用してアシスタントまたは IoT デバイスをアクティブにする

IoT デバイスや音声対応アシスタント用のカスタム キーワードを作成してブランドを差別化することで、より個人的で個人向けの、安全なものにすることができます。

ハンズフリー シナリオ用の音声コマンドを追加する

タッチレスの音声優先エクスペリエンスを構築して安全性を高め、職場回帰のシナリオをサポートします。

包括的なセキュリティとコンプライアンスの組み込み

  • Microsoft ではサイバーセキュリティの研究と開発に年間 USD 10 億を超える投資を行っています。

  • Microsoft には、データ セキュリティとプライバシーを専門とする 3,500 人を超えるセキュリティ エキスパートがいます。

  • Azure は、他のクラウド プロバイダーを上回る数の認定を受けています。包括的なリストをご確認ください。

柔軟な価格設定により必要な能力とコントロールを提供

使った分だけ支払い、初期費用は必要ありません。Speech では、以下に基づいて使用した分だけ支払うことができます。

  • 音声テキスト変換での文字起こしや音声翻訳を行う時間数。
  • テキスト読み上げ用に音声に変換する文字数
  • Speaker Recognition のトランザクション数

音声のドキュメントとリソース

音声サービスの使用を始める

ドキュメントを参照する

Microsoft Learn Speech コースを受講する

広く使われている開発者リソースを確認する

サンプル コードと SDK をチェックアウト

Speech studio Stack Overflow を使用して音声モデルをすばやく構築

あらゆる規模の企業から寄せられる信頼

AT&T は没入型エクスペリエンスで顧客を満足させる

AT&T では、お客様が Bugs Bunny と直接話しかけるイマーシブなエクスペリエンスを備えた 5G ネットワークを紹介しています。*

*LOONEY TUNES and all related characters and elements © & ™ Warner Bros. Entertainment Inc. (s21)

ATT

Progressive が Flo を顧客に直接提供

Progressive は、Custom Neural Voice を使用して、自然な音声の仮想版 Flo を構築し、自動車保険の無料見積もりから一般的な保険に関する質問まで、お客様をサポートします。

Progressive

KPMG は通話の文字起こしを合理化

KPMG は音声テキスト変換を使用して何千もの通話を書き起こし、カタログ化することで、顧客のコンプライアンス コストを 80% も削減しています。

KPMG

Motorola は、最初のレスポンダーが重要なデータにアクセスするのに役立ちます

Motorola Solutions は、音声優先の仮想アシスタントを使用して、現場の第一応答者が重要な情報にアクセスするサポートを行います。

モトローラソリューションズ

Hochtief では音声を使用して構築上の欠陥を文書化します

音声対応の仮想アシスタントは、建設プロジェクト マネージャーが建設現場の欠陥を特定して文書化する上で役立ちます。

HOCHTIEF

Zencity は AI ソリューションで生活の質を向上させる

データ分析のスタートアップである Zencity では、音声翻訳を使用して、ソーシャル メディアやメンテナンス要求など、さまざまなソースからのデータを分析し、政府がデータに基づく意思決定を行い、住民によりよいサービスを提供できるようサポートを行っています。

Zencity

音声の更新、ブログ、お知らせ

準備が整ったら、Azure の無料アカウントを設定しましょう。

どのようなご用件ですか?