Trace Id is missing
メイン コンテンツへスキップ
Azure

Azure AI 音声

事前構築済みまたはカスタマイズ可能な音声モデルを使用して、マルチモーダルで多言語の AI アプリをより迅速に構築できます。
概要

生成 AI アプリに複数のモダリティを追加する

  • 高速な文字起こしと自然な響きの音声を使用して、音声対応の多言語生成 AI アプリを構築します。
  • OpenAI Whisper モデルを含むドメインのアプリで音声をカスタマイズするか、ブランド化された音声をコパイロットに提供します。
  • 音声ストリームのリアルタイムでの多言語の音声間翻訳と音声テキスト変換文字起こしを有効にします。
  • データがある場所ならどこでも AI モデルを実行できます。コンテナーを使用してクラウド内またはエッジでアプリをデプロイします。
ユース ケース

音声モデルを使用してマルチモーダルな生成 AI アプリを開発する

音声テキスト変換を文字起こしする

コール センターまたは会議の会話を文字起こしします。100 を超える言語でオーディオ キャプションを使用してグローバル化します。

テキストを音声に変換する

自然に話すボットを構築します。カスタマイズされた現実的な音声と話し方を使用してブランドを差別化します。

音声分析

オーディオ録音またはビデオ通話録音を分析して、詳細な分析情報を得ることができます。主要なトピックを要約し、個人識別情報を抽出または編集します。

OpenAI Whisper を使用してオーディオを文字起こしする

Azure AI 音声または Azure OpenAI Service の最新の OpenAI Whisper モデルを使用してコール センターを変革します。

カスタム音声を構築する

カスタム ニューラル音声を使用して、自然に聞こえる音声を構築します。

独自のアバターを構築する

自然に聞こえる音声を使用した事前構築済みのアバターまたはカスタム アバターを使用して、ブランドに命を吹き込みます。

話者を確認して識別する

アプリに話者認証と識別を追加することで、相手の身元を確認したり、会議で誰が発言しているかを識別したりすることができます。

多言語通信を有効にする

オーディオまたはビデオ データを、サポートされている言語の増え続けるリストから、またはリストに翻訳します。業界に合わせて翻訳をカスタマイズします。

埋め込み音声

クラウド接続が断続的であるか利用できない場合に、埋め込み音声を使用して、デバイス上の音声テキスト変換とテキスト読み上げのシナリオを強化します。
セキュリティ

組み込みのセキュリティとコンプライアンス 

デニム ジャケットを着た人が、背景のラックにさまざまな服が掛かっている衣料品店でタブレットを使用しています。
価格

実際のニーズに応じた柔軟な価格設定

初期費用は不要で、料金は使用した分のみ発生します。Azure AI 音声の従量課金制価格は、以下に基づいて請求されます。
顧客事例

顧客が Azure AI 音声を利用して何を構築しているかを確認する

よくあるご質問

よくあるご質問

  •  Azure AI Speech には、音声テキスト変換、テキスト読み上げ、音声翻訳などのさまざまな機能が用意されています。これらは、C#、C++、Java などの複数のプログラミング言語の SDK を通じて提供されます。
  • はい。Azure AI 音声では、特にバッチ文字起こし用の OpenAI の Whisper モデルがサポートされています。
  •  Azure AI 音声では、増え続ける一連の言語がサポートされています。サポートされている言語の現在のリストについては、このリストを参照してください。
  • 顧客は、Azure AI サービスを使用して興味深いアプリケーションを構築しています。会話 AI、通話後の分析、ビデオ要約、その他のユース ケースのために、Azure AI Studio で音声分析を開始してください。
2 人の人がテーブルに座り、ノート PC を見ながら話し合っています。背景色はオレンジです
 アカウントのサインアップ

無料アカウントで開始する

200 米国ドルの Azure クレジットで開始
眼鏡をかけて緑色のセーターを着た人が、小さな植物と鉛筆入りのコップが置かれた机の上のノート PC を使用することに集中しています。
 アカウントのサインアップ

従量課金制の価格で開始する

前払いのコミットメントはなく、いつでもキャンセルできます。