Azure AI 音声
事前構築済みまたはカスタマイズ可能な音声モデルを使用して、マルチモーダルで多言語の AI アプリをより迅速に構築できます。
概要
生成 AI アプリに複数のモダリティを追加する
- 高速な文字起こしと自然な響きの音声を使用して、音声対応の多言語生成 AI アプリを構築します。
- OpenAI Whisper モデルを含むドメインのアプリで音声をカスタマイズするか、ブランド化された音声をコパイロットに提供します。
- 音声ストリームのリアルタイムでの多言語の音声間翻訳と音声テキスト変換文字起こしを有効にします。
- データがある場所ならどこでも AI モデルを実行できます。コンテナーを使用してクラウド内またはエッジでアプリをデプロイします。
ユース ケース
音声モデルを使用してマルチモーダルな生成 AI アプリを開発する
音声テキスト変換を文字起こしする
コール センターまたは会議の会話を文字起こしします。100 を超える言語でオーディオ キャプションを使用してグローバル化します。
テキストを音声に変換する
自然に話すボットを構築します。カスタマイズされた現実的な音声と話し方を使用してブランドを差別化します。
音声分析
オーディオ録音またはビデオ通話録音を分析して、詳細な分析情報を得ることができます。主要なトピックを要約し、個人識別情報を抽出または編集します。
OpenAI Whisper を使用してオーディオを文字起こしする
Azure AI 音声または Azure OpenAI Service の最新の OpenAI Whisper モデルを使用してコール センターを変革します。
カスタム音声を構築する
カスタム ニューラル音声を使用して、自然に聞こえる音声を構築します。
独自のアバターを構築する
自然に聞こえる音声を使用した事前構築済みのアバターまたはカスタム アバターを使用して、ブランドに命を吹き込みます。
話者を確認して識別する
アプリに話者認証と識別を追加することで、相手の身元を確認したり、会議で誰が発言しているかを識別したりすることができます。
多言語通信を有効にする
オーディオまたはビデオ データを、サポートされている言語の増え続けるリストから、またはリストに翻訳します。業界に合わせて翻訳をカスタマイズします。
埋め込み音声
クラウド接続が断続的であるか利用できない場合に、埋め込み音声を使用して、デバイス上の音声テキスト変換とテキスト読み上げのシナリオを強化します。
セキュリティ
組み込みのセキュリティとコンプライアンス
Microsoft は、5 年間で 200 億米国ドルのサイバーセキュリティに投資することを約束しています。
77 か国で 8,500 を超えるセキュリティおよび脅威インテリジェンスの専門家 を採用しています。
Azure には、業界最大の コンプライアンス認定ポートフォリオ の 1 つがあります。
関連製品
Azure 製品の連携強化
Azure AI 音声とその他の Azure AI 製品を使用して、包括的なソリューションを構築します。
顧客事例
顧客が Azure AI 音声を利用して何を構築しているかを確認する
リソース
Azure AI 音声を開始する
よくあるご質問
よくあるご質問
- Azure AI Speech には、音声テキスト変換、テキスト読み上げ、音声翻訳などのさまざまな機能が用意されています。これらは、C#、C++、Java などの複数のプログラミング言語の SDK を通じて提供されます。
- はい。Azure AI 音声では、特にバッチ文字起こし用の OpenAI の Whisper モデルがサポートされています。
- Azure AI 音声では、増え続ける一連の言語がサポートされています。サポートされている言語の現在のリストについては、このリストを参照してください。
- 顧客は、Azure AI サービスを使用して興味深いアプリケーションを構築しています。会話 AI、通話後の分析、ビデオ要約、その他のユース ケースのために、Azure AI Studio で音声分析を開始してください。
アカウントのサインアップ
無料アカウントで開始する
200 米国ドルの Azure クレジットで開始
アカウントのサインアップ
従量課金制の価格で開始する
前払いのコミットメントはなく、いつでもキャンセルできます。