Azure AI 音声

事前構築済みまたはカスタマイズ可能な音声モデルを使用して、マルチモーダルで多言語の AI アプリをより迅速に構築できます。

Azure の使用を開始する

概要

生成 AI アプリに複数のモダリティを追加する

高速な文字起こしと自然な響きの音声を使用して、音声対応の多言語生成 AI アプリを構築します。

Azure AI 音声を詳しく見る
OpenAI Whisper モデルを含むドメインのアプリで音声をカスタマイズするか、ブランド化された音声をコパイロットに提供します。

音声モデルを微調整する
音声ストリームのリアルタイムでの多言語の音声間翻訳と音声テキスト変換文字起こしを有効にします。

詳細情報
データがある場所ならどこでも AI モデルを実行できます。コンテナーを使用してクラウド内またはエッジでアプリをデプロイします。

コンテナーを使用して開発する

ユースケース

音声モデルを使用してマルチモーダルな生成 AI アプリを開発する

音声テキスト変換を文字起こしする

コールセンターまたは会議の会話を文字起こしします。100 を超える言語でオーディオキャプションを使用してグローバル化します。

テキストを音声に変換する

自然に話すボットを構築します。カスタマイズされた現実的な音声と話し方を使用してブランドを差別化します。

音声分析

オーディオ録音またはビデオ通話録音を分析して、詳細な分析情報を得ることができます。主要なトピックを要約し、個人識別情報を抽出または編集します。

OpenAI Whisper を使用してオーディオを文字起こしする

Azure AI 音声または Azure OpenAI Service の最新の OpenAI Whisper モデルを使用してコールセンターを変革します。

カスタム音声を構築する

カスタムニューラル音声を使用して、自然に聞こえる音声を構築します。

独自のアバターを構築する

自然に聞こえる音声を使用した事前構築済みのアバターまたはカスタムアバターを使用して、ブランドに命を吹き込みます。

話者を確認して識別する

アプリに話者認証と識別を追加することで、相手の身元を確認したり、会議で誰が発言しているかを識別したりすることができます。

多言語通信を有効にする

オーディオまたはビデオデータを、サポートされている言語の増え続けるリストから、またはリストに翻訳します。業界に合わせて翻訳をカスタマイズします。

埋め込み音声

クラウド接続が断続的であるか利用できない場合に、埋め込み音声を使用して、デバイス上の音声テキスト変換とテキスト読み上げのシナリオを強化します。

セキュリティ

組み込みのセキュリティとコンプライアンス

Microsoft は、5 年間で 200 億米国ドルのサイバーセキュリティに投資することを約束しています。

77 か国で 8,500 を超えるセキュリティおよび脅威インテリジェンスの専門家を採用しています。

Azure には、業界最大のコンプライアンス認定ポートフォリオの 1 つがあります。

Azure のセキュリティについての詳細情報

デニムジャケットを着た人が、背景のラックにさまざまな服が掛かっている衣料品店でタブレットを使用しています。

価格

実際のニーズに応じた柔軟な価格設定

初期費用は不要で、料金は使用した分のみ発生します。Azure AI 音声の従量課金制価格は、以下に基づいて請求されます。

Azure AI 音声の価格

顧客事例

顧客が Azure AI 音声を利用して何を構築しているかを確認する

すべての Azure AI 事例を表示する

2 人の女性 (1 人はヒジャブを着用しています) がコンピューターの画面を注意深く観察しており、ぼやけた背景で 1 人の男性が電話で話しています。

“Azure に関する私たちの最大のユースケースは、AI、Cognitive Services、音声領域にあります。この機能は、私たちのプラットフォームのほぼすべての部分をカバーします。”

Jeff Gallino:Cofounder and Chief Technology Officer、CallMiner

ライトアップされた高層ビルと、上空の空のさまざまな地点を結ぶ光線のネットワークが映し出された、夕暮れ時の都市のスカイライン。

“私たちは、ここブラジルでパイオニアでした。私たちは、他の誰もまだ行っていないときに、ニューラル合成音声の使用に投資する勇気ある選択を行いました。私たちは毎年、何百万もの顧客と話し合っているため、私たちの音声を変えることは勇気のいる行為です。” 

Olimpio Fernandes:Director of Cognitive Experience Center、TIM

NaturalReader のロゴとタグライン "AI を活用したテキスト読み上げ" (左側に波のグラフィックあり)

“高品質の音声を大規模に提供することは非常に困難ですが、Microsoft のおかげで、TTS を使い始めて、お客様に音声を届けることができきました。”

Moad Ben-Suleiman:Software Engineer、NaturalReader

リソース

Azure AI 音声を開始する

屋外のカフェで、眼鏡をかけてベージュ色のシャツを着た人が、ノート PC を見ながら、笑顔でジェスチャーをしています

Azure AI 音声のドキュメント

チュートリアルや API リファレンスなどをご確認ください。

詳細情報

キーボード、ヘッドホン、カップと一緒に置かれたワークステーションのコンピューターモニターに表示されたコードについて話し合っている 2 人の人。

音声対応アプリを構築する

エンタープライズレベルの音声対応アプリを設計して構築します。

 ダウンロード

眼鏡をかけてオレンジ色のセーター着た男性が、オフィスでノート PC を使用しながら片手に持った用紙を見ています。

GitHub リソース

サンプルコードと SDK をご確認ください。

 参照

1 人の人が、オフィス内のデュアルモニターが置かれた環境で椅子に座り、キーボードにコードを入力しています

今すぐ構築を開始

Azure AI Speech Studio を使用してモデルをすばやく構築します。

Speech Studio を確認する

4 人の人がテーブルに座り、熱心に話し合いながらノート PC で作業しています。彼らは共同で作業しているようです。

Azure AI 音声のラーニングパス

Azure AI サービスを使用して自然言語処理ソリューションを開発します。

詳細情報

よくあるご質問

 Azure AI Speech には、音声テキスト変換、テキスト読み上げ、音声翻訳などのさまざまな機能が用意されています。これらは、C#、C++、Java などの複数のプログラミング言語の SDK を通じて提供されます。

詳細情報
はい。Azure AI 音声では、特にバッチ文字起こし用の OpenAI の Whisper モデルがサポートされています。

詳細情報
 Azure AI 音声では、増え続ける一連の言語がサポートされています。サポートされている言語の現在のリストについては、このリストを参照してください。
顧客は、Azure AI サービスを使用して興味深いアプリケーションを構築しています。会話 AI、通話後の分析、ビデオ要約、その他のユースケースのために、Azure AI Studio で音声分析を開始してください。

2 人の人がテーブルに座り、ノート PC を見ながら話し合っています。背景色はオレンジです

 アカウントのサインアップ

無料アカウントで開始する

200 米国ドルの Azure クレジットで開始

Azure を無料で試す

眼鏡をかけて緑色のセーターを着た人が、小さな植物と鉛筆入りのコップが置かれた机の上のノート PC を使用することに集中しています。

 アカウントのサインアップ

従量課金制の価格で開始する

前払いのコミットメントはなく、いつでもキャンセルできます。

従量課金制アカウントを作成する

Azure AI 音声

生成 AI アプリに複数のモダリティを追加する

クラス最高のモデルを使用して開発する

独自の AI モデルをカスタマイズする

オーディオまたはテキストを翻訳する

任意の場所にデプロイ

音声モデルを使用してマルチモーダルな生成 AI アプリを開発する

音声テキスト変換を文字起こしする

テキストを音声に変換する

音声分析

OpenAI Whisper を使用してオーディオを文字起こしする

カスタム音声を構築する

独自のアバターを構築する

話者を確認して識別する

多言語通信を有効にする

埋め込み音声

組み込みのセキュリティとコンプライアンス

実際のニーズに応じた柔軟な価格設定

Azure 製品の連携強化

Azure OpenAI Service

Azure AI Studio

Azure AI Content Safety

顧客が Azure AI 音声を利用して何を構築しているかを確認する

Azure AI 音声を開始する

Azure AI 音声のドキュメント

音声対応アプリを構築する

GitHub リソース

今すぐ構築を開始

Azure AI 音声のラーニングパス

よくあるご質問

Azure AI 音声ではどのような機能がサポートされていますか?

Azure AI 音声で OpenAI の Whisper モデルを使用できますか?

Azure AI 音声の音声翻訳では、どのような言語がサポートされていますか?

音声テキスト変換と Azure OpenAI の GPT モデルを使用してユースケースを構築したいと考えています。お手伝いいただけますか?

無料アカウントで開始する

従量課金制の価格で開始する

Azure AI 音声

生成 AI アプリに複数のモダリティを追加する

クラス最高のモデルを使用して開発する

独自の AI モデルをカスタマイズする

オーディオまたはテキストを翻訳する

任意の場所にデプロイ

音声モデルを使用してマルチモーダルな生成 AI アプリを開発する

音声テキスト変換を文字起こしする

テキストを音声に変換する

音声分析

OpenAI Whisper を使用してオーディオを文字起こしする

カスタム音声を構築する

独自のアバターを構築する

話者を確認して識別する

多言語通信を有効にする

埋め込み音声

組み込みのセキュリティとコンプライアンス

実際のニーズに応じた柔軟な価格設定

Azure 製品の連携強化

Azure OpenAI Service

Azure AI Studio

Azure AI Content Safety

顧客が Azure AI 音声を利用して何を構築しているかを確認する

Azure AI 音声を開始する

Azure AI 音声のドキュメント

音声対応アプリを構築する

GitHub リソース

今すぐ構築を開始

Azure AI 音声のラーニング パス

よくあるご質問

Azure AI 音声ではどのような機能がサポートされていますか?

Azure AI 音声で OpenAI の Whisper モデルを使用できますか?

Azure AI 音声の音声翻訳では、どのような言語がサポートされていますか?

音声テキスト変換と Azure OpenAI の GPT モデルを使用してユース ケースを構築したいと考えています。お手伝いいただけますか?

無料アカウントで開始する

従量課金制の価格で開始する

Azure AI 音声のラーニングパス

音声テキスト変換と Azure OpenAI の GPT モデルを使用してユースケースを構築したいと考えています。お手伝いいただけますか?