Azure

Foundry Tools の Azure 音声

カスタマイズ可能な事前構築済みの多言語音声 AI モデルで、アプリとエージェントに活力をもたらしましょう。

Azure の使用を開始 Microsoft Foundry を使用して作成する

概要

Azure 音声の最新機能をご覧ください

高速な文字起こしと自然な響きの音声を使用して、音声対応の多言語生成 AI アプリを構築します。

Azure 音声の詳細を見る
AI エージェントに、カスタマイズされた文字起こし、音声、アバターなどを含むエンドツーエンドの音声機能を持たせましょう。

Voice Live API の詳細を見る
音声ストリームのリアルタイムでの多言語の音声間翻訳と音声テキスト変換文字起こしを有効にします。

詳細情報
データがある場所ならどこでも AI モデルを実行できます。コンテナーを使用してクラウド内またはエッジでアプリをデプロイします。

コンテナーを使用して開発する

ユースケース

音声モデルを使用してマルチモーダルな生成 AI アプリを開発する

音声対応エージェントを構築する

カスタマイズされたオーディオ入力およびオーディオ出力モデルと共に基礎モデルを使用して、エージェントに音声機能を提供します。

音声テキスト変換を文字起こしする

コールセンターまたは会議の会話を文字起こしします。100 を超える言語でオーディオキャプションを使用してグローバル化します。

テキストを音声に変換する

自然に話すボットを構築します。カスタマイズされた現実的な音声と話し方を使用してブランドを差別化します。

通話後分析を使用する

Foundry Tools の Azure コンテンツ解釈では、基礎モデルを使って音声またはビデオ通話のレコーディングを分析し、詳細な分析情報を得ることができます。

OpenAI Whisper による音声の文字起こし

Foundry Models の Azure 音声または Azure OpenAI で、最新の OpenAI Whisper モデルを利用してコールセンターを変革しましょう。

カスタム音声を構築する

カスタムニューラル音声を使用して、自然に聞こえる音声を構築します。

独自のアバターを構築する

自然な音声で話すことができる事前構築済みアバターまたはカスタムアバターで、ブランドにあたたかみを加えましょう。

多言語通信を有効にする

オーディオまたはビデオデータを、サポートされている言語の増え続けるリストから、またはリストに翻訳します。業界に合わせて翻訳をカスタマイズします。

埋め込み音声

クラウド接続が断続的であるか利用できない場合に、埋め込み音声を使用して、デバイス上の音声テキスト変換とテキスト読み上げのシナリオを強化します。

セキュリティ

埋め込みのセキュリティとコンプライアンス

34,000

Microsoft のセキュリティイニシアティブに専念するフルタイム相当のエンジニアの人数。

15,000

専門的なセキュリティ知識を持つパートナーの数。

>100

50 以上の世界中の地域や国に特化したものを含むコンプライアンス認定数。

Azure のセキュリティについての詳細情報

デニムジャケットを着た人が、背景のラックにさまざまな服が掛かっている衣料品店でタブレットを使用しています。

価格

実際のニーズに応じた柔軟な価格設定

初期費用は不要で、料金は使用した分のみ発生します。Azure 音声の従量課金制料金は、以下の要素に基づいて請求されます。

Azure 音声の価格

Azure OpenAI

複数のモダリティを組み込み、テキスト、画像、ビデオ、オーディオなどの複数の種類のデータを組み合わせたモデルを使用してアプリを強化します。

Microsoft Foundry

生成 AI アプリケーションとカスタムエージェントの開発に必要なものすべてが、1 つのプラットフォーム上に揃っています。

Foundry コントロールプレーンでのコンテンツの安全性

責任ある AI 原則を実践する組み込みのツールを使用して、安全で信頼できるソリューションを提供します。

Azure コンテンツ解釈

マルチモーダルデータの分析情報への変換を加速します。

Azure Translator

ドキュメントとテキストをリアルタイムまたはバッチで 100 を超える言語で翻訳し、グローバルな展開を実現します。

Azure Language

AI を活用する事前構築済み機能で、会話型インターフェイスの構築、ドキュメントの要約、テキストの分析を実行できます。

リソース

Azure 音声の使用を開始する

屋外のカフェで、眼鏡をかけてベージュ色のシャツを着た人が、ノート PC を見ながら、笑顔でジェスチャーをしています

Azure AI 音声のドキュメントを見る

チュートリアルや API リファレンスなどのリソースを見つけます。

キーボード、ヘッドホン、カップと一緒に置かれたワークステーションのコンピューターモニターに表示されたコードについて話し合っている 2 人の人。

音声対応アプリを構築する

エンタープライズレベルの音声対応アプリを設計して構築します。

インフォグラフィックをダウンロードする

眼鏡をかけてオレンジ色のセーター着た男性が、オフィスでノート PC を使用しながら片手に持った用紙を見ています。

GitHub リソース

サンプルコードと SDK をご確認ください。

GitHub でサンプルを参照する

1 人の人が、オフィス内のデュアルモニターが置かれた環境で椅子に座り、キーボードにコードを入力しています

今すぐ構築を開始

Foundry でモデルをすばやく構築します。

Foundry の Azure 音声の詳細をご確認ください。

4 人の人がテーブルに座り、熱心に話し合いながらノート PC で作業しています。彼らは共同で作業しているようです。

Azure 音声のラーニングパス

Azure を使って自然言語処理ソリューションを開発しましょう。

タブレットを見ている男性と女性。

エージェント AI を作成する

AI エージェントをシームレスにアプリに統合し、高度なモデルの微調整手法について学習します。

青いジャケットを着た女性がコンピュータの画面を見ています。

最適な AI モデルを見つける

マルチモーダルモデル、モデル選択、ベンチマークを有効にし、マルチモーダルアプリケーションを作成します。

コンピューターの画面を見ている人。

セキュリティで保護された責任ある AI

AI のセキュリティ、評価、有害なコンテンツの管理の基礎を理解します。

FAQ

Azure 音声は Foundry Tools (旧称 Azure AI Services) の一部であり、音声テキスト変換、テキスト読み上げ、翻訳、話者認識の API を提供します。以前の名称は Azure AI 音声でした。
はい。Microsoft では、多数の旧 Azure AI サービスのブランドを Foundry Tools に変更しています。この変更は、Foundry への広範なプラットフォーム統合を反映したものであり、また、これらのサービスをエージェント型 AI アプリケーション構築の中核ツールとして位置付けることを示しています。

Foundry Tools の Azure 音声に以前から備わっている、音声認識、テキスト読み上げ、翻訳などの強力な機能は今後も同様に提供されますが、今後は、インテリジェントなエージェントを構築する開発者のための統合ツールキットの一部として位置づけられます。

このリブランディングは、これらの API が Foundry エコシステムの中で担う役割を明確化し、発見、調整や、他のモダン AI ワークフローとの統合を容易にするものです。
Azure 音声には、音声テキスト変換、テキスト読み上げ、音声翻訳などのさまざまな機能が備わっています。それらは、C#、C++、Java など数種類のプログラミング言語の SDK を通じて提供されます。

詳細情報
Azure 音声では多数の言語がサポートされ、サポート対象の言語数はさらに増え続けています。サポートされている言語については、こちらのリストをご覧ください。
さまざまなお客様が、Foundry Tools を使用して興味深いアプリケーションを構築しています。会話 AI、通話後分析、ビデオ要約などのユースケースに対応する Azure 音声分析の活用を始めましょう。

女性がテーブルに向かって座り、ノート PC を使っています。

次のステップ

適切な Azure アカウントを選択する 

プリペイドで始めることも、最大 30 日間無料で Azure を試すこともできます。

Azure の利用を開始する

ショートカーリーヘアで笑顔の女性と、その隣に座っている男性

AI 開発ツール

AI アプリケーションの設計と管理

AI アプリとエージェントを効率的に作成、カスタマイズ、スケーリングします。

Foundry を確認する

ノート PC を使用している白いシャツを着た男性。

ビジネスソリューションハブ

革新的なクラウドソリューションで成果を上げる

ビジネスソリューションハブを参照して、目標を達成するための製品とソリューションを見つけましょう。

Microsoft ソリューションを確認する

Azure mobile app を入手する