Trace Id is missing
メイン コンテンツにスキップ

音声テキスト変換

音声をテキストに正確に文字起こしする AI 音声 機能。

会話音声を実用的なものにする

100 を超える言語とバリアントで、オーディオをすばやく正確に文字起こしします。モデルをカスタマイズして、専門分野固有の用語の精度を高めます。文字起こしされたテキストの検索や分析を有効にしたり、アクションを促進したりして、お好みのプログラミング言語で音声からより多くの価値を引き出すことができます。

Build で Azure AI の最新情報を入手する

高品質な文字起こし

最新の音声認識を使用して、音声からテキストへの正確な文字起こしを行います。

カスタマイズ可能なモデル

基本ボキャブラリに特定の単語を追加するか、独自の音声変換モデルを構築します。

柔軟性の高いデプロイ

クラウド、コンテナーを使用したエッジで、どこでも Speech to Text を実行できます。

実稼働準備完了

Microsoft 製品全体にわたり音声認識を強化するテクノロジと同一の堅牢なテクノロジにアクセスできます。

さまざまなソースの音声を正確に文字起こしする

 マイク、 音声ファイル、 Blob Storage などのさまざまなソースから音声をテキストに変換します。話者ダイアライゼーションを使用して、誰が何をいつ話したかを判断します。自動書式と句読点を使用して、読みやすい音声テキストを取得します。

ニーズに合わせて音声モデルをカスタマイズする

音声モデルを調整して、組織や業界固有の用語を理解します。背景ノイズ、アクセント、独特のボキャブラリなどの音声認識の障壁を克服します。 音声データと音声テキストをアップロードしてモデルをカスタマイズ します。 Office 365 データを使用してカスタム モデルを自動的に生成 し、組織の音声認識精度を最適化します。

任意の場所にデプロイ

データがある場所ならどこでも Speech to Text を実行できます。 コンテナーを使用して、堅牢なクラウド機能とオンプレミス用に最適化された音声アプリケーションを構築します。

クラウド AI サービスを使用してアプリケーションのイノベーションを実現する

組織が AI を使用して価値を迅速に実現するための 5 つの主要な方法について説明します。

「クラウド AI サービスを使用してアプリケーションのイノベーションを実現する」というタイトルのレポートを読む

包括的なプライバシーとセキュリティ

  • Azure AI サービスの一部である AI 音声サービスは、SOC、FedRamp、PCI、DSS、HIPAA、HITECH、ISO によって 認定 されています。

  • カスタム音声データとモデルは、いつでも表示や削除することができます。お客様のデータは、ストレージに格納されている間、暗号化されます。

  • データは引き続き保持されます。音声入力や文字起こしデータは、音声処理中に記録されることはありません。

  • Azure インフラストラクチャを基盤とする  AI 音声サービスは、企業向け仕様のセキュリティ、可用性、コンプライアンス、管理性を提供します。

包括的なセキュリティとコンプライアンスの組み込み

Azure 無料アカウントで作業を開始する

1

無料で始めましょう USD200  相当のクレジットを取得して 30 日間使用できます。クレジットを保持している間は、最も人気のあるサービスの多くを無料で利用できるほか、55 以上のその他のサービスを常時無料で利用できます。

2

クレジットがなくなった後に、同じ無料サービスでビルドを続けるには、従量課金制に移行してください。月々の無料使用分を超えた場合にのみ、お支払いいただきます。

3

12 か月が経過した後も、55 以上の常時無料サービスを引き続き利用できます。料金は、月々の無料利用分を超えて使用した分だけをお支払いいただきます。

ドキュメントとリソース

開始する

 ドキュメントを参照する

 Microsoft Learn のコースで  AI 音声サービスを作成する

コード サンプルを確認する

Microsoft の サンプル コードをご確認ください

カスタマイズのリソースを見る

 Speech Studio を使用して音声テキスト変換ソリューションを探してカスタマイズします。コードは不要です。

Speech to Text に関してよく寄せられる質問

  • これは、音声をテキストに正確かつ迅速に文字起こしする、音声サービス内の機能です。

  • AI サービス  は、AI をアプリケーションに追加するために使用できる、カスタマイズ可能な事前構築済み AI モデルのコレクションです。音声、Decision、Language、Vision など、さまざまなドメインがあります。Speech to Text は、AI 音声サービス内の 1 つの機能です。Speech 関連のその他の機能には、 Text to Speech、 Speech Translation、 Speaker Recognition があります。Decision サービスの 1 つの例は、 Personalizer です。これを使用すると、パーソナライズされた関連エクスペリエンスを提供できます。AI Language の例には、 Language Understanding、自然言語処理用の  Text Analytics 、FAQ エクスペリエンス用の  QnA Maker 、言語翻訳用の  Translator  が含まれます。

AI サービスを使用して構築を始める

音声テキスト変換を無料で試す