会話音声を実用的なものにする
100 を超える言語とバリアントで、オーディオをすばやく正確に文字起こしします。モデルをカスタマイズして、専門分野固有の用語の精度を高めます。文字起こしされたテキストの検索や分析を有効にしたり、アクションを促進したりして、お好みのプログラミング言語で音声からより多くの価値を引き出すことができます。
高品質な文字起こし
最新の音声認識を使用して、音声からテキストへの正確な文字起こしを行います。
カスタマイズ可能なモデル
基本ボキャブラリに特定の単語を追加するか、独自の音声変換モデルを構築します。
柔軟性の高いデプロイ
クラウド、コンテナーを使用したエッジで、どこでも Speech to Text を実行できます。
実稼働準備完了
Microsoft 製品全体にわたり音声認識を強化するテクノロジと同一の堅牢なテクノロジにアクセスできます。
さまざまなソースの音声を正確に文字起こしする
マイク、 音声ファイル、 Blob Storage などのさまざまなソースから音声をテキストに変換します。話者ダイアライゼーションを使用して、誰が何をいつ話したかを判断します。自動書式と句読点を使用して、読みやすい音声テキストを取得します。
ニーズに合わせて音声モデルをカスタマイズする
音声モデルを調整して、組織や業界固有の用語を理解します。背景ノイズ、アクセント、独特のボキャブラリなどの音声認識の障壁を克服します。 音声データと音声テキストをアップロードしてモデルをカスタマイズ します。 Office 365 データを使用してカスタム モデルを自動的に生成 し、組織の音声認識精度を最適化します。
任意の場所にデプロイ
データがある場所ならどこでも Speech to Text を実行できます。 コンテナーを使用して、堅牢なクラウド機能とオンプレミス用に最適化された音声アプリケーションを構築します。
包括的なプライバシーとセキュリティ
-
Azure Cognitive Services の一部である Speech サービスは、SOC、FedRAMP、PCI、HIPAA、HITECH、ISO によって 認定 されています。
-
カスタム音声データとモデルは、いつでも表示や削除することができます。お客様のデータは、ストレージに格納されている間、暗号化されます。
-
データは引き続き保持されます。音声入力や文字起こしデータは、音声処理中に記録されることはありません。
-
Azure インフラストラクチャを基盤とする Speech サービスは、企業向け仕様のセキュリティ、可用性、コンプライアンス、管理性を提供します。
包括的なセキュリティとコンプライアンスの組み込み
-
Microsoft では、サイバーセキュリティの研究と開発に年間 USD10 億を超える投資を行っています。
-
Microsoft には、データ セキュリティとプライバシーを専門とする 3,500 人を超えるセキュリティ エキスパートがいます。
-
Azure は、他のあらゆるクラウド プロバイダーを上回る数の認定を受けています。包括的なリストをご確認ください。
Azure 無料アカウントで作業を開始する
1
2
クレジットがなくなった後に、同じ無料サービスでビルドを続けるには、従量課金制に移行してください。月々の無料使用分を超えた場合にのみ、お支払いいただきます。
3
ドキュメントおよびリソース
始める
ドキュメントを参照する
Microsoft Learn のコースで音声サービスを作成
コード サンプルを確認する
Microsoft の サンプル コードをご確認ください
カスタマイズのリソースを見る
Speech Studio を使用して音声テキスト変換ソリューションを探してカスタマイズします。コードは不要です。
Speech to Text に関してよく寄せられる質問
-
これは、音声をテキストに正確かつ迅速に文字起こしする、Speech サービス内の機能です。
-
Cognitive Services は、AI をアプリケーションに追加するために使用できる、カスタマイズ可能な事前構築済み AI モデルのコレクションです。Speech、Decision、Language、Vision など、さまざまなドメインがあります。Speech to Text は、Speech サービス内の 1 つの機能です。Speech 関連のその他の機能には、 Text to Speech、 Speech Translation、 Speaker Recognition があります。Decision サービスの 1 つの例は、 Personalizer です。これを使用すると、パーソナライズされた関連エクスペリエンスを提供できます。Language サービスの例には、 Language Understanding、自然言語処理用の Text Analytics 、FAQ エクスペリエンス用の QnA Maker 、言語翻訳用の Translator が含まれます。