メイン コンテンツにスキップ

音声テキスト変換

音声をテキストに正確に文字起こしする Speech サービス機能。

会話音声を実用的なものにする

100 を超える言語とバリアントで、オーディオをすばやく正確に文字起こしします。モデルをカスタマイズして、専門分野固有の用語の精度を高めます。文字起こしされたテキストの検索や分析を有効にしたり、アクションを促進したりして、お好みのプログラミング言語で音声からより多くの価値を引き出すことができます。

高品質な文字起こし

最新の音声認識を使用して、音声からテキストへの正確な文字起こしを行います。

カスタマイズ可能なモデル

基本ボキャブラリに特定の単語を追加するか、独自の音声変換モデルを構築します。

柔軟性の高いデプロイ

クラウド、コンテナーを使用したエッジで、どこでも Speech to Text を実行できます。

実稼働準備完了

Microsoft 製品全体にわたり音声認識を強化するテクノロジと同一の堅牢なテクノロジにアクセスできます。

さまざまなソースの音声を正確に文字起こしする

 マイク、 音声ファイル、 Blob Storage などのさまざまなソースから音声をテキストに変換します。話者ダイアライゼーションを使用して、誰が何をいつ話したかを判断します。自動書式と句読点を使用して、読みやすい音声テキストを取得します。

ニーズに合わせて音声モデルをカスタマイズする

音声モデルを調整して、組織や業界固有の用語を理解します。背景ノイズ、アクセント、独特のボキャブラリなどの音声認識の障壁を克服します。 音声データと音声テキストをアップロードしてモデルをカスタマイズ します。 Office 365 データを使用してカスタム モデルを自動的に生成 し、組織の音声認識精度を最適化します。

任意の場所にデプロイ

データがある場所ならどこでも Speech to Text を実行できます。 コンテナーを使用して、堅牢なクラウド機能とオンプレミス用に最適化された音声アプリケーションを構築します。

クラウド AI サービスを使用してアプリケーションのイノベーションを実現する

組織が AI を使用して価値を迅速に実現するための 5 つの主要な方法について説明します。

「クラウド AI サービスを使用してアプリケーションのイノベーションを実現する」というタイトルのレポートを読む

包括的なプライバシーとセキュリティ

  • Azure Cognitive Services の一部である Speech サービスは、SOC、FedRAMP、PCI、HIPAA、HITECH、ISO によって 認定 されています。

  • カスタム音声データとモデルは、いつでも表示や削除することができます。お客様のデータは、ストレージに格納されている間、暗号化されます。

  • データは引き続き保持されます。音声入力や文字起こしデータは、音声処理中に記録されることはありません。

  • Azure インフラストラクチャを基盤とする Speech サービスは、企業向け仕様のセキュリティ、可用性、コンプライアンス、管理性を提供します。

包括的なセキュリティとコンプライアンスの組み込み

  • Microsoft では、サイバーセキュリティの研究と開発に年間 USD10 億を超える投資を行っています。

  • Microsoft には、データ セキュリティとプライバシーを専門とする 3,500 人を超えるセキュリティ エキスパートがいます。

  • Azure は、他のあらゆるクラウド プロバイダーを上回る数の認定を受けています。包括的なリストをご確認ください。

  • 柔軟な価格設定で必要な制御を実現

    Speech to Text は、文字起こしする音声の時間数に基づく従量課金制で、初期費用はかかりません。

Azure 無料アカウントで作業を開始する

1

無料で始めましょう USD200  相当のクレジットを取得して 30 日間使用できます。クレジットを保持している間は、最も人気のあるサービスの多くを無料で利用できるほか、55 以上のその他のサービスが常に無料です。

2

クレジットがなくなった後に、同じ無料サービスでビルドを続けるには、従量課金制に移行してください。月々の無料使用分を超えた場合にのみ、お支払いいただきます。

3

12 か月が経過した後も、55 以上の常時無料サービスを引き続き利用できます。そして、料金は月々の無料利用分の超過分だけをお支払いいただきます。

Speech to Text を信頼する企業

Motorola は音声を使用して緊急対応要員のアクセスを支援

Motorola Solutions は、音声を使用した仮想アシスタントによって、警察官や他の緊急対応要員が重要な情報により迅速にアクセスできるよう支援しています。

胸に付けたトランシーバーに話している人
タブに戻る

ドキュメントおよびリソース

始める

 ドキュメントを参照する

 Microsoft Learn のコースで音声サービスを作成

コード サンプルを確認する

Microsoft の サンプル コードをご確認ください

カスタマイズのリソースを見る

 Speech Studio を使用して音声テキスト変換ソリューションを探してカスタマイズします。コードは不要です。

Speech to Text に関してよく寄せられる質問

  • これは、音声をテキストに正確かつ迅速に文字起こしする、Speech サービス内の機能です。

  • Cognitive Services  は、AI をアプリケーションに追加するために使用できる、カスタマイズ可能な事前構築済み AI モデルのコレクションです。Speech、Decision、Language、Vision など、さまざまなドメインがあります。Speech to Text は、Speech サービス内の 1 つの機能です。Speech 関連のその他の機能には、 Text to Speech、 Speech Translation、 Speaker Recognition があります。Decision サービスの 1 つの例は、 Personalizer です。これを使用すると、パーソナライズされた関連エクスペリエンスを提供できます。Language サービスの例には、 Language Understanding、自然言語処理用の  Text Analytics 、FAQ エクスペリエンス用の  QnA Maker 、言語翻訳用の  Translator  が含まれます。

Cognitive Services でビルドを開始する

音声テキスト変換を無料で試す

セールス担当者とチャット