Speech to Text

読み上げられたオーディオをテキストに正確に変換する音声サービス機能

会話音声を実用的なものにする

30 を超える言語で音声をテキストにすばやく正確に文字起こしします。モデルをカスタマイズして、専門分野固有の用語の精度を高めます。文字起こしされたテキストの検索や分析を有効にしたり、アクションを促進したりして、お好みのプログラミング言語で音声からより多くの価値を引き出すことができます。

高品質な文字起こし

最先端の音声認識を使用して、正確な文字起こしを取得します。

カスタマイズ可能なモデル

基本ボキャブラリに特定の単語を追加するか、独自のモデルを構築します。

柔軟性の高いデプロイ

クラウド、コンテナーを使用したエッジで、どこでも Speech to Text を実行できます。

実稼働可能

Microsoft 製品全体にわたり音声認識を強化するテクノロジと同一の堅牢なテクノロジにアクセスできます。

例文

ベースライン

Custom Speech

構築に関する詳細情報

さまざまなソースからの音声を正確に書き起こす

マイク音声ファイルBLOB ストレージなどのさまざまなソースから音声をテキストに変換します。話者ダイアライゼーションを使用して、誰が何をいつ話したかを判断します。自動書式と句読点を使用して、読みやすい音声テキストを取得します。

ニーズに合わせて音声モデルをカスタマイズする

音声モデルを調整して、組織や業界固有の用語を理解します。背景ノイズ、アクセント、独特のボキャブラリなどの音声認識の障壁を克服します。音声データと音声テキストをアップロードしてモデルをカスタマイズします。Office 365 データを使用してカスタム モデルを自動的に生成し、組織の音声認識精度を最適化します。

クラウドからエッジまで、どこにでも配置

データがある場所ならどこでも Speech to Text を実行できます。コンテナーを使用して、堅牢なクラウド機能とエッジのローカル性という両方に最適化された音声アプリケーションを構築します (プレビュー)。音声コンテナーでは、標準音声とカスタム音声の両方がサポートされます。

包括的なプライバシーとセキュリティ

  • Azure Cognitive Services の一部である Speech サービスは、SOC、FedRAMP、PCI DSS、HIPAA、HITECH、ISO により認定を受けています。
  • お客様のデータはお客様が管理します。音声入力や文字起こしデータは、音声処理中に記録されることはありません。
  • カスタム音声データとモデルは、いつでも表示や削除することができます。データはストレージに格納されている間、暗号化されます。
  • Azure インフラストラクチャを基盤とする Speech サービスは、エンタープライズ級のセキュリティ、可用性、コンプライアンス、管理性を提供します。

柔軟な価格設定により必要な能力とコントロールを提供

初期コストは不要で、料金は使用した分だけ発生します。Speech to Text の価格は、書き起こされた音声の時間数に基づく従量課金制です。

ドキュメントおよびリソース

コード サンプルを確認する

カスタマイズのリソースを見る

Speech Studio を使用して音声ソリューションをカスタマイズします。コードは不要です。

KPMG

KPMG は Speech to Text のカスタマイズ機能を使用し通話の文字起こしと翻訳を効率化し、90% 以上の文字起こしの精度を実現します。

Get started with Speech