Speech to Text

読み上げられたオーディオをテキストに正確に変換する音声サービス機能

音声をテキストに変換する

85 を超える言語とバリエーションで、音声をすばやく正確にテキストに書き起こします。モデルをカスタマイズして、専門分野固有の用語の精度を高めます。文字起こしされたテキストの検索や分析を有効にしたり、アクションを促進したりして、お好みのプログラミング言語で音声からより多くの価値を引き出すことができます。

高品質な文字起こし

最新の音声テキスト変換ソフトウェアを使用して、正確な音声テキスト変換で文字起こしを行うことができます。

カスタマイズ可能なモデル

基本ボキャブラリに特定の単語を追加するか、お客様独自の音声モデルを構築できます。

柔軟性の高いデプロイ

クラウド、コンテナーを使用したエッジで、どこでも Speech to Text を実行できます。

運用環境に対応

Microsoft 製品全体にわたり音声認識を強化するテクノロジと同一の堅牢なテクノロジにアクセスできます。

この JavaScript SDK に基づいて作成されたデモ アプリで Speech to Text をお試しください

マイクを使用してご自分の音声でデモを試すには、WebRTC をサポートする別のブラウザー (最新バージョンの Microsoft Edge、Firefox、Chrome など) に変更してください。

お客様の音声データは保存されません

さまざまなソースからの正確な音声テキスト変換

マイク音声ファイルBLOB ストレージなどのさまざまなソースから音声をテキストに変換できます。話者ダイアライゼーションを使用して、誰が何をいつ話したかを判断します。自動書式と句読点を使用して、読みやすい音声テキストを取得します。

ニーズに合わせて音声モデルをカスタマイズする

組織固有および業界固有の用語を理解するよう、お客様の音声モデルカスタマイズできます。背景の雑音、訛り、独特のボキャブラリなど、音声認識の障壁を克服できます。音声データやトランスクリプトをアップロードして、お客様の音声認識モデルをカスタマイズすることができます。Office 365 データを使用してカスタム モデルを自動的に生成し、お客様の組織の音声認識精度を最適化することができます。

クラウドからエッジまで、どこにでも配置

データがある場所ならどこでも Speech to Text を実行できます。コンテナーと言語検出 (プレビュー) を使用して、堅牢なクラウド機能とエッジのローカル性の両方に最適化された音声テキスト変換アプリを構築できます。音声コンテナーでは、標準およびカスタムの音声テキスト変換の両方がサポートされます。

包括的なプライバシーとセキュリティ

  • Azure Cognitive Services の一部である Speech サービスは、SOC、FedRAMP、PCI DSS、HIPAA、HITECH、ISO により認定を受けています。
  • お客様のデータはお客様が管理します。お客様の音声入力や文字起こしデータは、音声テキスト変換処理中に記録されることはありません。
  • カスタム音声データとモデルは、いつでも表示や削除することができます。データはストレージに格納されている間、暗号化されます。
  • Azure インフラストラクチャを基盤とする Speech サービスは、エンタープライズ級のセキュリティ、可用性、コンプライアンス、管理性を提供します。

柔軟な価格設定により必要な能力とコントロールを提供

初期コストは不要で、料金は使用した分だけ発生します。Speech to Text の価格は、書き起こされた音声の時間数に基づく従量課金制です。

ドキュメントおよびリソース

始める

ドキュメントを読む

Microsoft Learn コースを受講する

コード サンプルを確認する

サンプル コードを確認する

カスタマイズのリソースを見る

Speech Studio を使って、お手持ちの音声テキスト変換ソフトウェアをカスタマイズできます。コードは不要です。

Speech to Text を使用して作成

KPMG は通話の文字起こしを合理化

KPMG は Speech to Text を使用して、数千時間の通話を文字起こししてカタログを作成することにより、クライアントのコンプライアンスに関するコストを 80% も削減しています。

KPMG

Motorola は音声を使用して緊急対応要員のアクセスを支援

Motorola Solutions は、音声を使用した仮想アシスタントによって、警察官や他の緊急対応要員が重要な情報により迅速にアクセスできるよう支援しています。

Motorola Solutions

Universal Electronics は音声対応のスマート ホーム エクスペリエンスを提供

Universal Electronics は、家庭にある日常的なデバイス全体で動作する音声対応のナビゲーションおよび制御機能を提供し、真にユニークな顧客エクスペリエンスを提供できるよう、企業を支援しています。

Universal Electronics

Hochtief は音声を使用して建設の欠陥を文書化

Hochtief は、音声対応の仮想アシスタントを使用して、プロジェクト マネージャーがプロジェクト現場で建設の欠陥を特定し、文書化するのを支援しています。

Cheetah Mobile

NTT データは会議の分析情報で意思決定を加速

NTT データは、リアルタイムでの会議の文字起こしにより、音声データから分析情報を取得しています。また Custom Speech を使用して、組織固有の用語を理解できるよう音声認識モデルをカスタマイズすることができます。

NTTDATA

Insight は会話型の銀行業務エクスペリエンスを強化

Insight Enterprises は会話型 AI を搭載した銀行業務ソリューションで、銀行の各支店でのデジタルのスピードと利便性の向上を支援しています。Speech to Text は、顧客が話した内容をデータに変換して処理、分析します。それにより顧客は、タイムリーで適切な回答を得ることができます。

Insight Enterprise, Inc.

Speech の使用を開始する