Speech to Text

読み上げられたオーディオをテキストに正確に変換する音声サービス機能

会話音声を実用的なものにする

Quickly and accurately transcribe audio to text in more than 85 languages and variants. Customize models to enhance accuracy for domain-specific terminology. Get more value from spoken audio by enabling search or analytics on transcribed text or facilitating action—all in your preferred programming language.

高品質な文字起こし

最先端の音声認識を使用して、正確な文字起こしを取得します。

カスタマイズ可能なモデル

基本ボキャブラリに特定の単語を追加するか、独自のモデルを構築します。

柔軟性の高いデプロイ

クラウド、コンテナーを使用したエッジで、どこでも Speech to Text を実行できます。

実稼働可能

Microsoft 製品全体にわたり音声認識を強化するテクノロジと同一の堅牢なテクノロジにアクセスできます。

この JavaScript SDK に基づいて作成されたデモ アプリで Speech to Text をお試しください

マイクを使用してご自分の音声でデモを試すには、WebRTC をサポートする別のブラウザー (最新バージョンの Microsoft Edge、Firefox、Chrome など) に変更してください。

お客様の音声データは保存されません

さまざまなソースからの音声を正確に書き起こす

マイク音声ファイルBLOB ストレージなどのさまざまなソースから音声をテキストに変換します。話者ダイアライゼーションを使用して、誰が何をいつ話したかを判断します。自動書式と句読点を使用して、読みやすい音声テキストを取得します。

ニーズに合わせて音声モデルをカスタマイズする

音声モデルを調整して、組織や業界固有の用語を理解します。背景ノイズ、アクセント、独特のボキャブラリなどの音声認識の障壁を克服します。音声データと音声テキストをアップロードしてモデルをカスタマイズします。Office 365 データを使用してカスタム モデルを自動的に生成し、組織の音声認識精度を最適化します。

クラウドからエッジまで、どこにでも配置

Run Speech to Text wherever your data resides. Build speech applications that are optimized for both robust cloud capabilities and edge locality using containers and language detection (preview). Speech containers support both standard and custom speech.

包括的なプライバシーとセキュリティ

  • Azure Cognitive Services の一部である Speech サービスは、SOC、FedRAMP、PCI DSS、HIPAA、HITECH、ISO により認定を受けています。
  • お客様のデータはお客様が管理します。音声入力や文字起こしデータは、音声処理中に記録されることはありません。
  • カスタム音声データとモデルは、いつでも表示や削除することができます。データはストレージに格納されている間、暗号化されます。
  • Azure インフラストラクチャを基盤とする Speech サービスは、エンタープライズ級のセキュリティ、可用性、コンプライアンス、管理性を提供します。

柔軟な価格設定により必要な能力とコントロールを提供

初期コストは不要で、料金は使用した分だけ発生します。Speech to Text の価格は、書き起こされた音声の時間数に基づく従量課金制です。

ドキュメントおよびリソース

開始する

ドキュメントを読む

Microsoft Learn コースを受講する

コード サンプルを確認する

サンプル コードを確認する

カスタマイズのリソースを見る

Speech Studio を使用して音声ソリューションをカスタマイズします。コードは不要です。

Speech to Text を使用して作成

KPMG は通話の文字起こしを合理化

KPMG は Speech to Text を使用して、数千時間の通話を文字起こししてカタログを作成することにより、クライアントのコンプライアンスに関するコストを 80% も削減しています。

KPMG

Motorola は音声を使用して緊急対応要員のアクセスを支援

Motorola Solutions は、音声を使用した仮想アシスタントによって、警察官や他の緊急対応要員が重要な情報により迅速にアクセスできるよう支援しています。

Motorola Solutions

Universal Electronics は音声対応のスマート ホーム エクスペリエンスを提供

Universal Electronics は、家庭にある日常的なデバイス全体で動作する音声対応のナビゲーションおよび制御機能を提供し、真にユニークな顧客エクスペリエンスを提供できるよう、企業を支援しています。

Universal Electronics

Hochtief は音声を使用して建設の欠陥を文書化

Hochtief は、音声対応の仮想アシスタントを使用して、プロジェクト マネージャーがプロジェクト現場で建設の欠陥を特定し、文書化するのを支援しています。

Cheetah Mobile

NTT データは会議の分析情報で意思決定を加速

NTT データは、リアルタイムでの会議の文字起こしにより、音声データから分析情報を取得しています。また Custom Speech を使用して、組織固有の用語を理解できるよう音声認識モデルをカスタマイズすることができます。

NTTDATA

Insight は会話型の銀行業務エクスペリエンスを強化

Insight Enterprises は会話型 AI を搭載した銀行業務ソリューションで、銀行の各支店でのデジタルのスピードと利便性の向上を支援しています。Speech to Text は、顧客が話した内容をデータに変換して処理、分析します。それにより顧客は、タイムリーで適切な回答を得ることができます。

Insight Enterprise, Inc.

Speech の使用を開始する