Bing Speech API

オーディオをテキストに変換、インテントを理解、自然な応答としてテキストを音声に変換

音声認識

オーディオをテキストに変換します。この API は、マイクからのリアルタイムなオーディオ認識、別のリアルタイムなオーディオ ソースのオーディオ認識、またはファイル内のオーディオ認識のいずれかに切り替えることができます。いずれの場合も、リアルタイム ストリーミングも利用できるため、オーディオがサーバーに送信されると同時に部分認識の結果も返されます。

Speech to Text API を使えば、音声にトリガーされるスマート アプリを作成できます。機能を確認するには、ターゲット言語を選択してから、マイクをクリックして朗読を開始します。または、サンプル音声フレーズの 1 つをクリックして、音声認識の機能を確認することもできます。このデモを使用するときは、サービス向上を目的としたお客様の音声入力データの Microsoft への提供に同意いただくことになります

アクションからご覧ください

マイクを使用してご自分の音声でデモを試すには、WebRTC をサポートする別のブラウザー (最新バージョンの Microsoft Edge、Firefox、Chrome など) に変更してください。

このデモにデータをアップロードすることにより、Microsoft がお客様のデータを保存し、本 API などの Microsoft サービスの品質向上に役立てることに同意するものとします。お客様のプライバシーを保護するため、お客様のデータは匿名化され、セキュリティで保護されます。お客様のデータを第三者に開示または提供することはありません。

使ってみたいですか?

テキストから音声へ

テキストから音声への変換アプリケーションからユーザーに “応答“ し返す必要がある場合、この API を使用して、アプリで生成されたテキストをオーディオに変換し、それをユーザーに向けて再生できます。

Text-To-Speech API を使えば、話すスマート アプリを作成できます。ここでは、API をテストできます。ターゲット言語を選択して、文を追加してから、再生ボタンをクリックして音声合成の機能を確認してください。このデモを使用すると、サービス向上を目的としたお客様の音声入力データの Microsoft への提供に同意いただくことになります。

アクションからご覧ください

残り 500 文字

このデモにデータをアップロードすることにより、Microsoft がお客様のデータを保存し、本 API などの Microsoft サービスの品質向上に役立てることに同意するものとします。お客様のプライバシーを保護するため、お客様のデータは匿名化され、セキュリティで保護されます。お客様のデータを第三者に開示または提供することはありません。

使ってみたいですか?

Cognitive Services APIs を詳しく見る

Computer Vision API

画像から意思決定に役立つ情報を抽出

Face API

写真に含まれる顔の検出、識別、分析、グループ化、タグ付け

Content Moderator

画像、テキスト、ビデオを自動モデレート

Emotion API プレビュー

感情認識を使用してユーザー エクスペリエンスをパーソナライズ

Custom Vision Service プレビュー

貴社の最先端のコンピューター ビジョン モデルを、独自の用途向けに簡単にカスタマイズできます

Video Indexer プレビュー

動画の洞察を解放

Language Understanding Intelligent Service プレビュー

ユーザーが入力したコマンドをアプリケーションが理解できるようにします。

Text Analytics API

センチメントとトピックを簡単に評価して、ユーザーが求めるものを理解

Bing Spell Check API

アプリでのスペル ミスを検出して修正

Translator Text API

シンプルな REST API 呼び出しで機械翻訳を簡単に実行

Web Language Model API プレビュー

Web 規模のデータで学習した予測言語モデルを活用

Linguistic Analysis API プレビュー

Linguistic Analysis API で複雑な言語概念を単純化しテキストを解析しましょう

Translator Speech API

シンプルな REST API 呼び出しでリアルタイムの音声翻訳を簡単に実行

Speaker Recognition API プレビュー

音声を使用して個々の話者を識別および認証

Bing Speech API

音声をテキストへ、またそのテキストを再び音声に変換し、ユーザーの意図を理解

Custom Speech Service プレビュー

話し方、背景ノイズ、ボキャブラリといった音声認識の障壁を打開

Recommendations API プレビュー

顧客が欲しい品物を予測して推奨

Academic Knowledge API プレビュー

Microsoft Academic Graph の豊富な教育的コンテンツを利用

Knowledge Exploration Service プレビュー

自然言語入力による構造化データの対話型検索を実現

QnA Maker API プレビュー

情報から会話形式のナビゲーションしやすい回答を抽出

Entity Linking Intelligence Service API プレビュー

名前付きエンティティ認識とあいまいさ排除でアプリのデータ リンクをパワーアップしましょう

Custom Decision Service プレビュー

クラウドべースの文脈に応じた意思決定 API。学習により精度が高まります

プロジェクト プラハ

ジェスチャー ベースの制御

プロジェクト クスコ

Wikipedia エントリーに関連付けられたイベント

Project Nanjing

等時線計算

アプリをパワーアップさせる準備はできていますか?