ナビゲーションをスキップする

Bing Speech

オーディオをテキストに変換、インテントを理解、自然な応答としてテキストを音声に変換

音声認識

オーディオをテキストに変換します。この API は、マイクからのリアルタイムなオーディオ認識、別のリアルタイムなオーディオ ソースのオーディオ認識、またはファイル内のオーディオ認識のいずれかに切り替えることができます。いずれの場合も、リアルタイム ストリーミングも利用できるため、オーディオがサーバーに送信されると同時に部分認識の結果も返されます。

Speech to Text API を使えば、音声にトリガーされるスマート アプリを作成できます。機能を確認するには、ターゲット言語を選択してから、マイクをクリックして朗読を開始します。または、サンプル音声フレーズの 1 つをクリックして、音声認識の機能を確認することもできます。このデモを使用するときは、サービス向上を目的としたお客様の音声入力データの Microsoft への提供に同意いただくことになります

アクションからご覧ください

マイクを使用してご自分の音声でデモを試すには、WebRTC をサポートする別のブラウザー (最新バージョンの Microsoft Edge、Firefox、Chrome など) に変更してください。

使ってみたいですか?

Text to Speech

テキストから音声への変換アプリケーションからユーザーに “応答“ し返す必要がある場合、この API を使用して、アプリで生成されたテキストをオーディオに変換し、それをユーザーに向けて再生できます。

Text-To-Speech API を使えば、話すスマート アプリを作成できます。ここでは、API をテストできます。ターゲット言語を選択して、文を追加してから、再生ボタンをクリックして音声合成の機能を確認してください。このデモを使用すると、サービス向上を目的としたお客様の音声入力データの Microsoft への提供に同意いただくことになります。

アクションからご覧ください

残り 500 文字

使ってみたいですか?

Cognitive Services APIs を詳しく見る

Computer Vision

画像から意思決定に役立つ情報を抽出

Face

写真に含まれる顔の検出、識別、分析、グループ化、タグ付け

Video Indexer

動画の洞察を解放

Content Moderator

画像、テキスト、ビデオを自動モデレート

Custom Vision プレビュー

貴社の最先端のコンピューター ビジョン モデルを、独自の用途向けに簡単にカスタマイズできます

Text Analytics

センチメントとトピックを簡単に評価して、ユーザーが求めるものを理解

Translator Text

シンプルな REST API 呼び出しで機械翻訳を簡単に実行

Bing Spell Check

アプリでのスペル ミスを検出して修正

Content Moderator

画像、テキスト、ビデオを自動モデレート

Language Understanding

ユーザーが入力したコマンドをアプリが理解できるようにします。

Speaker Recognition プレビュー

音声を使用して個々の話者を識別および検証

Speech Services

音声テキスト変換、テキスト読み上げ、音声翻訳のための統合Speech Services

QnA Maker

情報から会話形式のナビゲーションしやすい回答を抽出

アプリをパワーアップさせる準備はできていますか?