Bing Speech API

音声をテキストへ、またそのテキストを再び音声に変換し、発言の意図を理解

音声認識

ファイルからの音声、マイクを介した生の音声、あるいはその他の音源からの音声であるかにかかわらず、音声をテキストにリアルタイムで変換します。リアルタイム ストリーミングのオプションも利用できるため、音声がサーバーに送信されると同時に部分認識の結果も返されます。

音声意図認識

音声を意図に変換して処理を行います。Language Understanding Intelligent Service モデルを使用すると、音声意図認識により、アプリケーションで音声のテキストへの変換が実行されるだけでなく、話し手の意図を容易に解析して、アプリ内で “アラームの設定” などの処理を行います。

テキストから音声への変換

テキストから音声への変換アプリケーションからユーザーに “応答“ し返す必要がある場合、この API では、アプリで生成されたテキストが音声に変換され、それがユーザーに向けて再生されます。

その他の Cognitive Services API をチェックする

言語

アプリケーションが自然言語を処理し、センチメントとトピックを評価して、ユーザーの欲しいものを認識する方法を学習できるようにします。

Language Understanding Intelligent Service プレビュー

ユーザーが入力したコマンドをアプリケーションが理解できるようにします。

Text Analytics API プレビュー

センチメントとトピックを簡単に評価して、ユーザーが求めるものを理解

Web Language Model API プレビュー

Web 規模のデータで学習した予測言語モデルを活用

Bing Spell Check API

アプリでのスペル ミスを検出して修正

Translator Text API

シンプルな REST API 呼び出しで自動テキスト翻訳を簡単に実行

視覚

顔、画像、感情認識などのスマートな洞察を返すことにより、コンテンツを自動でモデレートし、アプリケーションをさらにパーソナライズする最先端の画像処理アルゴリズム。

Face API プレビュー

写真に含まれる顔の検出、分析、グループ化、タグ付け

Emotion API プレビュー

感情認識を使用してユーザー エクスペリエンスをパーソナライズ

Computer Vision API プレビュー

画像から意思決定に役立つ情報を抽出

Content Moderator プレビュー

画像、テキスト、ビデオを自動モデレート

音声

アプリケーション内で音声言語を処理

Bing Speech API

音声をテキストへ、またそのテキストを再び音声に変換し、ユーザーの意図を理解

Speaker Recognition API プレビュー

音声を使用して個々の話者を識別および認証

Translator Speech API

シンプルな REST API 呼び出しでリアルタイムの音声翻訳を簡単に実行

Custom Speech Service プレビュー

話し方、背景ノイズ、ボキャブラリといった音声認識の障壁を打開

検索

Bing Search API との連携を深めて、アプリや Web ページ、その他の機能をもっと使いやすくしましょう。

Bing Search API

アプリ用の Web、Image、Video、News Search API

Bing Autosuggest API

アプリにインテリジェントな自動提案機能を追加

知識

合理的なレコメンデーションやセマンティック検索などのタスクを行うことができるように、複雑な情報とデータをマッピングします。

Recommendations API プレビュー

顧客が欲しい品物を予測して推奨

Academic Knowledge API プレビュー

Microsoft Academic Graph の豊富な教育的コンテンツを利用

Bing Speech API には独立したライセンスが付与され、以下の使用条件が適用されます。

無料の Azure アカウントで Cognitive Services をお試しください