ナビゲーションをスキップする

Speaker Recognition

Speaker Recognition なら、話をしている個人の識別や、声を認証の手段として使うことが可能

話者認証

認証にご自分の音声を使います。この API を使用して、インテリジェントな認証ツールを含むアプリケーションを開発することができます。話者が特定の ID を主張した場合、音声を使用してこの主張を検証します。

動作を確認するには、以下のフレーズの一覧からパス フレーズを選択します。そのフレーズを使い、3 つのオーディオ サンプルを記録して、ご自分の音声をサービスに登録してください。このステップを「登録」と言います。登録が完了すると、異なる音声の記録やフレーズを使って認証ステップを開始し、サービスをテストすることができます。

アクションからご覧ください

"i am going to make him an offer he cannot refuse"

音声を登録するために、上のフレーズを 3 回読んでください。

1
2
3

使ってみたいですか?

話者識別

話者を識別します。この API を使用して、不明な話者の ID を特定することができます。不明な話者の入力音声を選択された話者のグループと照合し、一致があった場合に話者の ID を返します。

5 人の異なる米国大統領を選び、彼らの音声の 1 つを使ってサービスに登録してあります。デモをご覧になるには、下のサンプル オーディオをクリックして大統領の 1 人の音声を選択するか、ご自分の音声をアップロードして、話している大統領がどのように自動識別されるかテストしてください。

アクションからご覧ください

Barack Obama 大統領
George W Bush 大統領
William J Clinton 大統領
George H W Bush 大統領
Ronald Reagan 大統領
Jimmy Carter 大統領

使ってみたいですか?

Cognitive Services APIs を詳しく見る

Computer Vision

画像から意思決定に役立つ情報を抽出

Face

写真に含まれる顔の検出、識別、分析、グループ化、タグ付け

Video Indexer プレビュー

動画の洞察を解放

Content Moderator

画像、テキスト、ビデオを自動モデレート

Custom Vision プレビュー

貴社の最先端のコンピューター ビジョン モデルを、独自の用途向けに簡単にカスタマイズできます

Text Analytics

センチメントとトピックを簡単に評価して、ユーザーが求めるものを理解

Translator Text

シンプルな REST API 呼び出しで機械翻訳を簡単に実行

Bing Spell Check

アプリでのスペル ミスを検出して修正

Content Moderator

画像、テキスト、ビデオを自動モデレート

Language Understanding

ユーザーが入力したコマンドをアプリケーションが理解できるようにします。

Bing Speech

音声をテキストへ、またそのテキストを再び音声に変換し、ユーザーの意図を理解

Speaker Recognition プレビュー

音声を使用して個々の話者を識別および検証

Translator Speech

シンプルな REST API 呼び出しでリアルタイムの音声翻訳を簡単に実行

Custom Speech プレビュー

話し方、背景ノイズ、ボキャブラリといった音声認識の障壁を打開

Speech Services プレビュー

音声テキスト変換、テキスト読み上げ、音声翻訳のための統合Speech Services

QnA Maker

情報から会話形式のナビゲーションしやすい回答を抽出

アプリをパワーアップさせる準備はできていますか?