Computer Vision API

画像から豊富な情報を抽出して、視覚データを分類および処理します。また、機械による画像のモデレートで、お客様のサービスを集約してお伝えします。

画像の分析

この機能では、画像内にあるビジュアル コンテンツに関する情報が返されます。タグ付け、説明、ドメイン固有モデルを使用してコンテンツを特定し、確実にラベル付けします。成人向け/わいせつな描写に対する設定を適用すれば、アダルト コンテンツの自動制限を有効にできます。画像の種類や写真内の配色を特定します。

アクションからご覧ください

特徴名:
説明 { "tags": [ "train", "platform", "station", "building", "indoor", "subway", "track", "walking", "waiting", "pulling", "board", "people", "man", "luggage", "standing", "holding", "large", "woman", "yellow", "suitcase" ], "captions": [ { "text": "people waiting at a train station", "confidence": 0.8331026 } ] }
タグ [ { "name": "train", "confidence": 0.9975446 }, { "name": "platform", "confidence": 0.995543063 }, { "name": "station", "confidence": 0.9798007 }, { "name": "indoor", "confidence": 0.927719653 }, { "name": "subway", "confidence": 0.838939846 }, { "name": "pulling", "confidence": 0.431715637 } ]
画像形式 "Jpeg"
画像サイズ 462 x 600
クリップ アートの種類 0
線画の種類 0
モノクロ false
成人向けコンテンツ false
成人スコア 0.0147124995
わいせつ性 false
わいせつスコア 0.0162802152
カテゴリ [ { "name": "trans_trainstation", "score": 0.98828125 } ]
[]
背景のドミナント カラー
"Black"
前景のドミナント カラー
"Black"
アクセント カラー
#484C83

使ってみたいですか?

画像内のテキストの読み取り

光学式文字認識 (OCR) により画像内のテキストを検出し、認識した語句をマシンに抽出して、判読可能な文字ストリームに変換します。画像を分析して埋め込みテキストを検出し、文字ストリームを生成し、検索を有効にします。テキストをコピーする代わりに写真を撮ることで、時間と労力を節約します。

アクションからご覧ください

  1. プレビュー
  2. JSON

IF WE DID

ALL

THE THINGS

WE ARE

CAPABLÉ•

OF DOING,

WE WOULD

LITERALLY

ASTOUND

QURSELV*S.

{
  "textAngle": 0.0,
  "orientation": "NotDetected",
  "language": "en",
  "regions": [
    {
      "boundingBox": "316,47,284,340",
      "lines": [
        {
          "boundingBox": "319,47,182,24",
          "words": [
            {
              "boundingBox": "319,47,42,24",
              "text": "IF"
            },
            {
              "boundingBox": "375,47,44,24",
              "text": "WE"
            },
            {
              "boundingBox": "435,47,66,23",
              "text": "DID"
            }
          ]
        },
        {
          "boundingBox": "316,74,204,69",
          "words": [
            {
              "boundingBox": "316,74,204,69",
              "text": "ALL"
            }
          ]
        },
        {
          "boundingBox": "318,147,207,24",
          "words": [
            {
              "boundingBox": "318,147,63,24",
              "text": "THE"
            },
            {
              "boundingBox": "397,147,128,24",
              "text": "THINGS"
            }
          ]
        },
        {
          "boundingBox": "316,176,125,23",
          "words": [
            {
              "boundingBox": "316,176,44,23",
              "text": "WE"
            },
            {
              "boundingBox": "375,176,66,23",
              "text": "ARE"
            }
          ]
        },
        {
          "boundingBox": "319,194,281,44",
          "words": [
            {
              "boundingBox": "319,194,281,44",
              "text": "CAPABLÉ•"
            }
          ]
        },
        {
          "boundingBox": "318,243,181,29",
          "words": [
            {
              "boundingBox": "318,243,43,23",
              "text": "OF"
            },
            {
              "boundingBox": "376,243,123,29",
              "text": "DOING,"
            }
          ]
        },
        {
          "boundingBox": "316,271,170,24",
          "words": [
            {
              "boundingBox": "316,272,44,23",
              "text": "WE"
            },
            {
              "boundingBox": "375,271,111,24",
              "text": "WOULD"
            }
          ]
        },
        {
          "boundingBox": "317,300,200,24",
          "words": [
            {
              "boundingBox": "317,300,200,24",
              "text": "LITERALLY"
            }
          ]
        },
        {
          "boundingBox": "316,328,157,24",
          "words": [
            {
              "boundingBox": "316,328,157,24",
              "text": "ASTOUND"
            }
          ]
        },
        {
          "boundingBox": "318,357,214,30",
          "words": [
            {
              "boundingBox": "318,357,214,30",
              "text": "QURSELV*S."
            }
          ]
        }
      ]
    }
  ]
}

このデモにデータをアップロードすることにより、Microsoft がお客様のデータを保存し、本 API などの Microsoft サービスの品質向上に役立てることに同意するものとします。お客様のプライバシーを保護するため、お客様のデータは匿名化され、セキュリティで保護されます。お客様のデータを第三者に開示または提供することはありません。

使ってみたいですか?

プレビュー: 画像からの手書き文字の読み取り

このテクノロジ (手書き文字認識) では、メモ、手紙、レポート、ホワイトボード、用紙などから手書きの文字を検出し抽出することができます。白色の紙や黄色い付箋紙、ホワイトボードなど、さまざまな表面や下地に対応可能です。

手書き文字認識を使用すれば、テキストを書き写すのではなく撮影するだけでよくなるため、時間と手間が抑えられ、生産性を向上させることができます。メモをデジタル化することで、素早く簡単に検索できるようになります。また、書類が散乱する事態も防ぐことができます。

注: 本テクノロジは現在プレビュー段階であり、アルファベットにのみ対応しています。

下にあるデモ版の光学文字認識を試すには、ローカルに保存している画像をアップロードするか、画像の URL を入力してください。お客様からの許可がない限り、このデモで提供された画像は保存されません。

アクションからご覧ください

  1. プレビュー
  2. JSON

OUR greatest glory is not

i never failing ,

but in rising every

time we fall

{
  "status": "Succeeded",
  "succeeded": true,
  "failed": false,
  "finished": true,
  "recognitionResult": {
    "lines": [
      {
        "boundingBox": [
          67,
          204,
          668,
          210,
          667,
          272,
          66,
          267
        ],
        "text": "OUR greatest glory is not",
        "words": [
          {
            "boundingBox": [
              69,
              206,
              159,
              205,
              155,
              274,
              65,
              275
            ],
            "text": "OUR"
          },
          {
            "boundingBox": [
              192,
              205,
              350,
              204,
              346,
              273,
              188,
              274
            ],
            "text": "greatest"
          },
          {
            "boundingBox": [
              393,
              204,
              509,
              203,
              505,
              272,
              389,
              273
            ],
            "text": "glory"
          },
          {
            "boundingBox": [
              539,
              203,
              588,
              203,
              584,
              272,
              534,
              272
            ],
            "text": "is"
          },
          {
            "boundingBox": [
              601,
              202,
              680,
              202,
              676,
              271,
              597,
              271
            ],
            "text": "not"
          }
        ]
      },
      {
        "boundingBox": [
          540,
          289,
          900,
          302,
          897,
          374,
          538,
          360
        ],
        "text": "i never failing ,",
        "words": [
          {
            "boundingBox": [
              534,
              300,
              558,
              300,
              568,
              376,
              545,
              376
            ],
            "text": "i"
          },
          {
            "boundingBox": [
              589,
              300,
              694,
              300,
              705,
              376,
              600,
              376
            ],
            "text": "never"
          },
          {
            "boundingBox": [
              720,
              300,
              874,
              300,
              885,
              376,
              731,
              376
            ],
            "text": "failing"
          },
          {
            "boundingBox": [
              877,
              300,
              905,
              300,
              916,
              376,
              888,
              376
            ],
            "text": ","
          }
        ]
      },
      {
        "boundingBox": [
          139,
          416,
          572,
          433,
          570,
          491,
          136,
          474
        ],
        "text": "but in rising every",
        "words": [
          {
            "boundingBox": [
              145,
              418,
              215,
              418,
              202,
              491,
              132,
              491
            ],
            "text": "but"
          },
          {
            "boundingBox": [
              227,
              418,
              275,
              418,
              262,
              491,
              214,
              491
            ],
            "text": "in"
          },
          {
            "boundingBox": [
              308,
              418,
              428,
              419,
              415,
              492,
              295,
              491
            ],
            "text": "rising"
          },
          {
            "boundingBox": [
              476,
              419,
              581,
              419,
              568,
              492,
              463,
              492
            ],
            "text": "every"
          }
        ]
      },
      {
        "boundingBox": [
          622,
          413,
          967,
          410,
          968,
          470,
          623,
          472
        ],
        "text": "time we fall",
        "words": [
          {
            "boundingBox": [
              627,
              408,
              722,
              409,
              713,
              470,
              618,
              468
            ],
            "text": "time"
          },
          {
            "boundingBox": [
              765,
              409,
              828,
              410,
              818,
              471,
              756,
              470
            ],
            "text": "we"
          },
          {
            "boundingBox": [
              873,
              410,
              976,
              412,
              967,
              472,
              864,
              471
            ],
            "text": "fall"
          }
        ]
      }
    ]
  }
}

使ってみたいですか?

著名人およびランドマークの認識

ドメイン固有モデルの例として、著名人モデルおよびランドマーク モデルがあります。著名人認識モデルでは、ビジネス、政治、スポーツ、エンターテイメント分野での 200,000 人の著名人を認識できます。ランドマーク認識モデルでは、世界中の 9000 種類の自然物や人工物のランドマークを認識できます。ドメイン固有モデルは Computer Vision API で継続的に進化を遂げている機能です。

アクションからご覧ください

{
  "categories": [
    {
      "name": "people_",
      "score": 0.86328125,
      "detail": {
        "celebrities": [
          {
            "name": "Satya Nadella",
            "faceRectangle": {
              "left": 239,
              "top": 293,
              "width": 138,
              "height": 138
            },
            "confidence": 0.9999974
          }
        ],
        "landmarks": null
      }
    }
  ],
  "adult": null,
  "tags": [
    {
      "name": "person",
      "confidence": 0.99956613779067993
    },
    {
      "name": "suit",
      "confidence": 0.98934584856033325
    },
    {
      "name": "man",
      "confidence": 0.98844343423843384
    },
    {
      "name": "outdoor",
      "confidence": 0.860062301158905
    }
  ],
  "description": {
    "tags": [
      "person",
      "suit",
      "man",
      "necktie",
      "outdoor",
      "building",
      "clothing",
      "standing",
      "wearing",
      "business",
      "looking",
      "holding",
      "black",
      "front",
      "hand",
      "dressed",
      "phone",
      "field"
    ],
    "captions": [
      {
        "text": "Satya Nadella wearing a suit and tie",
        "confidence": 0.99033389849736619
      }
    ]
  },
  "requestId": "ce058874-8a0a-4dee-8f0c-19e3caf71427",
  "metadata": {
    "width": 600,
    "height": 900,
    "format": "Jpeg"
  },
  "faces": [
    {
      "age": 49,
      "gender": "Male",
      "faceRectangle": {
        "left": 239,
        "top": 293,
        "width": 138,
        "height": 138
      }
    }
  ],
  "color": {
    "dominantColorForeground": "Black",
    "dominantColorBackground": "Black",
    "dominantColors": [
      "Black",
      "Grey"
    ],
    "accentColor": "7B5E50",
    "isBWImg": false
  },
  "imageType": {
    "clipArtType": 0,
    "lineDrawingType": 0
  }
}

使ってみたいですか?

ほぼリアルタイムでビデオを分析

ほぼリアルタイムでビデオを分析。ご使用のデバイスでビデオのフレームを抽出し、それらのフレームをお好きな API 呼び出しに送信することで、任意の Computer Vision API をビデオ ファイルに使用できます。ビデオの結果はすぐに返ってきます。

まず GitHub のサンプルを使用して、アプリを構築しましょう。

詳細情報

アクションからご覧ください

使ってみたいですか?

サムネイルの生成

あらゆる入力画像に基づいて、高品質でストレージ効率の高いサムネイルを生成します。サムネイル生成機能を使用して、サイズ、形、スタイルのニーズに最も適したものに画像を変更できます。スマート トリミングを適用すれば、元の画像とは異なる縦横比であるものの、関心領域を維持したサムネイルを生成できます。

アクションからご覧ください

このデモにデータをアップロードすることにより、Microsoft がお客様のデータを保存し、本 API などの Microsoft サービスの品質向上に役立てることに同意するものとします。お客様のプライバシーを保護するため、お客様のデータは匿名化され、セキュリティで保護されます。お客様のデータを第三者に開示または提供することはありません。

使ってみたいですか?

Cognitive Services APIs を詳しく見る

Computer Vision API

画像から意思決定に役立つ情報を抽出

Face API

写真に含まれる顔の検出、識別、分析、グループ化、タグ付け

Content Moderator

画像、テキスト、ビデオを自動モデレート

Emotion API プレビュー

感情認識を使用してユーザー エクスペリエンスをパーソナライズ

Custom Vision Service プレビュー

貴社の最先端のコンピューター ビジョン モデルを、独自の用途向けに簡単にカスタマイズできます

Video Indexer プレビュー

動画の洞察を解放

Language Understanding Intelligent Service プレビュー

ユーザーが入力したコマンドをアプリケーションが理解できるようにします。

Text Analytics API

センチメントとトピックを簡単に評価して、ユーザーが求めるものを理解

Bing Spell Check API

アプリでのスペル ミスを検出して修正

Translator Text API

シンプルな REST API 呼び出しで機械翻訳を簡単に実行

Web Language Model API プレビュー

Web 規模のデータで学習した予測言語モデルを活用

Linguistic Analysis API プレビュー

Linguistic Analysis API で複雑な言語概念を単純化しテキストを解析しましょう

Translator Speech API

シンプルな REST API 呼び出しでリアルタイムの音声翻訳を簡単に実行

Speaker Recognition API プレビュー

音声を使用して個々の話者を識別および認証

Bing Speech API

音声をテキストへ、またそのテキストを再び音声に変換し、ユーザーの意図を理解

Custom Speech Service プレビュー

話し方、背景ノイズ、ボキャブラリといった音声認識の障壁を打開

Recommendations API プレビュー

顧客が欲しい品物を予測して推奨

Academic Knowledge API プレビュー

Microsoft Academic Graph の豊富な教育的コンテンツを利用

Knowledge Exploration Service プレビュー

自然言語入力による構造化データの対話型検索を実現

QnA Maker API プレビュー

情報から会話形式のナビゲーションしやすい回答を抽出

Entity Linking Intelligence Service API プレビュー

名前付きエンティティ認識とあいまいさ排除でアプリのデータ リンクをパワーアップしましょう

Custom Decision Service プレビュー

クラウドべースの文脈に応じた意思決定 API。学習により精度が高まります

プロジェクト プラハ

ジェスチャー ベースの制御

プロジェクト クスコ

Wikipedia エントリーに関連付けられたイベント

Project Nanjing

等時線計算

アプリをパワーアップさせる準備はできていますか?