ナビゲーションをスキップする

Computer Vision

画像から豊富な情報を抽出して、視覚データを分類および処理します。また、機械による画像のモデレートを実施して、サービスのキュレーションを支援します。

画像の分析

この機能では、画像内にあるビジュアル コンテンツに関する情報が返されます。タグ付け、ドメイン固有モデル、4 言語での説明を使用してコンテンツを特定し、確実にラベル付けします。成人向け/わいせつな描写に対する設定を適用すれば、成人向けである可能性のあるコンテンツを検出するのに役立ちます。画像の種類や写真内の配色を特定します。

アクションからご覧ください

特徴名:
説明 { "tags": [ "train", "platform", "station", "building", "indoor", "subway", "track", "walking", "waiting", "pulling", "board", "people", "man", "luggage", "standing", "holding", "large", "woman", "yellow", "suitcase" ], "captions": [ { "text": "people waiting at a train station", "confidence": 0.833099365 } ] }
タグ [ { "name": "train", "confidence": 0.9975446 }, { "name": "platform", "confidence": 0.995543063 }, { "name": "station", "confidence": 0.9798007 }, { "name": "indoor", "confidence": 0.927719653 }, { "name": "subway", "confidence": 0.838939846 }, { "name": "pulling", "confidence": 0.431715637 } ]
画像形式 "Jpeg"
画像サイズ 462 x 600
クリップ アートの種類 0
線画の種類 0
モノクロ false
成人向けコンテンツ false
成人スコア 0.0147124995
わいせつ性 false
わいせつスコア 0.0162802152
カテゴリ [ { "name": "trans_trainstation", "score": 0.98828125 } ]
[]
背景のドミナント カラー
"Black"
前景のドミナント カラー
"Black"
アクセント カラー
#484C83

使ってみたいですか?

画像内のテキストの読み取り

光学式文字認識 (OCR) によって画像内のテキストを検出し、認識した語句をマシンが読み取れる文字ストリームとして抽出します。画像を分析して埋め込みテキストを検出し、文字ストリームを生成し、検索を有効にします。テキストをコピーする代わりに写真を撮ることで、時間と労力を節約できます。

一般提供となっている OCR サービスをぜひご利用ください。以下では、新しいプレビューの OCR エンジン と、さらに精度が高まった英語のテキスト認識の結果を ("Recognize Text" API 操作で) 手軽にご確認いただけます。

アクションからご覧ください

  1. プレビュー
  2. JSON

Sorry!

Have a

nice day !

Oops!

See you soon !

bye!

{
  "status": "Succeeded",
  "succeeded": true,
  "failed": false,
  "finished": true,
  "recognitionResult": {
    "lines": [
      {
        "boundingBox": [
          122,
          122,
          401,
          85,
          404,
          229,
          143,
          233
        ],
        "text": "Sorry!",
        "words": [
          {
            "boundingBox": [
              121,
              121,
              424,
              81,
              442,
              223,
              140,
              263
            ],
            "text": "Sorry!"
          }
        ]
      },
      {
        "boundingBox": [
          586,
          160,
          917,
          120,
          929,
          221,
          599,
          262
        ],
        "text": "Have a",
        "words": [
          {
            "boundingBox": [
              585,
              166,
              813,
              138,
              814,
              232,
              593,
              265
            ],
            "text": "Have"
          },
          {
            "boundingBox": [
              832,
              137,
              898,
              135,
              896,
              224,
              833,
              230
            ],
            "text": "a"
          }
        ]
      },
      {
        "boundingBox": [
          577,
          243,
          980,
          204,
          992,
          335,
          590,
          374
        ],
        "text": "nice day !",
        "words": [
          {
            "boundingBox": [
              575,
              265,
              757,
              237,
              765,
              342,
              583,
              353
            ],
            "text": "nice"
          },
          {
            "boundingBox": [
              774,
              234,
              934,
              211,
              941,
              339,
              782,
              341
            ],
            "text": "day"
          },
          {
            "boundingBox": [
              934,
              211,
              991,
              204,
              997,
              339,
              941,
              339
            ],
            "text": "!"
          }
        ]
      },
      {
        "boundingBox": [
          210,
          367,
          436,
          347,
          435,
          499,
          192,
          483
        ],
        "text": "Oops!",
        "words": [
          {
            "boundingBox": [
              192,
              368,
              452,
              345,
              466,
              495,
              205,
              519
            ],
            "text": "Oops!"
          }
        ]
      },
      {
        "boundingBox": [
          167,
          622,
          686,
          588,
          693,
          684,
          174,
          719
        ],
        "text": "See you soon !",
        "words": [
          {
            "boundingBox": [
              165,
              624,
              307,
              614,
              308,
              711,
              168,
              722
            ],
            "text": "See"
          },
          {
            "boundingBox": [
              300,
              614,
              442,
              606,
              441,
              702,
              302,
              712
            ],
            "text": "you"
          },
          {
            "boundingBox": [
              448,
              605,
              622,
              597,
              619,
              690,
              448,
              701
            ],
            "text": "soon"
          },
          {
            "boundingBox": [
              622,
              597,
              686,
              594,
              683,
              687,
              619,
              690
            ],
            "text": "!"
          }
        ]
      },
      {
        "boundingBox": [
          824,
          491,
          1010,
          482,
          1013,
          611,
          808,
          603
        ],
        "text": "bye!",
        "words": [
          {
            "boundingBox": [
              811,
              491,
              1034,
              480,
              1040,
              609,
              817,
              620
            ],
            "text": "bye!"
          }
        ]
      }
    ]
  }
}

使ってみたいですか?

プレビュー: 画像からの手書き文字の読み取り

メモ、手紙、レポート、ホワイトボード、記入用紙などのソースから手書きの文字を検出し、抽出することができます。手書きのメモから転記せず、写真を撮ることで、書類の山を減らし、生産性を高めることができます。また、検索を実装することで、デジタル メモを見つけやすくなります。手書き文字の OCR は、白色の紙や黄色い付箋紙、ホワイトボードなど、さまざまな表面や下地に対応しています。

注: このテクノロジは現在プレビュー段階であり、英文のみに対応しています。

アクションからご覧ください

  1. プレビュー
  2. JSON

Our greatest glory is not

in never failing ,

but in rising every

time we fall

{
  "status": "Succeeded",
  "succeeded": true,
  "failed": false,
  "finished": true,
  "recognitionResult": {
    "lines": [
      {
        "boundingBox": [
          67,
          204,
          668,
          210,
          667,
          272,
          66,
          267
        ],
        "text": "Our greatest glory is not",
        "words": [
          {
            "boundingBox": [
              47,
              206,
              161,
              205,
              157,
              274,
              43,
              275
            ],
            "text": "Our"
          },
          {
            "boundingBox": [
              179,
              205,
              350,
              204,
              346,
              273,
              175,
              274
            ],
            "text": "greatest"
          },
          {
            "boundingBox": [
              381,
              204,
              509,
              203,
              505,
              272,
              377,
              273
            ],
            "text": "glory"
          },
          {
            "boundingBox": [
              526,
              203,
              588,
              203,
              584,
              272,
              522,
              272
            ],
            "text": "is"
          },
          {
            "boundingBox": [
              588,
              203,
              680,
              202,
              676,
              271,
              584,
              272
            ],
            "text": "not"
          }
        ]
      },
      {
        "boundingBox": [
          540,
          289,
          900,
          302,
          897,
          374,
          538,
          360
        ],
        "text": "in never failing ,",
        "words": [
          {
            "boundingBox": [
              507,
              300,
              553,
              300,
              564,
              376,
              518,
              376
            ],
            "text": "in"
          },
          {
            "boundingBox": [
              579,
              300,
              693,
              300,
              704,
              376,
              590,
              376
            ],
            "text": "never"
          },
          {
            "boundingBox": [
              712,
              300,
              872,
              300,
              883,
              376,
              723,
              376
            ],
            "text": "failing"
          },
          {
            "boundingBox": [
              864,
              300,
              902,
              300,
              913,
              376,
              875,
              376
            ],
            "text": ","
          }
        ]
      },
      {
        "boundingBox": [
          139,
          416,
          572,
          433,
          570,
          491,
          136,
          474
        ],
        "text": "but in rising every",
        "words": [
          {
            "boundingBox": [
              125,
              417,
              213,
              418,
              200,
              491,
              112,
              490
            ],
            "text": "but"
          },
          {
            "boundingBox": [
              217,
              418,
              273,
              418,
              260,
              491,
              204,
              491
            ],
            "text": "in"
          },
          {
            "boundingBox": [
              297,
              418,
              433,
              419,
              420,
              492,
              284,
              491
            ],
            "text": "rising"
          },
          {
            "boundingBox": [
              461,
              419,
              589,
              420,
              576,
              492,
              448,
              492
            ],
            "text": "every"
          }
        ]
      },
      {
        "boundingBox": [
          622,
          413,
          967,
          410,
          968,
          470,
          623,
          472
        ],
        "text": "time we fall",
        "words": [
          {
            "boundingBox": [
              612,
              407,
              718,
              409,
              709,
              470,
              603,
              468
            ],
            "text": "time"
          },
          {
            "boundingBox": [
              753,
              409,
              825,
              410,
              815,
              471,
              743,
              470
            ],
            "text": "we"
          },
          {
            "boundingBox": [
              863,
              410,
              973,
              412,
              964,
              472,
              853,
              471
            ],
            "text": "fall"
          }
        ]
      }
    ]
  }
}

使ってみたいですか?

著名人およびランドマークの認識

ビジネス、政治、スポーツ、エンターテイメント分野での 200,000 人の著名人のほか、世界各国 9,000 の自然物や人工物のランドマークを認識します。

アクションからご覧ください

{
  "categories": [
    {
      "name": "people_",
      "score": 0.86328125,
      "detail": {
        "celebrities": [
          {
            "name": "Satya Nadella",
            "faceRectangle": {
              "left": 240,
              "top": 294,
              "width": 135,
              "height": 135
            },
            "confidence": 0.99999558925628662
          }
        ],
        "landmarks": null
      }
    }
  ],
  "adult": null,
  "tags": [
    {
      "name": "person",
      "confidence": 0.99956613779067993
    },
    {
      "name": "suit",
      "confidence": 0.98934584856033325
    },
    {
      "name": "man",
      "confidence": 0.98844343423843384
    },
    {
      "name": "outdoor",
      "confidence": 0.860062301158905
    }
  ],
  "description": {
    "tags": [
      "person",
      "suit",
      "man",
      "necktie",
      "outdoor",
      "building",
      "clothing",
      "standing",
      "wearing",
      "business",
      "looking",
      "holding",
      "black",
      "front",
      "hand",
      "dressed",
      "phone",
      "field"
    ],
    "captions": [
      {
        "text": "Satya Nadella wearing a suit and tie",
        "confidence": 0.9903275009959599
      }
    ]
  },
  "requestId": "4357144a-d5fc-44e0-a664-428d57fca6d2",
  "metadata": {
    "width": 600,
    "height": 900,
    "format": "Jpeg"
  },
  "faces": [
    {
      "age": 48,
      "gender": "Male",
      "faceRectangle": {
        "left": 240,
        "top": 294,
        "width": 135,
        "height": 135
      }
    }
  ],
  "color": {
    "dominantColorForeground": "Black",
    "dominantColorBackground": "Black",
    "dominantColors": [
      "Black",
      "Grey"
    ],
    "accentColor": "7B5E50",
    "isBWImg": false
  },
  "imageType": {
    "clipArtType": 0,
    "lineDrawingType": 0
  }
}

使ってみたいですか?

ほぼリアルタイムでビデオを分析

ほぼリアルタイムでビデオを分析。ご使用のデバイスでビデオのフレームを抽出し、それらのフレームをお好きな API 呼び出しに送信することで、任意の Computer Vision API をビデオ ファイルに使用できます。ビデオの結果はすぐに返ってきます。

まず GitHub のサンプルを使用して、アプリを構築しましょう。

詳細情報

アクションからご覧ください

使ってみたいですか?

サムネイルの生成

あらゆる画像をベースに高品質でストレージ効率の高いサムネイルを生成したり、サイズ、形、スタイルのニーズに最も合ったものに画像を変更したりできます。スマート トリミングを適用すれば、元の画像とは異なる縦横比であるものの、関心領域を維持したサムネイルを生成できます。

アクションからご覧ください

使ってみたいですか?

Cognitive Services APIs を詳しく見る

Computer Vision

画像から意思決定に役立つ情報を抽出

Face

写真に含まれる顔の検出、識別、分析、グループ化、タグ付け

Video Indexer プレビュー

動画の洞察を解放

Content Moderator

画像、テキスト、ビデオを自動モデレート

Custom Vision プレビュー

貴社の最先端のコンピューター ビジョン モデルを、独自の用途向けに簡単にカスタマイズできます

Text Analytics

センチメントとトピックを簡単に評価して、ユーザーが求めるものを理解

Translator Text

シンプルな REST API 呼び出しで機械翻訳を簡単に実行

Bing Spell Check

アプリでのスペル ミスを検出して修正

Content Moderator

画像、テキスト、ビデオを自動モデレート

Language Understanding

ユーザーが入力したコマンドをアプリケーションが理解できるようにします。

Bing Speech

音声をテキストへ、またそのテキストを再び音声に変換し、ユーザーの意図を理解

Speaker Recognition プレビュー

音声を使用して個々の話者を識別および検証

Translator Speech

シンプルな REST API 呼び出しでリアルタイムの音声翻訳を簡単に実行

Custom Speech プレビュー

話し方、背景ノイズ、ボキャブラリといった音声認識の障壁を打開

Speech Services プレビュー

音声テキスト変換、テキスト読み上げ、音声翻訳のための統合音声サービス

QnA Maker

情報から会話形式のナビゲーションしやすい回答を抽出

アプリをパワーアップさせる準備はできていますか?