Computer Vision API

從影像擷取豐富資訊,進而分類及處理視覺化資料,並對影像進行機器輔助審核,以協助籌備您的服務。

分析影像

這項功能會傳回在影像中找到的視覺化內容資訊。使用標籤、描述及網域特定模型,從容地識別內容並將其加上標籤。套用成人/猥瑣設定,進而啟用自動限制成人內容。識別圖片中的影像類型及色彩配置。

觀看影片

性別 Male
年齡 36
功能名稱:
說明 { "tags": [ "water", "swimming", "sport", "pool", "person", "man", "frisbee", "ocean", "blue", "bird", "riding", "top", "standing", "wave", "young", "body", "large", "game", "glass", "pond", "playing", "board", "catch", "clear", "boat", "white" ], "captions": [ { "text": "a man swimming in a pool of water", "confidence": 0.8909298 } ] }
標籤 [ { "name": "water", "confidence": 0.9997857 }, { "name": "swimming", "confidence": 0.955619633 }, { "name": "sport", "confidence": 0.953807831 }, { "name": "pool", "confidence": 0.9515978 }, { "name": "person", "confidence": 0.889862537 }, { "name": "water sport", "confidence": 0.664259 } ]
影像格式 "Jpeg"
影像尺寸 462 x 600
美工圖案類型 0
線條繪圖類型 0
黑與白 false
成人內容 false
成人分數 0.07518345
辛辣 false
辛辣分數 0.1814024
類別 [ { "name": "people_swimming", "score": 0.98046875 } ]
臉部 [ { "age": 36, "gender": "Male", "faceRectangle": { "top": 133, "left": 298, "width": 121, "height": 121 } } ]
主要色彩背景
"White"
主要色彩前景
"Grey"
輔色
#19A4B2

想要建置這個嗎?

讀取影像中的文字

光學字元辨識 (OCR) 可偵測影像中的文字,並將辨識出的字詞擷取到電腦可讀取的字元資料流中。分析影像,進而偵測內嵌的文字、產生字元資料流並啟用搜尋。替文字照相,省下複製文字所需的時間及精力。

觀看影片

  1. 預覽
  2. JSON

IF WE DID

ALL

THE THINGS

WE ARE

CAPABLÉ•

OF DOING,

WE WOULD

LITERALLY

ASTOUND

QURSELV*S.

{
  "textAngle": 0.0,
  "orientation": "NotDetected",
  "language": "en",
  "regions": [
    {
      "boundingBox": "316,47,284,340",
      "lines": [
        {
          "boundingBox": "319,47,182,24",
          "words": [
            {
              "boundingBox": "319,47,42,24",
              "text": "IF"
            },
            {
              "boundingBox": "375,47,44,24",
              "text": "WE"
            },
            {
              "boundingBox": "435,47,66,23",
              "text": "DID"
            }
          ]
        },
        {
          "boundingBox": "316,74,204,69",
          "words": [
            {
              "boundingBox": "316,74,204,69",
              "text": "ALL"
            }
          ]
        },
        {
          "boundingBox": "318,147,207,24",
          "words": [
            {
              "boundingBox": "318,147,63,24",
              "text": "THE"
            },
            {
              "boundingBox": "397,147,128,24",
              "text": "THINGS"
            }
          ]
        },
        {
          "boundingBox": "316,176,125,23",
          "words": [
            {
              "boundingBox": "316,176,44,23",
              "text": "WE"
            },
            {
              "boundingBox": "375,176,66,23",
              "text": "ARE"
            }
          ]
        },
        {
          "boundingBox": "319,194,281,44",
          "words": [
            {
              "boundingBox": "319,194,281,44",
              "text": "CAPABLÉ•"
            }
          ]
        },
        {
          "boundingBox": "318,243,181,29",
          "words": [
            {
              "boundingBox": "318,243,43,23",
              "text": "OF"
            },
            {
              "boundingBox": "376,243,123,29",
              "text": "DOING,"
            }
          ]
        },
        {
          "boundingBox": "316,271,170,24",
          "words": [
            {
              "boundingBox": "316,272,44,23",
              "text": "WE"
            },
            {
              "boundingBox": "375,271,111,24",
              "text": "WOULD"
            }
          ]
        },
        {
          "boundingBox": "317,300,200,24",
          "words": [
            {
              "boundingBox": "317,300,200,24",
              "text": "LITERALLY"
            }
          ]
        },
        {
          "boundingBox": "316,328,157,24",
          "words": [
            {
              "boundingBox": "316,328,157,24",
              "text": "ASTOUND"
            }
          ]
        },
        {
          "boundingBox": "318,357,214,30",
          "words": [
            {
              "boundingBox": "318,357,214,30",
              "text": "QURSELV*S."
            }
          ]
        }
      ]
    }
  ]
}

為此示範上傳資料,即表示您同意 Microsoft 可儲存此資料並用其改進 Microsoft 服務,包括此 API。為了協助保護您的隱私權,我們採取了幾個步驟來取消識別您的資料並確保其安全。我們不會發佈您的資料或讓其他人使用此資料。

想要建置這個嗎?

預覽:讀取影像中的手寫文字

這項技術 (手寫 OCR) 可讓您偵測記事、信件、文章、白板、表格等的手寫文字並加以擷取,且可在不同的介面及背景中運作,例如技術白皮書、黃色自黏便箋及白板。

您可透過手寫文字辨識擷取文字的影像而無須謄寫,進而節省時間及心力並更具生產力。如此便可將筆記數位化,讓您實作快速輕易的搜尋,同時減少紙張堆疊量。

附註:這項技術目前為預覽狀態,且只適用於英文文字。

若要試用這項光學字元辨識示範,請上傳存在本機的影像或提供影像 URL。若未經您的允許,我們不會儲存您提供給這項示範的影像。

觀看影片

  1. 預覽
  2. JSON

Our greatest glory is not

in never failing

but in rising every

time we fall

{
  "status": "Succeeded",
  "succeeded": true,
  "failed": false,
  "finished": true,
  "recognitionResult": {
    "lines": [
      {
        "boundingBox": [
          202,
          618,
          2047,
          643,
          2046,
          840,
          200,
          813
        ],
        "text": "Our greatest glory is not",
        "words": [
          {
            "boundingBox": [
              204,
              627,
              481,
              628,
              481,
              830,
              204,
              829
            ],
            "text": "Our"
          },
          {
            "boundingBox": [
              585,
              628,
              1067,
              630,
              1066,
              832,
              585,
              831
            ],
            "text": "greatest"
          },
          {
            "boundingBox": [
              1190,
              630,
              1539,
              631,
              1539,
              833,
              1189,
              832
            ],
            "text": "glory"
          },
          {
            "boundingBox": [
              1643,
              631,
              1785,
              632,
              1784,
              834,
              1642,
              834
            ],
            "text": "is"
          },
          {
            "boundingBox": [
              1832,
              632,
              2068,
              632,
              2067,
              835,
              1831,
              834
            ],
            "text": "not"
          }
        ]
      },
      {
        "boundingBox": [
          1612,
          903,
          2744,
          935,
          2738,
          1139,
          1607,
          1107
        ],
        "text": "in never failing",
        "words": [
          {
            "boundingBox": [
              1611,
              934,
              1707,
              933,
              1708,
              1147,
              1613,
              1147
            ],
            "text": "in"
          },
          {
            "boundingBox": [
              1822,
              932,
              2132,
              930,
              2133,
              1144,
              1824,
              1146
            ],
            "text": "never"
          },
          {
            "boundingBox": [
              2217,
              930,
              2673,
              927,
              2674,
              1140,
              2218,
              1143
            ],
            "text": "failing"
          }
        ]
      },
      {
        "boundingBox": [
          426,
          1271,
          1748,
          1330,
          1738,
          1519,
          416,
          1462
        ],
        "text": "but in rising every",
        "words": [
          {
            "boundingBox": [
              424,
              1273,
              635,
              1273,
              635,
              1500,
              424,
              1500
            ],
            "text": "but"
          },
          {
            "boundingBox": [
              683,
              1273,
              811,
              1273,
              811,
              1500,
              683,
              1500
            ],
            "text": "in"
          },
          {
            "boundingBox": [
              924,
              1274,
              1284,
              1274,
              1284,
              1501,
              923,
              1501
            ],
            "text": "rising"
          },
          {
            "boundingBox": [
              1437,
              1275,
              1749,
              1275,
              1749,
              1502,
              1436,
              1502
            ],
            "text": "every"
          }
        ]
      },
      {
        "boundingBox": [
          1900,
          1261,
          2954,
          1254,
          2956,
          1437,
          1902,
          1443
        ],
        "text": "time we fall",
        "words": [
          {
            "boundingBox": [
              1911,
              1250,
              2197,
              1252,
              2176,
              1437,
              1890,
              1435
            ],
            "text": "time"
          },
          {
            "boundingBox": [
              2326,
              1253,
              2524,
              1255,
              2503,
              1440,
              2305,
              1438
            ],
            "text": "we"
          },
          {
            "boundingBox": [
              2670,
              1256,
              2979,
              1259,
              2958,
              1444,
              2649,
              1441
            ],
            "text": "fall"
          }
        ]
      }
    ]
  }
}

想要建置這個嗎?

辨識名人和地標

名人和地標模型是特定領域模型的例子。我們的名人辨識模型可辨識 20 萬名來自商業界、政界、體壇及娛樂圈的名人。我們的地標辨識模型可辨識世界各地 9000 個自然與人工地標。特定領域模型是一項電腦視覺 API 中持續演進的功能。

觀看影片

{
  "categories": [
    {
      "name": "people_",
      "score": 0.86328125,
      "detail": {
        "celebrities": [
          {
            "name": "Satya Nadella",
            "faceRectangle": {
              "left": 239,
              "top": 293,
              "width": 138,
              "height": 138
            },
            "confidence": 0.9999974
          }
        ],
        "landmarks": null
      }
    }
  ],
  "adult": null,
  "tags": [
    {
      "name": "person",
      "confidence": 0.99956613779067993
    },
    {
      "name": "suit",
      "confidence": 0.98934584856033325
    },
    {
      "name": "man",
      "confidence": 0.98844343423843384
    },
    {
      "name": "outdoor",
      "confidence": 0.860062301158905
    }
  ],
  "description": {
    "tags": [
      "person",
      "suit",
      "man",
      "necktie",
      "outdoor",
      "building",
      "clothing",
      "standing",
      "wearing",
      "business",
      "looking",
      "holding",
      "black",
      "front",
      "hand",
      "dressed",
      "phone",
      "field"
    ],
    "captions": [
      {
        "text": "Satya Nadella wearing a suit and tie",
        "confidence": 0.99033389849736619
      }
    ]
  },
  "requestId": "58047b5d-7e98-40eb-8a96-83bfb0fdbce8",
  "metadata": {
    "width": 600,
    "height": 900,
    "format": "Jpeg"
  },
  "faces": [
    {
      "age": 49,
      "gender": "Male",
      "faceRectangle": {
        "left": 239,
        "top": 293,
        "width": 138,
        "height": 138
      }
    }
  ],
  "color": {
    "dominantColorForeground": "Black",
    "dominantColorBackground": "Black",
    "dominantColors": [
      "Black",
      "Grey"
    ],
    "accentColor": "7B5E50",
    "isBWImg": false
  },
  "imageType": {
    "clipArtType": 0,
    "lineDrawingType": 0
  }
}

想要建置這個嗎?

近乎即時分析影片

近乎即時分析影片:從裝置擷取視訊框架,然後將其傳送至您所選的 API 呼叫,即可對您的視訊檔案使用任何一項電腦視覺 API。更快從影片取得結果。

使用 GitHub 上的範例,開始使用並建置您專屬的應用程式。

深入了解

觀看影片

想要建置這個嗎?

產生縮圖

依據任何輸入影像,產生高品質且具儲存體效益的縮圖。使用產生縮圖,將影像修改為最符合您需求的大小、形狀及風格。套用智慧裁剪,產生出外觀比例與原始影像不同的縮圖,同時保留所關注的區域。

觀看影片

為此示範上傳資料,即表示您同意 Microsoft 可儲存此資料並用其改進 Microsoft 服務,包括此 API。為了協助保護您的隱私權,我們採取了幾個步驟來取消識別您的資料並確保其安全。我們不會發佈您的資料或讓其他人使用此資料。

想要建置這個嗎?

探索辨識服務 API

Computer Vision API

從影像擷取可操作的資訊

臉部 API

偵測、識別、分析、組織和標記相片中的臉孔

內容仲裁

自動審核影像、文字及影片

Emotion API 預覽

利用表情辨識個人化使用者體驗

影片 API 預覽

智慧型影片處理

Custom Vision Service 預覽

輕鬆自訂先進且適合您獨特使用案例的電腦視覺模型

影片索引器 預覽

深入探索影片

Language Understanding Intelligent Service 預覽

教導您的應用程式理解使用者發出的命令

Text Analytics API 預覽

輕鬆解讀意見與話題,從而了解使用者的需求

Bing 拼字檢查 API

偵測並校正您應用程式中的拼字錯誤

Translator Text API

使用簡單的 REST API 呼叫,輕鬆進行機器翻譯

Web 語言模型 API 預覽

運用已經過網路規模資料訓練之預測語言模型的能力

語言分析 API 預覽

使用語言分析 API 簡化複雜的語言概念及剖析文字

Translator Speech API

使用簡單的 REST API 呼叫,輕鬆地進行即時語音翻譯

說話者辨識 API 預覽

使用語音來辨識及驗證各個說話者

Bing 語音 API

雙向轉換語音與文字,從而了解使用者的想法

Custom Speech Service 預覽

克服像是語音模式、背景雜音以及詞彙等語音辨識的阻礙

Recommendations API 預覽

預測並建議客戶想要的商品

Academic Knowledge API 預覽

充分利用 Microsoft Academic Graph 中豐富的學術內容

Knowledge Exploration Service 預覽

啟用透過自然語言輸入對結構化資料進行互動式搜尋的功能

QnA Maker API 預覽

將資訊整理成易於導覽的交談式回答

Entity Linking Intelligence Service API 預覽

透過具名實體辨識和去除混淆,增強您的應用程式資料連結

Custom Decision Service 預覽

透過體驗所加強的雲端式內容相關決策制定 API

布拉格專案

軌跡控制

庫斯科專案

與 Wikipedia 項目相關的事件

南京專案

等時計算

阿布達比專案

距離矩陣

約翰尼斯堡專案

物流路線

臥龍崗專案

位置探索

準備好大幅提升應用程式的效能了嗎?