Computer Vision API

이미지에서 다양한 정보를 추출하여 시각적 데이터를 분류 및 처리하고 이미지의 기계 지원 수정을 통해 서비스 조정을 지원합니다.

이미지 분석

이 기능은 이미지에서 찾은 시각적 콘텐츠에 대한 정보를 반환합니다. 태그 지정, 설명 및 도메인 특정 모델을 사용하여 자신 있게 콘텐츠를 파악하고 레이블을 지정하세요. 성인 콘텐츠를 자동으로 제한할 수 있도록 성인/외설 설정을 적용합니다. 사진의 이미지 형식과 색 구성표를 파악합니다.

실제 동작 확인


성별 Male
연령 36
기능 이름:
설명 { "Tags": [ "water", "swimming", "sport", "pool", "person", "man", "frisbee", "ocean", "blue", "bird", "riding", "top", "standing", "wave", "young", "body", "large", "game", "glass", "pond", "playing", "board", "catch", "clear", "boat", "white" ], "Captions": [ { "Text": "a man swimming in a pool of water", "Confidence": 0.8909298 } ] }
태그 [ { "Name": "water", "Confidence": 0.9997857 }, { "Name": "swimming", "Confidence": 0.955619633 }, { "Name": "sport", "Confidence": 0.953807831 }, { "Name": "pool", "Confidence": 0.9515978 }, { "Name": "person", "Confidence": 0.889862537 }, { "Name": "water sport", "Confidence": 0.664259 } ]
이미지 형식 "Jpeg"
이미지 차원 462 x 600
클립 아트 유형 0
선 그리기 형식 0
흑백 false
성인 콘텐츠 false
성인 점수 0.07518345
외설 false
외설 점수 0.1814024
범주 [ { "Name": "people_swimming", "Score": 0.98046875 } ]
얼굴 [ { "Age": 36, "Gender": "Male", "FaceRectangle": { "Top": 133, "Left": 298, "Width": 121, "Height": 121 } } ]
주요 색상 배경
"White"
주요 색상 전경
"Grey"
강조 색
#19A4B2

이 내용을 빌드할까요?

이미지의 텍스트 읽기

OCR(광학 인식)에서는 이미지에서 텍스트를 감지하고 인식된 단어를 기계에서 읽을 수 있는 문자 스트림으로 추출합니다. 이미지를 분석하여 포함된 텍스트를 감지하고 문자 스트림을 생성하고 검색을 지원합니다. 텍스트를 복사하는 대신 사진을 찍어 시간과 노력을 절약합니다.

실제 동작 확인


  1. 미리 보기
  2. JSON

IF WE DID

ALL

THE THINGS

WE ARE

CAPABLÉ•

OF DOING,

WE WOULD

LITERALLY

ASTOUND

QURSELV*S.

{
  "TextAngle": 0.0,
  "Orientation": "NotDetected",
  "Language": "en",
  "Regions": [
    {
      "BoundingBox": "316,47,284,340",
      "Lines": [
        {
          "BoundingBox": "319,47,182,24",
          "Words": [
            {
              "BoundingBox": "319,47,42,24",
              "Text": "IF"
            },
            {
              "BoundingBox": "375,47,44,24",
              "Text": "WE"
            },
            {
              "BoundingBox": "435,47,66,23",
              "Text": "DID"
            }
          ]
        },
        {
          "BoundingBox": "316,74,204,69",
          "Words": [
            {
              "BoundingBox": "316,74,204,69",
              "Text": "ALL"
            }
          ]
        },
        {
          "BoundingBox": "318,147,207,24",
          "Words": [
            {
              "BoundingBox": "318,147,63,24",
              "Text": "THE"
            },
            {
              "BoundingBox": "397,147,128,24",
              "Text": "THINGS"
            }
          ]
        },
        {
          "BoundingBox": "316,176,125,23",
          "Words": [
            {
              "BoundingBox": "316,176,44,23",
              "Text": "WE"
            },
            {
              "BoundingBox": "375,176,66,23",
              "Text": "ARE"
            }
          ]
        },
        {
          "BoundingBox": "319,194,281,44",
          "Words": [
            {
              "BoundingBox": "319,194,281,44",
              "Text": "CAPABLÉ•"
            }
          ]
        },
        {
          "BoundingBox": "318,243,181,29",
          "Words": [
            {
              "BoundingBox": "318,243,43,23",
              "Text": "OF"
            },
            {
              "BoundingBox": "376,243,123,29",
              "Text": "DOING,"
            }
          ]
        },
        {
          "BoundingBox": "316,271,170,24",
          "Words": [
            {
              "BoundingBox": "316,272,44,23",
              "Text": "WE"
            },
            {
              "BoundingBox": "375,271,111,24",
              "Text": "WOULD"
            }
          ]
        },
        {
          "BoundingBox": "317,300,200,24",
          "Words": [
            {
              "BoundingBox": "317,300,200,24",
              "Text": "LITERALLY"
            }
          ]
        },
        {
          "BoundingBox": "316,328,157,24",
          "Words": [
            {
              "BoundingBox": "316,328,157,24",
              "Text": "ASTOUND"
            }
          ]
        },
        {
          "BoundingBox": "318,357,214,30",
          "Words": [
            {
              "BoundingBox": "318,357,214,30",
              "Text": "QURSELV*S."
            }
          ]
        }
      ]
    }
  ]
}

이 데모에 대한 데이터를 업로드하면 Microsoft가 해당 데이터를 저장하고 이 API를 개선하는 등 Microsoft 서비스를 개선하는 데 해당 데이터를 사용할 수 있다는 것에 동의하게 됩니다. 개인 정보를 보호하기 위해 데이터를 익명으로 처리하고 안전하게 유지하는 단계를 거칩니다. 데이터를 게시하거나 다른 사람이 사용하게 하지 않습니다.

이 내용을 빌드할까요?

미리 보기: 이미지에서 필기한 텍스트 읽기

이 기술(필기한 OCR)을 통해 노트, 편지, 에세이, 화이트보드, 양식 등에서 필기한 텍스트를 감지하여 추출할 수 있습니다. 이 기술은 흰색 종이, 노란색 스티커 메모 및 화이트보드와 같은 다양한 표면 및 배경에서 작동합니다.

필기한 텍스트 인식은 시간과 노력을 줄여주며 텍스트를 기록할 필요 없이 텍스트 이미지를 촬영할 수 있게 하여 생산성을 높여줄 수 있습니다. 이 기술을 통해 노트를 디지털화할 수 있습니다. 그러면 빠르고 쉬운 검색을 구현할 수 있습니다. 또한 종이 문서를 줄여줍니다.

참고: 이 기술은 현재 미리 보기로 제공되며 영어 텍스트에만 사용할 수 있습니다.

이 광학 인식 데모를 체험하려면 로컬에 저장된 이미지를 업로드하거나 이미지 URL을 제공하세요. Microsoft에서는 사용자가 허락하지 않는 한 이 데모를 위해 제공한 이미지를 저장하지 않습니다.

실제 동작 확인