탐색 건너뛰기

Computer Vision API

이미지에서 풍부한 정보를 추출하여 시각적 데이터를 분류 및 처리하고, 이미지를 기계 보조 방식으로 처리하여 서비스를 선별합니다.

이미지 분석

이 기능은 이미지에서 찾은 시각적 콘텐츠에 대한 정보를 제공합니다. 태그 지정, 도메인 특정 모델 및 설명에 대해 4개의 언어를 사용하여 자신 있게 콘텐츠를 파악하고 레이블을 지정하실 수 있습니다. 잠재적인 성인 콘텐츠를 감지할 수 있도록 성인/외설 설정을 적용합니다. 사진의 이미지 형식과 색 구성표를 파악합니다.

실제 작동되는 방식을 확인해보세요.

기능 이름:
설명 { "tags": [ "train", "platform", "station", "building", "indoor", "subway", "track", "walking", "waiting", "pulling", "board", "people", "man", "luggage", "standing", "holding", "large", "woman", "yellow", "suitcase" ], "captions": [ { "text": "people waiting at a train station", "confidence": 0.8330993 } ] }
태그 [ { "name": "train", "confidence": 0.9975446 }, { "name": "platform", "confidence": 0.995543063 }, { "name": "station", "confidence": 0.9798007 }, { "name": "indoor", "confidence": 0.9277198 }, { "name": "subway", "confidence": 0.838939548 }, { "name": "pulling", "confidence": 0.4317156 } ]
이미지 형식 "Jpeg"
이미지 차원 462 x 600
클립 아트 유형 0
선 그리기 형식 0
흑백 false
성인 콘텐츠 false
성인 점수 0.0147124995
외설 false
외설 점수 0.0162802152
범주 [ { "name": "trans_trainstation", "score": 0.98828125 } ]
얼굴 []
주요 색상 배경
"Black"
주요 색상 전경
"Black"
강조 색
#484C83

이 내용으로 구축하시겠습니까?

이미지 내의 텍스트 읽기

광학식 문자 인식(OCR)을 사용하여 이미지 내의 텍스트를 감지하고 인식된 단어를 기계 가독 가능한 문자 스트림으로 추출합니다. 이미지를 분석하여 내장된 텍스트를 감지하고 문자 스트림을 생성하며 검색을 활성화합니다. 텍스트를 복사하는 대신 사진을 찍어 시간과 노력을 절약하세요.

일반용으로 OCR 서비스를 시작하고, 영어에 대한 더 나은 텍스트 인식 결과로 새로운 미리 보기 OCR 엔진("텍스트 인식" API 작동을 통해)을 미리 살펴보세요.

실제 작동되는 방식을 확인해보세요.

  1. Preview
  2. JSON

Sorry!

Have a

nice day !

Oops!

See you soon !

bye!

{
  "status": "Succeeded",
  "succeeded": true,
  "failed": false,
  "finished": true,
  "recognitionResult": {
    "lines": [
      {
        "boundingBox": [
          122,
          122,
          401,
          85,
          404,
          229,
          143,
          233
        ],
        "text": "Sorry!",
        "words": [
          {
            "boundingBox": [
              120,
              105,
              426,
              82,
              437,
              226,
              131,
              249
            ],
            "text": "Sorry!"
          }
        ]
      },
      {
        "boundingBox": [
          586,
          160,
          917,
          120,
          929,
          221,
          599,
          262
        ],
        "text": "Have a",
        "words": [
          {
            "boundingBox": [
              585,
              166,
              813,
              138,
              814,
              232,
              593,
              265
            ],
            "text": "Have"
          },
          {
            "boundingBox": [
              832,
              137,
              898,
              135,
              896,
              224,
              833,
              230
            ],
            "text": "a"
          }
        ]
      },
      {
        "boundingBox": [
          577,
          243,
          980,
          204,
          992,
          335,
          590,
          374
        ],
        "text": "nice day !",
        "words": [
          {
            "boundingBox": [
              575,
              265,
              757,
              237,
              765,
              342,
              583,
              353
            ],
            "text": "nice"
          },
          {
            "boundingBox": [
              774,
              234,
              934,
              211,
              941,
              339,
              782,
              341
            ],
            "text": "day"
          },
          {
            "boundingBox": [
              934,
              211,
              991,
              204,
              997,
              339,
              941,
              339
            ],
            "text": "!"
          }
        ]
      },
      {
        "boundingBox": [
          210,
          367,
          436,
          347,
          435,
          499,
          192,
          483
        ],
        "text": "Oops!",
        "words": [
          {
            "boundingBox": [
              200,
              349,
              463,
              346,
              465,
              498,
              201,
              501
            ],
            "text": "Oops!"
          }
        ]
      },
      {
        "boundingBox": [
          167,
          622,
          686,
          588,
          693,
          684,
          174,
          719
        ],
        "text": "See you soon !",
        "words": [
          {
            "boundingBox": [
              165,
              624,
              307,
              614,
              308,
              711,
              168,
              722
            ],
            "text": "See"
          },
          {
            "boundingBox": [
              300,
              614,
              442,
              606,
              441,
              702,
              302,
              712
            ],
            "text": "you"
          },
          {
            "boundingBox": [
              448,
              605,
              622,
              597,
              619,
              690,
              448,
              701
            ],
            "text": "soon"
          },
          {
            "boundingBox": [
              622,
              597,
              686,
              594,
              683,
              687,
              619,
              690
            ],
            "text": "!"
          }
        ]
      },
      {
        "boundingBox": [
          824,
          491,
          1010,
          482,
          1013,
          611,
          808,
          603
        ],
        "text": "bye!",
        "words": [
          {
            "boundingBox": [
              816,
              482,
              1039,
              481,
              1040,
              610,
              816,
              611
            ],
            "text": "bye!"
          }
        ]
      }
    ]
  }
}

이 내용으로 구축하시겠습니까?

미리 보기: 이미지에서 필기한 텍스트 읽기

노트, 편지, 에세이, 화이트보드, 양식 및 기타 소스에서 필기한 텍스트를 감지하여 추출하십시오. 옮겨 쓰는 대신 필기한 노트를 사진으로 찍어 종이 문서를 줄이고 생산성을 높이며, 검색 기능을 구현하여 디지털 노트를 쉽게 찾을 수 있도록 만들 수 있습니다. 필기 OCR은 흰색 종이, 노란색 스티커 메모지 및 화이트보드와 같은 다양한 표면 및 배경에서 작동합니다.

참고: 이 기술은 현재 미리 보기로 제공되며, 영어 텍스트에만 사용할 수 있습니다.

실제 작동되는 방식을 확인해보세요.

  1. Preview
  2. JSON

Our greatest glory is not

in never failing ,

but in rising every

time we fall

{
  "status": "Succeeded",
  "succeeded": true,
  "failed": false,
  "finished": true,
  "recognitionResult": {
    "lines": [
      {
        "boundingBox": [
          67,
          204,
          668,
          210,
          667,
          272,
          66,
          267
        ],
        "text": "Our greatest glory is not",
        "words": [
          {
            "boundingBox": [
              45,
              205,
              160,
              204,
              155,
              273,
              41,
              274
            ],
            "text": "Our"
          },
          {
            "boundingBox": [
              177,
              204,
              349,
              203,
              345,
              272,
              173,
              273
            ],
            "text": "greatest"
          },
          {
            "boundingBox": [
              380,
              202,
              507,
              202,
              503,
              271,
              375,
              271
            ],
            "text": "glory"
          },
          {
            "boundingBox": [
              525,
              201,
              587,
              201,
              582,
              270,
              521,
              270
            ],
            "text": "is"
          },
          {
            "boundingBox": [
              587,
              201,
              679,
              200,
              675,
              269,
              582,
              270
            ],
            "text": "not"
          }
        ]
      },
      {
        "boundingBox": [
          540,
          289,
          900,
          302,
          897,
          374,
          538,
          360
        ],
        "text": "in never failing ,",
        "words": [
          {
            "boundingBox": [
              506,
              299,
              551,
              299,
              562,
              375,
              517,
              375
            ],
            "text": "in"
          },
          {
            "boundingBox": [
              578,
              299,
              692,
              299,
              703,
              375,
              589,
              375
            ],
            "text": "never"
          },
          {
            "boundingBox": [
              711,
              299,
              871,
              298,
              881,
              374,
              722,
              374
            ],
            "text": "failing"
          },
          {
            "boundingBox": [
              863,
              298,
              901,
              298,
              912,
              374,
              874,
              374
            ],
            "text": ","
          }
        ]
      },
      {
        "boundingBox": [
          139,
          416,
          572,
          433,
          570,
          491,
          136,
          474
        ],
        "text": "but in rising every",
        "words": [
          {
            "boundingBox": [
              124,
              416,
              212,
              417,
              198,
              490,
              110,
              489
            ],
            "text": "but"
          },
          {
            "boundingBox": [
              216,
              417,
              272,
              417,
              258,
              490,
              202,
              490
            ],
            "text": "in"
          },
          {
            "boundingBox": [
              296,
              417,
              432,
              418,
              418,
              491,
              282,
              490
            ],
            "text": "rising"
          },
          {
            "boundingBox": [
              460,
              418,
              588,
              419,
              574,
              491,
              446,
              491
            ],
            "text": "every"
          }
        ]
      },
      {
        "boundingBox": [
          622,
          413,
          967,
          410,
          968,
          470,
          623,
          472
        ],
        "text": "time we fall",
        "words": [
          {
            "boundingBox": [
              610,
              406,
              717,
              408,
              708,
              469,
              601,
              467
            ],
            "text": "time"
          },
          {
            "boundingBox": [
              751,
              408,
              823,
              409,
              814,
              470,
              742,
              469
            ],
            "text": "we"
          },
          {
            "boundingBox": [
              861,
              409,
              971,
              410,
              962,
              471,
              852,
              470
            ],
            "text": "fall"
          }
        ]
      }
    ]
  }
}

이 내용으로 구축하시겠습니까?

유명인 및 랜드마크 인식

200,000명이 넘는 전 세계 비즈니스, 정치, 스포츠 및 연예계의 유명인뿐 아니라 9,000개의 자연 및 인공 랜드마크를 인식합니다.

실제 작동되는 방식을 확인해보세요.

{
  "categories": [
    {
      "name": "people_",
      "score": 0.86328125,
      "detail": {
        "celebrities": [
          {
            "name": "Satya Nadella",
            "faceRectangle": {
              "left": 240,
              "top": 294,
              "width": 135,
              "height": 135
            },
            "confidence": 0.99999833106994629
          }
        ],
        "landmarks": null
      }
    }
  ],
  "adult": null,
  "tags": [
    {
      "name": "person",
      "confidence": 0.99956613779067993
    },
    {
      "name": "suit",
      "confidence": 0.98934584856033325
    },
    {
      "name": "man",
      "confidence": 0.98844343423843384
    },
    {
      "name": "outdoor",
      "confidence": 0.860062301158905
    }
  ],
  "description": {
    "tags": [
      "person",
      "suit",
      "man",
      "necktie",
      "outdoor",
      "building",
      "clothing",
      "standing",
      "wearing",
      "business",
      "looking",
      "holding",
      "black",
      "front",
      "hand",
      "dressed",
      "phone",
      "field"
    ],
    "captions": [
      {
        "text": "Satya Nadella wearing a suit and tie",
        "confidence": 0.99032750982666984
      }
    ]
  },
  "requestId": "59484d09-18d0-42aa-bccd-4f1a9b717323",
  "metadata": {
    "width": 600,
    "height": 900,
    "format": "Jpeg"
  },
  "faces": [
    {
      "age": 49,
      "gender": "Male",
      "faceRectangle": {
        "left": 240,
        "top": 294,
        "width": 135,
        "height": 135
      }
    }
  ],
  "color": {
    "dominantColorForeground": "Black",
    "dominantColorBackground": "Black",
    "dominantColors": [
      "Black",
      "Grey"
    ],
    "accentColor": "7B5E50",
    "isBWImg": false
  },
  "imageType": {
    "clipArtType": 0,
    "lineDrawingType": 0
  }
}

이 내용으로 구축하시겠습니까?

실시간으로 비디오 분석

거의 실시간으로 비디오 분석 장치에서 비디오 프레임을 추출하고 추출한 프레임을 원하는 API 호출로 보내 비디오 파일에 Computer Vision API를 사용하세요. 비디오를 통해 더 신속한 결과를 얻을 수 있습니다.

GitHub에서 샘플을 사용하여 자신의 앱을 만들고 시작해보세요.

자세히 보기  

실제 작동되는 방식을 확인해보세요.

이 내용으로 구축하시겠습니까?

썸네일 생성

이미지를 기반으로 저장에 효율적인 고품질 썸네일을 생성하고, 이미지의 크기, 모양 및 스타일을 필요에 맞게 수정합니다. 스마트 크롭핑(cropping)을 사용하여 원래 이미지와 가로 세로 비율은 다르지만 관심 영역은 그대로인 미리 보기를 생성합니다.

실제 작동되는 방식을 확인해보세요.

이 내용으로 구축하시겠습니까?

Cognitive Services API 살펴보기

Computer Vision API

이미지에서 실용적인 정보를 추출

Face

사진에서 얼굴을 감지, 식별, 분석, 구성 및 태그 지정

Video Indexer

비디오 인사이트 활용하기

Content Moderator

자동화된 이미지, 텍스트 및 비디오 조정

Custom Vision 미리 보기

자신만의 사용 사례에 맞게 최신 컴퓨터 비전 모델을 쉽게 사용자 지정할 수 있습니다.

Text Analytics

정서와 주제를 간단히 평가하여 사용자가 원하는 것을 파악

Translator Text

간단한 REST API 호출로 손쉽게 기계 번역 수행

Bing Spell Check

앱에서 검색어 오류 감지 및 수정

Content Moderator

자동화된 이미지, 텍스트 및 비디오 조정

Language Understanding

앱이 사용자의 명령을 인식하도록 학습

Speaker Recognition 미리 보기

음성을 사용하여 개별 화자를 식별하고 확인

음성 서비스

음성 텍스트 변환, 텍스트 음성 변환 및 음성 번역을 위한 통합 음성 서비스

QnA Maker

정보를 탐색하기 쉬운 대화형 답변으로 추출합니다.