탐색 건너뛰기

Computer Vision API

이미지에서 다양한 정보를 추출하여 시각적 데이터를 분류 및 처리하고 이미지의 기계 지원 수정을 수행하여 서비스 조정을 지원합니다.

이미지 분석

이 기능은 이미지에서 찾은 시각적 콘텐츠에 대한 정보를 반환합니다. 태그 지정, 도메인 특정 모델 및 설명을 4개 언어로 사용하여 자신 있게 콘텐츠를 파악하고 레이블을 지정하세요. 잠재적인 성인 콘텐츠를 감지할 수 있도록 성인/외설 설정을 적용합니다. 사진의 이미지 형식과 색 구성표를 파악합니다.

실제 동작 확인

기능 이름:
설명 { "tags": [ "train", "platform", "station", "building", "indoor", "subway", "track", "walking", "waiting", "pulling", "board", "people", "man", "luggage", "standing", "holding", "large", "woman", "yellow", "suitcase" ], "captions": [ { "text": "people waiting at a train station", "confidence": 0.833099365 } ] }
태그 [ { "name": "train", "confidence": 0.9975446 }, { "name": "platform", "confidence": 0.995543063 }, { "name": "station", "confidence": 0.9798007 }, { "name": "indoor", "confidence": 0.927719653 }, { "name": "subway", "confidence": 0.838939846 }, { "name": "pulling", "confidence": 0.431715637 } ]
이미지 형식 "Jpeg"
이미지 차원 462 x 600
클립 아트 유형 0
선 그리기 형식 0
흑백 false
성인 콘텐츠 false
성인 점수 0.0147124995
외설 false
외설 점수 0.0162802152
범주 [ { "name": "trans_trainstation", "score": 0.98828125 } ]
얼굴 []
주요 색상 배경
"Black"
주요 색상 전경
"Black"
강조 색
#484C83

이 데모에 대한 데이터를 업로드하면 Microsoft가 해당 데이터를 저장하고 이 API를 비롯한 Microsoft 서비스를 개선하는 데 해당 데이터를 사용할 수 있다는 것에 동의하게 됩니다. 개인 정보를 보호하기 위해 데이터를 익명으로 처리하고 안전하게 유지하는 단계를 거칩니다. 데이터를 게시하거나 다른 사람이 사용하게 하지 않습니다.

이 내용을 빌드할까요?

이미지의 텍스트 읽기

OCR(광학 문자 인식)을 사용하여 이미지에서 텍스트를 감지하고 인식된 단어를 기계에서 사용 가능한 문자 스트림으로 추출합니다. 이미지를 분석하여 포함된 텍스트를 감지하고 문자 스트림을 생성하고 검색을 지원합니다. 텍스트를 복사하는 대신 사진을 찍어 시간과 노력을 절약합니다.

일반 공급되는 OCR 서비스를 시작하고 아래에서 영어에 대한 텍스트 인식 결과가 훨씬 더 향상된 새로운 미리 보기 OCR 엔진을 살펴보세요.

실제 동작 확인

  1. 미리 보기
  2. JSON

Sorry!

Have a

nice day !

Oops!

See you soon !

bye!

{
  "status": "Succeeded",
  "succeeded": true,
  "failed": false,
  "finished": true,
  "recognitionResult": {
    "lines": [
      {
        "boundingBox": [
          122,
          122,
          401,
          85,
          404,
          229,
          143,
          233
        ],
        "text": "Sorry!",
        "words": [
          {
            "boundingBox": [
              121,
              121,
              424,
              81,
              442,
              223,
              140,
              263
            ],
            "text": "Sorry!"
          }
        ]
      },
      {
        "boundingBox": [
          586,
          160,
          917,
          120,
          929,
          221,
          599,
          262
        ],
        "text": "Have a",
        "words": [
          {
            "boundingBox": [
              585,
              166,
              813,
              138,
              814,
              232,
              593,
              265
            ],
            "text": "Have"
          },
          {
            "boundingBox": [
              832,
              137,
              898,
              135,
              896,
              224,
              833,
              230
            ],
            "text": "a"
          }
        ]
      },
      {
        "boundingBox": [
          577,
          243,
          980,
          204,
          992,
          335,
          590,
          374
        ],
        "text": "nice day !",
        "words": [
          {
            "boundingBox": [
              575,
              265,
              757,
              237,
              765,
              342,
              583,
              353
            ],
            "text": "nice"
          },
          {
            "boundingBox": [
              774,
              234,
              934,
              211,
              941,
              339,
              782,
              341
            ],
            "text": "day"
          },
          {
            "boundingBox": [
              934,
              211,
              991,
              204,
              997,
              339,
              941,
              339
            ],
            "text": "!"
          }
        ]
      },
      {
        "boundingBox": [
          210,
          367,
          436,
          347,
          435,
          499,
          192,
          483
        ],
        "text": "Oops!",
        "words": [
          {
            "boundingBox": [
              192,
              368,
              452,
              345,
              466,
              495,
              205,
              519
            ],
            "text": "Oops!"
          }
        ]
      },
      {
        "boundingBox": [
          167,
          622,
          686,
          588,
          693,
          684,
          174,
          719
        ],
        "text": "See you soon !",
        "words": [
          {
            "boundingBox": [
              165,
              624,
              307,
              614,
              308,
              711,
              168,
              722
            ],
            "text": "See"
          },
          {
            "boundingBox": [
              300,
              614,
              442,
              606,
              441,
              702,
              302,
              712
            ],
            "text": "you"
          },
          {
            "boundingBox": [
              448,
              605,
              622,
              597,
              619,
              690,
              448,
              701
            ],
            "text": "soon"
          },
          {
            "boundingBox": [
              622,
              597,
              686,
              594,
              683,
              687,
              619,
              690
            ],
            "text": "!"
          }
        ]
      },
      {
        "boundingBox": [
          824,
          491,
          1010,
          482,
          1013,
          611,
          808,
          603
        ],
        "text": "bye!",
        "words": [
          {
            "boundingBox": [
              811,
              491,
              1034,
              480,
              1040,
              609,
              817,
              620
            ],
            "text": "bye!"
          }
        ]
      }
    ]
  }
}

이 데모에 대한 데이터를 업로드하면 Microsoft가 해당 데이터를 저장하고 이 API를 비롯한 Microsoft 서비스를 개선하는 데 해당 데이터를 사용할 수 있다는 것에 동의하게 됩니다. 개인 정보를 보호하기 위해 데이터를 익명으로 처리하고 안전하게 유지하는 단계를 거칩니다. 데이터를 게시하거나 다른 사람이 사용하게 하지 않습니다.

이 내용을 빌드할까요?

미리 보기: 이미지에서 필기한 텍스트 읽기

노트, 편지, 에세이, 화이트보드, 양식 및 기타 원본에서 필기한 텍스트를 감지하여 추출하세요. 받아 쓰는 대신 필기한 노트를 사진으로 찍어 종이 문서를 줄이고 생산성을 높이며 검색 기능을 구현하여 디지털 노트를 쉽게 찾을 수 있도록 만드세요. 필기 OCR은 흰색 종이, 노란색 스티커 메모 및 화이트보드와 같은 다양한 표면 및 배경에서 작동합니다.

참고: 이 기술은 현재 미리 보기로 제공되며 영어 텍스트에만 사용할 수 있습니다.

실제 동작 확인

  1. 미리 보기
  2. JSON

Our greatest glory is not

in never failing ,

but in rising every

time we fall

{
  "status": "Succeeded",
  "succeeded": true,
  "failed": false,
  "finished": true,
  "recognitionResult": {
    "lines": [
      {
        "boundingBox": [
          67,
          204,
          668,
          210,
          667,
          272,
          66,
          267
        ],
        "text": "Our greatest glory is not",
        "words": [
          {
            "boundingBox": [
              47,
              206,
              161,
              205,
              157,
              274,
              43,
              275
            ],
            "text": "Our"
          },
          {
            "boundingBox": [
              179,
              205,
              350,
              204,
              346,
              273,
              175,
              274
            ],
            "text": "greatest"
          },
          {
            "boundingBox": [
              381,
              204,
              509,
              203,
              505,
              272,
              377,
              273
            ],
            "text": "glory"
          },
          {
            "boundingBox": [
              526,
              203,
              588,
              203,
              584,
              272,
              522,
              272
            ],
            "text": "is"
          },
          {
            "boundingBox": [
              588,
              203,
              680,
              202,
              676,
              271,
              584,
              272
            ],
            "text": "not"
          }
        ]
      },
      {
        "boundingBox": [
          540,
          289,
          900,
          302,
          897,
          374,
          538,
          360
        ],
        "text": "in never failing ,",
        "words": [
          {
            "boundingBox": [
              507,
              300,
              553,
              300,
              564,
              376,
              518,
              376
            ],
            "text": "in"
          },
          {
            "boundingBox": [
              579,
              300,
              693,
              300,
              704,
              376,
              590,
              376
            ],
            "text": "never"
          },
          {
            "boundingBox": [
              712,
              300,
              872,
              300,
              883,
              376,
              723,
              376
            ],
            "text": "failing"
          },
          {
            "boundingBox": [
              864,
              300,
              902,
              300,
              913,
              376,
              875,
              376
            ],
            "text": ","
          }
        ]
      },
      {
        "boundingBox": [
          139,
          416,
          572,
          433,
          570,
          491,
          136,
          474
        ],
        "text": "but in rising every",
        "words": [
          {
            "boundingBox": [
              125,
              417,
              213,
              418,
              200,
              491,
              112,
              490
            ],
            "text": "but"
          },
          {
            "boundingBox": [
              217,
              418,
              273,
              418,
              260,
              491,
              204,
              491
            ],
            "text": "in"
          },
          {
            "boundingBox": [
              297,
              418,
              433,
              419,
              420,
              492,
              284,
              491
            ],
            "text": "rising"
          },
          {
            "boundingBox": [
              461,
              419,
              589,
              420,
              576,
              492,
              448,
              492
            ],
            "text": "every"
          }
        ]
      },
      {
        "boundingBox": [
          622,
          413,
          967,
          410,
          968,
          470,
          623,
          472
        ],
        "text": "time we fall",
        "words": [
          {
            "boundingBox": [
              612,
              407,
              718,
              409,
              709,
              470,
              603,
              468
            ],
            "text": "time"
          },
          {
            "boundingBox": [
              753,
              409,
              825,
              410,
              815,
              471,
              743,
              470
            ],
            "text": "we"
          },
          {
            "boundingBox": [
              863,
              410,
              973,
              412,
              964,
              472,
              853,
              471
            ],
            "text": "fall"
          }
        ]
      }
    ]
  }
}

이 데모에 대한 데이터를 업로드하면 Microsoft가 해당 데이터를 저장하고 이 API를 비롯한 Microsoft 서비스를 개선하는 데 해당 데이터를 사용할 수 있다는 것에 동의하게 됩니다. 개인 정보를 보호하기 위해 데이터를 익명으로 처리하고 안전하게 유지하는 단계를 거칩니다. 데이터를 게시하거나 다른 사람이 사용하게 하지 않습니다.

이 내용을 빌드할까요?

유명인 및 랜드마크 인식

전 세계 비즈니스, 정치, 스포츠 및 연예계의 유명인 200,000명뿐 아니라 자연 및 인공 랜드마크 9,000곳을 인식합니다.

실제 동작 확인

{
  "categories": [
    {
      "name": "people_",
      "score": 0.86328125,
      "detail": {
        "celebrities": [
          {
            "name": "Satya Nadella",
            "faceRectangle": {
              "left": 240,
              "top": 294,
              "width": 135,
              "height": 135
            },
            "confidence": 0.99999558925628662
          }
        ],
        "landmarks": null
      }
    }
  ],
  "adult": null,
  "tags": [
    {
      "name": "person",
      "confidence": 0.99956613779067993
    },
    {
      "name": "suit",
      "confidence": 0.98934584856033325
    },
    {
      "name": "man",
      "confidence": 0.98844343423843384
    },
    {
      "name": "outdoor",
      "confidence": 0.860062301158905
    }
  ],
  "description": {
    "tags": [
      "person",
      "suit",
      "man",
      "necktie",
      "outdoor",
      "building",
      "clothing",
      "standing",
      "wearing",
      "business",
      "looking",
      "holding",
      "black",
      "front",
      "hand",
      "dressed",
      "phone",
      "field"
    ],
    "captions": [
      {
        "text": "Satya Nadella wearing a suit and tie",
        "confidence": 0.9903275009959599
      }
    ]
  },
  "requestId": "2e6bf5a7-9023-4ed8-83ff-d699050357f5",
  "metadata": {
    "width": 600,
    "height": 900,
    "format": "Jpeg"
  },
  "faces": [
    {
      "age": 48,
      "gender": "Male",
      "faceRectangle": {
        "left": 240,
        "top": 294,
        "width": 135,
        "height": 135
      }
    }
  ],
  "color": {
    "dominantColorForeground": "Black",
    "dominantColorBackground": "Black",
    "dominantColors": [
      "Black",
      "Grey"
    ],
    "accentColor": "7B5E50",
    "isBWImg": false
  },
  "imageType": {
    "clipArtType": 0,
    "lineDrawingType": 0
  }
}

이 데모에 대한 데이터를 업로드하면 Microsoft가 해당 데이터를 저장하고 이 API를 비롯한 Microsoft 서비스를 개선하는 데 해당 데이터를 사용할 수 있다는 것에 동의하게 됩니다. 개인 정보를 보호하기 위해 데이터를 익명으로 처리하고 안전하게 유지하는 단계를 거칩니다. 데이터를 게시하거나 다른 사람이 사용하게 하지 않습니다.

이 내용을 빌드할까요?

실시간으로 비디오 분석

거의 실시간으로 비디오 분석 장치에서 비디오 프레임을 추출하고 추출한 프레임을 원하는 API 호출로 보내 비디오 파일에 Computer Vision API를 사용하세요. 비디오에서 결과를 더 빠르게 얻을 수 있습니다.

GitHub의 샘플을 사용하여 시작하고 고유한 앱을 빌드하세요.

자세한 정보

실제 동작 확인

이 내용을 빌드할까요?

축소판 그림 생성

이미지를 기반으로 저장에 효율적인 고품질 미리 보기를 생성하고 이미지의 크기, 모양 및 스타일을 필요에 맞게 수정합니다. 스마트 자르기를 사용하여 원래 이미지와 가로 세로 비율은 다르지만 관심 영역은 그대로인 미리 보기를 생성합니다.

실제 동작 확인

이 데모에 대한 데이터를 업로드하면 Microsoft가 해당 데이터를 저장하고 이 API를 비롯한 Microsoft 서비스를 개선하는 데 해당 데이터를 사용할 수 있다는 것에 동의하게 됩니다. 개인 정보를 보호하기 위해 데이터를 익명으로 처리하고 안전하게 유지하는 단계를 거칩니다. 데이터를 게시하거나 다른 사람이 사용하게 하지 않습니다.

이 내용을 빌드할까요?

Cognitive Services API 살펴보기

Computer Vision API

이미지에서 실용적인 정보를 추출

Face

사진에서 얼굴을 감지, 식별, 분석, 구성 및 태그 지정

Video Indexer 미리 보기

비디오 인사이트 활용하기

Content Moderator

자동화된 이미지, 텍스트 및 비디오 조정

Custom Vision 미리 보기

자신만의 사용 사례에 맞게 최신 컴퓨터 비전 모델을 쉽게 사용자 지정

텍스트 분석

의미 및 주제를 간단히 평가하여 사용자가 무엇을 원하는지 파악

Translator Text

간단한 REST API 호출로 기계 번역을 손쉽게 수행

Bing Spell Check

앱에서 맞춤법 오류 감지 및 수정

Content Moderator

자동화된 이미지, 텍스트 및 비디오 조정

Language Understanding

앱이 사용자의 명령을 인식하도록 학습

Bing Speech

음성을 텍스트로 변환하고 다시 음성으로 변환하여 사용자 의도 이해

화자 인식 미리 보기

음성을 사용하여 개별 화자를 식별하고 확인

Translator Speech

간단한 REST API 호출로 실시간 음성 번역을 손쉽게 수행

Custom Speech 미리 보기

말하기 스타일, 배경 소음 및 어휘와 같은 음성 인식의 장애 해결

음성 서비스 미리 보기

음성 텍스트 변환, 텍스트 음성 변환 및 음성 번역을 위한 통합 음성 서비스

QnA Maker

정보를 탐색하기 쉬운 대화형 답변으로 추출

Custom Decision 미리 보기

사용할수록 더욱 개선되는 클라우드 기반의 상황에 따른 의사 결정 API

앱을 강화할 준비가 되셨나요?