Компьютерное зрение

Извлекайте из изображений ценные сведения для классификации и обработки визуальных данных, а функция машинной модерации обеспечит необходимый контроль за вашими службами.

Анализ изображения

Эта функция возвращает информацию о визуальном содержимом изображений. Используйте добавление тегов, модели и описания на четырех языках, предназначенные для определенных сфер, для безошибочного определения и обозначения содержимого. Используйте функцию обнаружения объектов, чтобы определить расположение тысяч различных объектов на изображении. Примените настройки содержимого для взрослых или материалов непристойного характера, чтобы помочь вам определить потенциальное содержимое для взрослых. Определяйте типы изображений и цветовые схемы на фотографиях.

Оцените работу решения в действии

person
person
subway train
Название функции: Значение
Объекты [ { "rectangle": { "x": 93, "y": 178, "w": 115, "h": 237 }, "object": "person", "confidence": 0.764 }, { "rectangle": { "x": 0, "y": 229, "w": 101, "h": 206 }, "object": "person", "confidence": 0.624 }, { "rectangle": { "x": 161, "y": 31, "w": 439, "h": 423 }, "object": "subway train", "parent": { "object": "train", "parent": { "object": "Land vehicle", "parent": { "object": "Vehicle", "confidence": 0.926 }, "confidence": 0.923 }, "confidence": 0.917 }, "confidence": 0.801 } ]
Теги [ { "name": "train", "confidence": 0.9975446 }, { "name": "platform", "confidence": 0.9955431 }, { "name": "station", "confidence": 0.979800761 }, { "name": "indoor", "confidence": 0.9277198 }, { "name": "subway", "confidence": 0.8389395 }, { "name": "clothing", "confidence": 0.5043765 }, { "name": "pulling", "confidence": 0.4317162 } ]
Описание { "tags": [ "train", "platform", "station", "building", "indoor", "subway", "track", "walking", "waiting", "pulling", "board", "people", "man", "luggage", "standing", "holding", "large", "woman", "yellow", "suitcase" ], "captions": [ { "text": "people waiting at a train station", "confidence": 0.8330992 } ] }
Формат изображения "Jpeg"
Размеры изображения 462 x 600
Тип изображения 0
Тип графического изображения 0
Черно-белая фотография false
Материалы для взрослых false
Оценка зрелости 0.009112834
Неприличность false
Оценка неприличности 0.0143244695
Категории [ { "name": "trans_trainstation", "score": 0.98828125 } ]
Лица []
Преобладающий цветовой фон
"Black"
Преобладающий цвет переднего плана
"Black"
Цветовой акцент
#484C83

Хотите создать подобное?

Выпущена общедоступная версия функции для считывания печатного и рукописного текста на изображениях

Новейшая функция оптического распознавания текста (OCR) в операции чтения позволяет обнаруживать печатный и рукописный текст на изображениях и извлекать распознанные слова в машиночитаемые потоки символов, а также поддерживает поиск. Экономьте время и силы, фотографируя текст, вместо того чтобы копировать его.

Оцените работу решения в действии

  1. Предварительная версия
  2. JSON

Sorry!

Have a

Oops!

nice day !

See you soon !

Bye !

{
  "status": "Succeeded",
  "succeeded": true,
  "failed": false,
  "finished": true,
  "recognitionResults": [
    {
      "page": 1,
      "clockwiseOrientation": 353.71,
      "width": 1138,
      "height": 825,
      "unit": "pixel",
      "lines": [
        {
          "boundingBox": [
            124,
            126,
            399,
            90,
            407,
            199,
            140,
            229
          ],
          "text": "Sorry!",
          "words": [
            {
              "boundingBox": [
                137,
                121,
                397,
                89,
                410,
                198,
                150,
                229
              ],
              "text": "Sorry!"
            }
          ]
        },
        {
          "boundingBox": [
            591,
            173,
            908,
            124,
            921,
            207,
            604,
            256
          ],
          "text": "Have a",
          "words": [
            {
              "boundingBox": [
                598,
                173,
                812,
                140,
                824,
                224,
                610,
                256
              ],
              "text": "Have"
            },
            {
              "boundingBox": [
                834,
                136,
                894,
                127,
                906,
                212,
                846,
                221
              ],
              "text": "a"
            }
          ]
        },
        {
          "boundingBox": [
            199,
            379,
            424,
            365,
            423,
            476,
            209,
            488
          ],
          "text": "Oops!",
          "words": [
            {
              "boundingBox": [
                205,
                377,
                420,
                364,
                426,
                475,
                212,
                488
              ],
              "text": "Oops!"
            }
          ]
        },
        {
          "boundingBox": [
            583,
            267,
            973,
            224,
            982,
            305,
            592,
            348
          ],
          "text": "nice day !",
          "words": [
            {
              "boundingBox": [
                584,
                271,
                762,
                251,
                771,
                330,
                593,
                344
              ],
              "text": "nice"
            },
            {
              "boundingBox": [
                810,
                245,
                940,
                229,
                949,
                310,
                819,
                325
              ],
              "text": "day"
            },
            {
              "boundingBox": [
                954,
                227,
                973,
                225,
                982,
                306,
                963,
                308
              ],
              "text": "!"
            }
          ]
        },
        {
          "boundingBox": [
            166,
            628,
            662,
            599,
            667,
            683,
            170,
            712
          ],
          "text": "See you soon !",
          "words": [
            {
              "boundingBox": [
                172,
                628,
                295,
                624,
                300,
                704,
                178,
                712
              ],
              "text": "See"
            },
            {
              "boundingBox": [
                312,
                623,
                446,
                618,
                449,
                692,
                316,
                702
              ],
              "text": "you"
            },
            {
              "boundingBox": [
                463,
                617,
                620,
                611,
                620,
                680,
                465,
                691
              ],
              "text": "soon"
            },
            {
              "boundingBox": [
                636,
                610,
                659,
                609,
                658,
                677,
                636,
                679
              ],
              "text": "!"
            }
          ]
        },
        {
          "boundingBox": [
            824,
            498,
            1003,
            489,
            1014,
            594,
            834,
            607
          ],
          "text": "Bye !",
          "words": [
            {
              "boundingBox": [
                830,
                497,
                961,
                489,
                967,
                598,
                837,
                606
              ],
              "text": "Bye"
            },
            {
              "boundingBox": [
                982,
                488,
                1004,
                486,
                1011,
                595,
                989,
                597
              ],
              "text": "!"
            }
          ]
        }
      ]
    }
  ]
}

Результаты демонстрации предоставляются исключительно в качестве примера — из-за небольшой предварительной обработки изображения фактические результаты API могут отличаться.

Хотите создать подобное?

Распознавание торговых марок, знаменитостей и черт лица

Распознавайте более 1 500 мировых торговых марок и логотипов, 1 миллиона известных деятелей бизнеса, политики, спорта и индустрии развлечений, а также 9 000 природных и рукотворных достопримечательностей со всего мира.

Оцените работу решения в действии

{
  "categories": [
    {
      "name": "people_",
      "score": 0.86328125,
      "detail": {
        "celebrities": [
          {
            "name": "Satya Nadella",
            "faceRectangle": {
              "left": 240,
              "top": 294,
              "width": 135,
              "height": 135
            },
            "confidence": 0.99984323978424072
          }
        ],
        "landmarks": null
      }
    }
  ],
  "adult": null,
  "tags": [
    {
      "name": "person",
      "confidence": 0.99956607818603516
    },
    {
      "name": "suit",
      "confidence": 0.98934578895568848
    },
    {
      "name": "man",
      "confidence": 0.98844337463378906
    },
    {
      "name": "tie",
      "confidence": 0.959053635597229
    },
    {
      "name": "human face",
      "confidence": 0.95430314540863037
    },
    {
      "name": "clothing",
      "confidence": 0.860575795173645
    },
    {
      "name": "smile",
      "confidence": 0.8601078987121582
    },
    {
      "name": "outdoor",
      "confidence": 0.86006265878677368
    },
    {
      "name": "glasses",
      "confidence": 0.68438893556594849
    }
  ],
  "description": {
    "tags": [
      "person",
      "suit",
      "man",
      "necktie",
      "outdoor",
      "building",
      "clothing",
      "standing",
      "wearing",
      "business",
      "looking",
      "holding",
      "black",
      "front",
      "hand",
      "dressed",
      "phone",
      "field"
    ],
    "captions": [
      {
        "text": "Satya Nadella wearing a suit and tie",
        "confidence": 0.99032749706305134
      }
    ]
  },
  "requestId": "fe522d83-a0e3-42d5-9e87-d1071b8f9d00",
  "metadata": {
    "width": 600,
    "height": 900,
    "format": "Jpeg"
  },
  "faces": [
    {
      "age": 49,
      "gender": "Male",
      "faceRectangle": {
        "left": 240,
        "top": 294,
        "width": 135,
        "height": 135
      }
    }
  ],
  "color": {
    "dominantColorForeground": "Black",
    "dominantColorBackground": "Black",
    "dominantColors": [
      "Black",
      "Grey"
    ],
    "accentColor": "7B5E50",
    "isBWImg": false
  },
  "imageType": {
    "clipArtType": 0,
    "lineDrawingType": 0
  },
  "brands": []
}

Хотите создать подобное?

Анализ видео практически в реальном времени

Анализ видео практически в реальном времени. Используйте любой из API компьютерного зрения с видеофайлами, извлекая кадры из видео на своем устройстве и отправляя эти кадры в любые вызовы API. Быстрее получайте результаты анализа видео.

Воспользуйтесь нашим примером на сайте GitHub, чтобы начать работу и создать собственное приложение.

Подробнее

Оцените работу решения в действии

Хотите создать подобное?

Создание эскизов

Создавайте высококачественные, удобные в хранении эскизы из любых входных изображений в соответствии с вашими требованиями к размеру, форме и стилю. Используйте интеллектуальную обрезку, чтобы создавать эскизы, которые отличаются от исходных изображений пропорциями, но содержат интересующую вас область.

Оцените работу решения в действии

Хотите создать подобное?

"We can use the Computer Vision API to prove to our clients the reliability of the data, so they can be confident making important business decisions based on that information"

Лендерт де Вогд (Leendert de Voogd), генеральный директор | Vigiglobe
vigiglobe

"It didn't take us long to realize Microsoft Cognitive Services had handed us a powerful set of computer-vision and artificial-intelligence tools that we could use to create great apps and new features for our customers in just a few hours"

Джон Фен (John Fan), сооснователь и генеральный директор | Cardinal Blue Software
Pic Collage

"Because the Cognitive Services APIs harness the power of machine learning, we were able to bring advanced intelligence into our product without the need to have a team of data scientists on hand"

Аарон Эделл (Aaron Edell), руководитель проекта | GrayMeta
GrayMeta

"We found Cognitive Services to be the missing piece in the equation, the one that we needed to bring this solution to market and really revolutionize the way people look at video"

Кэти Макканн (Katie McCann), вице-президент отдела управления продукцией и проектирования | Prism Skylabs
Prism Skylabs

"Microsoft Cognitive Services gives us a huge range of opportunities. It's a perfect match for us now, and in the future when we want to add more features to our app"

Яан Апаялахти (Jaan Apajalahti), генеральный директор | Blucup
Blucup

"Using the Cognitive Services APIs, it took us three months to develop a test pair of glasses that can translate text and images into speech, identify emotions, and describe scenery.If we had been working full time, we could have done it in two weeks"

Бенуа Ширутэ (Benoit Chirouter), руководитель отдела исследовательской работы | Pivothead
Pivothead

Знакомство с API-интерфейсами Cognitive Services

Компьютерное зрение

Извлечение важнейшей информации из изображений

Распознавание лиц

Распознает, опознает, анализирует, группирует и помечает тегами лица на фотографиях

Распознаватель рукописного текста ПРЕДВАРИТЕЛЬНАЯ ВЕРСИЯ

Служба ИИ, распознающая содержимое рукописного ввода, включая записи от руки, формы и документы

Индексатор видео

Получите все преимущества анализа видео

Пользовательское визуальное распознавание

Простая настройка новейших моделей компьютерного зрения для конкретных вариантов использования

Распознаватель документов ПРЕДВАРИТЕЛЬНАЯ ВЕРСИЯ

Служба извлечения документов с поддержкой АА, распознающая формы

Анализ текста

Легко оценивайте мнение и темы, чтобы узнать желания пользователей

Перевод текстов

Легко выполняйте машинный перевод текста с помощью простого вызова REST API

QnA Maker

Преобразуйте информацию в ответы, представленные в режиме диалога с удобной навигацией

Распознавание речи

Научите свои приложения понимать команды пользователей

Иммерсивное средство чтения ПРЕДВАРИТЕЛЬНАЯ ВЕРСИЯ

Упростите чтение и понимание текста для пользователей разных возрастов и с разными возможностями

Службы речи

Унифицированные службы речи для преобразования речи в текст, текста в речь и перевода речи

Распознавание говорящего ПРЕДВАРИТЕЛЬНАЯ ВЕРСИЯ

Используйте речь, чтобы идентифицировать и проверить отдельных говорящих

Content Moderator

Автоматическая модерация изображений, текста и видео

Детектор аномалий ПРЕДВАРИТЕЛЬНАЯ ВЕРСИЯ

Без труда внедряйте возможности обнаружения аномалий в свои приложения.

Персонализатор ПРЕДВАРИТЕЛЬНАЯ ВЕРСИЯ

Служба ИИ, которая обеспечивает персонализированную работу

Готовы ускорить работу своего приложения по максимуму?