Компьютерное зрение

Извлекайте из изображений ценные сведения для классификации и обработки визуальных данных, а функция машинной модерации обеспечит необходимый контроль за вашими службами.

Анализ изображения

Эта функция возвращает информацию о визуальном содержимом изображений. Используйте добавление тегов, модели и описания на четырех языках, предназначенные для определенных сфер, для безошибочного определения и обозначения содержимого. Используйте функцию обнаружения объектов, чтобы определить расположение тысяч различных объектов на изображении. Примените настройки содержимого для взрослых или материалов непристойного характера, чтобы помочь вам определить потенциальное содержимое для взрослых. Определяйте типы изображений и цветовые схемы на фотографиях.

Оцените работу решения в действии

person
person
subway train
Название функции: Значение
Объекты [ { "rectangle": { "x": 93, "y": 178, "w": 115, "h": 237 }, "object": "person", "confidence": 0.764 }, { "rectangle": { "x": 0, "y": 229, "w": 101, "h": 206 }, "object": "person", "confidence": 0.624 }, { "rectangle": { "x": 161, "y": 31, "w": 439, "h": 423 }, "object": "subway train", "parent": { "object": "train", "parent": { "object": "Land vehicle", "parent": { "object": "Vehicle", "confidence": 0.926 }, "confidence": 0.923 }, "confidence": 0.917 }, "confidence": 0.801 } ]
Теги [ { "name": "train", "confidence": 0.9975446 }, { "name": "platform", "confidence": 0.9955431 }, { "name": "station", "confidence": 0.979800761 }, { "name": "indoor", "confidence": 0.9277198 }, { "name": "subway", "confidence": 0.8389395 }, { "name": "clothing", "confidence": 0.5043765 }, { "name": "pulling", "confidence": 0.4317162 } ]
Описание { "tags": [ "train", "platform", "station", "building", "indoor", "subway", "track", "walking", "waiting", "pulling", "board", "people", "man", "luggage", "standing", "holding", "large", "woman", "yellow", "suitcase" ], "captions": [ { "text": "people waiting at a train station", "confidence": 0.8330992 } ] }
Формат изображения "Jpeg"
Размеры изображения 462 x 600
Тип изображения 0
Тип графического изображения 0
Черно-белая фотография false
Материалы для взрослых false
Оценка зрелости 0.009112834
Неприличность false
Оценка неприличности 0.0143244695
Категории [ { "name": "trans_trainstation", "score": 0.98828125 } ]
Лица []
Преобладающий цветовой фон
"Black"
Преобладающий цвет переднего плана
"Black"
Цветовой акцент
#484C83

Хотите создать подобное?

Выпущена общедоступная версия функции для считывания печатного и рукописного текста на изображениях

Новейшая функция оптического распознавания текста (OCR) в операции чтения позволяет обнаруживать печатный и рукописный текст на изображениях и извлекать распознанные слова в машиночитаемые потоки символов, а также поддерживает поиск. Экономьте время и силы, фотографируя текст, вместо того чтобы копировать его.

Оцените работу решения в действии

  1. Предварительная версия
  2. JSON

Sorry!

Have a

Oops!

nice day !

See you soon !

Bye !

{
  "status": "Succeeded",
  "succeeded": true,
  "failed": false,
  "finished": true,
  "recognitionResults": [
    {
      "page": 1,
      "clockwiseOrientation": 353.71,
      "width": 1138,
      "height": 825,
      "unit": "pixel",
      "lines": [
        {
          "boundingBox": [
            124,
            126,
            399,
            90,
            407,
            199,
            140,
            229
          ],
          "text": "Sorry!",
          "words": [
            {
              "boundingBox": [
                137,
                121,
                397,
                89,
                410,
                198,
                150,
                229
              ],
              "text": "Sorry!"
            }
          ]
        },
        {
          "boundingBox": [
            591,
            173,
            908,
            124,
            921,
            207,
            604,
            256
          ],
          "text": "Have a",
          "words": [
            {
              "boundingBox": [
                598,
                173,
                812,
                140,
                824,
                224,
                610,
                256
              ],
              "text": "Have"
            },
            {
              "boundingBox": [
                834,
                136,
                894,
                127,
                906,
                212,
                846,
                221
              ],
              "text": "a"
            }
          ]
        },
        {
          "boundingBox": [
            199,
            379,
            424,
            365,
            423,
            476,
            209,
            488
          ],
          "text": "Oops!",
          "words": [
            {
              "boundingBox": [
                205,
                377,
                420,
                364,
                426,
                475,
                212,
                488
              ],
              "text": "Oops!"
            }
          ]
        },
        {
          "boundingBox": [
            583,
            267,
            973,
            224,
            982,
            305,
            592,
            348
          ],
          "text": "nice day !",
          "words": [
            {
              "boundingBox": [
                584,
                271,
                762,
                251,
                771,
                330,
                593,
                344
              ],
              "text": "nice"
            },
            {
              "boundingBox": [
                810,
                245,
                940,
                229,
                949,
                310,
                819,
                325
              ],
              "text": "day"
            },
            {
              "boundingBox": [
                954,
                227,
                973,
                225,
                982,
                306,
                963,
                308
              ],
              "text": "!"
            }
          ]
        },
        {
          "boundingBox": [
            166,
            628,
            662,
            599,
            667,
            683,
            170,
            712
          ],
          "text": "See you soon !",
          "words": [
            {
              "boundingBox": [
                172,
                628,
                295,
                624,
                300,
                704,
                178,
                712
              ],
              "text": "See"
            },
            {
              "boundingBox": [
                312,
                623,
                446,
                618,
                449,
                692,
                316,
                702
              ],
              "text": "you"
            },
            {
              "boundingBox": [
                463,
                617,
                620,
                611,
                620,
                680,
                465,
                691
              ],
              "text": "soon"
            },
            {
              "boundingBox": [
                636,
                610,
                659,
                609,
                658,
                677,
                636,
                679
              ],
              "text": "!"
            }
          ]
        },
        {
          "boundingBox": [
            824,
            498,
            1003,
            489,
            1014,
            594,
            834,
            607
          ],
          "text": "Bye !",
          "words": [
            {
              "boundingBox": [
                830,
                497,
                961,
                489,
                967,
                598,
                837,
                606
              ],
              "text": "Bye"
            },
            {
              "boundingBox": [
                982,
                488,
                1004,
                486,
                1011,
                595,
                989,
                597
              ],
              "text": "!"
            }
          ]
        }
      ]
    }
  ]
}

Результаты демонстрации предоставляются исключительно в качестве примера — из-за небольшой предварительной обработки изображения фактические результаты API могут отличаться.

Хотите создать подобное?

Распознавание торговых марок, знаменитостей и черт лица

Распознавайте более 1 500 мировых торговых марок и логотипов, 1 миллиона известных деятелей бизнеса, политики, спорта и индустрии развлечений, а также 9 000 природных и рукотворных достопримечательностей со всего мира.

Оцените работу решения в действии

{
  "categories": [
    {
      "name": "people_",
      "score": 0.86328125,
      "detail": {
        "celebrities": [
          {
            "name": "Satya Nadella",
            "faceRectangle": {
              "left": 240,
              "top": 294,
              "width": 135,
              "height": 135
            },
            "confidence": 0.99984323978424072
          }
        ],
        "landmarks": null
      }
    }
  ],
  "adult": null,
  "tags": [
    {
      "name": "person",
      "confidence": 0.99956607818603516
    },
    {
      "name": "suit",
      "confidence": 0.98934578895568848
    },
    {
      "name": "man",
      "confidence": 0.98844337463378906
    },
    {
      "name": "tie",
      "confidence": 0.959053635597229
    },
    {
      "name": "human face",
      "confidence": 0.95430314540863037
    },
    {
      "name": "clothing",
      "confidence": 0.860575795173645
    },
    {
      "name": "smile",
      "confidence": 0.8601078987121582
    },
    {
      "name": "outdoor",
      "confidence": 0.86006265878677368
    },
    {
      "name": "glasses",
      "confidence": 0.68438893556594849
    }
  ],
  "description": {
    "tags": [
      "person",
      "suit",
      "man",
      "necktie",
      "outdoor",
      "building",
      "clothing",
      "standing",
      "wearing",
      "business",
      "looking",
      "holding",
      "black",
      "front",
      "hand",
      "dressed",
      "phone",
      "field"
    ],
    "captions": [
      {
        "text": "Satya Nadella wearing a suit and tie",
        "confidence": 0.99032749706305134
      }
    ]
  },
  "requestId": "df179870-8f31-483f-959b-0a03918839cb",
  "metadata": {
    "width": 600,
    "height": 900,
    "format": "Jpeg"
  },
  "faces": [
    {
      "age": 49,
      "gender": "Male",
      "faceRectangle": {
        "left": 240,
        "top": 294,
        "width": 135,
        "height": 135
      }
    }
  ],
  "color": {
    "dominantColorForeground": "Black",
    "dominantColorBackground": "Black",
    "dominantColors": [
      "Black",
      "Grey"
    ],
    "accentColor": "7B5E50",
    "isBWImg": false
  },
  "imageType": {
    "clipArtType": 0,
    "lineDrawingType": 0
  },
  "brands": []
}

Хотите создать подобное?

Анализ видео практически в реальном времени

Анализ видео практически в реальном времени. Используйте любой из API компьютерного зрения с видеофайлами, извлекая кадры из видео на своем устройстве и отправляя эти кадры в любые вызовы API. Быстрее получайте результаты анализа видео.

Воспользуйтесь нашим примером на сайте GitHub, чтобы начать работу и создать собственное приложение.

Подробнее

Оцените работу решения в действии

Хотите создать подобное?

Создание эскизов

Создавайте высококачественные, удобные в хранении эскизы из любых входных изображений в соответствии с вашими требованиями к размеру, форме и стилю. Используйте интеллектуальную обрезку, чтобы создавать эскизы, которые отличаются от исходных изображений пропорциями, но содержат интересующую вас область.

Оцените работу решения в действии

Хотите создать подобное?

Знакомство с API-интерфейсами Cognitive Services

Компьютерное зрение

Извлечение важнейшей информации из изображений

Распознавание лиц

Распознает, опознает, анализирует, группирует и помечает тегами лица на фотографиях

Распознаватель рукописного текста ПРЕДВАРИТЕЛЬНАЯ ВЕРСИЯ

Служба ИИ, распознающая содержимое рукописного ввода, включая записи от руки, формы и документы

Индексатор видео

Получите все преимущества анализа видео

Пользовательское визуальное распознавание

Простая настройка новейших моделей компьютерного зрения для конкретных вариантов использования

Распознаватель документов ПРЕДВАРИТЕЛЬНАЯ ВЕРСИЯ

Служба извлечения документов с поддержкой АА, распознающая формы

Анализ текста

Легко оценивайте мнение и темы, чтобы узнать желания пользователей

Перевод текстов

Легко выполняйте машинный перевод текста с помощью простого вызова REST API

QnA Maker

Преобразуйте информацию в ответы, представленные в режиме диалога с удобной навигацией

Распознавание речи

Научите свои приложения понимать команды пользователей

Иммерсивное средство чтения ПРЕДВАРИТЕЛЬНАЯ ВЕРСИЯ

Упростите чтение и понимание текста для пользователей разных возрастов и с разными возможностями

Службы речи

Унифицированные службы речи для преобразования речи в текст, текста в речь и перевода речи

Распознавание говорящего ПРЕДВАРИТЕЛЬНАЯ ВЕРСИЯ

Используйте речь, чтобы идентифицировать и проверить отдельных говорящих

Content Moderator

Автоматическая модерация изображений, текста и видео

Детектор аномалий ПРЕДВАРИТЕЛЬНАЯ ВЕРСИЯ

Без труда внедряйте возможности обнаружения аномалий в свои приложения.

Персонализатор ПРЕДВАРИТЕЛЬНАЯ ВЕРСИЯ

Служба ИИ, которая обеспечивает персонализированную работу

Готовы ускорить работу своего приложения по максимуму?