API компьютерного зрения

Извлекайте из изображений ценные сведения для классификации и обработки визуальных данных, а функция машинной модерации обеспечит необходимый контроль за вашими службами.

Анализ изображения

Эта функция возвращает информацию о визуальном содержимом изображений. Используйте добавление тегов, описания и модели, предназначенные для определенных сфер, для безошибочного определения и обозначения содержимого. Используйте параметры для определения непристойных материалов и содержимого для взрослых, чтобы включить автоматическое ограничение такого содержимого. Определяйте типы изображений и цветовые схемы на фотографиях.

Оцените работу решения в действии

Пол Male
Возраст 36
Название функции: Значение
Описание { "tags": [ "water", "swimming", "sport", "pool", "person", "man", "frisbee", "ocean", "blue", "bird", "riding", "top", "standing", "wave", "young", "body", "large", "game", "glass", "pond", "playing", "board", "catch", "clear", "boat", "white" ], "captions": [ { "text": "a man swimming in a pool of water", "confidence": 0.8909298 } ] }
Теги [ { "name": "water", "confidence": 0.9997857 }, { "name": "swimming", "confidence": 0.955619633 }, { "name": "sport", "confidence": 0.953807831 }, { "name": "pool", "confidence": 0.9515978 }, { "name": "person", "confidence": 0.889862537 }, { "name": "water sport", "confidence": 0.664259 } ]
Формат изображения "Jpeg"
Размеры изображения 462 x 600
Тип изображения 0
Тип графического изображения 0
Черно-белая фотография false
Материалы для взрослых false
Оценка зрелости 0.07518345
Неприличность false
Оценка неприличности 0.1814024
Категории [ { "name": "people_swimming", "score": 0.98046875 } ]
Лица [ { "age": 36, "gender": "Male", "faceRectangle": { "top": 133, "left": 298, "width": 121, "height": 121 } } ]
Преобладающий цветовой фон
"White"
Преобладающий цвет переднего плана
"Grey"
Цветовой акцент
#19A4B2

Хотите создать подобное?

Считывание текста на изображениях

Функция оптического распознавания символов (OCR) позволяет выявлять текст на изображениях и извлекать распознанные слова в поток символов, пригодный для машинного чтения. С помощью анализа изображений можно распознавать встроенный текст, создавать потоки символов и использовать поиск. Фотографируйте, а не копируйте текст — это позволит вам сэкономить время и силы.

Оцените работу решения в действии

  1. Предварительная версия
  2. JSON

IF WE DID

ALL

THE THINGS

WE ARE

CAPABLÉ•

OF DOING,

WE WOULD

LITERALLY

ASTOUND

QURSELV*S.

{
  "textAngle": 0.0,
  "orientation": "NotDetected",
  "language": "en",
  "regions": [
    {
      "boundingBox": "316,47,284,340",
      "lines": [
        {
          "boundingBox": "319,47,182,24",
          "words": [
            {
              "boundingBox": "319,47,42,24",
              "text": "IF"
            },
            {
              "boundingBox": "375,47,44,24",
              "text": "WE"
            },
            {
              "boundingBox": "435,47,66,23",
              "text": "DID"
            }
          ]
        },
        {
          "boundingBox": "316,74,204,69",
          "words": [
            {
              "boundingBox": "316,74,204,69",
              "text": "ALL"
            }
          ]
        },
        {
          "boundingBox": "318,147,207,24",
          "words": [
            {
              "boundingBox": "318,147,63,24",
              "text": "THE"
            },
            {
              "boundingBox": "397,147,128,24",
              "text": "THINGS"
            }
          ]
        },
        {
          "boundingBox": "316,176,125,23",
          "words": [
            {
              "boundingBox": "316,176,44,23",
              "text": "WE"
            },
            {
              "boundingBox": "375,176,66,23",
              "text": "ARE"
            }
          ]
        },
        {
          "boundingBox": "319,194,281,44",
          "words": [
            {
              "boundingBox": "319,194,281,44",
              "text": "CAPABLÉ•"
            }
          ]
        },
        {
          "boundingBox": "318,243,181,29",
          "words": [
            {
              "boundingBox": "318,243,43,23",
              "text": "OF"
            },
            {
              "boundingBox": "376,243,123,29",
              "text": "DOING,"
            }
          ]
        },
        {
          "boundingBox": "316,271,170,24",
          "words": [
            {
              "boundingBox": "316,272,44,23",
              "text": "WE"
            },
            {
              "boundingBox": "375,271,111,24",
              "text": "WOULD"
            }
          ]
        },
        {
          "boundingBox": "317,300,200,24",
          "words": [
            {
              "boundingBox": "317,300,200,24",
              "text": "LITERALLY"
            }
          ]
        },
        {
          "boundingBox": "316,328,157,24",
          "words": [
            {
              "boundingBox": "316,328,157,24",
              "text": "ASTOUND"
            }
          ]
        },
        {
          "boundingBox": "318,357,214,30",
          "words": [
            {
              "boundingBox": "318,357,214,30",
              "text": "QURSELV*S."
            }
          ]
        }
      ]
    }
  ]
}

Отправляя данные для этой демоверсии, вы соглашаетесь с тем, что корпорация Майкрософт может хранить их, а также использовать для улучшения работы служб Майкрософт, включая этот API-интерфейс. Чтобы обеспечить вашу конфиденциальность, мы обезличиваем данные и заботимся об их безопасности. Мы не опубликуем ваши данные и не позволим другим лицам использовать их.

Хотите создать подобное?

Считывание рукописных текстов с изображений (предварительная версия)

Эта технология (рукописного оптического распознавания символов) позволит вам обнаружить и извлечь рукописные тексты из заметок, писем, эссе, настенных досок, форм и т. д. Она используется при работе с различными поверхностями и фоном, например с техническими документами, желтыми стикерами и настенными досками.

Функция распознавания рукописного текста позволит сэкономить время и усилия, а также повысить продуктивность работы. Вы можете всего лишь сфотографировать изображения с текстом, а не переписывать их. Кроме того, предоставляется возможность переводить заметки в цифровую форму, что эффективно для реализации быстрого поиска. Вы также сможете избавиться от ненужных печатных документов.

Примечание. Сейчас доступна предварительная версия этой технологии. Пока что она может распознавать тексты только на английском языке.

Чтобы ознакомиться с этой демонстрационной версией оптического распознавания символов, отправьте локально сохраненное изображение или укажите URL-адрес этого изображения. Мы не сохраняем изображения, которые вы отправляете для использования данной демонстрационной версии продукта, без вашего разрешения.

Оцените работу решения в действии

  1. Предварительная версия
  2. JSON

OUR greatest glory is not

i never failing ,

but in rising every

time we fall

{
  "status": "Succeeded",
  "succeeded": true,
  "failed": false,
  "finished": true,
  "recognitionResult": {
    "lines": [
      {
        "boundingBox": [
          67,
          204,
          668,
          210,
          667,
          272,
          66,
          267
        ],
        "text": "OUR greatest glory is not",
        "words": [
          {
            "boundingBox": [
              69,
              206,
              159,
              205,
              155,
              274,
              65,
              275
            ],
            "text": "OUR"
          },
          {
            "boundingBox": [
              192,
              205,
              350,
              204,
              346,
              273,
              188,
              274
            ],
            "text": "greatest"
          },
          {
            "boundingBox": [
              393,
              204,
              509,
              203,
              505,
              272,
              389,
              273
            ],
            "text": "glory"
          },
          {
            "boundingBox": [
              539,
              203,
              588,
              203,
              584,
              272,
              534,
              272
            ],
            "text": "is"
          },
          {
            "boundingBox": [
              601,
              202,
              680,
              202,
              676,
              271,
              597,
              271
            ],
            "text": "not"
          }
        ]
      },
      {
        "boundingBox": [
          540,
          289,
          900,
          302,
          897,
          374,
          538,
          360
        ],
        "text": "i never failing ,",
        "words": [
          {
            "boundingBox": [
              534,
              300,
              558,
              300,
              568,
              376,
              545,
              376
            ],
            "text": "i"
          },
          {
            "boundingBox": [
              589,
              300,
              694,
              300,
              705,
              376,
              600,
              376
            ],
            "text": "never"
          },
          {
            "boundingBox": [
              720,
              300,
              874,
              300,
              885,
              376,
              731,
              376
            ],
            "text": "failing"
          },
          {
            "boundingBox": [
              877,
              300,
              905,
              300,
              916,
              376,
              888,
              376
            ],
            "text": ","
          }
        ]
      },
      {
        "boundingBox": [
          139,
          416,
          572,
          433,
          570,
          491,
          136,
          474
        ],
        "text": "but in rising every",
        "words": [
          {
            "boundingBox": [
              145,
              418,
              215,
              418,
              202,
              491,
              132,
              491
            ],
            "text": "but"
          },
          {
            "boundingBox": [
              227,
              418,
              275,
              418,
              262,
              491,
              214,
              491
            ],
            "text": "in"
          },
          {
            "boundingBox": [
              308,
              418,
              428,
              419,
              415,
              492,
              295,
              491
            ],
            "text": "rising"
          },
          {
            "boundingBox": [
              476,
              419,
              581,
              419,
              568,
              492,
              463,
              492
            ],
            "text": "every"
          }
        ]
      },
      {
        "boundingBox": [
          622,
          413,
          967,
          410,
          968,
          470,
          623,
          472
        ],
        "text": "time we fall",
        "words": [
          {
            "boundingBox": [
              627,
              408,
              722,
              409,
              713,
              470,
              618,
              468
            ],
            "text": "time"
          },
          {
            "boundingBox": [
              765,
              409,
              828,
              410,
              818,
              471,
              756,
              470
            ],
            "text": "we"
          },
          {
            "boundingBox": [
              873,
              410,
              976,
              412,
              967,
              472,
              864,
              471
            ],
            "text": "fall"
          }
        ]
      }
    ]
  }
}

Хотите создать подобное?

Распознавание знаменитостей и черт лица

Модели знаменитостей и черт лица — это примеры моделей, предназначенных для определенных сфер. Наша модель распознавания знаменитостей может распознать 200 000 известных деятелей бизнеса, политики, спорта и индустрии развлечений. Модель распознавания черт лица может распознать 9000 естественных и искусственных ориентиров со всего мира. Модели, предназначенные для определенных сфер, — это постоянно совершенствующаяся функция API компьютерного зрения.

Оцените работу решения в действии

{
  "categories": [
    {
      "name": "people_",
      "score": 0.86328125,
      "detail": {
        "celebrities": [
          {
            "name": "Satya Nadella",
            "faceRectangle": {
              "left": 239,
              "top": 293,
              "width": 138,
              "height": 138
            },
            "confidence": 0.9999974
          }
        ],
        "landmarks": null
      }
    }
  ],
  "adult": null,
  "tags": [
    {
      "name": "person",
      "confidence": 0.99956613779067993
    },
    {
      "name": "suit",
      "confidence": 0.98934584856033325
    },
    {
      "name": "man",
      "confidence": 0.98844343423843384
    },
    {
      "name": "outdoor",
      "confidence": 0.860062301158905
    }
  ],
  "description": {
    "tags": [
      "person",
      "suit",
      "man",
      "necktie",
      "outdoor",
      "building",
      "clothing",
      "standing",
      "wearing",
      "business",
      "looking",
      "holding",
      "black",
      "front",
      "hand",
      "dressed",
      "phone",
      "field"
    ],
    "captions": [
      {
        "text": "Satya Nadella wearing a suit and tie",
        "confidence": 0.99033389849736619
      }
    ]
  },
  "requestId": "6f854feb-7e84-45ad-81cb-9fd7364f8d9c",
  "metadata": {
    "width": 600,
    "height": 900,
    "format": "Jpeg"
  },
  "faces": [
    {
      "age": 49,
      "gender": "Male",
      "faceRectangle": {
        "left": 239,
        "top": 293,
        "width": 138,
        "height": 138
      }
    }
  ],
  "color": {
    "dominantColorForeground": "Black",
    "dominantColorBackground": "Black",
    "dominantColors": [
      "Black",
      "Grey"
    ],
    "accentColor": "7B5E50",
    "isBWImg": false
  },
  "imageType": {
    "clipArtType": 0,
    "lineDrawingType": 0
  }
}

Хотите создать подобное?

Анализ видео практически в реальном времени

Анализ видео практически в реальном времени. Используйте любой из API компьютерного зрения с видеофайлами, извлекая кадры из видео на своем устройстве и отправляя эти кадры в любые вызовы API. Быстрее получайте результаты анализа видео.

Воспользуйтесь нашим примером на сайте GitHub, чтобы начать работу и создать собственное приложение.

Подробнее

Оцените работу решения в действии

Хотите создать подобное?

Создание эскизов

Создавайте высококачественные, удобные в хранении эскизы из любых входных изображений. Функция создания эскизов изменяет изображения в соответствии с вашими требованиями к размеру, форме и стилю. Используйте интеллектуальную обрезку, чтобы создавать эскизы, которые отличаются от исходных изображений пропорциями, но содержат интересующую вас область.

Оцените работу решения в действии

Отправляя данные для этой демоверсии, вы соглашаетесь с тем, что корпорация Майкрософт может хранить их, а также использовать для улучшения работы служб Майкрософт, включая этот API-интерфейс. Чтобы обеспечить вашу конфиденциальность, мы обезличиваем данные и заботимся об их безопасности. Мы не опубликуем ваши данные и не позволим другим лицам использовать их.

Хотите создать подобное?

Знакомство с API-интерфейсами Cognitive Services

API компьютерного зрения

Извлечение важнейшей информации из изображений

API распознавания лиц

Распознает, опознает, анализирует, группирует и помечает тегами лица на фотографиях

Content Moderator

Автоматическая модерация изображений, текста и видео

API распознавания эмоций ПРЕДВАРИТЕЛЬНАЯ ВЕРСИЯ

Персонализация взаимодействия с пользователем при помощи распознавания эмоций

API для видео ПРЕДВАРИТЕЛЬНАЯ ВЕРСИЯ

Интеллектуальная обработка видео

Пользовательская служба визуального распознавания ПРЕДВАРИТЕЛЬНАЯ ВЕРСИЯ

Простая настройка новейших моделей компьютерного зрения для конкретных вариантов использования

Индексатор видео ПРЕДВАРИТЕЛЬНАЯ ВЕРСИЯ

Получите все преимущества анализа видео

Интеллектуальная служба анализа языка ПРЕДВАРИТЕЛЬНАЯ ВЕРСИЯ

Научите свои приложения понимать команды пользователей

API анализа текста

Легко оценивайте мнение и темы, чтобы узнать желания пользователей

API Bing для проверки орфографии

Обеспечьте обнаружение и исправление орфографических ошибок в своем приложении

Translator Text API

Легко выполняйте машинный перевод текста с помощью простого вызова REST API

API веб-модели языка ПРЕДВАРИТЕЛЬНАЯ ВЕРСИЯ

Используйте прогнозные модели языка, построенные на основании данных веб-масштабирования

API лингвистического анализа ПРЕДВАРИТЕЛЬНАЯ ВЕРСИЯ

Упростите сложные концепции языка и анализируйте текст с помощью API лингвистического анализа.

Translator Speech API

Легко переводите речь в реальном времени с помощью простого вызова REST API

API распознавания говорящего ПРЕДВАРИТЕЛЬНАЯ ВЕРСИЯ

Используйте речь, чтобы идентифицировать и проверить подлинность отдельных говорящих

API-интерфейс Bing для распознавания речи

Преобразуйте речь в текст и обратно, а также улавливайте суть высказывания

Пользовательская служба распознавания речи ПРЕДВАРИТЕЛЬНАЯ ВЕРСИЯ

Устранение препятствий при распознавании речи, таких как разговорный стиль, фоновые помехи и словарный запас

API рекомендаций ПРЕДВАРИТЕЛЬНАЯ ВЕРСИЯ

Определяйте и рекомендуйте товары, которые нужны клиентам

Academic Knowledge API ПРЕДВАРИТЕЛЬНАЯ ВЕРСИЯ

Используйте всю мощь академических данных в Microsoft Academic Graph

Служба поиска и распознавания данных ПРЕДВАРИТЕЛЬНАЯ ВЕРСИЯ

Выполняйте интерактивный поиск по структурированным данным через систему пользовательского ввода на естественном языке

API службы QnA Maker ПРЕДВАРИТЕЛЬНАЯ ВЕРСИЯ

Преобразуйте информацию в ответы, представленные в режиме диалога с удобной навигацией

API для интеллектуальной службы связывания сущностей ПРЕДВАРИТЕЛЬНАЯ ВЕРСИЯ

Добавьте в источники данных приложения возможности распознавания и устранения неоднозначности именованных сущностей.

Пользовательская служба принятия решений ПРЕДВАРИТЕЛЬНАЯ ВЕРСИЯ

Облачный API-интерфейс с поддержкой принятия решений на основе контекста

Проект "Прага"

Жестикуляционные элементы управления

Проект "Куско"

Событие, связанное с записями в Википедии

Project Nanjing

Вычисление изохрон

Проект "Абу-Даби"

Матрица расстояний

Проект "Йоханнесбург"

Планирование маршрута

Проект "Вуллонгонг"

Аналитика, основанная на местоположении

Готовы ускорить работу своего приложения по максимуму?