计算机影像 API

从图像中提取丰富的信息,以便对视觉数据进行分类和处理,在计算机的辅助下审查图像,为策展服务提供帮助。

分析图像

此功能可返回图像中找到的视觉对象内容的相关信息。使用标记、描述和特定于域的模型来识别内容并标为可信。应用“成人/不雅”设置,启用成人内容自动限制。识别图片中的图像类型和配色方案。

在实际操作中查看

特征名称:
说明 { "tags": [ "train", "platform", "station", "building", "indoor", "subway", "track", "walking", "waiting", "pulling", "board", "people", "man", "luggage", "standing", "holding", "large", "woman", "yellow", "suitcase" ], "captions": [ { "text": "people waiting at a train station", "confidence": 0.8331026 } ] }
标记 [ { "name": "train", "confidence": 0.9975446 }, { "name": "platform", "confidence": 0.995543063 }, { "name": "station", "confidence": 0.9798007 }, { "name": "indoor", "confidence": 0.927719653 }, { "name": "subway", "confidence": 0.838939846 }, { "name": "pulling", "confidence": 0.431715637 } ]
图像格式 "Jpeg"
图像尺寸 462 x 600
剪贴画类型 0
线条绘制类型 0
黑色和白色 false
成人内容 false
成人评分 0.0147124995
猥亵内容 false
猥亵内容评分 0.0162802152
类别 [ { "name": "trans_trainstation", "score": 0.98828125 } ]
人脸 []
背景主色
"Black"
前景主色
"Black"
主题色
#484C83

想要生成它?

读取图像中的文本

光学字符识别技术 (OCR) 可检测图像中的文本,并将所识别的字词提取到计算机可识别的字符流中。分析图像以检测嵌入的文本、生成字符流和启用搜索。获取文本的照片而非进行复制,节省时间和精力。

在实际操作中查看

  1. 预览
  2. JSON

IF WE DID

ALL

THE THINGS

WE ARE

CAPABLÉ•

OF DOING,

WE WOULD

LITERALLY

ASTOUND

QURSELV*S.

{
  "textAngle": 0.0,
  "orientation": "NotDetected",
  "language": "en",
  "regions": [
    {
      "boundingBox": "316,47,284,340",
      "lines": [
        {
          "boundingBox": "319,47,182,24",
          "words": [
            {
              "boundingBox": "319,47,42,24",
              "text": "IF"
            },
            {
              "boundingBox": "375,47,44,24",
              "text": "WE"
            },
            {
              "boundingBox": "435,47,66,23",
              "text": "DID"
            }
          ]
        },
        {
          "boundingBox": "316,74,204,69",
          "words": [
            {
              "boundingBox": "316,74,204,69",
              "text": "ALL"
            }
          ]
        },
        {
          "boundingBox": "318,147,207,24",
          "words": [
            {
              "boundingBox": "318,147,63,24",
              "text": "THE"
            },
            {
              "boundingBox": "397,147,128,24",
              "text": "THINGS"
            }
          ]
        },
        {
          "boundingBox": "316,176,125,23",
          "words": [
            {
              "boundingBox": "316,176,44,23",
              "text": "WE"
            },
            {
              "boundingBox": "375,176,66,23",
              "text": "ARE"
            }
          ]
        },
        {
          "boundingBox": "319,194,281,44",
          "words": [
            {
              "boundingBox": "319,194,281,44",
              "text": "CAPABLÉ•"
            }
          ]
        },
        {
          "boundingBox": "318,243,181,29",
          "words": [
            {
              "boundingBox": "318,243,43,23",
              "text": "OF"
            },
            {
              "boundingBox": "376,243,123,29",
              "text": "DOING,"
            }
          ]
        },
        {
          "boundingBox": "316,271,170,24",
          "words": [
            {
              "boundingBox": "316,272,44,23",
              "text": "WE"
            },
            {
              "boundingBox": "375,271,111,24",
              "text": "WOULD"
            }
          ]
        },
        {
          "boundingBox": "317,300,200,24",
          "words": [
            {
              "boundingBox": "317,300,200,24",
              "text": "LITERALLY"
            }
          ]
        },
        {
          "boundingBox": "316,328,157,24",
          "words": [
            {
              "boundingBox": "316,328,157,24",
              "text": "ASTOUND"
            }
          ]
        },
        {
          "boundingBox": "318,357,214,30",
          "words": [
            {
              "boundingBox": "318,357,214,30",
              "text": "QURSELV*S."
            }
          ]
        }
      ]
    }
  ]
}

上传此演示的数据即表示你同意 Microsoft 对其进行存储并将其用于改进 Microsoft 服务(包括此 API)。为了保护用户隐私,我们会采取措施对数据进行反识别处理并确保它的安全。我们不会公开用户数据或让其他人使用这些数据。

想要生成它?

预览:从图像读取手写文本

此技术(手写 OCR)使你可以检测和提取笔记、信件、文章、白板、表格等对象中的手写文本。它适用于不同的图面和背景,如白纸、黄色便签和白板等。

手写文本识别既省时又省力,并且可通过允许拍摄文本图像,而不必进行转录,使你工作更高效。它使得数字化笔记变为可能,届时你变可以实现快速而轻视的搜索。它还减少了纸张乱堆的情况。

注意:此技术当前处于预览状态,且仅适用于英语文本。

若要试用此光学字符识别演示版,请上传本地存储的图像或提供图像 URL。对于此演示版,除非授予操作权限,否则我们不会存储提供的图像。

在实际操作中查看

  1. 预览
  2. JSON

OUR greatest glory is not

i never failing ,

but in rising every

time we fall

{
  "status": "Succeeded",
  "succeeded": true,
  "failed": false,
  "finished": true,
  "recognitionResult": {
    "lines": [
      {
        "boundingBox": [
          67,
          204,
          668,
          210,
          667,
          272,
          66,
          267
        ],
        "text": "OUR greatest glory is not",
        "words": [
          {
            "boundingBox": [
              69,
              206,
              159,
              205,
              155,
              274,
              65,
              275
            ],
            "text": "OUR"
          },
          {
            "boundingBox": [
              192,
              205,
              350,
              204,
              346,
              273,
              188,
              274
            ],
            "text": "greatest"
          },
          {
            "boundingBox": [
              393,
              204,
              509,
              203,
              505,
              272,
              389,
              273
            ],
            "text": "glory"
          },
          {
            "boundingBox": [
              539,
              203,
              588,
              203,
              584,
              272,
              534,
              272
            ],
            "text": "is"
          },
          {
            "boundingBox": [
              601,
              202,
              680,
              202,
              676,
              271,
              597,
              271
            ],
            "text": "not"
          }
        ]
      },
      {
        "boundingBox": [
          540,
          289,
          900,
          302,
          897,
          374,
          538,
          360
        ],
        "text": "i never failing ,",
        "words": [
          {
            "boundingBox": [
              534,
              300,
              558,
              300,
              568,
              376,
              545,
              376
            ],
            "text": "i"
          },
          {
            "boundingBox": [
              589,
              300,
              694,
              300,
              705,
              376,
              600,
              376
            ],
            "text": "never"
          },
          {
            "boundingBox": [
              720,
              300,
              874,
              300,
              885,
              376,
              731,
              376
            ],
            "text": "failing"
          },
          {
            "boundingBox": [
              877,
              300,
              905,
              300,
              916,
              376,
              888,
              376
            ],
            "text": ","
          }
        ]
      },
      {
        "boundingBox": [
          139,
          416,
          572,
          433,
          570,
          491,
          136,
          474
        ],
        "text": "but in rising every",
        "words": [
          {
            "boundingBox": [
              145,
              418,
              215,
              418,
              202,
              491,
              132,
              491
            ],
            "text": "but"
          },
          {
            "boundingBox": [
              227,
              418,
              275,
              418,
              262,
              491,
              214,
              491
            ],
            "text": "in"
          },
          {
            "boundingBox": [
              308,
              418,
              428,
              419,
              415,
              492,
              295,
              491
            ],
            "text": "rising"
          },
          {
            "boundingBox": [
              476,
              419,
              581,
              419,
              568,
              492,
              463,
              492
            ],
            "text": "every"
          }
        ]
      },
      {
        "boundingBox": [
          622,
          413,
          967,
          410,
          968,
          470,
          623,
          472
        ],
        "text": "time we fall",
        "words": [
          {
            "boundingBox": [
              627,
              408,
              722,
              409,
              713,
              470,
              618,
              468
            ],
            "text": "time"
          },
          {
            "boundingBox": [
              765,
              409,
              828,
              410,
              818,
              471,
              756,
              470
            ],
            "text": "we"
          },
          {
            "boundingBox": [
              873,
              410,
              976,
              412,
              967,
              472,
              864,
              471
            ],
            "text": "fall"
          }
        ]
      }
    ]
  }
}

想要生成它?

识别名人和地标

名人和地标模型是特定于域的模型的示例。名人模型识别功能可识别 20 万商业、政治、体育和娱乐界名人。地标模型识别功能可识别全世界 9000 个自然和人工地标。特定于域的模型是计算机影像 API 内不断发展的功能。

在实际操作中查看

{
  "categories": [
    {
      "name": "people_",
      "score": 0.86328125,
      "detail": {
        "celebrities": [
          {
            "name": "Satya Nadella",
            "faceRectangle": {
              "left": 239,
              "top": 293,
              "width": 138,
              "height": 138
            },
            "confidence": 0.9999974
          }
        ],
        "landmarks": null
      }
    }
  ],
  "adult": null,
  "tags": [
    {
      "name": "person",
      "confidence": 0.99956613779067993
    },
    {
      "name": "suit",
      "confidence": 0.98934584856033325
    },
    {
      "name": "man",
      "confidence": 0.98844343423843384
    },
    {
      "name": "outdoor",
      "confidence": 0.860062301158905
    }
  ],
  "description": {
    "tags": [
      "person",
      "suit",
      "man",
      "necktie",
      "outdoor",
      "building",
      "clothing",
      "standing",
      "wearing",
      "business",
      "looking",
      "holding",
      "black",
      "front",
      "hand",
      "dressed",
      "phone",
      "field"
    ],
    "captions": [
      {
        "text": "Satya Nadella wearing a suit and tie",
        "confidence": 0.99033389849736619
      }
    ]
  },
  "requestId": "96e71bee-1c4d-4383-8bb2-5870420cb19f",
  "metadata": {
    "width": 600,
    "height": 900,
    "format": "Jpeg"
  },
  "faces": [
    {
      "age": 49,
      "gender": "Male",
      "faceRectangle": {
        "left": 239,
        "top": 293,
        "width": 138,
        "height": 138
      }
    }
  ],
  "color": {
    "dominantColorForeground": "Black",
    "dominantColorBackground": "Black",
    "dominantColors": [
      "Black",
      "Grey"
    ],
    "accentColor": "7B5E50",
    "isBWImg": false
  },
  "imageType": {
    "clipArtType": 0,
    "lineDrawingType": 0
  }
}

想要生成它?

近乎实时地分析视频

近乎实时地分析视频:通过从设备中提取视频的帧,并将这些帧发送到你选择的 API 调用,可将任意计算机视觉 API 用于视频文件。更快速地从视频中获取结果。

通过 GitHub 上的示例开始使用并构建你自己的应用。

了解更多

在实际操作中查看

想要生成它?

生成缩略图

基于任何输入图像生成充分利用存储空间的高质量缩略图。使用缩略图生成来修改图像,从而最好地满足你的大小、形状和风格需要。应用智能裁剪来生成与原始图像纵横比不同却保留感兴趣区域的缩略图。

在实际操作中查看

上传此演示的数据即表示你同意 Microsoft 对其进行存储并将其用于改进 Microsoft 服务(包括此 API)。为了保护用户隐私,我们会采取措施对数据进行反识别处理并确保它的安全。我们不会公开用户数据或让其他人使用这些数据。

想要生成它?

了解认知服务 API

计算机影像 API

从图像中提取可操作信息

人脸 API

检测、识别、分析、组织和标记照片中的人脸

内容审查器

自动化图像、文本和视频审查

情感 API 预览版

通过情绪识别实现个性化用户体验

自定义影像服务 预览版

为你独一无二的用例轻松自定义最先进的计算机影像模型

视频索引器 预览版

解锁视频见解

语言理解智能服务 预览版

教会应用理解用户发出的命令

文本分析 API

轻松评估观点和主题以理解用户的需求

必应拼写检查 API

检测并更正应用中的拼写错误

文本翻译API

通过简单的 REST API 调用即可轻松进行机器翻译

Web 语言模型 API 预览版

利用以 Web 上的数据为目标的预测语言模型的功能

语言分析 API 预览版

使用语言分析 API 简化复杂的语言定义并分析文本

语音翻译API

通过简单的 REST API 调用即可轻松实现实时语音翻译

说话人识别 API 预览版

使用语音以识别并对单个说话人进行身份验证

必应语音 API

将语音转换为文本,再转回语音,并理解用户的意图

自定义语音服务 预览版

克服语音识别障碍,如说话风格、背景噪音和词汇

建议 API 预览版

预测和推荐客户所需的商品

学术知识 API 预览版

利用 Microsoft Academic Graph 中丰富的学术内容

知识探索服务 预览版

通过自然语言输入实现结构化数据的交互式搜索体验

QnA Maker API 预览版

提取信息,并将其转化为一目了然的对话式答案

实体链接智能服务 API 预览版

为应用的数据链接提供命名实体识别并消除歧义

自定义决策服务 预览版

一种日益成熟的基于云的上下文决策 API

布拉格项目

基于手势的控制

库斯科项目

与维基百科条目相关的活动

Project Nanjing

等时线计算

阿布达比项目

距离矩阵

约翰内斯堡项目

物流路线

伍伦贡项目

位置见解

准备好好利用你的应用了吗?