Trace Id is missing
跳到主内容

Azure AI 视觉

使用 OCR 和 AI 从图像和视频分析中发现计算机视觉见解。

提升计算机视觉项目

Azure AI 视觉是一种联合服务,可提供创新的计算机视觉功能。通过预置的图像标记功能、采用光学字符识别 (OCR) 的文本提取功能以及可靠的面部识别功能,让应用能够分析图像、读取文本和检测人脸。将视觉特征合并到项目中,无需机器学习体验。

在 Vision Studio 上试用

宣布推出面向开发人员的先进计算机视觉功能
图像分析可从 10,000 多个概念和对象中拉取以检测、分类、描述和生成见解。
空间分析可实时了解人们在物理区域中的存在状态和移动情况。
光学字符识别 (OCR)可从图像中提取各种语言和书写样式的打印文本和手写文本。
面部识别可创建识别和验证人类身份的智能应用程序。

通过图像分析更容易发现内容

自动使用自然语言为图像添加说明,使用智能裁剪,并对图像进行分类(预览版)。

使用空间分析实时直播视频

使用带图像分析和对象检测功能的计算机视觉实时跟踪移动情况和分析环境。

使用光学字符识别 (OCR) 读取图像中的文本

使用 OCR 技术,从图像中提取采用混合语言和书写样式的打印文本和手写文本。

用于营养成分标签的光学字符识别

使用面部识别验证身份

创建带面部识别功能的应用,以提供高度安全的无缝用户体验。

训练自定义计算机视觉模型

在不影响准确性的情况下,使用少量图像自定义图像分类和对象检测以满足你的需求(预览版)。

Vision Studio 中的自定义模型概述

负责任地应用 AI

获取有关如何负责任地使用计算机 AI 视觉来实现目标和获得准确结果的明确指导。

IDC MarketScape 全球通用计算机视觉 AI 软件平台图,其中包含 Microsoft、Google、AWS、Clarifai 等领导者。

Microsoft 在 IDC MarketScape 中被评为领导者:全球通用计算机视觉 AI 软件平台 2022 供应商评估

IDC MarketScape 报告评估了 Microsoft 的策略和能力,并将 Microsoft 归为“领导者”类别。我们认为,这种认可彰显了 Microsoft 对向各种规模和所有垂直行业中的组织提供先进、可靠和以客户为中心的 AI 产品的承诺。

《设计分布式系统》一书的封面

借助云 AI 服务推动应用创新

阅读由 Forrester Consulting 开展的这份 2022 年委托研究,了解如何帮助组织中任何技能水平的开发人员使用预置的生产就绪云 AI 服务快速部署 AI 解决方案。

全面的内置安全性和合规性

  • ISO/IEC

  • CSA/CCM

  • ITAR

  • CJIS

  • HIPAA

  • IRS 1075

通过 Azure 免费帐户开始使用

1

免费开始使用获取有效期 30 天的 USD200 额度。拥有赠金时,可获取许多最热门服务的免费使用量,外加超过 55 种其他永久免费的服务的免费使用量。

2

用完额度后,请改为即付即用定价以继续使用相同的免费服务构建自己的内容。只需为超出每月免费金额以外的部分付费。

3

12 个月后,你将能继续使用超过 55 种永久免费的服务,而且仍然只需为超出每月免费使用量的部分付费。

在各行业中受到各种规模的公司的信赖

USA Surfing 加入 AI 浪潮

“教练研究这些要素。他们研究人体受到的压缩力。他们研究各种动态因素。这些机器学习模型在身体完成冲浪技巧时测量关节间的角度,实际上可以帮助教练提供反馈,”- Kevin Schulz,美国队空翻优秀选手和冲浪者

一名冲浪者在冲浪

KPMG 帮助银行客户识别财务风险

借助 AI 视觉,KPMG 可以查找和分析图像和视频,并使用光学字符识别(OCR) API 来识别风险。

三个人一边在走廊上走路,一边聊天

H&R Block 使用 Azure AI 转换纳税申报单

“给我们一盒税务文件,我们将使用 AI 和机器学习将数据放入正确的位置。”

Sameer Agarwal:H&R Block 的 IT 总监

一个人在办公桌前工作,办公桌上的笔记本电脑显示 H&R Block 网站

Reddit 通过图像和字幕生成改进了辅助功能和 SEO

"新建的图像字幕使 Reddit 更易于访问,并为 Reddit 用户提供了更多机会来浏览我们的图像、参与对话,并最终建立连接和社区。"

Tiffany Ong:Reddit 的来宾体验& SEO 产品经理

三个人坐在桌子之间的桌椅上交谈
返回到选项卡

文档和资源

开始使用

浏览示例

有关 Azure AI 视觉的常见问题解答

  • 保证 Azure AI 视觉和其他 Azure AI 服务产品/服务的可用率达到 99.9%。我们没有为免费定价层提供 SLA。请参阅 SLA 详细信息

  • 不。Microsoft 将在处理后自动删除你的图像和视频,而不会使用你的数据进行训练以增强基础模型。视频数据不会离开本地,并且也不会存储在容器运行的边缘上。详细了解隐私与使用条款。

  • 否,空间分析检测和定位视频片段中的人员并在每个检测到的人员周身输出一个边框。这些 AI 模型不会检测人脸,也不会确定个人的身份和人口统计信息。

  • 空间分析 AI 模型基于算法来检测和跟踪视频源中的移动情况,这些算法通过人体边框来识别一个或多个人员的存在。对于在照相机视野中的某个区域中检测到的每个人和边框,AI 模型输出的事件数据包括:人员身体的边框坐标、事件类型(例如区域出入口或方向线交叉)、用于跟踪边框的匿名标识符和检测置信度分数。此事件数据会发送到你的 Azure IoT 中心实例。

  • 是。由于模型自定义设计为针对你的方案进行微调,因此你需要提供标记数据来训练模型。

  • 该服务的模型自定义功能经过优化,可以快速识别图像之间的主要差异,因此可以使用少量数据开始原型制作。一开始,每个标签只有一个图像。如果有更多标记的图像,则可以添加更多图像。根据问题的复杂性和所需的准确度,可以继续为每个标签添加其他图像以改进模型。

  • 两者都是。可以使用站点访问图形界面来管理模型的数据集、训练和模型以实现无代码体验,另外,也可以使用计算机视觉 API。

  • 可以在 Azure 机器学习工作室中标记图像,该工作室与 Vision Studio 集成,可轻松导出标记的数据。还可以标记 COCO 文件格式的数据,并直接在 Vision Studio 中导入 COCO 文件。有关详细信息,请参阅文档

  • Azure AI 视觉的模型自定义功能是下一代自定义视觉,具有更高的准确性和少样本学习功能。可以继续使用自定义视觉,也可以迁移训练数据以使用 Azure AI 视觉中的模型自定义来重新训练模型。有关详细信息,请参阅文档

  • 使用 Azure AI 视觉从图像和视频中提取见解和文本后,可以使用文本分析来分析情绪,使用翻译工具将文本翻译为所需的语言,或使用沉浸式阅读器朗读文本,让人们更容易获取内容。相关服务和功能包括用于从文档中提取键值对和表的 Azure 表单识别器、用于从音频和视频文件中提取高级元数据的 Azure AI 视频索引器,以及用于检测有害文本或图像的内容审查器

准备好了就开始 - 设置 Azure 免费帐户

免费试用 Azure