Navigation überspringen

Maschinelles Sehen

Ein KI-Dienst, der Inhalte in Bildern und Videos analysiert

Extrahieren umfangreicher Informationen aus Bildern und Videos

Verbessern Sie die Erkennbarkeit von Inhalten, automatisieren Sie die Textextraktion, analysieren Sie Videos in Echtzeit und entwickeln Sie Produkte, die mehr Personen verwenden können, indem Sie Cloudfunktionen für maschinelles Sehen in Ihre Apps einbetten. Nutzen Sie dafür die Azure Cognitive Services-API für maschinelles Sehen. Verwenden Sie die visuelle Datenverarbeitung, um Inhalte mit Objekten und Konzepten zu beschriften, Text zu extrahieren, Bildbeschreibungen zu generieren, Inhalte zu moderieren und die Bewegung von Menschen in physischen Räumen nachzuvollziehen. Es sind keine Vorkenntnisse im maschinellen Lernen erforderlich.

Textextraktion (OCR)

Extrahieren Sie gedruckten und handschriftlichen Text aus Bildern und Dokumenten mit verschiedenen Sprachen und Schreibstilen.

Bildanalyse

Profitieren Sie von einer umfangreichen Ontologie mit mehr als 10.000 Konzepten und Objekten für die Wertschöpfung aus Ihren virtuellen Ressourcen.

Räumliche Analyse

Analysieren Sie Räume in Echtzeit, um die Personenanzahl, den Abstand zwischen Personen und Gesichtsmasken zu erkennen.

Flexible Bereitstellung

Führen Sie maschinelles Sehen in der Cloud oder am Edge in Containern aus.

Maschinelles Sehen – modernste Technologie direkt einsetzbar

Statten Sie Ihre eigenen Apps mit führender Technologie für Video- und Bilderkennung aus – ein einfacher API-Aufruf reicht aus.

Demo anzeigen

person
person
subway train
Name des Merkmals: Wert
Objekte [ { "rectangle": { "x": 93, "y": 178, "w": 115, "h": 237 }, "object": "person", "confidence": 0.764 }, { "rectangle": { "x": 0, "y": 229, "w": 101, "h": 206 }, "object": "person", "confidence": 0.624 }, { "rectangle": { "x": 161, "y": 31, "w": 439, "h": 423 }, "object": "subway train", "parent": { "object": "train", "parent": { "object": "Land vehicle", "parent": { "object": "Vehicle", "confidence": 0.926 }, "confidence": 0.923 }, "confidence": 0.917 }, "confidence": 0.801 } ]
Tags [ { "name": "train", "confidence": 0.9974923 }, { "name": "platform", "confidence": 0.9955776 }, { "name": "station", "confidence": 0.9796659 }, { "name": "indoor", "confidence": 0.9272351 }, { "name": "subway", "confidence": 0.83886826 }, { "name": "clothing", "confidence": 0.5561272 }, { "name": "person", "confidence": 0.505803 }, { "name": "pulling", "confidence": 0.431911558 } ]
Beschreibung { "tags": [ "train", "platform", "station", "building", "indoor", "subway", "track", "walking", "waiting", "pulling", "board", "people", "man", "luggage", "standing", "holding", "large", "woman", "suitcase" ], "captions": [ { "text": "people waiting at a train station", "confidence": 0.833144546 } ] }
Bildformat "Jpeg"
Bildmaße 462 x 600
Schwarzweiß false
Nicht jugendfreier Inhalt false
Bewertung für nicht jugendfreien Inhalt 0.009112839
Gewalttätig false
Gewaltscore 0.0461505651
Freizügigkeit false
Bewertung für Freizügigkeit 0.0143244788
Kategorien [ { "name": "trans_trainstation", "score": 0.98828125 } ]
Gesichter []
Vorherrschende Hintergrundfarbe
"Black"
Vorherrschende Vordergrundfarbe
"Black"
Akzentfarbe
#484C83
{
  "categories": [
    {
      "name": "trans_trainstation",
      "score": 0.98828125
    }
  ],
  "adult": {
    "isAdultContent": false,
    "isGoryContent": false,
    "isRacyContent": false,
    "adultScore": 0.009112839,
    "goreScore": 0.0461505651,
    "racyScore": 0.0143244788
  },
  "tags": [
    {
      "name": "train",
      "confidence": 0.9974923
    },
    {
      "name": "platform",
      "confidence": 0.9955776
    },
    {
      "name": "station",
      "confidence": 0.9796659
    },
    {
      "name": "indoor",
      "confidence": 0.9272351
    },
    {
      "name": "subway",
      "confidence": 0.83886826
    },
    {
      "name": "clothing",
      "confidence": 0.5561272
    },
    {
      "name": "person",
      "confidence": 0.505803
    },
    {
      "name": "pulling",
      "confidence": 0.431911558
    }
  ],
  "description": {
    "tags": [
      "train",
      "platform",
      "station",
      "building",
      "indoor",
      "subway",
      "track",
      "walking",
      "waiting",
      "pulling",
      "board",
      "people",
      "man",
      "luggage",
      "standing",
      "holding",
      "large",
      "woman",
      "suitcase"
    ],
    "captions": [
      {
        "text": "people waiting at a train station",
        "confidence": 0.833144546
      }
    ]
  },
  "requestId": "78e27c8f-1d81-45dd-8611-e5bbf25ade75",
  "metadata": {
    "width": 600,
    "height": 462,
    "format": "Jpeg"
  },
  "faces": [],
  "color": {
    "dominantColorForeground": "Black",
    "dominantColorBackground": "Black",
    "accentColor": "484C83",
    "isBWImg": false
  },
  "objects": [
    {
      "rectangle": {
        "x": 93,
        "y": 178,
        "w": 115,
        "h": 237
      },
      "object": "person",
      "confidence": 0.764
    },
    {
      "rectangle": {
        "x": 0,
        "y": 229,
        "w": 101,
        "h": 206
      },
      "object": "person",
      "confidence": 0.624
    },
    {
      "rectangle": {
        "x": 161,
        "y": 31,
        "w": 439,
        "h": 423
      },
      "object": "subway train",
      "parent": {
        "object": "train",
        "parent": {
          "object": "Land vehicle",
          "parent": {
            "object": "Vehicle",
            "confidence": 0.926
          },
          "confidence": 0.923
        },
        "confidence": 0.917
      },
      "confidence": 0.801
    }
  ]
}
{
  "categories": [
    {
      "name": "trans_trainstation",
      "score": 0.98828125
    }
  ],
  "adult": {
    "isAdultContent": false,
    "isGoryContent": false,
    "isRacyContent": false,
    "adultScore": 0.009112839,
    "goreScore": 0.0461505651,
    "racyScore": 0.0143244788
  },
  "tags": [
    {
      "name": "train",
      "confidence": 0.9974923
    },
    {
      "name": "platform",
      "confidence": 0.9955776
    },
    {
      "name": "station",
      "confidence": 0.9796659
    },
    {
      "name": "indoor",
      "confidence": 0.9272351
    },
    {
      "name": "subway",
      "confidence": 0.83886826
    },
    {
      "name": "clothing",
      "confidence": 0.5561272
    },
    {
      "name": "person",
      "confidence": 0.505803
    },
    {
      "name": "pulling",
      "confidence": 0.431911558
    }
  ],
  "description": {
    "tags": [
      "train",
      "platform",
      "station",
      "building",
      "indoor",
      "subway",
      "track",
      "walking",
      "waiting",
      "pulling",
      "board",
      "people",
      "man",
      "luggage",
      "standing",
      "holding",
      "large",
      "woman",
      "suitcase"
    ],
    "captions": [
      {
        "text": "people waiting at a train station",
        "confidence": 0.833144546
      }
    ]
  },
  "requestId": "78e27c8f-1d81-45dd-8611-e5bbf25ade75",
  "metadata": {
    "width": 600,
    "height": 462,
    "format": "Jpeg"
  },
  "faces": [],
  "color": {
    "dominantColorForeground": "Black",
    "dominantColorBackground": "Black",
    "accentColor": "484C83",
    "isBWImg": false
  },
  "objects": [
    {
      "rectangle": {
        "x": 93,
        "y": 178,
        "w": 115,
        "h": 237
      },
      "object": "person",
      "confidence": 0.764
    },
    {
      "rectangle": {
        "x": 0,
        "y": 229,
        "w": 101,
        "h": 206
      },
      "object": "person",
      "confidence": 0.624
    },
    {
      "rectangle": {
        "x": 161,
        "y": 31,
        "w": 439,
        "h": 423
      },
      "object": "subway train",
      "parent": {
        "object": "train",
        "parent": {
          "object": "Land vehicle",
          "parent": {
            "object": "Vehicle",
            "confidence": 0.926
          },
          "confidence": 0.923
        },
        "confidence": 0.917
      },
      "confidence": 0.801
    }
  ]
}

Transformieren Sie Ihre Prozesse

Identifizieren Sie mehr als 10.000 Objekte und Konzepte in Ihren Bildern automatisch. Extrahieren Sie gedruckten und handschriftlichen Text aus mehreren Bild- und Dokumenttypen, nutzen Sie die Unterstützung für mehrere Sprachen und gemischte Schreibstile. Wenden Sie diese Features für maschinelles Sehen an, um Prozesse zu optimieren, z. B. die robotergesteuerte Prozessautomatisierung und die digitale Ressourcenverwaltung.

Maximieren des Werts des physischen Raums Ihrer Organisation

Understand how people move in a physical space, whether it's an office or a store. Use the spatial analysis feature to create apps that can count people in a room, trace paths, understand dwell times in front of a retail display, and determine wait times in queues. Build solutions that enable occupancy management and social distancing, face mask compliance, optimize in-store and office layouts, and accelerate the checkout process. Run the service across multiple cameras and sites.

Weitere Informationen zu dieser Funktion

Bereitstellungen von der Cloud bis zum Edge

Führen Sie maschinelles Sehen mithilfe von Containern in der Cloud oder in der lokalen Umgebung aus. Wenden Sie es in verschiedenen Szenarios an, zum Beispiel für die Bildanalyse für Patientendaten, die Textextraktion aus sicheren Dokumenten oder die Analyse der Bewegung von Kunden in einem Geschäft, bei denen die Sicherheit der Daten und eine niedrige Latenz unverzichtbar sind.

Informationen zur Verwendung von „Maschinelles Sehen“ in Containern

Vertrauen Sie auf die branchenführende Azure-Sicherheit

  • Microsoft investiert über USD 1 billion pro Jahr in Forschung und Entwicklung im Bereich Cybersicherheit.

  • Microsoft beschäftigt mehr als 3.500 Sicherheitsexperten, die ausschließlich den Schutz und die Sicherheit Ihrer Daten im Blick haben.

  • Azure verfügt über mehr Compliancezertifizierungen als jeder andere Cloudanbieter. Sehen Sie sich die vollständige Liste an.

Erstklassiges Modell für maschinelles Sehen zu einem fairen Preis

Zahlen Sie nur für die tatsächliche Nutzung und keine Vorabkosten. Bei der Funktion „Maschinelles Sehen“ richten sich Ihre Gebühren nach der Anzahl der Transaktionen.

In drei Schritten zu maschinellem Sehen

Wenn Sie sich für ein kostenloses Azure-Konto registrieren, erhalten Sie sofortigen Zugriff und ein Guthaben von $200.

Melden Sie sich beim Azure-Portal an, und fügen Sie „Maschinelles Sehen“ hinzu.

Erfahren Sie in Schnellstarts und in der Dokumentation, wie Sie maschinelles Sehen einbetten.

Dokumentation und Ressourcen

Erste Schritte

Dokumentation lesen

Microsoft Learn-Kurse absolvieren

Codebeispiele

Eine Beispiel-App erkunden

Häufig gestellte Fragen zum maschinellem Sehen

  • Sehen Sie sich die Verfügbarkeit nach Region an.
  • Für maschinelles Sehen und andere Azure Cognitive Services-Angebote wird eine Verfügbarkeit von 99,9 Prozent garantiert. Für den Free-Tarif wird keine SLA bereitgestellt. Siehe SLA-Details.
  • Nein, Microsoft löscht Ihre Bilder und Videos nach der Verarbeitung automatisch. Ihre Daten werden nicht zum Trainieren der zugrunde liegenden Modelle verwendet. Die Videodaten verlassen Ihre lokale Umgebung nicht und werden nicht am Edge gespeichert, wo der Container ausgeführt wird. Erfahren Sie mehr über den Datenschutz und die Nutzungsbedingungen.
  • Nach der Verwendung der API für maschinelles Sehen zum Extrahieren von Bildern und Videos können Sie die API Textanalyse verwenden, um Stimmungen zu analysieren, die API Textübersetzung, um Text in eine Sprache Ihrer Wahl zu übersetzen, oder das Tool Plastischer Reader, um Text laut vorlesen zu lassen und so für mehr Barrierefreiheit zu sorgen. Weitere Funktionen im Zusammenhang mit der API für maschinelles Sehen sind die API Formularerkennung, um Schlüssel-Wert-Paare und Tabellen aus Dokumenten zu extrahieren, die API Gesichtserkennung, um Gesichter auf Bildern zu erkennen, Custom Vision, um mühelos eigene Modelle für maschinelles Sehen von Grund auf zu erstellen, und Content Moderator, um nicht erwünschten Text oder unerwünschte Bilder zu erkennen.
  • Nein, die räumliche Analyse erkennt und ortet Menschen in Videoaufnahmen und -ausgaben mithilfe eines Begrenzungsrahmens um einen menschlichen Körper. Die KI-Modelle erkennen keine Gesichter und bestimmen auch nicht die Identität oder demografische Angaben zu einzelnen Personen.
  • Die KI-Modelle der räumlichen Analyse erkennen und verfolgen Bewegungen im Videofeed auf Grundlage von Algorithmen, die Menschen anhand eines Begrenzungsrahmens für den Körper erkennen. Für jede Begrenzungsrahmenbewegung in einem Bereich der Kameraaufnahme geben die KI-Modelle Ereignisdaten aus, einschließlich der Begrenzungsrahmenkoordinaten für den Körper einer Person, des Ereignistyps (z. B. Betreten oder Verlassen des Bereichs, Überschreitung einer direktionalen Linie), der pseudonymen Bezeichner zur Nachverfolgung des Begrenzungsrahmens und einer Zuverlässigkeitsbewertung für die Erkennung. Diese Ereignisdaten werden an Ihre eigene Instanz von Azure IoT Hub gesendet.

Sind Sie bereit? Dann richten Sie Ihr kostenloses Azure-Konto ein.