Maschinelles Sehen

Ein KI-Dienst, der Inhalte in Bildern und Videos analysiert

Extrahieren umfangreicher Informationen aus Bildern und Videos

Verbessern Sie die Erkennbarkeit von Inhalten, automatisieren Sie die Textextraktion, Analysieren Sie Videos in Echtzeit und entwickeln Sie Produkte, die mehr Personen verwenden können, indem Sie Funktionen zum maschinellen Sehen in Ihre Apps einbetten. Verwenden Sie die visuelle Datenverarbeitung, um Inhalte mit Objekten und Konzepten zu beschriften, Text zu extrahieren, Bildbeschreibungen zu generieren, Inhalte zu moderieren und die Bewegung von Menschen in physischen Bereichen nachzuvollziehen. Es sind keine Vorkenntnisse im maschinellen Lernen erforderlich.

Textextraktion (OCR)

Extrahieren Sie gedruckten und handschriftlichen Text aus Bildern und Dokumenten mit verschiedenen Sprachen und Schreibstilen.

Bildanalyse

Profitieren Sie von einer umfangreichen Ontologie mit mehr als 10.000 Konzepten und Objekten für die Wertschöpfung aus Ihren virtuellen Ressourcen.

Räumliche Analyse

Analysieren Sie die Bewegungen von Personen innerhalb eines Bereichs in Echtzeit.

Flexible Bereitstellung

Führen Sie maschinelles Sehen in der Cloud oder am Edge in Containern aus.

Maschinelles Sehen – modernste Technologie direkt einsetzbar

Statten Sie Ihre eigenen Apps mit führender Technologie für maschinelles Sehen aus – ein einfacher API-Aufruf reicht aus.

Demo anzeigen

person
person
subway train
Name des Merkmals: Wert
Objekte [ { "rectangle": { "x": 93, "y": 178, "w": 115, "h": 237 }, "object": "person", "confidence": 0.764 }, { "rectangle": { "x": 0, "y": 229, "w": 101, "h": 206 }, "object": "person", "confidence": 0.624 }, { "rectangle": { "x": 161, "y": 31, "w": 439, "h": 423 }, "object": "subway train", "parent": { "object": "train", "parent": { "object": "Land vehicle", "parent": { "object": "Vehicle", "confidence": 0.926 }, "confidence": 0.923 }, "confidence": 0.917 }, "confidence": 0.801 } ]
Tags [ { "name": "train", "confidence": 0.9974923 }, { "name": "platform", "confidence": 0.9955777 }, { "name": "station", "confidence": 0.979665935 }, { "name": "indoor", "confidence": 0.9272351 }, { "name": "subway", "confidence": 0.838868737 }, { "name": "clothing", "confidence": 0.5561282 }, { "name": "person", "confidence": 0.505803 }, { "name": "pulling", "confidence": 0.431911945 } ]
Beschreibung { "tags": [ "train", "platform", "station", "building", "indoor", "subway", "track", "walking", "waiting", "pulling", "board", "people", "man", "luggage", "standing", "holding", "large", "woman", "suitcase" ], "captions": [ { "text": "people waiting at a train station", "confidence": 0.833144546 } ] }
Bildformat "Jpeg"
Bildmaße 462 x 600
Schwarzweiß false
Nicht jugendfreier Inhalt false
Bewertung für nicht jugendfreien Inhalt 0.009112834
Gewalttätig false
Gewaltscore 0.046150554
Freizügigkeit false
Bewertung für Freizügigkeit 0.0143244695
Kategorien [ { "name": "trans_trainstation", "score": 0.98828125 } ]
Gesichter []
Vorherrschende Hintergrundfarbe
"Black"
Vorherrschende Vordergrundfarbe
"Black"
Akzentfarbe
#484C83
  1. Vorschau
  2. JSON
{
  "categories": [
    {
      "name": "trans_trainstation",
      "score": 0.98828125
    }
  ],
  "adult": {
    "isAdultContent": false,
    "isGoryContent": false,
    "isRacyContent": false,
    "adultScore": 0.009112834,
    "goreScore": 0.046150554,
    "racyScore": 0.0143244695
  },
  "tags": [
    {
      "name": "train",
      "confidence": 0.9974923
    },
    {
      "name": "platform",
      "confidence": 0.9955777
    },
    {
      "name": "station",
      "confidence": 0.979665935
    },
    {
      "name": "indoor",
      "confidence": 0.9272351
    },
    {
      "name": "subway",
      "confidence": 0.838868737
    },
    {
      "name": "clothing",
      "confidence": 0.5561282
    },
    {
      "name": "person",
      "confidence": 0.505803
    },
    {
      "name": "pulling",
      "confidence": 0.431911945
    }
  ],
  "description": {
    "tags": [
      "train",
      "platform",
      "station",
      "building",
      "indoor",
      "subway",
      "track",
      "walking",
      "waiting",
      "pulling",
      "board",
      "people",
      "man",
      "luggage",
      "standing",
      "holding",
      "large",
      "woman",
      "suitcase"
    ],
    "captions": [
      {
        "text": "people waiting at a train station",
        "confidence": 0.833144546
      }
    ]
  },
  "requestId": "96ccbc16-14fc-46b3-9b3c-e188c90086db",
  "metadata": {
    "width": 600,
    "height": 462,
    "format": "Jpeg"
  },
  "faces": [],
  "color": {
    "dominantColorForeground": "Black",
    "dominantColorBackground": "Black",
    "accentColor": "484C83",
    "isBWImg": false
  },
  "objects": [
    {
      "rectangle": {
        "x": 93,
        "y": 178,
        "w": 115,
        "h": 237
      },
      "object": "person",
      "confidence": 0.764
    },
    {
      "rectangle": {
        "x": 0,
        "y": 229,
        "w": 101,
        "h": 206
      },
      "object": "person",
      "confidence": 0.624
    },
    {
      "rectangle": {
        "x": 161,
        "y": 31,
        "w": 439,
        "h": 423
      },
      "object": "subway train",
      "parent": {
        "object": "train",
        "parent": {
          "object": "Land vehicle",
          "parent": {
            "object": "Vehicle",
            "confidence": 0.926
          },
          "confidence": 0.923
        },
        "confidence": 0.917
      },
      "confidence": 0.801
    }
  ]
}
{
  "categories": [
    {
      "name": "trans_trainstation",
      "score": 0.98828125
    }
  ],
  "adult": {
    "isAdultContent": false,
    "isGoryContent": false,
    "isRacyContent": false,
    "adultScore": 0.009112834,
    "goreScore": 0.046150554,
    "racyScore": 0.0143244695
  },
  "tags": [
    {
      "name": "train",
      "confidence": 0.9974923
    },
    {
      "name": "platform",
      "confidence": 0.9955777
    },
    {
      "name": "station",
      "confidence": 0.979665935
    },
    {
      "name": "indoor",
      "confidence": 0.9272351
    },
    {
      "name": "subway",
      "confidence": 0.838868737
    },
    {
      "name": "clothing",
      "confidence": 0.5561282
    },
    {
      "name": "person",
      "confidence": 0.505803
    },
    {
      "name": "pulling",
      "confidence": 0.431911945
    }
  ],
  "description": {
    "tags": [
      "train",
      "platform",
      "station",
      "building",
      "indoor",
      "subway",
      "track",
      "walking",
      "waiting",
      "pulling",
      "board",
      "people",
      "man",
      "luggage",
      "standing",
      "holding",
      "large",
      "woman",
      "suitcase"
    ],
    "captions": [
      {
        "text": "people waiting at a train station",
        "confidence": 0.833144546
      }
    ]
  },
  "requestId": "96ccbc16-14fc-46b3-9b3c-e188c90086db",
  "metadata": {
    "width": 600,
    "height": 462,
    "format": "Jpeg"
  },
  "faces": [],
  "color": {
    "dominantColorForeground": "Black",
    "dominantColorBackground": "Black",
    "accentColor": "484C83",
    "isBWImg": false
  },
  "objects": [
    {
      "rectangle": {
        "x": 93,
        "y": 178,
        "w": 115,
        "h": 237
      },
      "object": "person",
      "confidence": 0.764
    },
    {
      "rectangle": {
        "x": 0,
        "y": 229,
        "w": 101,
        "h": 206
      },
      "object": "person",
      "confidence": 0.624
    },
    {
      "rectangle": {
        "x": 161,
        "y": 31,
        "w": 439,
        "h": 423
      },
      "object": "subway train",
      "parent": {
        "object": "train",
        "parent": {
          "object": "Land vehicle",
          "parent": {
            "object": "Vehicle",
            "confidence": 0.926
          },
          "confidence": 0.923
        },
        "confidence": 0.917
      },
      "confidence": 0.801
    }
  ]
}

Transformieren Sie Ihre Prozesse

Identifizieren Sie mehr als 10.000 Objekte und Konzepte in Ihren Bildern automatisch. Extrahieren Sie gedruckten und handschriftlichen Text aus mehreren Bild- und Dokumenttypen, nutzen Sie die Unterstützung für mehrere Sprachen und gemischte Schreibstile. Wenden Sie diese Features für maschinelles Sehen an, um Prozesse zu optimieren, z. B. die robotergesteuerte Prozessautomatisierung und die digitale Ressourcenverwaltung.

Maximieren des Werts des physischen Raums Ihrer Organisation

Erfassen Sie Informationen darüber, wie sich Menschen in einem physischen Bereich bewegen, z. B. in einem Büro oder einem Geschäft. Entwickeln Sie Apps, die die Anzahl von Personen in einem Raum zählen, Pfade nachverfolgen, die Verweilzeit vor einer Auslage im Einzelhandel erfassen und Wartezeiten in Warteschlangen ermitteln können. Verwenden Sie diese Features zum Entwickeln von Lösungen, die die Belegungssteuerung, die räumliche Distanzierung, die Optimierung der Layouts von Geschäften und Büros und die Beschleunigung des Kassiervorgangs ermöglichen. Sie können den Dienst mit mehreren Kameras und Standorten ausführen.

Weitere Informationen zu dieser Funktion

Bereitstellungen von der Cloud bis zum Edge

Führen Sie maschinelles Sehen mithilfe von Containern in der Cloud oder in der lokalen Umgebung aus. Wenden Sie es in verschiedenen Szenarios an, zum Beispiel für die Bildanalyse für Patientendaten, die Textextraktion aus sicheren Dokumenten oder die Analyse der Bewegung von Kunden in einem Geschäft, bei denen die Sicherheit der Daten und eine niedrige Latenz unverzichtbar sind.

Informationen zur Verwendung von „Maschinelles Sehen“ in Containern

Vertrauen Sie auf die branchenführende Azure-Sicherheit

  • Microsoft investiert über USD 1 billion pro Jahr in Forschung und Entwicklung im Bereich Cybersicherheit.

  • Microsoft beschäftigt mehr als 3.500 Sicherheitsexperten, die ausschließlich den Schutz und die Sicherheit Ihrer Daten im Blick haben.

  • Azure verfügt über mehr Zertifizierungen als jeder andere Cloudanbieter. Sehen Sie sich die vollständige Liste an.

Erstklassiges Modell für maschinelles Sehen zu einem fairen Preis

Zahlen Sie nur für die tatsächliche Nutzung und keine Vorabkosten. Bei der Funktion „Maschinelles Sehen“ richten sich Ihre Gebühren nach der Anzahl der Transaktionen.

In drei Schritten zu maschinellem Sehen

Wenn Sie sich für ein kostenloses Azure-Konto registrieren, erhalten Sie sofortigen Zugriff und ein Guthaben von $200.

Melden Sie sich beim Azure-Portal an, und fügen Sie „Maschinelles Sehen“ hinzu.

Erfahren Sie in Schnellstarts und in der Dokumentation, wie Sie maschinelles Sehen einbetten.

Dokumentation und Ressourcen

Codebeispiele

Beispielcode

Updates, Blogbeiträge und Ankündigungen zu maschinellem Sehen

Häufig gestellte Fragen zum maschinellem Sehen

  • Sehen Sie sich die Verfügbarkeit nach Region an.
  • Für das maschinelle Sehen und andere Angebote im Bereich „Cognitive Services“ wird eine Verfügbarkeit von 99,9 Prozent garantiert. Für den Free-Tarif wird keine SLA bereitgestellt. Siehe SLA-Details.
  • Ihre Bilder und Videos werden automatisch nach der Verarbeitung gelöscht. Microsoft nutzt Ihre Daten nicht zum Trainieren und Optimieren der zugrunde liegenden Modelle. Die Videodaten verlassen Ihre lokalen Ressourcen nicht und werden nicht im Edgegateway gespeichert, in dem der Container ausgeführt wird. Erfahren Sie mehr über den Datenschutz und die Nutzungsbedingungen.
  • Ja, Sie können einzelne Bilder aus Videoinhalten extrahieren. Mit der „räumlichen Analyse“ können Sie Videostreams mit hoher Bildfrequenz mithilfe von Kameras identifizieren, die per Real-Time Streaming Protocol verbunden sind.
  • Die „räumliche Analyse“ erkennt und ortet Menschen in Videoaufnahmen und -ausgaben mithilfe eines Begrenzungsrahmens um einen menschlichen Körper. Die KI-Modelle erkennen keine Gesichter und ermitteln keine Identitäten oder demografischen Daten von Einzelpersonen.
  • Die KI-Modelle erkennen und verfolgen Bewegungen im Videofeed auf Grundlage von Algorithmen, die Menschen anhand eines Begrenzungsrahmens für den Körper erkennen. Für jede Begrenzungsrahmenbewegung in einem Bereich der Kameraaufnahme geben die KI-Modelle Ereignisdaten aus, einschließlich: Begrenzungsrahmenkoordinaten für den Körper einer Person, Ereignistyp (z. B. Betreten oder Verlassen des Bereichs, Überschreitung einer direktionalen Linie), pseudonymer Bezeichner zur Nachverfolgung des Begrenzungsrahmens und Zuverlässigkeitsbewertung für die Erkennung. Diese Ereignisdaten werden an Ihre eigene Instanz von Azure IoT Hub gesendet.

Sind Sie bereit? Dann richten Sie Ihr kostenloses Azure-Konto ein.