Navigation überspringen

Was ist maschinelles Sehen?

Informieren Sie sich über maschinelles Sehen, seine Funktionsweise und seine Einsatzgebiete.

Maschinelles Sehen

Maschinelles Sehen ist ein Bereich der Informatik, bei dem der Schwerpunkt darauf liegt, Computer mit der Fähigkeit zum Erkennen und Erfassen von Gegenständen und Personen in Bildern und Videos auszustatten. Wie bei anderen Arten künstlicher Intelligenz soll maschinelles Sehen dazu dienen, Aufgaben durchzuführen und zu automatisieren, die menschlichen Fähigkeiten entsprechen. In diesem Fall soll maschinelles Sehen die Art und Weise replizieren, wie Menschen sehen und wie Menschen die Eindrücke verarbeiten.

Aufgrund des praktischen Anwendungsbereichs der Technologie für maschinelles Sehen ist sie zentraler Bestandteil vieler moderner Innovationen und Lösungen. Maschinelles Sehen kann in der Cloud oder lokal ausgeführt werden.

Funktionsweise des maschinellen Sehens

Anwendungen für das maschinelle Sehen verwenden Eingaben von Sensorgeräten, künstliche Intelligenz, maschinelles Lernen und Deep Learning, um die Funktionsweise des menschlichen visuellen Wahrnehmungssystems zu replizieren. Anwendungen für das maschinelle Sehen werden auf Algorithmen ausgeführt, die mit riesigen Mengen an visuellen Daten oder Bildern in der Cloud trainiert werden. Diese erkennen Muster in diesen visuellen Daten und verwenden diese Muster zum Ermitteln des Inhalts anderer Bilder.

Bildanalyse mit maschinellem Sehen

  • Ein Sensorgerät erfasst ein Bild. Das Sensorgerät ist oft einfach eine Kamera, kann aber auch eine Videokamera, ein bildgebendes Gerät in der Medizin oder ein beliebiger anderer Gerätetyp sein, der ein Bild für die Analyse erfasst.
  • Das Bild wird dann an ein Auswertungsgerät gesendet. Das Auswertungsgerät verwendet die Mustererkennung, um das Bild in seine Bestandteile aufzuteilen, die Muster im Bild mit der Bibliothek bekannter Muster zu vergleichen und zu bestimmen, ob eine Übereinstimmung mit dem Inhalt im Bild vorliegt. Bei dem Muster kann es sich um allgemeine Eigenschaften handeln, z. B. das Erscheinungsbild eines bestimmten Typs von Gegenstand, oder es kann sich um eindeutige Merkmale handeln wie Gesichtszüge.
  • Ein Benutzer fordert bestimmte Informationen zu einem Bild an, und das Auswertungsgerät stellt die angeforderten Informationen auf Grundlage der Bildanalyse bereit.

Deep Learning und maschinelles Sehen

Moderne Anwendungen für das maschinelle Sehen verwenden zunehmend das sogenannte Deep Learning anstelle von statistischen Methoden für die Analyse von Bildern. Beim Deep Learning wird eine Anwendung für das maschinelle Sehen auf der Grundlage einer Art von Algorithmus ausgeführt, die als neuronales Netzwerk bezeichnet wird und noch genauere Bildanalysen erlaubt. Außerdem ermöglicht Deep Learning einem Programm für maschinelles Sehen, auf die Informationen aus den einzelnen bereits analysierten Bildern zurückzugreifen, sodass die Ergebnisse im Laufe der Zeit immer genauer werden.

Funktionen zum maschinellen Sehen

Es gibt drei Hauptfunktionen bei der Verarbeitung von Bildern durch maschinelles Sehen und die Rückgabe von Informationen:

Das System klassifiziert die Objekte in einem Bild gemäß einer definierten Kategorie. Beispielsweise kann ein Computer anhand der Objektklassifizierung Personen von Objekten in einem Foto unterscheiden und ermitteln, wie viele Personen das Foto zeigt.

Das System erkennt ein bestimmtes Objekt in einem Foto, Video oder Bild. Beispielsweise kann das System anhand der Objektidentifizierung nicht nur Personen in einem Foto unterscheiden, sondern auch ihr Erscheinungsbild analysieren, um die Identität oder die Merkmale dieser Personen zu ermitteln.

Das System analysiert ein Video, um die Position eines sich bewegenden Objekts im zeitlichen Verlauf zu verfolgen. Beispielsweise könnte bei der Objektverfolgung eine Überwachungskamera auf einem Parkplatz Autos erkennen und Informationen über den Standort und die Bewegungen dieser Fahrzeuge im Laufe der Zeit bereitstellen.

Das System erkennt Buchstaben und Ziffern in Bildern und konvertiert diesen Text in maschinenlesbaren Text, der von anderen Computeranwendungen gelesen oder von Benutzern bearbeitet werden kann.

Einsatzgebiete von maschinellem Sehen

Maschinelles Sehen ist eine leistungsstarke Funktion, die mit vielen Einsatzbereichen und Sensorgeräten kombiniert werden kann, um eine Reihe praktischer Anwendungsfälle zu unterstützen. Hier einige verschiedene Anwendungsfälle für maschinelles Sehen:

Inhaltsverwaltung

Maschinelles Sehen kann verwendet werden, um Personen oder Objekte in Fotos zu identifizieren und auf der Grundlage dieser Identifikation zu kategorisieren. Solche Fotoerkennungsanwendungen werden häufig in Fotospeicher- und Social Media-Anwendungen verwendet.

Textextraktion

Mit der optischen Zeichenerkennung kann die Verfügbarkeit von Inhalten hinsichtlich der Informationen verbessert werden, die in großen Mengen an Text enthalten sind. Außerdem wird so die Dokumentverarbeitung in automatisierten Szenarien mit maschineller Verarbeitung ermöglicht.

Augmented Reality

Physische Gegenstände werden mit maschinellem Sehen in Echtzeit erkannt und nachverfolgt. Anhand dieser Informationen werden virtuelle Objekte dann in einer physischen Umgebung verortet.

Landwirtschaft

Aufnahmen von Feldern, die von Satelliten, Drohnen oder Flugzeugen erfasst werden, können analysiert werden, um die Ernte zu überwachen, das Wachstum von Unkraut oder Nährstoffmangel zu erkennen.

Autonomes Fahren

Beim autonomen Fahren werden Objekterkennung und -verfolgung in Echtzeit verwendet, um die Umgebung um das Fahrzeug zu erfassen und das Fahrzeug entsprechend zu steuern.

Gesundheitswesen

Fotos und Bilder von anderen medizinischen Geräten können analysiert werden, um Ärzte bei der Auswertung zu unterstützen und es ihnen zu ermöglichen, schneller genauere Diagnosen zu erstellen.

Sport

Objekterkennung und -verfolgung werden für die Spiel- und Strategieanalyse herangezogen.

Fertigungsindustrie

Mit maschinellem Sehen können Fertigungsmaschinen zu Wartungszwecken überwacht werden. Es kann auch verwendet werden, um Produktqualität und -verpackung in einer Fertigungsanlage zu überwachen.

Räumliche Analyse

Das System erkennt Personen oder Objekte wie Autos im Raum und verfolgt deren Bewegungen innerhalb dieses Raums.

Gesichtserkennung

Maschinelles Sehen kann verwendet werden, um Personen zu erkennen.

Azure-Lösungen für maschinelles Sehen durchsuchen

Machen Sie sich mit Azure Cognitive Services vertraut, einer umfassenden Familie von KI-Diensten und kognitiven APIs zum Entwickeln intelligenter Apps mit Funktionen des maschinellen Sehens.

Grundlagen des maschinellen Sehens in Azure

Verbessern Sie die Erkennbarkeit von Inhalten, beschleunigen Sie die Textextraktion, und entwickeln Sie Produkte für einen breiteren Benutzerkreis, indem Sie visuelle Funktionen in Ihre Apps einbetten.

Weitere Informationen
Können wir Ihnen helfen?