Trace Id is missing
Zum Hauptinhalt wechseln

Machine-Learning-Algorithmen

Eine Einführung in die Mathematik und Logik von Machine Learning

Was sind Machine-Learning-Algorithmen?

Machine-Learning-Algorithmen sind Codeelemente, mit denen man komplexe Datasets untersuchen, analysieren und nützliche Erkenntnisse gewinnen kann. Jeder Algorithmus ist eine endliche Menge eindeutiger Schritt-für-Schritt-Anweisungen, die ein Computer abarbeiten kann, um ein bestimmtes Ziel zu erreichen. Das Ziel eines Machine-Learning-Modells besteht darin, Muster zu entwickeln oder zu erkennen, mit denen Benutzer Vorhersagen treffen oder Informationen kategorisieren können. Was ist Machine Learning?

Machine-Learning-Algorithmen verwenden Parameter, die auf Trainingsdaten basieren (einer Teilmenge, die ein größeres Dataset repräsentiert). Wenn die Trainingsdaten erweitert werden, um praxisnahe Bedingungen zu schaffen, berechnet der Algorithmus genauere Ergebnisse.

Unterschiedliche Algorithmen analysieren Daten auf verschiedene Weisen. Häufig werden sie nach den Machine-Learning-Verfahren gruppiert, für die sie bestimmt sind: überwachtes Lernen, unüberwachtes Lernen und verstärkendes Lernen. Die meistgenutzten Algorithmen basieren auf Regressionen und Klassifizierungen, um Zielkategorien und Werte vorherzusagen, atypische Datenpunkte zu ermitteln und Ähnlichkeiten aufzudecken.

Machine-Learning-Verfahren

Wenn Sie sich intensiver mit Machine-Learning-Algorithmen befassen, werden Sie feststellen, dass diese in der Regel einem der folgenden drei Machine-Learning-Verfahren zugeordnet sind:


Überwachtes Lernen

Beim überwachten Lernen treffen Algorithmen Vorhersagen auf Grundlage von bezeichneten Beispielen, die von Ihnen selbst bereitgestellt werden. Dieses Verfahren ist nützlich, wenn Sie das gewünschte Ergebnis bereits kennen.
 

Das gilt beispielsweise für ein Dataset, das die Einwohnerzahl einer Stadt nach Jahr für die letzten 100 Jahre enthält, und Sie wissen möchten, wie groß die Bevölkerung dieser Stadt in vier Jahren sein wird. Für das Ergebnis werden bereits im Dataset angelegte Bezeichnungen verwendet: Bevölkerung, Stadt und Jahr.
 

Unüberwachtes Lernen

Beim unüberwachten Lernen haben die Datenpunkte keine Bezeichnung. Der Algorithmus erledigt diesen Schritt, indem er die Daten organisiert oder die Struktur beschreibt. Dieses Verfahren ist hilfreich, wenn Sie das gewünschte Ergebnis nicht kennen.

 

Das gilt zum Beispiel, wenn Sie Kundendaten angeben und Segmente von Kunden erstellen möchten, die an ähnlichen Produkten interessiert sind. Die von Ihnen angegebenen Daten haben keine Bezeichnung, und die Bezeichnungen im Ergebnis werden anhand der Ähnlichkeiten generiert, die zwischen Datenpunkten ermittelt werden.

 

Verstärkendes Lernen

Beim verstärkenden Lernen werden Algorithmen verwendet, die aus den Ergebnissen lernen und entscheiden, welche Aktion als Nächstes folgt. Nach jeder Aktion erhält der Algorithmus eine Rückmeldung, durch die er bestimmen kann, ob die Entscheidung korrekt, neutral oder falsch war. Dieses Verfahren eignet sich gut für automatisierte Systeme, die ohne Zutun des Benutzers viele kleine Entscheidungen treffen müssen.

 

Nehmen wir als Beispiel die Entwicklung eines autonomen Fahrzeugs. Dabei muss sichergestellt werden, dass es für die Insassen sicher und mit dem Gesetz konform ist. Mit zunehmender Fahrpraxis und Verstärkung lernt das Fahrzeug, in der Spur zu bleiben, das Tempolimit einzuhalten und für Fußgänger zu bremsen.

Einsatzmöglichkeiten für Machine-Learning-Algorithmen

Mithilfe von Machine-Learning-Algorithmen lassen sich Fragen beantworten, die für manuelle Analysen zu komplex wären. Es gibt verschiedenste Machine-Learning-Algorithmen, doch die Anwendungsfälle entsprechen in der Regel einer der folgenden Kategorien.

Zielkategorie vorhersagen

Zweiklassige (binäre) Klassifizierungsalgorithmen unterteilen Daten in zwei Kategorien. Sie sind besonders nützlich für Fragestellungen, bei denen es nur zwei mögliche Antworten gibt, die sich gegenseitig ausschließen (z. B. Ja/Nein-Fragen). Beispiel:

  • Übersteht dieser Reifen die nächsten 1.500 km: ja oder nein?
  • Was bringt mehr Neukunden: eine Gutschrift über 10 USD oder ein Rabatt von 15 Prozent?

 

Algorithmen für mehrklassige (multinominale) Klassifizierung unterteilen Daten in mindestens drei Kategorien. Sie sind nützlich für Fragestellungen, bei denen es mindestens drei mögliche Antworten gibt, die sich gegenseitig ausschließen. Beispiel:

  • In welchem Monat kaufen die meisten Reisenden Flugtickets?
  • Welche Gefühlslage drückt die Person auf diesem Foto aus?

Untypische Datenpunkte ermitteln

Algorithmen zur Anomalieerkennung ermitteln Datenpunkte, die außerhalb der für den Normalzustand definierten Parameter liegen. Mit Algorithmen für die Anomalieerkennung lassen sich beispielsweise folgende Fragestellungen beantworten:

  • Welche Teile dieser Charge sind fehlerhaft?
  • Bei welchen Kreditkartenkäufen könnte es sich um Betrug handeln?

Werte vorhersagen

Regressionsalgorithmen sagen den Wert eines neuen Datenpunkts anhand der Verlaufsdaten voraus. Sie unterstützen die Beantwortung folgender Fragen:

  • Wie viel kostet eine Zwei-Zimmer-Wohnung in meiner Stadt durchschnittlich im nächsten Jahr?
  • Wie viele Patienten kommen am Dienstag in die Klinik?

Wertänderungen im Zeitverlauf nachverfolgen

Zeitreihenalgorithmen stellen die Veränderungen eines bestimmten Werts über einen gewissen Zeitraum dar. Bei Zeitreihenanalysen und -vorhersagen werden Daten in regelmäßigen Intervallen gesammelt und verwendet, um Vorhersagen zu treffen sowie Trends, saisonale Schwankungen, Konjunkturzyklen und Unregelmäßigkeiten zu erkennen. Zeitreihenalgorithmen unterstützen die Beantwortung folgender Fragen:

  • Wird der Kurs einer bestimmten Aktie im kommenden Jahr voraussichtlich steigen oder fallen?
  • Wie hoch werden meine Ausgaben im nächsten Jahr sein?

Ähnlichkeiten ermitteln

Clusteringalgorithmen teilen Daten in mehrere Gruppen auf, indem sie den Ähnlichkeitsgrad zwischen Datenpunkten ermitteln. Clusteringalgorithmen sind für folgende Fragestellungen gut geeignet:

  • Welche Besucher mögen dasselbe Filmgenre?
  • Welche Druckermodelle haben die gleichen technischen Probleme?

Klassifizierung

Klassifizierungsalgorithmen verwenden Vorhersageberechnungen, um Daten vordefinierten Kategorien zuzuweisen. Sie werden anhand von Eingabedaten trainiert und zur Beantwortung folgender Fragen verwendet:

  • Handelt es sich bei dieser E-Mail um Spam?
  • Welche Stimmung vermittelt ein bestimmter Text (positiv, negativ oder neutral)?

Algorithmen für die lineare Regression stellen die Beziehung zwischen zwei Variablen oder Faktoren dar oder sagen diese voraus, indem sie eine kontinuierliche gerade Linie an die Daten anpassen. Die Linie wird häufig mithilfe der Kostenfunktion für die quadratische Abweichung berechnet. Die lineare Regression zählt zu den häufigsten Arten der Regressionsanalyse.

Algorithmen für logistische Regression passen eine fortlaufende S-förmige Kurve an die Daten an. Die logistische Regression ist in der Regressionsanalyse ebenfalls häufig anzutreffen.

Naïve Bayes -Algorithmen berechnen die Wahrscheinlichkeit, dass ein Ereignis eintritt, anhand des Auftretens eines ähnlichen Ereignisses.
Support Vector Machines zeichnen eine Hyperebene zwischen den zwei nächstgelegenen Datenpunkten. Dadurch werden die Klassen marginalisiert. Außerdem wird die Distanz maximiert, um die Klassen deutlicher abzugrenzen.

Algorithmen für Entscheidungsstrukturen teilen die Daten in mindestens zwei homogene Gruppen auf. Dabei kommen Wenn-Dann-Regeln zum Einsatz, um die Daten auf Basis des wichtigsten Unterscheidungsmerkmals zwischen Datenpunkten zu differenzieren.

K-Nearest-Neighbor -Algorithmen speichern alle verfügbaren Datenpunkte und klassifizieren jeden neuen Datenpunkt anhand der nächstgelegenen Datenpunkte, so wie sie von einer Distanzfunktion gemessen werden.
Random-Forest -Algorithmen basieren auf Entscheidungsstrukturen. Statt einer einzelnen Struktur wird jedoch eine Gesamtstruktur erstellt. Anschließend werden die Strukturen in dieser Gesamtstruktur nach dem Zufallsprinzip zugeordnet. Dann werden Stimmen aus unterschiedlichen zufälligen Formationen der Entscheidungsstrukturen aggregiert, um die endgültige Klasse des Testobjekts zu bestimmen.
Gradient Boosting -Algorithmen erzeugen ein Vorhersagemodell, das schwache Vorhersagemodelle – in der Regel Entscheidungsstrukturen – durch einen Ensembling-Prozess bündelt. Damit lässt sich auch die Gesamtleistung des Modells optimieren.
K-Means -Algorithmen klassifizieren Daten in Cluster. Hierbei entspricht „K“ der Anzahl der Cluster. Die Datenpunkte innerhalb der einzelnen Cluster sind homogen. Gegenüber Datenpunkten in anderen Clustern sind sie jedoch heterogen.

Was sind Machine-Learning-Bibliotheken?

Eine Machine-Learning-Bibliothek besteht aus Funktionen, Frameworks, Modulen und Routinen, die in einer bestimmten Programmiersprache geschrieben wurden. Entwickler verwenden den Code in Machine-Learning-Bibliotheken als Bausteine für die Entwicklung von Machine-Learning-Lösungen, die komplexe Aufgaben bewältigen können. Entwickler müssen nicht jeden Algorithmus und jede Formel in einer Machine-Learning-Lösung manuell programmieren, sondern können die benötigten Funktionen und Module aus einer der zahlreichen ML-Bibliotheken entnehmen und so eine bedarfsgerechte Lösung programmieren.

Experimentieren Sie mit Azure Machine Learning

Erfahren Sie, wie sich Daten durch unterschiedliche Algorithmen analysieren lassen, indem Sie eigene Machine-Learning-Modelle mithilfe von Azure Machine Learning entwickeln und bereitstellen.