Was ist Deep Learning?
Deep Learning ist eine Art des Machine Learning, bei der künstliche neuronale Netze verwendet werden, damit digitale Systeme trainiert werden und Entscheidungen auf Grundlage von unstrukturierten und nicht bezeichneten Daten treffen können.
Normalerweise werden KI-Systeme mit Machine Learning darauf trainiert, aus Erfahrungen mit Daten zu lernen, Muster zu erkennen, Empfehlung zu geben und sich anzupassen. Durch Deep Learning sollen digitale Systeme jedoch nicht nur auf Regelsätze reagieren, sondern sich Wissen aus Beispielen aneignen und dieses anwenden, um wie ein Mensch zu reagieren und zu arbeiten sowie sich menschlich zu verhalten.
Relevanz von Deep Learning
Data Scientists und Entwickler setzen Deep-Learning-Software ein, um Computer für die Analyse großer und komplexer Datasets, komplizierte und nicht lineare Aufgaben und die Reaktion auf Texte, Stimmen oder Bilder zu trainieren. Die Ergebnisse sind häufig schneller und präziser als durch Menschen. Für diese Funktionen gibt es viele praktische Anwendungsfälle, und viele moderne Innovationen wurden nur dadurch ermöglicht. Mit Deep Learning verarbeiten autonome Fahrzeuge beispielsweise Bilder und unterscheiden Fußgänger von anderen Objekten auf der Straße. Auch Ihre Smart-Home-Geräte können Ihre Sprachbefehle nur dank dieser Technologie verstehen.
Deep Learning ist eine wichtige Technologie, denn die Datenmengen nehmen stetig zu, und Computekapazität wird immer leistungsfähiger und erschwinglicher. Daher investieren Unternehmen im Einzelhandel, Gesundheitswesen, in der Transportbranche, der Fertigungsindustrie, der Technologiebranche und in anderen Sektoren in Deep Learning, um Innovationen zu befeuern, Geschäftschancen zu erschließen und konkurrenzfähig zu bleiben.
So funktioniert Deep Learning
Für das Deep Learning werden neuronale Netzarchitekturen mit mehreren Schichten und leistungsstarken GPUs verwendet, die in der Cloud oder in Clustern bereitgestellt wurden. Es werden große Mengen gekennzeichneter Daten verwendet, um eine hohe Präzision bei der Text-, Sprach- und Bilderkennung zu erzielen. Dadurch können Entwickler digitale Systeme mit menschenähnlicher Intelligenz schaffen und die Time-to-Value durch eine Reduzierung der Trainingsdauer für Modelle von Wochen auf Stunden optimieren.
Für das Training eines Modells für ein autonomes Fahrzeug werden beispielsweise Tausende Stunden an Videomaterial und Millionen von Bildern benötigt. Ohne Deep Learning wäre ein solches Training nicht in diesem Umfang möglich.
Was ist ein Deep-Learning-Framework?
Entwickler verwenden Deep-Learning-Frameworks wie TensorFlow oder PyTorch, um die Implementierung komplexer Machine-Learning-Modelle zu vereinfachen. Mit diesen Frameworks kann das Sammeln der Daten optimiert werden, die dann für das Training neuronaler Netze verwendet werden. Darüber hinaus können Accelerators wie ONNX Runtime mit diesen Frameworks kombiniert werden, um das Training und die Rückschlüsse aus Modellen zu beschleunigen.
Deep-Learning-Modelle trainieren
Für das Training von Deep-Learning-Modellen gibt es unterschiedliche Strategien und Methoden. Einige davon werden hier näher behandelt.
Überwachtes Lernen
Beim überwachten Lernen wird ein Algorithmus mit gekennzeichneten Datasets trainiert. Wenn ein Algorithmus also eine Feststellung zu einer bestimmten Information trifft, können die auf die Daten angewendeten Labels verwendet werden, um die Korrektheit dieser Feststellung zu überprüfen. Die Trainingsdaten für Modelle müssen beim überwachten Lernen von einem menschlichen Benutzer bereitgestellt werden, der diese kennzeichnet, bevor der Algorithmus damit trainiert wird.
Unüberwachtes Lernen
Beim unüberwachten Lernen werden Algorithmen mit Daten ohne Labels oder Informationen trainiert, die der Algorithmus mit seinen Feststellungen abgleichen könnte. Stattdessen sortiert und klassifiziert das System die Daten anhand der Muster, die es selbst erkennt.
Vertiefendes Lernen
Durch vertiefendes Lernen (auch Reinforcement Learning) bewältigt ein System Aufgaben mit einem Trial-and-Error-Ansatz, um sequenzielle Entscheidungen zu treffen und ein beabsichtigtes Ergebnis zu erreichen, auch wenn die Umgebung nicht ideal ist. Beim vertiefenden Lernen verwendet der Algorithmus keine Datasets für Feststellungen, sondern aus der Umgebung gesammelte Informationen.
Deep Reinforcement Learning
Durch die Kombination von Deep Learning und Reinforcement Learning entsteht eine neue Art des Machine Learning, die als Deep Reinforcement Learning bezeichnet wird. Beim Deep Reinforcement Learning werden die gleichen auf einem Trial-and-Error-Ansatz basierenden Mechanismen für die Entscheidungsfindung und die Methoden zum Erreichen komplexer Ziele wie beim Reinforcement Learning verwendet, doch mithilfe der Deep-Learning-Funktionen werden große Mengen unstrukturierter Daten verarbeitet und erschlossen.
Wofür wird Deep Learning verwendet?
Deep Learning wird von Unternehmen aus vielerlei Branchen für die unterschiedlichsten Anwendungsfälle eingesetzt. Hier finden Sie einige Beispiele für häufige Anwendungsfälle für Deep Learning:
Bild-, Sprach- und Emotionserkennung
Mit Deep-Learning-Software wird die Präzision der Bild-, Sprach- und Emotionserkennung erhöht. Dadurch wird der Weg für Fotosuchen, persönliche digitale Assistenten, autonome Fahrzeuge, Maßnahmen für die öffentliche und digitale Sicherheit sowie weitere intelligente Technologien geebnet.
Maßgeschneiderte Customer Experience
Streamingdienste, Onlinehändler und andere Unternehmen setzen auf Deep-Learning-Modelle, um automatisierte Empfehlungen für Produkte, Filme, Musik und andere Dienstleistungen zu geben und die Nutzung für den Kunden auf Grundlage bisheriger Käufe, Verhaltensweisen und anderen Daten zu perfektionieren.
Chatbots
Manche Unternehmen setzen Deep Learning für text- oder sprachaktivierte Chatbots ein, die häufig gestellte Fragen beantworten, Routinetransaktionen erledigen und Kundensupport leisten. Sie ersetzen Serviceteams, ersparen Kunden den Aufenthalt in Warteschlangen und geben automatisierte, kontextbezogene und nützliche Antworten.
Persönliche digitale Assistenten
Sprachaktivierte digitale Assistenten nutzen Deep Learning, um Spracheingaben zu verstehen und sowohl in natürlicher Sprache als auch korrekt auf Fragen und Befehle zu reagieren – und gelegentlich auch mit dem Benutzer zu scherzen.
Autonome Fahrzeuge
Autonome Fahrzeuge sind das inoffizielle Aushängeschild für KI und Deep Learning, denn sie verwenden Deep-Learning-Algorithmen, um mehrere dynamische Datenfeeds in Sekundenbruchteilen zu verarbeiten, sodass sie nie nach dem Weg fragen müssen und auf unerwartete Situationen reagieren können – und das schneller als ein menschlicher Fahrer.
Viele Unternehmen verwenden Open-Source-Software für Machine Learning, um Deep-Learning-Lösungen in ihre Organisationen zu integrieren.
Was sind neuronale Netze?
Ein neuronales KI-Netz (ANN, Artificial Neuronal Network) ist eine digitale Architektur, die menschliche Denkprozesse imitiert, um komplexe Muster zu modellieren, Vorhersagen zu treffen und angemessen auf externe Trigger zu reagieren. Für viele Arten des Machine Learning werden strukturierte Daten benötigt. Neuronale Netze hingegen können Ereignisse in ihrer Umgebung als Daten interpretieren, die verarbeitet werden können.
Wenn Sie etwas lesen, einen Film ansehen, Auto fahren oder an einer Blume riechen, verarbeiten Milliarden von Neuronen in Ihrem Gehirn diese Informationen durch elektrische Signale. Jedes Neuron verarbeitet Eingaben, und die Ergebnisse werden als Ausgaben an das nächste Neuron übergeben. So werden diese weiterverarbeitet, bis schließlich Business Insights, ein Kichern, eine Bremsreaktion oder ein Moment der Freude entstehen. Beim Machine Learning ermöglichen neuronale Netze es digitalen Systemen, Situationen auf die gleiche Weise zu interpretieren und identisch zu reagieren.
Ein ANN ist wie ein Gehirn voller digitaler Neuronen. Die meisten ANNs sind zwar unvollständige Imitationen, können jedoch große Mengen nicht linearer Daten verarbeiten, um komplexe Probleme zu bewältigen, für die andernfalls menschliches Eingreifen erforderlich wäre. Bankanalysten können beispielsweise ein ANN verwenden, um Kreditanträge zu verarbeiten und die Wahrscheinlichkeit eines Kreditausfalls zu berechnen.
Einsatzmöglichkeiten für neuronale Netze
Beim Machine Learning werden neuronale Netze für das Lernen und die Modellierung komplexer, flüchtiger Ein- und Ausgaben, die Ableitung unerkannter Beziehungen und Vorhersagen ohne Einschränkungen der Datenverteilung verwendet. Modelle mit neuronalen Netzen stellen die Grundlage für viele Deep-Learning-Anwendungen dar, zum Beispiel für maschinelles Sehen und die Verarbeitung natürlicher Sprache, die unter anderem den Betrugsschutz, die Gesichtserkennung und das autonome Fahren ermöglichen.
Die meisten Unternehmen verlassen sich bei Geschäftsentscheidungen, Vertriebsstrategien, Finanzpolitik und Ressourcennutzung auf Vorhersagen. Für herkömmliche Vorhersagen gelten jedoch Einschränkungen, die das Prognostizieren komplexer, dynamischer Prozesse mit verschiedenen, häufig verborgenen Faktoren erschweren. Ein Beispiel dafür sind Aktienkurse. Deep-Learning-Modelle mit neuronalen Netzen können nicht lineare Beziehungen erkennen und verborgene Faktoren aufdecken, damit Unternehmen präzise Vorhersagen für die meisten Geschäftsaktivitäten entwickeln können.
Gängige neuronale Netze
Es gibt etliche Arten neuronaler KI-Netze (ANN, Artificial Neuronal Network), die jeweils für unterschiedliche Deep-Learning-Anwendungsfälle geeignet sind. Verwenden Sie ein ANN, das für Ihre geschäftlichen und technologischen Anforderungen geeignet ist. Im Folgenden finden Sie einige Beispiele für gängige neuronale KI-Netze:
Convolutional Neural Network (CNN)
Entwickler verwenden CNNs, damit KI-Systeme Bilder in digitale Matrizen konvertieren können. CNNs werden hauptsächlich für die Bildklassifizierung und Objekterkennung verwendet und sind für die Gesichtserkennung, Themenerkennung und Stimmungsanalyse geeignet.
Deconvolutional Neural Network (DNN)
Wenn komplexe oder umfangreiche Netzwerksignale verloren gehen oder mit anderen Signalen vermischt werden, kann ein DNN diese ermitteln. DNNs sind für die Verarbeitung hochauflösender Bilder und optischer Flowschätzungen nützlich.
Generative Adversarial Network (GAN)
Engineers verwenden GANs, um Modelle auf die Generierung neuer Informationen oder neuen Materials zu trainieren, die bestimmte Eigenschaften der Trainingsdaten imitieren. Mithilfe von GANs können Modelle geringfügige Unterschiede zwischen Originalen und Kopien erkennen, um authentischere Kopien zu erstellen. GAN-Anwendungen können für die Generierung hochauflösender Bilder und Videos, die fortschrittliche Gesichtserkennung und Super-Resolution Imaging eingesetzt werden.
Recurrent Neural Network (RNN)
Ein RNN gibt Daten mit bestimmten Zeitverzögerungen in verborgene Schichten ein. Für das Netzwerkcomputing werden Verlaufsdaten mit aktuellen Zustandsinformationen benötigt, und die Modellgröße nimmt durch ein höheres Eingabevolumen nicht zu. RNNs sind für die Spracherkennung, komplexe Vorhersagen, die Robotik und andere komplexe Deep-Learning-Workloads ideal.
Transformer
Transformer sind für die Verarbeitung sequenzieller Eingabedaten konzipiert. Sie verarbeiten diese Daten jedoch nicht zwangsläufig sequenziell. Für Transformer wird stattdessen ein Aufmerksamkeitsmechanismus verwendet, mit dem Modelle bestimmten Teilen der Eingabe verschiedene Einflussgrade zuweisen können. So kann auch der Kontext für einzelne Daten in der Eingabesequenz bestimmt werden. Dadurch wird ein höherer Parallelisierungsgrad ermöglicht, der die Trainingsdauer des Modells verringern kann.
Machine Learning und neuronale Netze im Vergleich
Neuronale Netze sind ein Teilgebiet des Machine Learning, doch es gibt grundlegende Unterschiede zwischen neuronalen Netzen und gewöhnlichen Machine Learning-Modellen.
Einerseits sind neuronale Netze generell komplexer und arbeiten unabhängiger als gewöhnliche Machine Learning-Modelle. Ein neuronales Netz kann beispielsweise selbstständig bestimmen, ob Vorhersagen und Ergebnisse präzise sind. Ein Machine Learning-Modell würde für diese Entscheidung eine Eingabe durch einen Menschen benötigen.
Darüber hinaus sind neuronale Netze darauf ausgelegt, selbstständig weiterzulernen und intelligente Entscheidungen zu treffen. Machine Learning-Modelle können nur Entscheidungen treffen, für die sie explizit trainiert wurden.
Erste Schritte mit Deep Learning in Azure
Erkennen Sie Bilder mit neuronalen Netzen, oder optimieren Sie die Verarbeitung natürlicher Sprache mit schnellen, unkomplizierten und präzisen BERT-Sprachmodellen. Erfahren Sie, wie Sie alle Arten von Deep-Learning-Modellen mit Azure Machine Learning entwickeln, trainieren und bereitstellen.
Machine Learning für wissenschaftliche Fachkräfte für Daten
Hier lernen Sie Machine-Learning-Tools für wissenschaftliche Fachkräfte für Daten und Machine-Learning-Entwickler in Azure kennen und erfahren, wie Sie Machine-Learning-Lösungen für die Cloud entwickeln.