Was ist Deep Learning und wie wird es eingesetzt

Die Verwendung von Siri oder anderen Sprachassistenten ist heutzutage Teil unseres Alltags geworden, um eine Vielzahl von Aufgaben schnell und einfach zu erledigen. Doch nicht jeder weiß, dass wir uns tatsächlich dem Deep Learning nähern, wenn wir das Potenzial dieser Tools nutzen. Ein Begriff, der in unserem Sprachgebrauch als Deep Learning bezeichnet wird, manche nennen ihn auch hierarchisches Lernen, und der in zweifacher Hinsicht mit dem Konzept des maschinellen Lernens und allgemeiner mit dem der künstlichen Intelligenz (AI) verbunden ist, das aus dem Englischen Artificial Intelligence stammt. Wenn das maschinelle Lernen ein spezifischer Zweig der künstlichen Intelligenz ist, so ist die in diesem Leitfaden betrachtete Technologie eine Untermenge der ersteren und liegt etwas viel breiterem zugrunde als einfaches maschinelles Lernen auf mehreren Ebenen. Wie wir bereits gesagt haben, gibt es unzählige Anwendungsmöglichkeiten, und wir werden die wichtigsten natürlich in den folgenden Abschnitten gemeinsam entdecken.


Die Definition von Deep Learning

Die technische Definition von Deep Learning oder tiefem Lernen ist die einer Klasse von Algorithmen des maschinellen Lernens, d.h. des Forschungsgebiets des maschinellen Lernens, des bereits erwähnten maschinellen Lernens und der künstlichen Intelligenz, die auf verschiedenen Repräsentationsebenen basiert, die Hierarchien von Merkmalen von Faktoren oder Konzepten entsprechen, wobei die Konzepte auf hoher Ebene auf der Grundlage der Konzepte auf niedriger Ebene definiert werden. Die Definition des Observatoriums für künstliche Intelligenz des Politecnico di Milano ist für Laien noch verständlicher: Deep Learning wird als eine Reihe von Techniken beschrieben, die auf künstlichen neuronalen Netzen basieren, die in verschiedenen Schichten organisiert sind, wobei jede Schicht die Werte für die nächste berechnet, so dass die Informationen auf immer vollständigere Weise verarbeitet werden.

Es ist also kein Zufall, dass unter den Architekturen des tiefen Lernens in der Regel die tiefen neuronalen Netze, die Faltung der tiefen neuronalen Netze, die tiefen Glaubensnetze und die rekursiven neuronalen Netze genannt werden. Sie alle stellen einen Ansatz dar, bei dem das Lernen dank der Daten erfolgt, die durch Algorithmen, hauptsächlich statistische Berechnungen, gewonnen werden.

Sie werden also verstanden haben, dass die großen Datenmengen, die von den neuronalen Netzen verarbeitet werden, einem "Weg" folgen, der dem des menschlichen Gehirns sehr ähnlich ist, das die Funktionsweise der gleichen künstlichen Netze inspiriert. Viele Forscher und Wissenschaftler sind für ihr Engagement im Bereich Deep Learning bekannt, darunter Andrew Yan-Tak Ng, der Gründer von Google Brain, Ian J. Goodfellow, der vom MIT Boston als einer der weltbesten Innovatoren unter 35 Jahren ausgezeichnet wurde, Yoshua Bengio, Ilya Sutskever und Geoffrey Everest Hinton, eine der Schlüsselfiguren der künstlichen Intelligenz.

Ihr Beitrag ermöglicht es uns nun, Deep Learning als ein System zu definieren, das eine Klasse von Algorithmen für maschinelles Lernen nutzt, die zunächst verschiedene Ebenen kaskadierender nichtlinearer Einheiten verwenden, um Aufgaben der Merkmalsextraktion und -umwandlung durchzuführen, wobei jede nachfolgende Ebene die Ausgabe der vorherigen Ebene als Eingabe verwendet. Die Algorithmen beruhen dann auf dem so genannten unüberwachten Lernen mehrerer hierarchischer Ebenen von Datenmerkmalen, wodurch eine hierarchische Darstellung entsteht. Und nicht nur das: So wie sie konzipiert sind, lernen sie mehrere Repräsentationsebenen, die verschiedenen Abstraktionsebenen entsprechen, und erzeugen so eine Hierarchie von Konzepten.

Erst um das Jahr 2000 herum begann man, von Deep Learning zu sprechen. In relativ kurzer Zeit haben sich die Anwendungen jedoch dank des technologischen Fortschritts und der immer ausgefeilteren neuronalen Netze rasant vervielfacht. Die ersten Studien über mehrschichtige neuronale Netze wurden von dem japanischen Wissenschaftler Kunihiko Fukushima erstellt und veröffentlicht, der 1975 das Modell des Cognitron und später das des Neo-Cognitron entwickelte. In den 80er Jahren wurde die Analyse der mehrschichtigen künstlichen neuronalen Netze weiter vorangetrieben, aber erst im letzten Jahrzehnt, vor allem dank des Aufkommens von Big Data und der Überwindung bestimmter Beschränkungen, zeigen sie ihr ganzes Potenzial in einer Vielzahl von Bereichen. Heute ermöglichen die Systeme des Deep Learning neben vielen anderen Anwendungen beispielsweise die Identifizierung von Objekten in Bildern und Videos, die Transkription von Sprache in Text oder die Identifizierung und Interpretation der Interessen von Online-Nutzern und liefern Suchergebnisse, die ihren spezifischen Bedürfnissen näher kommen.

Wie Deep Learning funktioniert

Wie im vorherigen Abschnitt des Leitfadens erläutert, basiert das Deep Learning auf der Klassifizierung und der sukzessiven Auswahl der relevantesten Daten, um zu einer möglichst optimalen Schlussfolgerung zu gelangen. Eine Funktionsweise, die der unseres biologischen Gehirns folgt, entweder um die richtige Antwort auf eine Frage zu formulieren, oder um zur Lösung eines bestimmten Problems zu gelangen, oder auch um eine logische Hypothese abzuleiten. Einige von Ihnen erinnern sich vielleicht an den berühmten Fall von AlphaGo, einer Software, die 2016 den Weltmeister in Go besiegt hat, und zwar mehrere Jahre früher als geplant.

Das tiefe Lernen verhält sich also genauso wie das menschliche Denken, allerdings unter Verwendung der künstlichen neuronalen Netze, von denen wir sprachen, d. h. mathematische Computermodelle, die auf der Funktionsweise biologischer neuronaler Netze basieren, die ihrerseits aus Informationsverknüpfungen bestehen. Ein neuronales Netz ist ein anpassungsfähiges System: Es kann seine Struktur, die aus Knoten und relativen Verbindungen besteht, auf der Grundlage externer und interner Daten ändern, die dann das neuronale Netz während der Lern- und Denkphase verbinden und durchqueren.

Das Lernen erfolgt dann sowohl automatisch als auch "tief", wobei tief bedeutet, dass es auf mehreren Ebenen stattfindet. Diese Art des Lernens hat sich als deutlich leistungsfähiger erwiesen als frühere KI-Technologien, so dass sie in jüngster Zeit eine nie dagewesene Aufmerksamkeit in den Medien erregt hat. Und zwangsläufig auch die wissenschaftliche und wirtschaftliche Aufmerksamkeit. An Einschränkungen mangelt es nicht, aber Deep Learning kann sicherlich durch die Qualität der erzielten Ergebnisse hervorgehoben werden, mit einem entsprechenden enormen Vorteil beim Lernen, um komplexe Probleme der Mustererkennung zu lösen. Obwohl der Bedarf an enormer Rechnerkapazität eine Einschränkung darstellen mag, unterscheidet sich Deep Learning vom maschinellen Lernen durch seine Skalierbarkeit, wenn die Menge der verfügbaren Daten und Algorithmen zunimmt.

Ersteres verbessert seine Leistung mit zunehmender Datenmenge, während letzteres, sobald es ein bestimmtes Leistungsniveau erreicht hat, seine Leistung nicht mehr verbessern kann. Denn das komplexe neuronale Netz lernt selbstständig, wie es die Rohdaten analysieren und eine bestimmte Aufgabe erfüllen kann. Der Computer ist also in der Lage, nach einer anfänglichen Trainingsphase ohne menschliche Anleitung "von selbst zu lernen". Letztlich geht es darum, Zeit und Ressourcen zu sparen, vor allem bei Routinearbeiten, die viel effizienter und schneller als jeder Mensch, ohne jeglichen Aufwand und in nahezu gleichbleibender Qualität erledigt werden.


Die Anwendungen des Deep Learning

Deep Learning

In diesem Bereich wurden enorme Fortschritte gemacht, obwohl einige der Entscheidungen beim Deep Learning auch heute noch aus rein menschlicher Sicht nicht vollständig nachvollziehbar sind. Dies verhindert nicht, wie jetzt klar ist, die ständige Verbesserung der Technologien im Zusammenhang mit Deep Learning, mehr noch dank der Menge der verfügbaren Daten und der Verfügbarkeit von Ultra-Hochleistungsinfrastrukturen, die Referenz, insbesondere, ist CPUs und GPUs. Es sollte nicht überraschen, dass Deep Learning derzeit in verschiedenen Branchen eingesetzt wird und vor allem, dass es in naher Zukunft auch in vielen anderen Bereichen unseres täglichen Lebens Anwendung finden und sich ausweiten wird. Man denke nur an fahrerlose Autos, Roboterdrohnen für die Paketzustellung, Spracherkennung und -synthese für Chatbots und Serviceroboter oder Gesichtserkennung für Sicherheitszwecke.

Auch in der Medizin gibt es Anwendungen in der Radiologie zur Früherkennung bestimmter Krebsarten oder die Möglichkeit, die genetischen Sequenzen bestimmter Krankheiten leicht zu identifizieren, um wirksamere Medikamente herzustellen. Zu nennen sind auch die automatische Einfärbung von Schwarz-Weiß-Bildern, die Simultanübersetzung, die Klassifizierung von Objekten auf einem Foto, die automatische Generierung von Handschrift und Text sowie die intuitive Aufteilung in Bildunterschriften. In ähnlicher Weise wurde auch das automatische Spielen entwickelt, bei dem das System selbständig lernt, wie ein bestimmtes Spiel zu spielen ist. Nicht zu unterschätzen sind schließlich die Fähigkeiten des Deep Learning bei der Aufdeckung von Unregelmäßigkeiten in Systemaktivitäten dank ihres unabhängigen und kontinuierlichen Lernens, insbesondere bei gefährlichen Cyberangriffen oder "intelligenten" Videoaufnahmen, die in den modernsten Flughäfen installiert sind.

Allerdings ist es wichtig zu betonen, dass Deep Learning nicht die beste technologische Lösung für jedes Problem sein kann und sollte. Viele Forscher, vor allem in den letzten fünf Jahren, sind davon überzeugt, dass es bald effektivere und vielleicht auch billigere Ansätze geben wird, die das hierarchische Lernen auf der Grundlage der Funktionsweise des menschlichen Gehirns überflüssig machen. Als ob es sich um ein vorübergehendes Phänomen handeln würde, das nur eines der vielen unglaublichen Phänomene darstellt! - Erscheinungsformen der künstlichen Intelligenz.


Schreibe einen Kommentar