· 

KÜNSTLICHE INTELLIGENZ vs. MACHINE LEARNING vs. DEEP LEARNING

Künstliche Intelligenz wird unsere Gesellschaft verändern und ist schon heute aus unserem Alltag kaum mehr wegzudenken: Seien es Sprachassistenten, Einparkhilfen oder der Umstand, dass dir Google diesen Artikel hier vorgeschlagen hat ... überall dort steckt mehr oder weniger KI drin ... oder AI ... oder neuronale Netze? Und was hat das eigentlich alles mit Deep Learning zu tun? Nun, diese Buzzwords werden in letzter Zeit immer häufiger verwendet, um entweder sein eigenes Produkt von der Konkurrenz abzuheben oder um fachlich dünne Bücher besser verkaufen zu können. Das Problem: Oft steckt in den entsprechenden Produkten gar nicht wirklich KI drin und in den aggressiv beworbenen Büchern werden die Begriffe mehr schlecht als recht vermischt. In der Praxis werden die Begriffe Machine Learning und KI synonym verwendet, um Supervised Learning zu bezeichnen (was das ist, besprechen wir noch). In diesem Artikel möchte ich dir in einfachen Worten erklären, was tatsächlich hinter den Buzzwords

  • KI bzw. AI,
  • Machine Learning,
  • Deep Learning und
  • Neuronalen Netzen

steckt. Das versetzt dich außerdem in die Lage, Dampfplauderer zukünftig auch als solche zu erkennen! Aber nun genug der langen Vorrede! Dies ist eine Übersicht über die geschichtliche Entwicklung der künstlichen Intelligenz, auf die wir im Folgenden noch genauer eingehen werden:


Was ist KI/AI?

Die Abkürzung KI steht für "Künstliche Intelligenz" und AI steht für "Artificial Intelligence". So ähnlich wie bei den Abkürzungen DNA und DNS ist AI einfach das englische Pendant zur KI. Künstliche Intelligenz ist ein Teilgebiet der Informatik, das sich mit der Automatisierung von intelligentem Verhalten und dem maschinellen Lernen befasst ... nun, das sagt zumindest Wikipedia. Direkt im nächsten Satz wird davon gesprochen, dass sich dieser Begriff nicht eindeutig abgrenzen lässt, da es bereits an einer genauen Definition von Intelligenz fehlt ... und wenn wir Intelligenz schon nicht definieren können, was soll dann künstliche Intelligenz sein? Im Grunde handelt es sich um eine Disziplin, in die viele Wissenschaften einzahlen. Man kann sagen, dass künstliche Intelligenz der Versuch ist, bestimmte Entscheidungsstrukturen des Menschen nachzubilden. Man denke z. B. an den Schachcomputer Deep Blue, der 1996 erstmals den damals amtierenden Schachweltmeister Garri Kasparow geschlagen hat. Da Algorithmen hierbei intelligentes Verhalten simulieren, spricht man dabei auch von nachgeahmter Intelligenz. Dieser Schachcomputer ist z. B. nicht in der Lage, ein Sudoku zu lösen ... seine Leistung beschränkt sich nur auf ein bestimmtes Problem! Auch das Computerprogramm AlphaGo kann in nur einem Spiel glänzen, nämlich GO.

Der Begriff Künstliche Intelligenz bzw. „Artificial Intelligence“ wurde erstmals 1955 von John McCarthy definiert. 

„Ziel der KI ist es, Maschinen zu entwickeln, die sich verhalten, als verfügten sie über Intelligenz.“

Nach dieser Definition ist bereits eine einfache Maschine, die mit Hilfe von Aktoren und Sensoren einen Regelmechanismus umsetzt ein intelligentes System, da sie dem Schein nach intelligent auf ihre Umwelt reagieren können, doch in Wahrheit handeln sie lediglich mit vordefinierten Regeln.

Im Zusammenhang mit künstlicher Intelligenz wird immer die Unterscheidung zwischen starker und schwacher künstlicher Intelligenz getroffen. Starke KI ist selbst nach dem aktuellen Stand der Forschung nach wie vor Science Fiction. Hierbei würde es sich um Computersysteme handelt, die die Arbeit zum Erledigen schwieriger Aufgaben auf Augenhöhe mit dem Menschen übernehmen könnten. Schwache KI ist demgegenüber nur in der Lage, konkrete Anwendungsprobleme (wie z. B. Schach oder GO) zu bewältigen und eben nicht in der Lage, mit der allgemeinen menschlichen Intelligenz zu konkurrieren. In meinem Video zu starker und schwacher KI gehe ich hierauf noch genauer ein.

In einer Studie von McKinsey wurden acht verschiedene Bereiche identifiziert, in denen KI besonders hohe Potentiale aufweist, nämlich:

  • Autonomes Fahren
  • Automatisierte Unterstützungsprozesse
  • Automatisierte Qualitätsprüfung
  • Automatisierte Qualitätsoptimierung
  • Supply-Chain-Management (also die Planung und Steuerung der Waren-, Informations- und Geldflüsse entlang der gesamten Lieferkette)
  • Predictive Maintenance (also die proaktive Maschinenwartung)
  • Mensch-Maschine- und Maschine-Maschine-Interaktion, sowie
  • Forschung und Entwicklung

Wenn wir in diesem Artikel von KI sprechen, dann meinen wir damit schwache KI


Machine Learning

Um von einer schwachen KI zu einer starken KI zu kommen, muss die Maschine Schritt-für-Schritt lernen wie ein Mensch zu denken. Die Techniken und Prozesse, die dazu verwendet werden, fasst man unter dem weiten Begriff Machine Learning zusammen. Machine Learning ist ein Teilgebiet der künstlichen Intelligenz. Es basiert auf der Idee, (wie der Mensch) aus Beispielen und Erfahrungen zu lernen, ohne explizit für das Problem programmiert zu sein, d. h. anstatt Code zu schrieben (also einen konkreten Problemlösungsalgorithmus zu implementieren), werden Daten an einen generischen Algorithmus weitergegeben. Es gibt verschiedene Möglichkeiten, wie der Lernvorgang erfolgen kann: Supervised-, Unsupervised- und Reinforcementl-Learning.

  • Supervised Learning: Überwachtes Lernen verwendet Trainings- und Testdaten für den Lernprozess. Diese Daten enthalten nicht nur Eingangsdaten (z. B. Objektkennzahlen) sondern auch das gewünschte Ergebnis (z. B. Klassifikation der entsprechenden Objekte). Es werden also z. B. Bilder von Katzen verwendet, die auch als solche gelabelt sind. Der Machine Learning-Algorithmus soll dann anhand der gelieferten Trainingsdaten eine Funktion finden, mit der die Eingangsdaten geeignet auf das Ergebnis abgebildet werden. Diese Funktion wird im Laufe des Lernprozesses selbständig von dem ML-Algorithmus angepasst. Wenn eine bestimmte Erfolgsquote mit den Trainingsdaten erreicht wurde, wird der Lernprozess unter Zuhilfenahme der Testdaten verifiziert. Diese Technik wird bspw. bei Clusteringsverfahren eingesetzt, bei denen die Cluster zuvor bekannt sind.
  • Unsupervised Learning: Beim unbewachten Lernen werden für den Lernprozess diesmal nur Eingangsdaten verwendet, bei denen das Ergebnis noch nicht feststeht (d. h. Tierbilder ohne Label). Der ML-Algorithmus soll anhand von Merkmalen in den Eingangsdaten Muster erkennen. Diese Technik kann zum Clustern von Daten eingesetzt, bei denen die Cluster zuvor allerdings nicht bekannt sind. Als Beispiel könnten wir Datensätze über das Gewicht und die Größe von Männern und Frauen bekommen, doch wir wissen nicht, von wem welche Daten kommen bzw. wann ein Mensch aufgrund der Körpergröße und des Gewichts als Mann oder Frau klassifiziert werden soll. Tragen wir diese Daten in ein Koordinatensystem ein, sehen wir, dass sich Cluster gebildet haben und die Aufgabe des ML-Algorithmus ist es nun, diese Cluster zu finden und für zukünftige Datensätze zu entscheiden, ob dieser von einem Mann oder einer Frau kommt. 
  • Reinforcement Learning: Das verstärkte Lernen basiert auf einem Belohnungsprinzip. Am Anfang befindet man sich in einem Ausgangszustand ohne Informationen über das Umfeld und ohne Kenntnis über die Auswirkungen bestimmter Aktionen. Nach dem Ausführen einer Aktion wechselt man in einen neuen Zustand und es findet eine Belohnung (positiv oder negativ) statt. Dieser Prozess wird so lange durchgeführt, bis eine bestimmte Endbedingung eingetreten ist. Danach kann man den Lernprozess natürlich wiederholen, um den Outcome noch weiter zu optimieren.

Machine Learning ist also ein Verfahren, das einen Algorithmus nutzt, um Daten zu analysieren, von ihnen zu lernen und darüber eine Aus- oder Vorhersage zu treffen. Im Gegensatz zu Software, die einen Algorithmus implementiert hat und durch spezielle Anweisungen Aufgaben erfüllt, wird die Maschine durch die Verwendung von sehr großen Datenmengen "trainiert". 

Beispiele für Machine Learning sind:

  • die Gesichtserkennung
  • Malware-Detection
  • die Analyse von Röntgenbildern
  • Spam-Filter
  • die Wettervorhersage

Deep Learning

Deep Learning (oder "tiefes Lernen") ist wiederum ein Teilgebiet des maschinellen Lernens. Dabei kommen die ebenfalls oft zitierten künstlichen neuronalen Netze zur Abbildung des Lernprozesses zum Einsatz! Diese repräsentieren ein Modell des menschlichen Gehirns und der neuronalen Prozesse, die in ihm ablaufen. Deep Learning ist also eine Möglichkeit zur Umsetzung maschinellen Lernens und neuronale Netze werden zur konkreten Implementierung verwendet. Das Modell besteht aus verschiedenen Elementen: 

  • Input-Neuronen sind die Neuronen, mit denen Signale von der Außenwelt empfangen werden. Für jede Art von Input (also jedes Merkmal / Feature) gibt es ein Neuron.
  • Hidden-Neuronen sind Neuronen, die den eigentlichen Lernprozess repräsentieren. Diese bilden sogenannte Aktivitätsschicht bzw. Hidden-Layer, von denen es in einem künstlichen neuronalen Netz auch mehrere geben kann.
  • Output-Neuronen sind die Neuronen, die Signale an die Außenwelt abgeben. Auch hier gibt es für jede Art von Output (Merkmal / Feature) ein Neuron.

Die Neuronen der jeweiligen Kategorien werden zu Schichten zusammengefasst. Es gibt in jedem neuronalen Netz also einen Input-Layer mit den Input-Neuronen, mindestens einen Hidden Layer mit den Hidden-Neuronen und einen Output Layer mit den Output-Neuronen. Wenn ein künstliches neuronales Netz mehr als einen Hidden Layer besitzt, wird es als Deep Neural Network (sprich tiefes neuronales Netz) bezeichnet. Daher auch der Name Deep Learning! Die Verbindungen zwischen den einzelnen Layern bzw. den darin eingefassten Neuronen werden (dem Beispiel des menschlichen Gehirns folgend) Synapsen genannt. Diese enthalten eine Gewichtung, die mit den Signalen der Input-Neuronen multipliziert werden. Die so entstandenen Gewichte werden während des Lernprozesses auf Basis von Funktionen angepasst.


Zusammenfassung

Du hast nun ein grobes Gefühl dafür bekommen, was man unter den verschiedenen Buzzwords versteht und wie sie zueinander in Beziehung stehen. 

Künstliche Intelligenz ist ein Sammelbegriff für die Automatisierung von intelligentem Verhalten. Davon ist Machine Learning ein Teilgebiet. Eine Ausprägung des Machine Learnings ist das Deep Learning, das wiederum durch neuronale Netze realisiert wird.