formulierte Entscheidungsbäume oder Expertensysteme aufgeführt werden. In einem
CI-Modell hingegen sind Informationen grundsätzlich numerisch repräsentiert. Das
1eißt „gedankliche“ Prozesse werden hauptsächlich in Form von numerischen
3erechnungen durchgeführt und Wissen ist nicht zwangsläufig in expliziter Darstellung
ıinterlegt. Als Beispiel kann ein neuronales Netz aufgeführt werden, bei welchem das
Wissen in Form eines Netzwerkes mit numerisch gewichteten Knotenpunkten
gespeichert ist. Bei einem CIl-Modell handelt es sich um ein Modell, welches auf
Grundlage eines vorhandenen Datensatzes algorithmisch erstellt wurde. Der Prozess
der Erstellung eines solchen Modells im Allgemeinen ist bekannt als Machine Learning
(dt.: Maschinelles Lernen, ML) und die Erstellung und sukzessive Verbesserung des
Modells im Spezifischen wird als Training bezeichnet.
2.1.1. Machine Learning
Zwei wesentliche Elemente im ML sind der Datensatz und der algorithmische Ansatz.
Jer Datensatz bildet die „Erfahrung“ ab, mit welcher das KIl-Modell trainiert wird. Das
Training erfolgt dabei nach dem gewählten algorithmischen Ansatz. Datensatz,
algorithmischer Ansatz und die verfolgte Anwendung befinden sich in einem
Wechselspiel und können nicht unabhängig voneinander gewählt werden.
Die Datensätze und Daten, die beim ML zum Einsatz kommen, können sehr
verschieden sein. Entsprechend relevant ist es, diese zu charakterisieren. Datensätze
<Önnen sich hinsichtlich ihrer Modalität unterscheiden und Datentypen wie z.B. Bild-,
Text-, Audio-, sequenzielle oder tabellarische Daten beinhalten. Neben dieser und
weiterer möglichen Datentypen spielt auch die statistische Verteilung der Daten eine
zentrale Rolle. Denn damit ein KI-Modell in der Realwelt zielführend funktioniert, muss
die statistische Verteilung des für das Training verwendeten Datensatzes die zu
erwartende statistische Verteilung aus der realen Anwendung widerspiegeln. Die
statistische Verteilung der Daten lässt sich mit Methoden der deskriptiven Statistik
zeschreiben (Navlani et al., 2021).
Je nach angestrebter Anwendung und verfügbarem Datensatz eignen sich
unterschiedliche ML-Ansätze. Ein ML-Ansatz lässt sich meist einem der folgenden drei
grundlegenden Lernansätze zuordnen (Burkov, 2019):
Supervised Learning (dt.: Überwachtes Lernen): Training mit einem
Datensatz, in welchem die Zielwerte für korrespondierende Eingangswerte
hinterlegt sind.
Unsupervised Learning (dt.: Unüberwachtes Lernen): Training mit einem
Datensatz ohne Verwendung von Zielwerten.
Reinforcement Learning (dt.: Bestärkendes Lernen): Training, welches durch
Bestärkung und Bestrafung für die Auswirkung von Entscheidungen,
durchgeführt wird.
Wenn das Training eines Modells abgeschlossen ist, dann kann das Modell als
eingefroren betrachtet werden. In diesem Fall ist das Verhalten des Modells
deterministisch und damit reproduzierbar. Denn das zu erwartende Verhalten verändert
sich nicht mit der Zeit.
\leben der Einordnung in Lernansätze, lassen sich ML-Ansätze auch hinsichtlich ihrer zu
Ösenden Aufgabe einordnen. Dabei besteht grundlegend ein Zusammenhang
zwischen dem gewählten Lernansatz und Iösbarer Aufgabentypen. Dies wird im
weiteren Verlauf anhand von Abbildung 4 verdeutlicht. Grundlegend existieren
folgende drei Aufgabentypen (Burkov, 2019):
eraunhofer 1
‚/erifAl
Bundesamt für Seeschifffahrt und Hydrographie