5.4 Synthese von Bilddaten
Zi Fraunhofer Zi Fraunhofer
CML 160
Abbildung 18: Synthetische Bilder erzeugt mit DALL-E 2 bei Verwendung der Texteingabe mulitple container vessels
in coastal waters in cloudy weather during daytime. Das erste Bild wurde zuerst erzeugt und die nachfolgenden
drei nachträglich als Variationen des ersten.
Abbildung 19: Synthetische Bilder erzeugt mit Stable Diffusion XL bei Verwendung der Texteingabe mulitple con-
tainer vessels in coastal waters in cloudless weather during daytime.
Abbildung 20: Synthetische Bilder erzeugt mit Stable Diffusion XL bei Verwendung der Texteingabe mulitple con-
tainer vessels in coastal waters in cloudy weather during daytime.
Synthetisch gewonnene Bilddaten können entsprechend intial mit notwendigen Annotationen ausgestattet
werden. Im obigen Fall (s. Abbildungen [I] und 3) würde sich die Annotation insbesondere hinsichtlich der Wet-
terbedingungen (wolkenlos bzw. bewölkt) unterscheiden. Neben diesen Chancen liegen Herausforderungen in der
präzisen Steuerung der Bildgeneratoren durch geeignete Prompts und Konfigurationsparameter. So ist an den bei-
spielhaft generierten Bildern zu erkennen, dass trotz der gleichen Prompts, Dall-E 2 und Stable Diffusion XL deutlich
unterschiedliche Ergebnisse liefern. Ersteres generiert Bilder aus einer Perspektive auf Schiffshöhe und in Richtung
offenes Wasser, wohingegen letzteres vornehmlich Bilder aus der Vogelperspektive auf offenem Wasser und auch
in unmittelbarer Hafennähe generiert. Eine Präzisierung des Prompts für Dall-E 2 zu aerjal view of mulitple con-
tainer vessels in coastal waters in cloudless weather during daytime liefert hingegen vergleichbare Ergebnisse (s.
Abbildung FD.
7