5.4 Synthese von Bilddaten
Zi Fraunhofer Zi Fraunhofer
CML 160
©
*
ß
T- a
N
S
vw
SE
®
a
m
£
ve
+
6
PA
Original Image
Rotations
Color Jitter
Gaussian Blur
Flip, Rotate,
Posterize, Jitter,
Gaussian Blur Gaussian Blur
Abbildung 16: Transformationen zur Augmentation von Bilddaten unter Anwendung verschiedener Strategien (Po-
licies) (Auszug [p8))
5.3.4 Annotation von Echtdaten an Bord eines Schiffes
Die Annotation von Bilddaten spielt eine zentrale Rolle beim Training und bei der Entwicklung von Modellen des
überwachten maschinellen Lernens, insbesondere im Bereich der Objekterkennung und der semantischen Seg-
mentierung. In der Regel erfolgt die Annotation durch das Hinzufügen von Bounding Boxes, Masken oder anderen
Markierungen, um Objekte in den Bildern zu identifizieren. Die Anwendung von maschinellem Lernen in mari-
timen Szenarien, insbesondere an Bord von Schiffen, bietet jedoch eine Vielzahl von Datenströmen, die für die
Entwicklung von Annotations- und Trainingsprozessen genutzt werden können. Dabei spielen insbesondere IEC
61162-1 (NMEA-0183) und IEC 61162-450 (NMEA-450) eine zentrale Rolle bei der Erfassung und Übertragung
von Navigations- und Betriebsdaten. In Verbindung mit ENC-Daten bieten sie die Möglichkeit, Bilddaten mit geo-
r‚eferenzierten Informationen aus der Seekarte zu versehen. Dies ermöglicht eine präzise Referenzierung der visuell
erfassten Umgebung, die für Anwendungen in der Navigation und Positionserfassung zur Erstellung umfassender
Trainingsdatensätze genutzt werden kann.
Für die Integration von Automatisierungsdaten bieten sich Protokolle wie Modbus, OPC/UA und MOTT an.
Sie ermöglichen die Erfassung von Informationen über den Zustand der automatisierten Systeme auf dem Schiff.
Die Korrelation dieser Daten mit den Bilddaten erlaubt eine umfassende Analyse und eine genauere Zuordnung
der Zustände des Schiffes. Eine Harmonisierung der Schnittstellen ist derzeit jedoch nicht gegeben, so dass eine
mögliche Integration dieser Daten im Einzelfall auf ihre Anwendbarkeit und Korrektheit geprüft werden muss.
Zusätzlich ermöglicht der Einsatz von Asterix CAT-240 die Erfassung von Radar-Rohbilddaten. Diese Daten sind
besonders wertvoll, da sie als Ground Truth für kamerabasierte Systeme dienen können, um die Leistungsfähigkeit
der Objekterkennung in Bezug auf die räumliche Verortung zu bewerten. Beispielhafte Implementierungen von
Verfahren zur Objekterkennung in Radarrohbildern sind in [EA] zu finden, beschränken sich jedoch zunächst auf
die Erkennung von Objekten in den Radarbildern selbst. Die Detektionen können aber als Hilfsmittel zur Korrelation
und räumlichen Zuordnung von Objekten in Kamerabildern genutzt werden. Vertiefende Untersuchungen werden
als Forschungsgegenstand für zukünftige Untersuchungen im Bereich der Annotation von Echtzeitdaten mit Hilfe
von Betriebsdaten an Bord eines Schiffes angesehen.
5.4 Synthese von Bilddaten
Die in der Entwicklung zur Verfügung stehenden realen Bilddaten Datensätze erfüllen häufig nicht die vorgegebe-
nen Anforderungen (s. Kapitel 5.2). Zwar lassen sich Bilddatensätze unter Verwendung (geometrischer) Transforma-
tionen augmentieren und so hinsichtlich verschiedener Eigenschaften verbessern, allerdings nur im beschränkten
Maße. Mithilfe der Synthese von Bilddaten, also der Erzeugung von künstlichen Bilddaten, können bestehende Da-
tensätze durch synthetische Bilddaten augmentiert werden oder gänzlich eigenständige synthetische Datensätze