5.3 Aggregation und Sammlung von realen Bilddaten
Zi Fraunhofer Zi Fraunhofer
CML 160
Bilddaten können in verschiedenen Formen vorliegen. Zwei wesentliche Darstellungsvarianten sind Graustu-
*enbilder und Farbbilder. Graustufenbilder enthalten nur Helligkeitsinformationen, während Farbbilder zusätzlich
Farbinformationen enthalten, die typischerweise in den drei Farbkanälen Rot, Grün, Blau (RGB) kodiert sind. Diese
Daten werden in geeigneten Dateiformaten gespeichert und können von Kameras oder Algorithmen erzeugt wer-
den. Im Bereich des ML werden die Farbwerte von Bildern häufig in Grauwertbilder umgewandelt, da Farben in
der Regel nur einen geringen Einfluss auf die Objekterkennung haben wohingegen Formen, Kontrastunterschiede
und Perspektiven die entscheidenden Faktoren für die Objekterkennung [EA] darstellen.
Die wichtigsten Anforderungen an reale und synthetische Bilddaten (vgl. [E3]) lassen sich in vier Eigenschaften
unterteilen, die nachfolgend aufgeführt und anschließend am Beispiel der realen Bilddaten tiefer erläutert werden:
i. Repräsentativität: Die erfassten Bilddaten sollten für die Zielanwendung geeignet sein. Dies bedeutet, dass
die Bilddaten ein breites Spektrum von Szenarien, Bedingungen und Variationen abdecken sollten, die der
erwarteten Verteilung der Daten innerhalb der gewählten Anwendungsdomäne entsprechen. Dies ermöglicht
es den Modellen, Muster und Merkmale zuverlässig zu erkennen. Die Quantifizierung der Repräsentativität
arfolgt durch eine Erfassung der Klassenverteilung in den annotierten Bilddaten.
2.
Qualität: Qualität definiert sich unter anderem durch eine korrekte Belichtung, Schärfe und Farbwiedergabe.
Verzerrte oder unscharfe Bilder können die Leistung von maschinellen Lernverfahren beeinträchtigen. Eine
Quantifizierung der Qualität kann jedoch helfen ML-Modelle unter Berücksichtigung verschiedener Qualitäts-
stufen der genutzten Bilddaten robuster zu gestalten.
3
Metadaten: Metadaten sind in Bilddaten eingebettete Zusatzinformationen, die wichtige Kontextinforma-
tionen wie Aufnahmeort, Aufnahmezeitpunkt oder Kameraeinstellungen enthalten. Metadaten können bei
der Organisation von Bilddaten helfen, da sie wichtige Parameter für die Vergleichbarkeit verschiedener Da-
tensätze enthalten.
Annotation: Annotationen sind hinzugefügte Informationen, die bestimmte Objekte, Regionen oder Merk-
male in einem Bild identifizieren oder beschreiben. Dazu gehören z. B. die Position oder Fläckenbedeckung
von Objekten, ihre Kategorie und weitere anwendungsabhängige Attribute.
1.
5.3 Aggregation und Sammlung von realen Bilddaten
Die in Kapitel A] betrachteten Architekturen wurden auf Datensätzen trainiert, welche in der maritimen Domäne
verbreitet sind und entsprechende Bilddaten und Annotationen enthalten. Die genutzten Datensätze fokussieren
sich dabei auf die Objekterkennung und Segmentierung und werden im folgenden kurz vorgestellt. Zusätzlich
wird ein Datensatz des Fraunhofer CML eingeführt welcher neben einer hohen Bandbreite an Objekten auch zeigt
welche Herausforderungen in der Beschaffung von realen Bilddaten auftreten können.
5.3.1 Evaluierung bestehender Datensätze für die maritime Objekterkennung
Im Rahmen der durchgeführten Untersuchungen für die Nutzbarkeit verschiedener ML Modelle in der maritimen
Domäne wurde in Kapitel A] der Fokus auf drei Datensätze (siehe Tabelle B) gelegt die über eine ausreichende Anzahl
an Annotationen für die Erstellung eines Objektdetektors und Segmentierungsmodells verfügen. Zu Vergleichs-
zwecken ist ein interner Bilddatensatz des Fraunhofer CML CML Schiffsdatenbank mit AIlS-Daten in der Tabelle mit
aufgeführt.
Tabelle 6: Auflistung genutzter Datensätze für den Vergleich der Leistungsfähigkeit untersuchter ML-Modelle.
Name Inhalt Verwendung Aufnahmeort
Singapore Maritime Dataset [5] 81 Videos Objektdetektion Singapur
ABOships Inshore and Offshore ca. 10.000 Bilder Objektdetektion Finnland
Maritime Vessel Detection Dataset [E71]
MaSTr dataset for training deep 1.325 Bilder Semantische Segmentierung Slowenien
UJSV obstacle detection models [EZ]
CML Schiffsdatenbank mit AIS-Daten ca. 1.2 Millionen Bilder Objektdetektion Hamburger Hafen
Die in Kapitel A] beschriebenen Datensätze wurden bereits im Rahmen der Studie für Untersuchungen der Nutz-
barkeit herangezogenen und entsprechend ausgewertet. Die Auswertung hat gezeigt das sich entsprechend den
f