Skip to main content

Full text: BAnA Studie zur Bewertung von Algorithmen für nautische Anwendungen

5.3 Aggregation und Sammlung von realen Bilddaten 
Zi Fraunhofer Zi Fraunhofer 
CML 160 
Bilddaten können in verschiedenen Formen vorliegen. Zwei wesentliche Darstellungsvarianten sind Graustu- 
*enbilder und Farbbilder. Graustufenbilder enthalten nur Helligkeitsinformationen, während Farbbilder zusätzlich 
Farbinformationen enthalten, die typischerweise in den drei Farbkanälen Rot, Grün, Blau (RGB) kodiert sind. Diese 
Daten werden in geeigneten Dateiformaten gespeichert und können von Kameras oder Algorithmen erzeugt wer- 
den. Im Bereich des ML werden die Farbwerte von Bildern häufig in Grauwertbilder umgewandelt, da Farben in 
der Regel nur einen geringen Einfluss auf die Objekterkennung haben wohingegen Formen, Kontrastunterschiede 
und Perspektiven die entscheidenden Faktoren für die Objekterkennung [EA] darstellen. 
Die wichtigsten Anforderungen an reale und synthetische Bilddaten (vgl. [E3]) lassen sich in vier Eigenschaften 
unterteilen, die nachfolgend aufgeführt und anschließend am Beispiel der realen Bilddaten tiefer erläutert werden: 
i. Repräsentativität: Die erfassten Bilddaten sollten für die Zielanwendung geeignet sein. Dies bedeutet, dass 
die Bilddaten ein breites Spektrum von Szenarien, Bedingungen und Variationen abdecken sollten, die der 
erwarteten Verteilung der Daten innerhalb der gewählten Anwendungsdomäne entsprechen. Dies ermöglicht 
es den Modellen, Muster und Merkmale zuverlässig zu erkennen. Die Quantifizierung der Repräsentativität 
arfolgt durch eine Erfassung der Klassenverteilung in den annotierten Bilddaten. 
2. 
Qualität: Qualität definiert sich unter anderem durch eine korrekte Belichtung, Schärfe und Farbwiedergabe. 
Verzerrte oder unscharfe Bilder können die Leistung von maschinellen Lernverfahren beeinträchtigen. Eine 
Quantifizierung der Qualität kann jedoch helfen ML-Modelle unter Berücksichtigung verschiedener Qualitäts- 
stufen der genutzten Bilddaten robuster zu gestalten. 
3 
Metadaten: Metadaten sind in Bilddaten eingebettete Zusatzinformationen, die wichtige Kontextinforma- 
tionen wie Aufnahmeort, Aufnahmezeitpunkt oder Kameraeinstellungen enthalten. Metadaten können bei 
der Organisation von Bilddaten helfen, da sie wichtige Parameter für die Vergleichbarkeit verschiedener Da- 
tensätze enthalten. 
Annotation: Annotationen sind hinzugefügte Informationen, die bestimmte Objekte, Regionen oder Merk- 
male in einem Bild identifizieren oder beschreiben. Dazu gehören z. B. die Position oder Fläckenbedeckung 
von Objekten, ihre Kategorie und weitere anwendungsabhängige Attribute. 
1. 
5.3 Aggregation und Sammlung von realen Bilddaten 
Die in Kapitel A] betrachteten Architekturen wurden auf Datensätzen trainiert, welche in der maritimen Domäne 
verbreitet sind und entsprechende Bilddaten und Annotationen enthalten. Die genutzten Datensätze fokussieren 
sich dabei auf die Objekterkennung und Segmentierung und werden im folgenden kurz vorgestellt. Zusätzlich 
wird ein Datensatz des Fraunhofer CML eingeführt welcher neben einer hohen Bandbreite an Objekten auch zeigt 
welche Herausforderungen in der Beschaffung von realen Bilddaten auftreten können. 
5.3.1 Evaluierung bestehender Datensätze für die maritime Objekterkennung 
Im Rahmen der durchgeführten Untersuchungen für die Nutzbarkeit verschiedener ML Modelle in der maritimen 
Domäne wurde in Kapitel A] der Fokus auf drei Datensätze (siehe Tabelle B) gelegt die über eine ausreichende Anzahl 
an Annotationen für die Erstellung eines Objektdetektors und Segmentierungsmodells verfügen. Zu Vergleichs- 
zwecken ist ein interner Bilddatensatz des Fraunhofer CML CML Schiffsdatenbank mit AIlS-Daten in der Tabelle mit 
aufgeführt. 
Tabelle 6: Auflistung genutzter Datensätze für den Vergleich der Leistungsfähigkeit untersuchter ML-Modelle. 
Name Inhalt Verwendung Aufnahmeort 
Singapore Maritime Dataset [5] 81 Videos Objektdetektion Singapur 
ABOships Inshore and Offshore ca. 10.000 Bilder Objektdetektion Finnland 
Maritime Vessel Detection Dataset [E71] 
MaSTr dataset for training deep 1.325 Bilder Semantische Segmentierung Slowenien 
UJSV obstacle detection models [EZ] 
CML Schiffsdatenbank mit AIS-Daten ca. 1.2 Millionen Bilder Objektdetektion Hamburger Hafen 
Die in Kapitel A] beschriebenen Datensätze wurden bereits im Rahmen der Studie für Untersuchungen der Nutz- 
barkeit herangezogenen und entsprechend ausgewertet. Die Auswertung hat gezeigt das sich entsprechend den 
f
	        
Waiting...

Note to user

Dear user,

In response to current developments in the web technology used by the Goobi viewer, the software no longer supports your browser.

Please use one of the following browsers to display this page correctly.

Thank you.