4.5 Vergleich zu generischen Anwendungen
(a) Faster-R-CNN
(b) DETR
Zi Fraunhofer Zi Fraunhofer
CML 160
(c) YOLOvV7
Abbildung 11: Visueller Vergleich der Faster-R-CNN, DETR und YOLOv7 Architekturen auf jeweils ein Beispielbild aus
dem Singapore Martime Dataset (oben) und aus AboShips (unten) sowie typische Fehler der Architekturen. Grüne
Boxen sind korrekt erkannte Objekte (True Positives), blaue Boxen sind nicht erkannte Objekte (False Negatives) und
rote Boxen sind Falsch-Positive. Faster-R-CNN zeigt häufig Schwächen bei überlappenden oder nah beieinander
liegenden Objekten und erkennt diese häufig als ein einziges Objekt. DETR neigt zum umgekehrten Problem, d.h.
generiert viele Falsch-Positive Detektionen und hat insbesondere bei kleinen, weit entfernten Objekten am Horizont
Probleme. YOLOv7 zeigt insgesamt weniger Schwächen, scheitert aber auch an den schwierigsten Stellen.
Alle untersuchten Architekturen liefern eine versprechende Erkennungsleistung für diesen Einsatzzweck. LR-
ASPP setzt den Fokus auf Geschwindigkeit und büßt damit an Genauigkeit ein. Falls genug Rechenleistung vorhan-
den ist, sollte eher auf DeepLabV3 oder SegFormer zurückgegriffen werden.
Tabelle 5: Hauptergebnisse der Evaluierung von Architekturen für Semantische Segmentatierung. Neben mIoU ist
sind hier auch die Werte für die einzelnen Klassen (Wasser, Himmel, Hindernisse) enthalten.
Architektur mIloU I0U,„ater 10Us%y OU pstactes
DeepLabV3 95.2 99.3 99.4 88.7
LR-ASPP 94.0 97.7 99.5 86.1
SegFormer 96.4 993 99.6 91.2
4.5 Vergleich zu generischen Anwendungen
Verglichen mit dem generischen COCO Datensatz, sind die Leistungsmetriken der Objekterkennung für die mariti-
men Anwendungen deutlich geringer. Mögliche Gründe liegen in der Natur der Bilder aus diesem Bereich. Mariti-
me Umgebungen unterliegen dynamischen und vielvältigen Wetterbedingungen wie Nebel, Regen und Blendung,
die die Bildqualität erheblich beeinträchtigen und häufig nur schwer in einem einzigen Trainingsdatensatz erfasst
werden können. Der herausfordernde Charakter fällt umso mehr auf, wenn man bedenkt, dass die Objekte weit
entfernt am Horizont liegen und somit sehr klein erscheinen können: Selbst bei einer hohen Bildauflösung in 4K
misst ein Schiff am Horizont nur wenige Pixel, was die Identifizierung und Lokalisierung zusätzlich erschwert.
In Bezug auf die semantische Segmentierung zeigt diese Studie signifikant bessere Leistungsindikatoren im
Vergleich zu dem generischen Datensätzen ADE2O0K oder dem aus dem Automobilbereich stammenden Cityscapes-
Datensatz. Dies lässt sich zum Teil durch die geringere Anzahl von Klassen in dem maritimen Datensatz erklären,
der nur drei Klassen (Wasser, Himmel, Küstenlinie und Hindernisse) enthält. Diese Klassen sind relativ groß und gut
definiert in den Bildern, was diese spezifische Segmentierungsaufgabe weniger komplex macht. Dennoch ist zu
betonen, dass es herausfordernden Beispiele mit widrigen Bedingungen, wie Nebel, starkem Regen oder starkem
Sonnenlicht gibt, die zeigen, dass die erzielten Ergebnisse nicht pauschal auf andere maritime Szenarien übertragen
werden können.
IN