Skip to main content

Full text: BAnA Studie zur Bewertung von Algorithmen für nautische Anwendungen

4.5 Vergleich zu generischen Anwendungen 
(a) Faster-R-CNN 
(b) DETR 
Zi Fraunhofer Zi Fraunhofer 
CML 160 
(c) YOLOvV7 
Abbildung 11: Visueller Vergleich der Faster-R-CNN, DETR und YOLOv7 Architekturen auf jeweils ein Beispielbild aus 
dem Singapore Martime Dataset (oben) und aus AboShips (unten) sowie typische Fehler der Architekturen. Grüne 
Boxen sind korrekt erkannte Objekte (True Positives), blaue Boxen sind nicht erkannte Objekte (False Negatives) und 
rote Boxen sind Falsch-Positive. Faster-R-CNN zeigt häufig Schwächen bei überlappenden oder nah beieinander 
liegenden Objekten und erkennt diese häufig als ein einziges Objekt. DETR neigt zum umgekehrten Problem, d.h. 
generiert viele Falsch-Positive Detektionen und hat insbesondere bei kleinen, weit entfernten Objekten am Horizont 
Probleme. YOLOv7 zeigt insgesamt weniger Schwächen, scheitert aber auch an den schwierigsten Stellen. 
Alle untersuchten Architekturen liefern eine versprechende Erkennungsleistung für diesen Einsatzzweck. LR- 
ASPP setzt den Fokus auf Geschwindigkeit und büßt damit an Genauigkeit ein. Falls genug Rechenleistung vorhan- 
den ist, sollte eher auf DeepLabV3 oder SegFormer zurückgegriffen werden. 
Tabelle 5: Hauptergebnisse der Evaluierung von Architekturen für Semantische Segmentatierung. Neben mIoU ist 
sind hier auch die Werte für die einzelnen Klassen (Wasser, Himmel, Hindernisse) enthalten. 
Architektur mIloU I0U,„ater 10Us%y OU pstactes 
DeepLabV3 95.2 99.3 99.4 88.7 
LR-ASPP 94.0 97.7 99.5 86.1 
SegFormer 96.4 993 99.6 91.2 
4.5 Vergleich zu generischen Anwendungen 
Verglichen mit dem generischen COCO Datensatz, sind die Leistungsmetriken der Objekterkennung für die mariti- 
men Anwendungen deutlich geringer. Mögliche Gründe liegen in der Natur der Bilder aus diesem Bereich. Mariti- 
me Umgebungen unterliegen dynamischen und vielvältigen Wetterbedingungen wie Nebel, Regen und Blendung, 
die die Bildqualität erheblich beeinträchtigen und häufig nur schwer in einem einzigen Trainingsdatensatz erfasst 
werden können. Der herausfordernde Charakter fällt umso mehr auf, wenn man bedenkt, dass die Objekte weit 
entfernt am Horizont liegen und somit sehr klein erscheinen können: Selbst bei einer hohen Bildauflösung in 4K 
misst ein Schiff am Horizont nur wenige Pixel, was die Identifizierung und Lokalisierung zusätzlich erschwert. 
In Bezug auf die semantische Segmentierung zeigt diese Studie signifikant bessere Leistungsindikatoren im 
Vergleich zu dem generischen Datensätzen ADE2O0K oder dem aus dem Automobilbereich stammenden Cityscapes- 
Datensatz. Dies lässt sich zum Teil durch die geringere Anzahl von Klassen in dem maritimen Datensatz erklären, 
der nur drei Klassen (Wasser, Himmel, Küstenlinie und Hindernisse) enthält. Diese Klassen sind relativ groß und gut 
definiert in den Bildern, was diese spezifische Segmentierungsaufgabe weniger komplex macht. Dennoch ist zu 
betonen, dass es herausfordernden Beispiele mit widrigen Bedingungen, wie Nebel, starkem Regen oder starkem 
Sonnenlicht gibt, die zeigen, dass die erzielten Ergebnisse nicht pauschal auf andere maritime Szenarien übertragen 
werden können. 
IN
	        
Waiting...

Note to user

Dear user,

In response to current developments in the web technology used by the Goobi viewer, the software no longer supports your browser.

Please use one of the following browsers to display this page correctly.

Thank you.