Skip to main content

Full text: BAnA Studie zur Bewertung von Algorithmen für nautische Anwendungen

5.3 Aggregation und Sammlung von realen Bilddaten 
Zi Fraunhofer ZZ Fraunhofer 
CML 160 
Metadaten 
Die verwendeten Bilddaten besitzen unterschiedliche Metadaten, je nachdem aus welcher Quelle sie stammen 
und in welchem Umfang sie nachbearbeitet wurden. Bei allen vorgestellten Datensätzen sind Informationen zur 
Auflösung, Bildgröße und Dateiformat durch die digitale Bereitstellung inhärent vorgegeben. Informationen zur 
Hardware des verwendeten Kamerasystems sind nur für das Singapore Maritime Dataset, den ABOships-Datensatz 
und den MaSTr-Datensatz verfügbar, die vom CML mittels Webcams erhobenen Daten enthalten keine Informa- 
tionen zur verwendeten Hardware, Aussagen über die Brennweite, das Objektiv oder den Kamerasensor können 
daher nur geschätzt und nicht näher spezifiziert werden. 
Annotation 
Bei der Objekterkennung werden üblicherweise Bounding Boxes und zugehörige kategoriale Labels verwendet, 
Jm die Position und Identifikation der erkannten Objekte in einer Szene festzuhalten. Im Fall des CML-Datensatzes, 
der AlS-Daten für Schiffe enthält, gestaltet sich die Annotation als komplex, da es keine eindeutig definierten 
Objektklassen gibt. Stattdessen werden sämtliche von AIS zur Verfügung gestellten Informationen genutzt. Dies 
ermöglicht die flexible Erstellung von Annotationen mit einer breiten Palette an Klassen und Labels, um die Viel- 
seitigkeit der Anwendungsfälle bestmöglich zu unterstützen. Dieser Ansatz ermöglicht eine nahtlose Integration 
komplexer und vielfältiger Schiffsinformationen in den Annotationsprozess. 
Concept Drift 
insbesondere bei ML-Modellen, die über einen längeren Zeitraum eingesetzt werden, ist die Veränderlichkeit der 
umgebenden Objekte ein Kriterium, das kontinuierlich überwacht und beim Betrieb des Systems berücksichtigt 
werden sollte. Im Gegensatz zu synthetisch erzeugten Daten können reale Daten nur schwer verändert und an 
neue Anforderungen angepasst werden, die sich aus dieser Veränderlichkeit ergeben. Dementsprechend müssen 
„orhandene Datensätze kontinuierlich auf ihre Verwendbarkeit für den Anwendungsfall überprüft und ggf. neue 
Daten beschafft werden, wenn eine Abweichung der im Betrieb beobachteten Daten von den für das Training 
beobachteten Daten auftritt. 
5.3.3 Augmentation von Datensätzen 
Die Augmentation von Bilddatensätzen ist ein wichtiges Verfahren im Bereich der Objekterkennung, insbesondere 
bei im Umfang eingeschränkten Datensätzen. Bei der Datenanreicherung werden vorhandene Bilddaten durch ver- 
schiedene Transformationen wie Drehungen, Skalierungen, Spiegelungen, Helligkeitsanpassungen und Rauschan- 
reicherungen künstlich variiert. Dadurch wird die Vielfalt der Trainingsdaten erhöht, was wiederum die Leistungsfä- 
higkeit von Objekterkennungsmodellen verbessert. Ein weiterer Vorteil der Datenanreicherung ist, dass bestehende 
Annotationen weiter verwendet werden können, da die Änderungen an den Bildern in der Regel die Integrität der 
Labels nicht beeinträchtigen. Einige der in der Abbildung [9 dargestellten Transformationen zeigen Strategien zur 
systematischen Veränderung von Bildern und der damit verbundenen Vergrösserung eines Datensatzes. Techniken 
der synthetischen Datengenerierung finden auch im Bereich der Augmentierung von Datensätzen Anwendung, 
da ML-basierte Algorithmen auch bestehende Bilder als Input verwenden können und definierte Attribute wie Ta- 
geszeit, Wetter oder die Farbe von Objekten verändern können. Eine detaillierte Auflistung, wie die Synthese von 
Bilddaten den Prozess der Datenbeschaffung unterstützen kann, wird im folgenden Kapitel näher erläutert. 
m
	        
Waiting...

Note to user

Dear user,

In response to current developments in the web technology used by the Goobi viewer, the software no longer supports your browser.

Please use one of the following browsers to display this page correctly.

Thank you.