5.3 Aggregation und Sammlung von realen Bilddaten
Zi Fraunhofer ZZ Fraunhofer
CML 160
Metadaten
Die verwendeten Bilddaten besitzen unterschiedliche Metadaten, je nachdem aus welcher Quelle sie stammen
und in welchem Umfang sie nachbearbeitet wurden. Bei allen vorgestellten Datensätzen sind Informationen zur
Auflösung, Bildgröße und Dateiformat durch die digitale Bereitstellung inhärent vorgegeben. Informationen zur
Hardware des verwendeten Kamerasystems sind nur für das Singapore Maritime Dataset, den ABOships-Datensatz
und den MaSTr-Datensatz verfügbar, die vom CML mittels Webcams erhobenen Daten enthalten keine Informa-
tionen zur verwendeten Hardware, Aussagen über die Brennweite, das Objektiv oder den Kamerasensor können
daher nur geschätzt und nicht näher spezifiziert werden.
Annotation
Bei der Objekterkennung werden üblicherweise Bounding Boxes und zugehörige kategoriale Labels verwendet,
Jm die Position und Identifikation der erkannten Objekte in einer Szene festzuhalten. Im Fall des CML-Datensatzes,
der AlS-Daten für Schiffe enthält, gestaltet sich die Annotation als komplex, da es keine eindeutig definierten
Objektklassen gibt. Stattdessen werden sämtliche von AIS zur Verfügung gestellten Informationen genutzt. Dies
ermöglicht die flexible Erstellung von Annotationen mit einer breiten Palette an Klassen und Labels, um die Viel-
seitigkeit der Anwendungsfälle bestmöglich zu unterstützen. Dieser Ansatz ermöglicht eine nahtlose Integration
komplexer und vielfältiger Schiffsinformationen in den Annotationsprozess.
Concept Drift
insbesondere bei ML-Modellen, die über einen längeren Zeitraum eingesetzt werden, ist die Veränderlichkeit der
umgebenden Objekte ein Kriterium, das kontinuierlich überwacht und beim Betrieb des Systems berücksichtigt
werden sollte. Im Gegensatz zu synthetisch erzeugten Daten können reale Daten nur schwer verändert und an
neue Anforderungen angepasst werden, die sich aus dieser Veränderlichkeit ergeben. Dementsprechend müssen
„orhandene Datensätze kontinuierlich auf ihre Verwendbarkeit für den Anwendungsfall überprüft und ggf. neue
Daten beschafft werden, wenn eine Abweichung der im Betrieb beobachteten Daten von den für das Training
beobachteten Daten auftritt.
5.3.3 Augmentation von Datensätzen
Die Augmentation von Bilddatensätzen ist ein wichtiges Verfahren im Bereich der Objekterkennung, insbesondere
bei im Umfang eingeschränkten Datensätzen. Bei der Datenanreicherung werden vorhandene Bilddaten durch ver-
schiedene Transformationen wie Drehungen, Skalierungen, Spiegelungen, Helligkeitsanpassungen und Rauschan-
reicherungen künstlich variiert. Dadurch wird die Vielfalt der Trainingsdaten erhöht, was wiederum die Leistungsfä-
higkeit von Objekterkennungsmodellen verbessert. Ein weiterer Vorteil der Datenanreicherung ist, dass bestehende
Annotationen weiter verwendet werden können, da die Änderungen an den Bildern in der Regel die Integrität der
Labels nicht beeinträchtigen. Einige der in der Abbildung [9 dargestellten Transformationen zeigen Strategien zur
systematischen Veränderung von Bildern und der damit verbundenen Vergrösserung eines Datensatzes. Techniken
der synthetischen Datengenerierung finden auch im Bereich der Augmentierung von Datensätzen Anwendung,
da ML-basierte Algorithmen auch bestehende Bilder als Input verwenden können und definierte Attribute wie Ta-
geszeit, Wetter oder die Farbe von Objekten verändern können. Eine detaillierte Auflistung, wie die Synthese von
Bilddaten den Prozess der Datenbeschaffung unterstützen kann, wird im folgenden Kapitel näher erläutert.
m