Synthesising large, low cost and diverse datasets for robust semantic segmentation in self-driving tasks

Dietz Romero, Pau; Mengel, Merlin David; Czekansky, Jakob

Citation link: http://dx.doi.org/10.25819/ubsi/10510

DC Field	Value	Language
crisitem.author.orcid	0000-0002-5252-1006	-
crisitem.author.orcid	0000-0002-1055-5259	-
crisitem.author.orcid	0000-0001-8432-0092	-
dc.contributor.author	Dietz Romero, Pau	-
dc.contributor.author	Mengel, Merlin David	-
dc.contributor.author	Czekansky, Jakob	-
dc.date.accessioned	2024-04-15T09:54:35Z	-
dc.date.available	2024-04-15T09:54:35Z	-
dc.date.issued	2022	de
dc.description	This article presents a framework to artificially generate computer vision datasets with great variance for low computing demand that is easily adaptable to different semantic segmentation tasks. The source code for this article is available on Github (https://github.com/cITIcar/SAD-Generator).	de
dc.description.abstract	Robust scene understanding algorithms are crucial for the success of autonomous navigation. The supervised learning of semantic segmentation unfortunately requires large and diverse datasets. For some self-driving tasks, such as navigating a robot within an industrial facility, freely available datasets are not available, and manual annotation of large datasets is impractical for smaller development teams. While there are approaches to automatically generate synthetic data, they can be computationally expensive, require significant preparation effort, or miss a wide variety of features. This paper presents a new framework for generating synthetic datasets with high variance for low computing demands that can be easily adapted to different self-driving tasks. The details of the framework can be found at https://github.com/cITIcar/SAD-Generator. As a demonstration, this approach was applied to a semantic segmentation task on a miniature road with random obstacles, lane markings, and disturbing artifacts. A U-Net was trained using synthesized data and later fine-tuned with a small amount of manually annotated data. This resulted in an improvement of 2.5 percentage points in pixel accuracy (PA) and 11.19 percentage points in mean intersection over union (mIoU).	en
dc.description.abstract	Robuste Algorithmen zum Verstehen von Situationen sind entscheidend für den Erfolg der autonomen Navigation. Das überwachte Lernen der semantischen Segmentierung erfordert leider große und vielfältige Datensätze. Für einige Aufgaben des autonomen Fahrens, wie z. B. die Navigation eines Roboters in einer Industrieanlage, sind frei verfügbare Datensätze nicht verfügbar, und die manuelle Beschriftung großer Datensätze ist für kleinere Entwicklungsteams unpraktisch. Es gibt zwar Ansätze zur automatischen Generierung synthetischer Daten, diese können jedoch rechenintensiv sein, einen erheblichen Vorbereitungsaufwand erfordern oder eine Vielzahl von Merkmalen auslassen. In diesem Artikel wird ein neuer Framework für die Generierung synthetischer Datensätze mit hoher Varianz bei geringem Rechenaufwand vorgestellt, der sich leicht an verschiedene Aufgaben des selbstfahrenden Autos anpassen lässt. Die Details des Frameworks können unter https://github.com/cITIcar/SAD-Generator gefunden werden. Zur Demonstration wurde dieser Ansatz auf eine semantische Segmentierungsaufgabe auf einer Modellstraße mit zufälligen Hindernissen, Fahrbahnmarkierungen und störenden Artefakten angewendet. Ein U-Net wurde mit synthetischen Daten trainiert und später mit einer kleinen Menge von manuell annotierten Daten feinabgestimmt. Dies führte zu einer Verbesserung von 2,5 Prozentpunkten bei der Pixelgenauigkeit (PA) und 11,19 Prozentpunkten bei der mittleren Schnittmenge über der Vereinigung (mIoU).	de
dc.identifier.doi	http://dx.doi.org/10.25819/ubsi/10510	-
dc.identifier.uri	https://dspace.ub.uni-siegen.de/handle/ubsi/2723	-
dc.identifier.urn	urn:nbn:de:hbz:467-27231	-
dc.language.iso	en	de
dc.relation.hasversion	2nd revised edition	de
dc.rights	Attribution-NoDerivatives 4.0 International	*
dc.rights.uri	http://creativecommons.org/licenses/by-nd/4.0/	*
dc.subject.ddc	004 Informatik	de
dc.subject.other	Computer vision	en
dc.subject.other	Supervised learning	en
dc.subject.other	Semantic segmentation	en
dc.subject.other	Autonomous driving	en
dc.subject.other	Robotics	en
dc.subject.other	Semantische Segmentierung	de
dc.subject.other	Maschinelles Sehen	de
dc.subject.other	Überwachtes Lernen	de
dc.subject.other	Autonomes Fahrzeug	de
dc.title	Synthesising large, low cost and diverse datasets for robust semantic segmentation in self-driving tasks	en
dc.type	Other	de
item.fulltext	With Fulltext	-
ubsi.origin.dspace5	1	-
ubsi.publication.affiliation	Department Physik	de
ubsi.subject.ghbs	TVVC	de
ubsi.subject.ghbs	TVUC	de
ubsi.subject.ghbs	ZQS	de
Appears in Collections:	Publikationen aus der Universität Siegen

Files in This Item:

File	Description	Size	Format
Dietz_Romero_Mengel_Czekansky_Synthesising_2nd_edition.pdf		529.3 kB	Adobe PDF	View/Open

This item is protected by original copyright

View License

Show simple item record

Page view(s)

202

checked on Nov 21, 2024

Download(s)

36

checked on Nov 21, 2024

Google Scholar^TM

Check

Altmetric

This item is licensed under a Creative Commons License

Opus Siegen

Files in This Item:

Page view(s)

Download(s)

Google ScholarTM

Altmetric

Google Scholar^TM