Autonome Optimierung des Verhaltens von Fahrzeugsteuerungen auf der Basis von Verstärkungslernen

Krödel, Michael

Citation link: https://nbn-resolving.org/urn:nbn:de:hbz:467-2371

Files in This Item:

File	Description	Size	Format
kroedel.pdf		2.41 MB	Adobe PDF	View/Open

Dokument Type:	Doctoral Thesis
metadata.dc.title:	Autonome Optimierung des Verhaltens von Fahrzeugsteuerungen auf der Basis von Verstärkungslernen
Authors:	Krödel, Michael
Institute:	Fachbereich 12, Elektrotechnik und Informatik
Free keywords:	autonome Verhaltensoptimierung, Fahrassistenzsystem, reinforcement learning
Dewey Decimal Classification:	004 Informatik
GHBS-Clases:	WFO
Issue Date:	2006
Publish Date:	2006
Abstract:	Fahrsysteme oder Fahrerassistenzsysteme sind bereits seit einigen Jahren Bestandteil von Forschungsprojekten. Dabei umfassen diese meist zwei wesentliche Bestandteile: die Erfassung der Umwelt sowie die Generierung von Steuerungsbefehlen. Die Lernfähigkeit solcher Projekte gewinnt zunehmend an Bedeutung und ist der Hauptfokus der vorliegenden Forschungsarbeit - wobei Lernfähigkeit als Optimierung von Fahrverhalten verstanden wird, d.h. die Auswahl vom optimalen Verhalten für eine jeweilige Situation. Die vorliegende Arbeit setzt für die Lernfähigkeit erstmals ein System basierend auf Verstärkungslernen (Reinforcement Learning) ein – dies im Gegensatz zu bisherigen Arbeiten im ähnlichen Umfeld basierend auf Modellierung oder Neuronalen Netzen. Im Kern der Arbeit werden Situationen klassifiziert und für jede Situation eine mögliche Anzahl von Verhalten ermittelt. Durch Verstärkungslernen werden diese Verhalten bewertet und die entsprechenden Situationsbewertungen konvergieren über die Zeit. Fazit: es wird autonom ermittelt, welche Verhalten in einer Situation angemessen sind und welche nicht. Neben einer mathematischen Abhandlung über das Konvergenzverhalten von Verstärkungslernen-Systemen wird mit unterschiedlichen Testreihen die Funktionsweise des o.g. Ansatzes im Rahmen einer konkreten Implementierung nachgewiesen und die Konvergenz der Situationsbewertungen untersucht. Driver and Driver Assistance Systems move more and more into the focus of research projects. Corresponding research areas consist of two main parts: the understanding of the environment as well as the generation of steering commands. Learning capabilities gain more and more importance and is the main aspect of this research. In detail: the term “learning capability” represents the optimization of driving behaviour, i.e. the optimized situation-specific selection of actions. The current research implements first-time a system based on Reinforcement Learning (RL) – in contrast to many other research work using modeling or neural nets. In the light of Reinforcement Learning, situations are being classified and possible actions are being identified for each situation. Rewards following such actions are used for cumulated ratings which in turn converge over time. In the end, the cumulated ratings indicate as to how much an action was appropriate for the determined situation. After a mathematical analysis of Reinforcement Learning methods in general, test-series are being analyzed within the framework of a real implementation and convergence behaviour as well as driving capabilities are being achieved.
URN:	urn:nbn:de:hbz:467-2371
URI:	https://dspace.ub.uni-siegen.de/handle/ubsi/237
License:	https://dspace.ub.uni-siegen.de/static/license.txt
Appears in Collections:	Hochschulschriften

This item is protected by original copyright

View License

Show full item record

Page view(s)

340

checked on Nov 25, 2024

Download(s)

238

checked on Nov 25, 2024

Google Scholar^TM

Check

Opus Siegen

Files in This Item:

Page view(s)

Download(s)

Google ScholarTM

Google Scholar^TM