Please use this identifier to cite or link to this item: https://nbn-resolving.org/urn:nbn:de:hbz:467-2371
Files in This Item:
File Description SizeFormat
kroedel.pdf2,41 MBAdobe PDFThumbnail
View/Open
Dokument Type: Doctoral Thesis
Title: Autonome Optimierung des Verhaltens von Fahrzeugsteuerungen auf der Basis von Verstärkungslernen
Authors: Krödel, Michael 
Institute: Fachbereich 12, Elektrotechnik und Informatik 
Free keywords: autonome Verhaltensoptimierung, Fahrassistenzsystem, reinforcement learning
Dewey Decimal Classification: 004 Informatik
GHBS-Clases: WFO
Issue Date: 2006
Publish Date: 2006
Abstract: 
Fahrsysteme oder Fahrerassistenzsysteme sind bereits seit einigen Jahren
Bestandteil von Forschungsprojekten. Dabei umfassen diese meist zwei
wesentliche Bestandteile: die Erfassung der Umwelt sowie die Generierung von
Steuerungsbefehlen. Die Lernfähigkeit solcher Projekte gewinnt zunehmend an
Bedeutung und ist der Hauptfokus der vorliegenden Forschungsarbeit - wobei
Lernfähigkeit als Optimierung von Fahrverhalten verstanden wird, d.h. die
Auswahl vom optimalen Verhalten für eine jeweilige Situation.

Die vorliegende Arbeit setzt für die Lernfähigkeit erstmals ein System basierend
auf Verstärkungslernen (Reinforcement Learning) ein – dies im Gegensatz zu
bisherigen Arbeiten im ähnlichen Umfeld basierend auf Modellierung oder
Neuronalen Netzen. Im Kern der Arbeit werden Situationen klassifiziert und für
jede Situation eine mögliche Anzahl von Verhalten ermittelt. Durch
Verstärkungslernen werden diese Verhalten bewertet und die entsprechenden
Situationsbewertungen konvergieren über die Zeit. Fazit: es wird autonom
ermittelt, welche Verhalten in einer Situation angemessen sind und welche nicht.

Neben einer mathematischen Abhandlung über das Konvergenzverhalten von
Verstärkungslernen-Systemen wird mit unterschiedlichen Testreihen die
Funktionsweise des o.g. Ansatzes im Rahmen einer konkreten Implementierung
nachgewiesen und die Konvergenz der Situationsbewertungen untersucht.

Driver and Driver Assistance Systems move more and more into the focus of
research projects. Corresponding research areas consist of two main parts: the
understanding of the environment as well as the generation of steering
commands. Learning capabilities gain more and more importance and is the
main aspect of this research. In detail: the term “learning capability” represents
the optimization of driving behaviour, i.e. the optimized situation-specific
selection of actions.

The current research implements first-time a system based on Reinforcement
Learning (RL) – in contrast to many other research work using modeling or
neural nets. In the light of Reinforcement Learning, situations are being classified
and possible actions are being identified for each situation. Rewards following
such actions are used for cumulated ratings which in turn converge over time. In
the end, the cumulated ratings indicate as to how much an action was
appropriate for the determined situation.

After a mathematical analysis of Reinforcement Learning methods in general,
test-series are being analyzed within the framework of a real implementation and
convergence behaviour as well as driving capabilities are being achieved.
URN: urn:nbn:de:hbz:467-2371
urn:nbn:de:hbz:467-2371
URI: https://dspace.ub.uni-siegen.de/handle/ubsi/237
License: https://dspace.ub.uni-siegen.de/static/license.txt
Appears in Collections:Hochschulschriften

This item is protected by original copyright

Show full item record

Page view(s)

103
checked on Oct 30, 2020

Download(s)

30
checked on Oct 30, 2020

Google ScholarTM

Check


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.