Zitierlink: https://nbn-resolving.org/urn:nbn:de:hbz:467-2371
Dateien zu dieser Ressource:
Datei Beschreibung GrößeFormat
kroedel.pdf2.41 MBAdobe PDFMiniaturbild
Öffnen/Anzeigen
Dokumentart: Doctoral Thesis
Titel: Autonome Optimierung des Verhaltens von Fahrzeugsteuerungen auf der Basis von Verstärkungslernen
AutorInn(en): Krödel, Michael 
Institut: Fachbereich 12, Elektrotechnik und Informatik 
Schlagwörter: autonome Verhaltensoptimierung, Fahrassistenzsystem, reinforcement learning
DDC-Sachgruppe: 004 Informatik
GHBS-Notation: WFO
Erscheinungsjahr: 2006
Publikationsjahr: 2006
Zusammenfassung: 
Fahrsysteme oder Fahrerassistenzsysteme sind bereits seit einigen Jahren
Bestandteil von Forschungsprojekten. Dabei umfassen diese meist zwei
wesentliche Bestandteile: die Erfassung der Umwelt sowie die Generierung von
Steuerungsbefehlen. Die Lernfähigkeit solcher Projekte gewinnt zunehmend an
Bedeutung und ist der Hauptfokus der vorliegenden Forschungsarbeit - wobei
Lernfähigkeit als Optimierung von Fahrverhalten verstanden wird, d.h. die
Auswahl vom optimalen Verhalten für eine jeweilige Situation.

Die vorliegende Arbeit setzt für die Lernfähigkeit erstmals ein System basierend
auf Verstärkungslernen (Reinforcement Learning) ein – dies im Gegensatz zu
bisherigen Arbeiten im ähnlichen Umfeld basierend auf Modellierung oder
Neuronalen Netzen. Im Kern der Arbeit werden Situationen klassifiziert und für
jede Situation eine mögliche Anzahl von Verhalten ermittelt. Durch
Verstärkungslernen werden diese Verhalten bewertet und die entsprechenden
Situationsbewertungen konvergieren über die Zeit. Fazit: es wird autonom
ermittelt, welche Verhalten in einer Situation angemessen sind und welche nicht.

Neben einer mathematischen Abhandlung über das Konvergenzverhalten von
Verstärkungslernen-Systemen wird mit unterschiedlichen Testreihen die
Funktionsweise des o.g. Ansatzes im Rahmen einer konkreten Implementierung
nachgewiesen und die Konvergenz der Situationsbewertungen untersucht.

Driver and Driver Assistance Systems move more and more into the focus of
research projects. Corresponding research areas consist of two main parts: the
understanding of the environment as well as the generation of steering
commands. Learning capabilities gain more and more importance and is the
main aspect of this research. In detail: the term “learning capability” represents
the optimization of driving behaviour, i.e. the optimized situation-specific
selection of actions.

The current research implements first-time a system based on Reinforcement
Learning (RL) – in contrast to many other research work using modeling or
neural nets. In the light of Reinforcement Learning, situations are being classified
and possible actions are being identified for each situation. Rewards following
such actions are used for cumulated ratings which in turn converge over time. In
the end, the cumulated ratings indicate as to how much an action was
appropriate for the determined situation.

After a mathematical analysis of Reinforcement Learning methods in general,
test-series are being analyzed within the framework of a real implementation and
convergence behaviour as well as driving capabilities are being achieved.
URN: urn:nbn:de:hbz:467-2371
URI: https://dspace.ub.uni-siegen.de/handle/ubsi/237
Lizenz: https://dspace.ub.uni-siegen.de/static/license.txt
Enthalten in den Sammlungen:Hochschulschriften

Diese Ressource ist urheberrechtlich geschützt.

Zur Langanzeige

Seitenansichten

340
checked on 25.11.2024

Download(s)

238
checked on 25.11.2024

Google ScholarTM

Prüfe


Alle Ressourcen in diesem Repository sind urheberrechtlich geschützt, soweit nicht anderweitig angezeigt.