Citation link: https://nbn-resolving.org/urn:nbn:de:hbz:467-4706
Files in This Item:
File Description SizeFormat
stommel.pdf14.67 MBAdobe PDFThumbnail
View/Open
Dokument Type: Doctoral Thesis
metadata.dc.title: Zur Erkennung verformbarer Objekte anhand ihrer Teile
Authors: Stommel, Martin 
Institute: Fachbereich 12, Elektrotechnik und Informatik 
Free keywords: Clusterung, erscheinungsbasiert, teilebasiert
Dewey Decimal Classification: 004 Informatik
GHBS-Clases: TVVC
Issue Date: 2010
Publish Date: 2010
Abstract: 
Die Erkennung verformbarer Objekte mit den Mitteln der digitalen Bildverarbeitung ist ein drängendes, aber bisher weitgehend ungelöstes Problem. In vielen industriellen und anderen Bereichen besteht ein großer Bedarf, Abläufe zu automatisieren, die in einer sich verändernden oder nicht vollständig kontrollierbaren Umgebung stattfinden. Technische Systeme folgen jedoch derzeit in der Regel starren Abläufen, ohne mit ihrer Umgebung zu interagieren. Das Hauptproblem liegt dabei in der Interpretation der Kameradaten. Die existierenden Verfahren zur Erkennung von Objekten funktionieren nur in einfachen Spezialfällen.

In dieser Arbeit wird daher ein neuartiger Ansatz untersucht, der sowohl eine Klassifikation als auch eine Lokalisation von Objekten im Bild ermöglicht. Dazu wird ein kompositionelles Modell eingeführt, bei dem ein Objekt als Hierarchie von Teilen und Unterteilen in geometrischen Beziehungen beschrieben wird. Ein besonderer Schwerpunkt liegt dabei auf der Untersuchung, welches Verhältnis zwischen der Ausprägung und der Position lokaler Merkmale besteht. Da gerade verformbare Objekte in ihrer Erscheinung stark variieren, speichert das Modell mehrere Objektansichten. Dies unterscheidet den vorliegenden Ansatz von vielen anderen.

Das Modell wird mittels einer Stichprobe von Beispielbildern trainiert. Dies umfaßt sowohl die automatische Wahl geeigneter Teile als auch die Identifikation charakteristischer Ansichten. Die Teilemengen auf verschiedenen Hierarchieebenen werden aufgrund unterschiedlicher Randbedingungen individuell optimiert. Über eine Erkennungsmethode, die sowohl zur Hough-Transformation als auch zu Radialen Basisfunktionen Ähnlichkeiten besitzt, wird das Modell mit den Bildern verglichen.

Die Leistungsfähigkeit des entwickelten Verfahrens wird am Beispiel einer Cartoon-Datenbank gezeigt. Dazu werden unterschiedliche Modellkonfigurationen vorgestellt, die bei einer Korrektklassifikationsrate von mindestens 78 Prozent entweder einen positiven Vorhersagewert von 97 Prozent oder eine Sensitivität von 93 Prozent erreichen.

The recognition of deformable objects by the means of digital image processing is a crucial, but widely unsolved problem yet. In many industrial and other areas there is a strong need to automate processes which take place in a changing or not completely controllable environment. However, technical systems are presently characterised by fixed operational procedures and little interaction with their environment. The main problem lies in the interpretation of the camera data. The existing object recognition methods work only in simple special cases.

Therefore, in this thesis a novel approach is studied which allows for a simultaneous classification and localisation of the objects present in an image. To this end, a compositional model is introduced which describes an object as a hierarchy of parts and sub-parts. Between parts, geometrical relationships are modelled. A major emphasis is placed on the analysis of the relationship between the position and the attributes of parts. To account for the strongly varying appearance of deformable objects, the model stores multiple views. This is in contrast to many other recent approaches.

The model is build by analysing sample images of the objects to be recognised. The training comprises both the automatic selection of appropriate parts as well as the identification of characteristic views. Due to differing boundary conditions, the resulting sets of parts are optimised individually for every level in the hierarchy. The comparison between the model and a test image is done by a voting method which has similarities to the Hough transform or to radial basis functions.

The performance of the new methods is demonstrated by the recognition of a character from a cartoon data-base with strongly varying appearance. Two model configurations are presented achieving either a precision of 97 percent or a recall of 93 percent with a general accuracy of at least 78 percent for both cases.
URN: urn:nbn:de:hbz:467-4706
URI: https://dspace.ub.uni-siegen.de/handle/ubsi/470
License: https://dspace.ub.uni-siegen.de/static/license.txt
Appears in Collections:Hochschulschriften

This item is protected by original copyright

Show full item record

Page view(s)

874
checked on Dec 26, 2024

Download(s)

372
checked on Dec 26, 2024

Google ScholarTM

Check


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.