On the confluence of machine learning and model-based energy minimization methods for computer vision

Dröge, Hannah

Citation link: http://dx.doi.org/10.25819/ubsi/10537

DC Field	Value	Language
crisitem.author.orcid	0000-0001-7163-4279	-
dc.contributor.author	Dröge, Hannah	-
dc.date.accessioned	2024-06-13T08:40:48Z	-
dc.date.available	2024-06-13T08:40:48Z	-
dc.date.issued	2024	de
dc.description.abstract	Deep learning has achieved great success in the field of computer vision across a wide range of applications. However, learning-based methods still have several limitations, particularly in terms of interpretability and guarantees. In contrast, traditional model-based computer vision techniques, built on explicit models that are derived from our understanding of the specific problem domain, offer a different and interpretable approach on addressing these challenges. In this work, we analyze and further develop hybrid approaches that combine model-based and learning-based methods in computer vision, introducing four different approaches. We analyze the capabilities of both model-based and learning-based methods, discuss the value of deep learning for underdetermined problems, present an extended approach to incorporate learning directly into the optimization process, and address problems where the challenge lies in the intrinsic formulation of the problem itself. Thereby we deal with different application areas in the field of computer vision. We start with studying segmentation problems on a single image, given only user input in the form of drawn scribbles in the color images, and analyze the performance of learning-based methods to incorporate the scribble information, compared to a cleverly designed model-based approach. Further, we address reconstruction problems, focusing on underdetermined computed tomography reconstructions of lung scans. We integrate a learning-based regularizer into the reconstruction process and explore the space of possible data-consistent reconstructions corresponding to various degrees of pathological malignancy. Also, to integrate neural networks into model-based approaches, we build on recent studies, which aim to learn iterative descent directions for minimizing model-based cost functions. By applying Moreau-Yosida regularization, we introduce a method that avoids the need for differentiability. This is a significant improvement over previous approaches, that are limited to continuously differentiable cost functions. For solving matching and assignment problems, we introduce an approach that approximates large permutation matrices and reduces computation and memory costs by non-linear low-rank matrix factorization. We experimentally demonstrate its performance across various model- and learning-based methods.	en
dc.description.abstract	Deep Learning hat im Bereich der ''Computer Vision'' für eine Vielzahl von Anwendungen große Erfolge erzielt. Allerdings weisen lernbasierte Methoden noch einige Einschränkungen auf, insbesondere in Bezug auf Interpretierbarkeit und Garantien. Im Gegensatz dazu bieten traditionelle, modellbasierte Techniken der ''Computer Vision'', die auf expliziten Modellen basieren und aus unserem Verständnis des spezifischen Problembereichs abgeleitet sind, einen anderen und interpretierbaren Ansatz, um diese Herausforderungen anzugehen. In dieser Arbeit analysieren und entwickeln wir hybride Ansätze weiter, die modellbasierte und lernbasierte Computer-Vision-Methoden kombinieren und stellen hierzu vier verschiedene Ansätze vor. Wir analysieren die Fähigkeiten sowohl modellbasierter als auch lernbasierter Methoden, diskutieren den Nutzen von Deep Learning bei unterbestimmten Problemen, präsentieren einen erweiterten Ansatz zur direkten Integration des Lernens in den Optimierungsprozess und befassen uns mit Problemen, in denen die Herausforderung in der intrinsischen Formulierung des Problems selber liegt. Dabei beschäftigen wir uns mit verschiedenen Anwendungsbereichen im Bereich der ''Computer Vision''. Wir beginnen mit der Untersuchung von Segmentierungsproblemen auf einzelnen Bildern, die ausschließlich Benutzereingaben in Form von auf den Farbbildern gezeichneten Markierungen erhalten, und vergleichen die Leistung von lernbasierten Methoden zur Einbeziehung der Markierungen mit einem durchdachten modellbasierten Ansatz. Außerdem befassen wir uns mit Rekonstruktionsproblemen, insbesondere mit unterbestimmten Computertomographie-Rekonstruktionen von Lungenscans. Wir integrieren einen lernbasierten Regularisierer in den Rekonstruktionsprozess und erkunden den Raum möglicher, datenkonsistenter Rekonstruktionen, die verschiedenen Graden von pathologischer Bösartigkeit entsprechen. Um neuronale Netze in modellbasierte Ansätze zu integrieren, stützen wir uns auf aktuelle Studien, die die iterativen Abstiegsrichtungen zum Minimieren modellbasierter Kostenfunktionen erlernen. Durch die Anwendung der Moreau-Yosida-Regularisierung führen wir eine Methode ein, die die Notwendigkeit der Differenzierbarkeit umgeht. Dies ist ein bedeutender Fortschritt gegenüber früheren Ansätzen, die auf stetig differenzierbare Kostenfunktionen beschränkt sind. Zur Lösung von Matching- und Zuordnungsproblemen stellen wir einen Ansatz vor, der große Permutationsmatrizen approximiert und die Rechen- und Speicherkosten durch nichtlineare Matrixfaktorisierung mit niedrigem Rang reduziert. Wir demonstrieren experimentell die Leistungsfähigkeit dieses Ansatzes in verschiedenen modell- und lernbasierten Methoden.	de
dc.identifier.doi	http://dx.doi.org/10.25819/ubsi/10537	-
dc.identifier.uri	https://dspace.ub.uni-siegen.de/handle/ubsi/2751	-
dc.identifier.urn	urn:nbn:de:hbz:467-27511	-
dc.language.iso	en	de
dc.rights	Namensnennung 4.0 International	*
dc.rights.uri	http://creativecommons.org/licenses/by/4.0/	*
dc.subject.ddc	004 Informatik	de
dc.subject.other	Computer vision	en
dc.subject.other	Machine learning	en
dc.subject.other	Energy minimization	en
dc.subject.other	Computer Vision	de
dc.subject.other	Maschinelles Lernen	de
dc.subject.other	Energieminimierung	de
dc.title	On the confluence of machine learning and model-based energy minimization methods for computer vision	en
dc.title.alternative	Über das Zusammenwirken von maschinellem Lernen und modellbasierten Energieminimierungsmethoden für Computer Vision	de
dc.type	Doctoral Thesis	de
item.fulltext	With Fulltext	-
ubsi.contributor.referee	Möller, Michael	-
ubsi.date.accepted	2024-04-17	-
ubsi.organisation.granting	Universität Siegen	-
ubsi.origin.dspace5	1	-
ubsi.publication.affiliation	Department Elektrotechnik - Informatik	de
ubsi.subject.ghbs	TVUC	de
ubsi.subject.ghbs	TUH	de
Appears in Collections:	Hochschulschriften

Files in This Item:

File	Description	Size	Format
Dissertation_Droege_Hannah.pdf		9.69 MB	Adobe PDF	View/Open

This item is protected by original copyright

View License

Show simple item record

Page view(s)

330

checked on Nov 23, 2024

Download(s)

99

checked on Nov 23, 2024

Google Scholar^TM

Check

Altmetric

This item is licensed under a Creative Commons License

Opus Siegen

Files in This Item:

Page view(s)

Download(s)

Google ScholarTM

Altmetric

Google Scholar^TM