Inhaltszusammenfassung:
In dieser Arbeit wird ein computergestütztes Framework für visuelle Objekterkennung entwickelt, das auf Ergebnissen aus der Wahrnehmungsforschung basiert. Die Motivation für diesen Ansatz leitet sich aus der Tatsache her, dass trotz mehrerer Jahrzehnte intensiver Forschung auf dem Gebiet des maschinellen Sehens (der ''Computer Vision'') noch immer kein Erkennungssystem existiert, das es mit der visuellen Erkennungsfähigkeit des Menschen aufnehmen kann. Die Leichtigkeit, mit der Erkennungs- und Kategorisierungsaufgaben vom Menschen gelöst werden, zeigt, dass wir ein hoch optimiertes visuelles System besitzen, das nicht nur robust erkennen und generalisieren kann, sondern auch flexibel neue Informationen lernen und organisieren kann. Bei der Entwicklung des hier vorgestellten Frameworks war die Philosophie, Objekterkennung auf einer abstrakten kognitiven Ebene zu modellieren, anstatt eine komplette neurophysiologisch plausible Implementation zu entwickeln. Das Framework ist in der Lage, Ergebnisse aus der Psychophysik zu modellieren und liefert zusätzlich sehr gute Erkennungsleistungen in Objekterkennungsexperimenten. Darüber hinaus ist es mit neuen, robusten Verfahren aus dem maschinellen Lernen (''Machine Learning'') kombinierbar, was die Anwendungsmöglichkeiten noch erweitert.
Abstract:
In this thesis a computational framework for visual object recognition is developed, which is based on results from perceptual research. The motivation for this approach is given by the fact that despite several decades of research in the field of computer vision, there still exists no recognition system which is able to match the visual performance of humans (or other primates). The apparent ease with which visual tasks such as recognition and categorization are solved by humans is testimony of a highly optimized visual system which not only exhibits excellent robustness and generalization capabilities but is in addition highly flexible in learning and organizing new data. In developing the framework, the underlying philosophy was to model object recognition on an abstract cognitive level rather than supplying a complete neurophysiologically plausible implementation.
The proposed framework is able to model results from psychophysics and, in addition, delivers excellent recognition performance in computational recognition experiments. Furthermore, the framework also interfaces well with advanced classification schemes from machine learning thus further broadening the scope of application.