Learning of invariant object recognition in hierarchical neural networks using temporal continuity

  • Although the detailed function of the human visual cortex is not decoded yet there are several postulated principles which might be implemented by it: 1. Learning of temporal groups, in which patterns appear when an object undergoes a transformation of its viewing conditions (e.g. rotation in depth). 2. A hierarchical connectivity structure between visual areas such that higher cortex regions learn and recognize representations of increasing complexity. 3. Utilization of temporal feedback for making use of temporal context for robust recognition. Two neuronal systems are developed in this thesis, which by usage of these principles are capable of very robust object recognition on standard benchmark data sets. This is demonstrated by execution of a plethora of experiments. Additionally, a locality sensitive hashing based method for fast nearest neighbour search in databases of high-dimensional visual patterns is introduced.
  • Auch wenn die detaillierte Funktionsweise des menschlichen visuellen Kortex noch nicht entschlüsselt ist, gibt es mehrere postulierte Prinzipien, die er möglicherweise umsetzt: 1. Das Erlernen zeitlicher Gruppen, in denen Merkmale erscheinen, wenn ein Objekt eine Transformation seiner Sichtbedingungen durchläuft (z. B. Tiefenrotation). 2. Eine hierarchische Verbindungsstruktur zwischen visuellen Arealen, so dass höhere Kortexregionen Repräsentationen von ansteigender Komplexität lernen und erkennen. 3. Verwendung zeitlichen Feedbacks, um zeitlichen Kontext für robustere Erkennung zu nutzen. In dieser Arbeit werden zwei neuronale Systeme entwickelt, die mittels dieser Prinzipien zu sehr robuster Objekterkennung auf Standardtestdatenbanken in der Lage sind. Dies wird durch zahlreiche Experimente demonstriert. Ausserdem wird eine auf Locality Sensitive Hashing basierende Methode für schnelle Nächste-Nachbarn-Suche in Datenbanken hochdimensionaler visueller Merkmale vorgestellt.

Download full text files

Export metadata

Additional Services

Share in Twitter Search Google Scholar
Metadaten
Author:Markus LeßmannGND
URN:urn:nbn:de:hbz:294-43543
Referee:Laurenz WiskottORCiDGND, Rolf WürtzORCiDGND
Document Type:Doctoral Thesis
Language:English
Date of Publication (online):2015/05/11
Date of first Publication:2015/05/11
Publishing Institution:Ruhr-Universität Bochum, Universitätsbibliothek
Granting Institution:Ruhr-Universität Bochum, Fakultät für Physik und Astronomie
Date of final exam:2014/11/03
Creating Corporation:Fakultät für Physik und Astronomie
GND-Keyword:Neuronales Netz; Objekterkennung; Maschinelles Lernen; Maschinelles Sehen; Künstliche Intelligenz
Institutes/Facilities:Institut für Neuroinformatik
Dewey Decimal Classification:Naturwissenschaften und Mathematik / Physik
faculties:Fakultät für Physik und Astronomie
Licence (German):License LogoKeine Creative Commons Lizenz - es gelten der Veröffentlichungsvertrag und das deutsche Urheberrecht