Student: J. Nathanael Philipp
Inhalt:
Im Rahmen dieser Arbeit wurden unterschiedliche Architekturen von Convolutional Neural Networks (CNN) auf ihre Eignung für die Objekterkennung am Beispiel von ägyptischen Hieroglyphen untersucht.
Zunächst werden Grundlagen zu künstlichen neuronalen Netzen und den Bestandteilen von CNNs, wie Convolutional-Layer, eingeführt und erklärt, dann folgen Erläuterungen zu den verwendeten Datensätzen. und die damit verbundenen Schwierigkeiten. Es werden anschließend Bibliotheken für konkrete Implementierung und Verwendung von künstlichen neuronalen Netzen vorgestellt und der Ablauf der Evaluation der Objekterkennung beschrieben.
Die CNNs wurden mit unterschiedlichen Anzahlen von Klassen und der damit verbundenen Anzahl von Bildern trainiert und evaluiert. Die Experimente wurden anhand der drei benutzten Trainingsmethoden unterteilt. Bei der ersten Methode wurden die CNNs mit Hilfe von Autoencodern vortrainiert. Bei der Zweiten wurden die CNNs blockweise trainiert und bei der dritten Methoden wurden tiefere Netzarchitekturen untersucht. Es wurden dabei unterschiedliche, in der Literatur beschriebene, Netzarchitekturen wie Residual Networks (ResNet) und Densely Connected Convolutional Networks nachimplementiert und evaluiert.
Die Ergebnisse der durchgeführten Ergebnisse zeigen zunächst, dass es möglich ist, CNNs mit bis zu 69 Convolutional-Layer zu trainieren, etwa 6500 unterschiedliche ägyptische Hieroglyphen zu klassifizieren und schlussendlich eine Objekterkennung mit sehr guten Ergebnissen durchzuführen. Die besten Ergebnisse für die Objekterkennung 0,92362 wurden dabei für ein CNN mit 6465 Klassen und 13 Convolutional-Layer erreicht.
Kontakt: Prof. Gerhard Heyer