Analyse von Chromatin durch den K-median und das Consensus Clustering

Type of thesis: Bachelorarbeit / location: Leipzig / Status of thesis: Finished theses

Für die Auswertung großer Datenmengen werden häufig sogenannte Clusterverfahren genutzt. Ziel dieser ist es, die gegebenen Daten in möglichst homogene Gruppen zu unterteilen. Dabei ist es sehr oft schwierig, für ein Problem das optimale Verfahren zu bestimmen. Aber auch die Wahl der einzustellenden Parameter kann große Auswirkungen auf das Ergebnis haben. In dem Vortrag werden die Ergebnisse der Arbeit über die Analyse des K-median und des Consensus Clustering vorgestellt. Sie wurden verwendet, um einen Datensatz mit ca. 815.000 Elementen zu clustern, welcher die Methylierungen an den Histonen verschiedener Mäusezellen beschreibt. In vorherigen Arbeiten ist dafür bereits der K-means++ verwendet worden. Das Ziel ist die Untersuchung der Kompaktheit des K-median und der Wahl der initialen Startzentren anhand des Consensus Clusterings.

 

Kontakt: Daniel Gerighausen / Dirk Zeckzer

Counterpart

Daniel Gerighausen / Dirk Zeckzer

TU
Universität
Max
Leibnitz-Institut
Helmholtz
Hemholtz
Institut
Fraunhofer-Institut
Fraunhofer-Institut
Max-Planck-Institut
Institute
Max-Plank-Institut