Analyse von Chromatin durch den K-median und das Consensus Clustering
Type of thesis: Bachelorarbeit / location: Leipzig / Status of thesis: Finished theses
Für die Auswertung großer Datenmengen werden häufig sogenannte Clusterverfahren genutzt. Ziel dieser ist es, die gegebenen Daten in möglichst homogene Gruppen zu unterteilen. Dabei ist es sehr oft schwierig, für ein Problem das optimale Verfahren zu bestimmen. Aber auch die Wahl der einzustellenden Parameter kann große Auswirkungen auf das Ergebnis haben. In dem Vortrag werden die Ergebnisse der Arbeit über die Analyse des K-median und des Consensus Clustering vorgestellt. Sie wurden verwendet, um einen Datensatz mit ca. 815.000 Elementen zu clustern, welcher die Methylierungen an den Histonen verschiedener Mäusezellen beschreibt. In vorherigen Arbeiten ist dafür bereits der K-means++ verwendet worden. Das Ziel ist die Untersuchung der Kompaktheit des K-median und der Wahl der initialen Startzentren anhand des Consensus Clusterings.
Kontakt: Daniel Gerighausen / Dirk Zeckzer
Counterpart
Daniel Gerighausen / Dirk Zeckzer