From c95e3dcb8e52de95dca204956581dd92b2c9b28e Mon Sep 17 00:00:00 2001 From: thaaoblues Date: Sun, 29 Dec 2024 16:13:58 +0100 Subject: [PATCH] Clustering --- Projet.Rmd | 12 ++++++++++-- 1 file changed, 10 insertions(+), 2 deletions(-) diff --git a/Projet.Rmd b/Projet.Rmd index 572d36d..e6bd7ad 100644 --- a/Projet.Rmd +++ b/Projet.Rmd @@ -429,8 +429,9 @@ fviz_cluster(res,data=donnees_transposees, ``` + ### clustering CAH -```{r} +```{r, fig.width=10} dx<-dist(donnees_transposees,method="euclidian") hward<-hclust(dx,method = "ward.D2") @@ -443,4 +444,11 @@ fviz_dend(hward,k=3, palette = "npg", rect_border = "npg", labels_track_height = 0.8)+ggtitle("Dendogramme du clustering de l'ACP des variables Tt en tant qu'individus, obtenu par méthode CAH") -``` \ No newline at end of file +``` + + + +### Comparaison des clusterings +On voit bien qu'à 4 classes, les regroupements ne sont pas consistents entre chaque méthode de clustering. A 3 classes nous obtenons une classification qui ne change pas, ou presque, entre chaque méthode. Nous décidons donc qu'il s'agit donc d'un bon choix de nombre de classes. + +La classification obtenue est en accord avec les observations faites lors de l'ACP, on y retrouve plus ou moins les mêmes groupements : celui majoritarement composé des relevés de T1 avec une majorité de gènes sans changement d'expression relative, celui composé des relevés de T2 et T3 aux heures des changements d'expression les plus brutaux, et finalement celui s'étalant sur la droite qui semble représenter la fin de l'évolution des traitements T2 et T3 où l'expression de gènes y est très polarisée. \ No newline at end of file