diff --git a/Projet.Rmd b/Projet.Rmd index 3e79bfc..be2371b 100644 --- a/Projet.Rmd +++ b/Projet.Rmd @@ -409,8 +409,8 @@ On remaque bien 2 clusters ### PAM ```{r, fig.cap="Visualisation des clusters générés par la méthode PAM dnas le plan factoriel 1,2"} -res = pam(s,2,metric="euclidean") -fviz_cluster(res,data=donnees_transposees, +res_pam = pam(s,2,metric="euclidean") +fviz_cluster(res_pam,data=donnees_transposees, ellipse.type="norm",labelsize=8, geom=c("point"))+ggtitle("Visualisation des clusters générés par la méthode PAM dnas le plan factoriel 1,2") ``` @@ -426,27 +426,16 @@ hward<-hclust(dx,method = "ward.D2") CH<-NULL Kmax<-20 for (k in 2:Kmax){ - CH<-c(CH,index.G1(dx, cl= cutree(hward,k))) + CH<-c(CH,index.G1(x=donnees_transposees, cl= cutree(hward,k))) } daux<-data.frame(NbClust=2:Kmax,CH=CH) ggplot(daux,aes(x=NbClust,y=CH))+ geom_line()+ geom_point() -ClustCH<-cutree(hward,k=6) -fviz_dend(hward,k=4,show_labels=FALSE) -fviz_pca_ind(res, habillage = as.factor(ClustCH), geom = c("point")) - - - - -fviz_dend(hward,k=4, - show_labels = TRUE, - rect=TRUE, - rect_fill = TRUE, - palette = "npg", - rect_border = "npg", - labels_track_height = 0.8)+ggtitle("Dendogramme du clustering de l'ACP des variables Tt en tant qu'individus, obtenu par méthode CAH") +ClustCH<-cutree(hward,k=2) +fviz_dend(hward,k=2,show_labels=FALSE)+ggtitle("Dendogramme du clustering de l'ACP des variables Tt en tant qu'individus, obtenu par méthode CAH") +fviz_pca_ind(res_pca, habillage = as.factor(ClustCH), geom = c("point")) ``` @@ -457,6 +446,24 @@ On voit bien qu'à 4 classes, les regroupements ne sont pas consistents entre ch La classification obtenue est en accord avec les observations faites lors de l'ACP, on y retrouve plus ou moins les mêmes groupements : celui majoritarement composé des relevés de T1 avec une majorité de gènes sans changement d'expression relative, celui composé des relevés de T2 et T3 aux heures des changements d'expression les plus brutaux, et finalement celui s'étalant sur la droite qui semble représenter la fin de l'évolution des traitements T2 et T3 où l'expression de gènes y est très polarisée. +FAIRE LES GRAPHES RONDS CHELOUS POUR LES CLUSTERINGS 2 A 2 + +```{r} +# kmeans et PAM +clust1f = paste("CLkm-",res_kmeans$cluster, sep="") +clust2f = paste("CLCAH-", res_pam$clustering, sep="") +chordDiagram(table(clust1f,clust2f)) + +# kmeans et CAH +clust1f = paste("CLkm-",res_kmeans$cluster, sep="") +clust2f = paste("CLCAH-", cutree(hward,2), sep="") +chordDiagram(table(clust1f,clust2f)) +# PAM ET CAH +clust1f = paste("CLkm-",res_pam$clustering, sep="") +clust2f = paste("CLCAH-", cutree(hward,2), sep="") +chordDiagram(table(clust1f,clust2f)) +``` + # ANALYSE DES GENES