Compare commits
No commits in common. "44731bbd566e742dd930ecb985fd7bd8b2a77cf2" and "dfa5a686622bf519f89791543063f308d3c16b51" have entirely different histories.
44731bbd56
...
dfa5a68662
1 changed files with 37 additions and 48 deletions
83
Projet.Rmd
83
Projet.Rmd
|
@ -414,11 +414,10 @@ replicats <- c("R1", "R2")
|
|||
# Initialiser une matrice vide pour stocker les moyennes
|
||||
G <- nrow(T) # Nombre de gènes
|
||||
DataExpMoy <- matrix(NA, nrow = G, ncol = length(traitements) * length(heures))
|
||||
|
||||
#nommer les lignes et les colonnes comme celles des données originales
|
||||
colnames(DataExpMoy) <- paste(rep(traitements, each = length(heures)), heures, sep = "_")
|
||||
rownames(DataExpMoy) <- rownames(T)
|
||||
|
||||
colnames(T)
|
||||
|
||||
# Calcul des moyennes
|
||||
for (t in traitements) {
|
||||
|
@ -538,6 +537,7 @@ fviz_cluster(res_kmeans_2,data=s_2,
|
|||
ellipse.type="norm",labelsize=8,
|
||||
geom=c("point"))+ggtitle("Visualisation des clusters générés par la méthode kmeans dnas le plan factoriel 1,2")
|
||||
|
||||
|
||||
```
|
||||
|
||||
|
||||
|
@ -624,6 +624,23 @@ MatriceExp = as.data.frame(MatriceExp)
|
|||
```
|
||||
|
||||
|
||||
### K-modes
|
||||
```{r,fig.cap=""}
|
||||
set.seed(1234)
|
||||
clkmodes=kmodes(MatriceExp,3,iter.max=100,weight=FALSE)
|
||||
clusplot(MatriceExp, clkmodes$cluster, color=TRUE, shade=TRUE, labels=0, lines=0)
|
||||
```
|
||||
### K-means sur ACM
|
||||
```{r,echo=FALSE,results = FALSE,message=FALSE,warning=FALSE,fig.show='hide'}
|
||||
afcm=MCA(MatriceExp,graph = TRUE)
|
||||
coeff=afcm$ind$coord
|
||||
clkmeans=kmeans(coeff,3)
|
||||
fviz_cluster(clkmeans,
|
||||
data = coeff,
|
||||
geom = "point",
|
||||
ellipse.type = "norm",
|
||||
main = "Clustering des gènes basé sur l'ACM et k-means")
|
||||
```
|
||||
|
||||
### PAM
|
||||
Pour effectuer un clustering PAM avec des données qualitatives, nous avons généré en amont une matrice de dissimilarité grâce à la métrique de gower, pour ensuite lancer l'algorithme PAM sur cette matrice.
|
||||
|
@ -647,56 +664,28 @@ ggplot(df,aes(x=K,y=Silhouette))+
|
|||
geom_line()+theme(legend.position = "bottom")
|
||||
|
||||
res_pam = pam(ds, k = 10)
|
||||
# le champ data doit être remis dans les resultats de PAM
|
||||
# car comme on a effectué l'algo en donnat directement la matrice de distance
|
||||
# la variable de résultat ne contient pas les données originales
|
||||
# Or elles sont necessaire car le champ data de fviz_cluster est utilisé
|
||||
# que pour des résultats de kmeans et dbscan
|
||||
pcoa_res <- cmdscale(as.matrix(ds), k = 10) # Project distance matrix to 2D
|
||||
res_pam$data <- as.data.frame(pcoa_res)
|
||||
|
||||
fviz_cluster(
|
||||
res_pam,
|
||||
labelsize = 8, # Taille des étiquettes
|
||||
geom = c("point") # Utiliser des points pour visualiser les données
|
||||
) +
|
||||
ggtitle("Visualisation des clusters générés par la méthode PAM")
|
||||
# Visualisation des clusters dans le plan original
|
||||
|
||||
# Ajouter les clusters aux données d'origine
|
||||
data_with_clusters <- MatriceExp
|
||||
data_with_clusters$cluster <- as.factor(res_pam$clustering)
|
||||
# Étape 4 : Visualiser les clusters
|
||||
#fviz_cluster(
|
||||
# res_pam,
|
||||
# data = MatriceExp,
|
||||
# ellipse.type = "norm", # Ajouter une ellipse normale autour des clusters
|
||||
# labelsize = 8, # Taille des étiquettes
|
||||
# geom = c("point") # Utiliser des points pour visualiser les données
|
||||
#) +
|
||||
# ggtitle("Visualisation des clusters générés par la méthode PAM")
|
||||
|
||||
ggplot(data_with_clusters, aes(x = ExpT1, y = ExpT2, color = cluster)) +
|
||||
geom_point(size = 3) +
|
||||
labs(
|
||||
title = "Visualisation des clusters PAM dans le plan original des données",
|
||||
x = "ExpT1",
|
||||
y = "ExpT2",
|
||||
color = "Cluster"
|
||||
) +
|
||||
theme_minimal()
|
||||
ggplot(data_with_clusters, aes(x = ExpT1, y = ExpT3, color = cluster)) +
|
||||
geom_point(size = 3) +
|
||||
labs(
|
||||
title = "Visualisation des clusters PAM dans le plan original des données",
|
||||
x = "ExpT1",
|
||||
y = "ExpT2",
|
||||
color = "Cluster"
|
||||
) +
|
||||
theme_minimal()
|
||||
|
||||
ggplot(data_with_clusters, aes(x = ExpT2, y = ExpT3, color = cluster)) +
|
||||
geom_point(size = 3) +
|
||||
labs(
|
||||
title = "Visualisation des clusters PAM dans le plan original des données",
|
||||
x = "ExpT1",
|
||||
y = "ExpT2",
|
||||
color = "Cluster"
|
||||
) +
|
||||
theme_minimal()
|
||||
```
|
||||
|
||||
|
||||
|
||||
# TODO :
|
||||
- refaire sans centrer-réduire
|
||||
- interpréter par rapport aux méta-variable
|
||||
- ne pas afficher le clustering dans les plans de l'acp pour les 2 dernières ACP
|
||||
- présenter chaque méthode/algo et pourquoi on l'utilise avant le code
|
||||
- analyser la seconde et troisième acp et les clustering qu'on en fait
|
||||
- refaire l'analyse de la première acp
|
||||
- choisir des graphes
|
||||
- voir si la troisième acp est bien ce qu'il faut psq wtf ??
|
Loading…
Reference in a new issue