partie Titouan

2021-12-10 22:26:07 +01:00 · 2021-12-10 22:26:07 +01:00 · bbb623d738
commit bbb623d738
parent 00919c2d5d 6790ba0289
6 changed files with 521 additions and 0 deletions
--- a/.RData
+++ b/.RData
--- a/.Rhistory
+++ b/.Rhistory
@ -159,3 +159,311 @@ dfAnimes <- select(dfAnimes, title, mean, rank, annee, saison, num_episodes, sou
 test <- dfAnimes
 test %>%
 mutate(genres = paste(genres, collapse=",")) -> test
 library("jsonlite")
 library("tidyverse")
 data<-fromJSON("C:\\Users\\Marianne\\Desktop\\projet-analyse-exploratoire\\db_animes\\db_animes.json")
 dfAnimes <- as.data.frame(data)
 #Filtrage des animes sortis avant 1960 (pas de télé :() et après 2021 et des OVAs, films, etc
 dfAnimes %>%
 filter(start_season$year > 1960) %>%
 filter(start_season$year < 2021) %>%
 filter(media_type == "tv") -> dfAnimes
 #Dedoublage de la colonne saison
 dfAnimes %>%
 mutate(annee = start_season$year) %>%
 mutate(saison = start_season$season) -> dfAnimes
 #Transformation de la colonne genre pour la rendre utilisable
 getgenre <- function(i){
 dfAnimes[i,13][[1]][[2]] -> res
 return(res)
 }
 dfAnimes %>%
 mutate(genres = lapply(1:4691, getgenre)) -> dfAnimes
 #Nettoyage des colonnes non utilisées
 dfAnimes <- select(dfAnimes, title, mean, rank, annee, saison, num_episodes, source, genres)
 View(dfAnimes)
 View(dfAnimes)
 View(animeCentury)
 View(animeCentury)
 View(animeCentury)
 library("jsonlite")
 library("tidyverse")
 data<-fromJSON("C:\\Users\\Marianne\\Desktop\\projet-analyse-exploratoire\\db_animes\\db_animes.json")
 dfAnimes <- as.data.frame(data)
 #Filtrage des animes sortis avant 1960 (pas de télé :() et après 2021 et des OVAs, films, etc
 dfAnimes %>%
 filter(start_season$year > 1960) %>%
 filter(start_season$year < 2021) %>%
 filter(media_type == "tv") -> dfAnimes
 #Dedoublage de la colonne saison
 dfAnimes %>%
 mutate(annee = start_season$year) %>%
 mutate(saison = start_season$season) -> dfAnimes
 #Transformation de la colonne genre pour la rendre utilisable
 getgenre <- function(i){
 dfAnimes[i,13][[1]][[2]] -> res
 return(res)
 }
 dfAnimes %>%
 mutate(genres = lapply(1:4691, getgenre)) -> dfAnimes
 #Nettoyage des colonnes non utilisées
 dfAnimes <- select(dfAnimes, title, mean, rank, annee, saison, num_episodes, source, genres)
 #Nombre d'animes durant plus de 2 cours (estimés à 30 épisodes) par an => a améliorer
 dfAnimes %>%
 filter(num_episodes>30) %>%
 group_by(annee) %>%
 count() %>%
 rename(nbAnimes = n) -> longbois
 longbois %>% ggplot(aes(annee, nbAnimes)) + geom_col()
 #Evolution du nombre de lettre (moyenne et médiane) dans les titres par année
 dfAnimes %>%
 group_by(annee) %>%
 summarise(lettres=mean(nchar(data.title))) -> dfAnimes
 dfAnimes %>%
 group_by(annee) %>%
 summarise(lettres=median(nchar(data.title))) -> medLettersByYear
 #Evolution du nombre de lettre (moyenne et médiane) dans les titres par année
 dfAnimes %>%
 group_by(annee) %>%
 summarise(lettres=mean(nchar(title))) -> dfAnimes
 dfAnimes %>%
 group_by(annee) %>%
 summarise(lettres=median(nchar(title))) -> medLettersByYear
 data<-fromJSON("C:\\Users\\Marianne\\Desktop\\projet-analyse-exploratoire\\db_animes\\db_animes.json")
 dfAnimes <- as.data.frame(data)
 #Filtrage des animes sortis avant 1960 (pas de télé :() et après 2021 et des OVAs, films, etc
 dfAnimes %>%
 filter(start_season$year > 1960) %>%
 filter(start_season$year < 2021) %>%
 filter(media_type == "tv") -> dfAnimes
 #Dedoublage de la colonne saison
 dfAnimes %>%
 mutate(annee = start_season$year) %>%
 mutate(saison = start_season$season) -> dfAnimes
 #Transformation de la colonne genre pour la rendre utilisable
 getgenre <- function(i){
 dfAnimes[i,13][[1]][[2]] -> res
 return(res)
 }
 dfAnimes %>%
 mutate(genres = lapply(1:4691, getgenre)) -> dfAnimes
 #Nettoyage des colonnes non utilisées
 dfAnimes <- select(dfAnimes, title, mean, rank, annee, saison, num_episodes, source, genres)
 #Nombre d'animes durant plus de 2 cours (estimés à 30 épisodes) par an => a améliorer
 dfAnimes %>%
 filter(num_episodes>30) %>%
 group_by(annee) %>%
 count() %>%
 rename(nbAnimes = n) -> longbois
 longbois %>% ggplot(aes(annee, nbAnimes)) + geom_col()
 #Evolution du nombre de lettre (moyenne et médiane) dans les titres par année
 dfAnimes %>%
 group_by(annee) %>%
 summarise(lettres=mean(nchar(title))) -> meanLettersByYear
 dfAnimes %>%
 group_by(annee) %>%
 summarise(lettres=median(nchar(title))) -> medLettersByYear
 meanLettersByYear %>% ggplot(aes(annee, lettres)) + geom_col()
 medLettersByYear %>% ggplot(aes(annee, lettres)) + geom_col()
 #Nombre d'animes originaux par an
 dfAnimes %>%
 filter(source="original") -> og
 #Nombre d'animes originaux par an
 dfAnimes %>%
 filter(source=="original") -> og
 og %>% ggplot((aes(annee, nbAnimes)) + geom_col()
 og %>% ggplot(aes(annee, nbAnimes)) + geom_col()
 og %>% ggplot(aes(annee, nbAnimes)) + geom_col()
 #Nombre d'animes originaux par an
 dfAnimes %>%
 filter(source=="original") %>%
 group_by(annee) %>%
 count() %>%
 rename(nbAnimes = n) -> og
 og %>% ggplot(aes(annee, nbAnimes)) + geom_col()
 #Nombre sources des animes par an
 dfAnimes %>%
 group_by(source, annee) %>%
 count() %>%
 rename(nbAnimes = n) -> dFSources
 dFSources %>% ggplot(aes(annee, nbAnimes), color = source) + geom_col()
 dFSources %>% ggplot(aes(annee, nbAnimes, color = source)) + geom_col()
 #Nombre sources des animes par an
 dfAnimes %>%
 filter(source %in% c("original", "manga", "light_novel", "game", "visual_novel", "other", "novel")) %>%
 group_by(source, annee) %>%
 count() %>%
 rename(nbAnimes = n) -> dFSources
 dFSources %>% ggplot(aes(annee, nbAnimes, color = source)) + geom_col()
 dFSources %>% ggplot(aes(annee, nbAnimes, fill = source)) + geom_col()
 install.packages(wesanderson)
 install.packages("wesanderson"")
 longbois %>% ggplot(aes(annee, nbAnimes)) + geom_point()
 longbois %>% ggplot(aes(annee, nbAnimes)) + geom_point()
 #Nombre d'animes durant plus de 2 cours (estimés à 30 épisodes) par an => a améliorer
 dfAnimes %>%
 filter(num_episodes>30) %>%
 group_by(annee) %>%
 count() %>%
 rename(nbAnimes = n) -> longbois
 library("jsonlite")
 library("tidyverse")
 data<-fromJSON("C:\\Users\\Marianne\\Desktop\\projet-analyse-exploratoire\\db_animes\\db_animes.json")
 dfAnimes <- as.data.frame(data)
 #Filtrage des animes sortis avant 1960 (pas de télé :() et après 2021 et des OVAs, films, etc
 dfAnimes %>%
 filter(start_season$year > 1960) %>%
 filter(start_season$year < 2021) %>%
 filter(media_type == "tv") -> dfAnimes
 #Dedoublage de la colonne saison
 dfAnimes %>%
 mutate(annee = start_season$year) %>%
 mutate(saison = start_season$season) -> dfAnimes
 #Transformation de la colonne genre pour la rendre utilisable
 getgenre <- function(i){
 dfAnimes[i,13][[1]][[2]] -> res
 return(res)
 }
 dfAnimes %>%
 mutate(genres = lapply(1:4691, getgenre)) -> dfAnimes
 #Nettoyage des colonnes non utilisées
 dfAnimes <- select(dfAnimes, title, mean, rank, annee, saison, num_episodes, source, genres)
 #Nombre d'animes durant plus de 2 cours (estimés à 30 épisodes) par an => a améliorer
 dfAnimes %>%
 filter(num_episodes>30) %>%
 group_by(annee) %>%
 count() %>%
 rename(nbAnimes = n) -> longbois
 longbois %>% ggplot(aes(annee, nbAnimes)) + geom_point()
 longbois %>% ggplot(aes(annee, nbAnimes)) + geom_line()
 dfAnimes %>%
 group_by(annee) %>%
 count() %>%
 rename(nbAnimes = n) -> allbois
 #Pourcentage d'animes durant plus de 2 cours (estimés à 30 épisodes) par an => a améliorer
 dfAnimes %>%
 filter(num_episodes>30) %>%
 group_by(annee) %>%
 count() %>%
 rename(nbAnimes = n) -> longbois
 percLongs <- longbois/allbois*100
 percLongs %>% ggplot(aes(annee, nbAnimes)) + geom_line()
 left_join(longbois, allbois, by=annee) -> test
 left_join(longbois, allbois, by="annee") -> test
 left_join(longbois, allbois, by="annee", suffix = c("-long", "-all")) -> test
 left_join(longbois, allbois, by="annee", suffix = c("_long", "_all")) %>%
 mutate(pourcentage_long = nbAnimes_long/nbAnimes_all*100) dFLong
 left_join(longbois, allbois, by="annee", suffix = c("_long", "_all")) %>%
 mutate(pourcentage_long = (nbAnimes_long/nbAnimes_all*100)) dFLong
 left_join(longbois, allbois, by="annee", suffix = c("_long", "_all")) %>%
 mutate(pourcentage_long = (nbAnimes_long/nbAnimes_all*100)) -> dFLong
 left_join(longbois, allbois, by="annee", suffix = c("_long", "_all")) %>%
 mutate(pourcentage_long = (nbAnimes_long/nbAnimes_all*100)) -> dFLong
 dFLong %>% ggplot(aes(annee, pourcentage_long)) + geom_point() + geom_line()
 longbois %>% ggplot(aes(annee, nbAnimes)) + geom_point() + geom_line()
 #Pourcentage d'animes durant plus de 2 cours (estimés à 30 épisodes) par an => a améliorer
 dfAnimes %>%
 filter(num_episodes>50) %>%
 group_by(annee) %>%
 count() %>%
 rename(nbAnimes = n) -> longbois
 longbois %>% ggplot(aes(annee, nbAnimes)) + geom_point() + geom_line()
 dfAnimes %>%
 group_by(annee) %>%
 count() %>%
 rename(nbAnimes = n) -> allbois
 left_join(longbois, allbois, by="annee", suffix = c("_long", "_all")) %>%
 mutate(pourcentage_long = (nbAnimes_long/nbAnimes_all*100)) -> dFLong
 dFLong %>% ggplot(aes(annee, pourcentage_long)) + geom_point() + geom_line()
 #Pourcentage d'animes durant plus de 2 cours (estimés à 30 épisodes) par an => a améliorer
 dfAnimes %>%
 filter(num_episodes>50) %>%
 group_by(annee) %>%
 count() %>%
 rename(nbAnimes = n) -> longbois
 longbois %>% ggplot(aes(annee, nbAnimes)) + geom_point() + geom_line()
 dfAnimes %>%
 group_by(annee) %>%
 count() %>%
 rename(nbAnimes = n) -> allbois
 left_join(longbois, allbois, by="annee", suffix = c("_long", "_all")) %>%
 mutate(pourcentage_long = (nbAnimes_long/nbAnimes_all*100)) -> dFLong
 dFLong %>% ggplot(aes(annee, pourcentage_long)) + geom_point() + geom_line()
 meanLettersByYear %>% ggplot(aes(annee, lettres)) + geom_point()+ geom_line()
 medLettersByYear %>% ggplot(aes(annee, lettres)) + geom_col()+ geom_line()
 medLettersByYear %>% ggplot(aes(annee, lettres)) + geom_point()+ geom_line()
 #En quelle saison sortent les meilleurs animes ?
 dfAnimes %>%
 group_by(saison)%>%
 summarise(moy_ratings = mean(rating)) -> dFRatingsSaison
 #En quelle saison sortent les meilleurs animes ?
 dfAnimes %>%
 group_by(saison)%>%
 summarise(moy_ratings = mean(mean)) -> dFRatingsSaison
 #Rename la colonne au nom débile
 rename(dfAnimes, note = mean) -> dfAnimes
 #En quelle saison sortent les meilleurs animes ?
 dfAnimes %>%
 group_by(saison)%>%
 summarise(moy_ratings = mean(note)) -> dFRatingsSaison
 #En quelle saison sortent les meilleurs animes ?
 dfAnimes %>%
 group_by(saison)%>%
 summarise(moy_ratings = sum(note)) -> dFRatingsSaison
 #Les animes deviennent ils meilleurs avec le temps ?
 dfAnimes %>%
 group_by(annee)%>%
 summarise(moy_ratings = sum(note)) -> dFRatingsAnnee
 View(dFRatingsAnnee)
 #En quelle saison sortent les meilleurs animes ?
 dfAnimes %>%
 group_by(saison)%>%
 summarise(moy_ratings = sum(note), na.rm=TRUE) -> dFRatingsSaison
 #En quelle saison sortent les meilleurs animes ?
 dfAnimes %>%
 group_by(saison)%>%
 filter(!is_na(note))%>%
 summarise(moy_ratings = sum(note)) -> dFRatingsSaison
 #En quelle saison sortent les meilleurs animes ?
 dfAnimes %>%
 group_by(saison)%>%
 filter(!isna(note))%>%
 summarise(moy_ratings = sum(note)) -> dFRatingsSaison
 #En quelle saison sortent les meilleurs animes ?
 dfAnimes %>%
 group_by(saison)%>%
 filter(!is.na(note))%>%
 summarise(moy_ratings = sum(note)) -> dFRatingsSaison
 #En quelle saison sortent les meilleurs animes ?
 dfAnimes %>%
 group_by(saison)%>%
 filter(!is.na(note))%>%
 summarise(moy_ratings = mean(note)) -> dFRatingsSaison
 dFRatingsSaison %>% ggplot(aes(saison, moy_ratings))+geom_bar()
 dFRatingsSaison %>% ggplot(aes(saison, moy_ratings))+geom_col()
 dFRatingsSaison %>% ggplot(aes(saison, moy_ratings))+geom_point()
 #Les animes deviennent ils meilleurs avec le temps ?
 dfAnimes %>%
 group_by(annee)%>%
 filter(!is.na(note))%>%
 summarise(moy_ratings = mean(note)) -> dFRatingsAnnee
 dFRatingsSaison %>% ggplot(aes(saison, moy_ratings))+geom_point()+geom_line()
 dFRatingsAnnee %>% ggplot(aes(annee, moy_ratings))+geom_point()+geom_line()
 dFRatingsSaison %>% ggplot(aes(saison, moy_ratings))+geom_point()
 dFRatingsSaison %>% ggplot(aes(saison, moy_ratings, shape = saison, color = saison))+geom_point()
 dFRatingsSaison %>% ggplot(aes(saison, moy_ratings, shape = saison, color = saison))+geom_count()
 dFRatingsSaison %>% ggplot(aes(saison, moy_ratings, shape = saison, color = saison))+geom_jitter()
 dFRatingsSaison %>% ggplot(aes(saison, moy_ratings, shape = saison, color = saison))+geom_bin2d()
 dFRatingsSaison %>% ggplot(aes(saison, moy_ratings, shape = saison, color = saison))+geom_jitter()
 dFRatingsSaison %>% ggplot(aes(saison, moy_ratings, shape = saison, color = saison))+geom_point()
 dFRatingsSaison %>% ggplot(aes(saison, moy_ratings, shape = saison, color = saison))+geom_point(size = 3)
 dFRatingsAnnee %>% ggplot(aes(annee, moy_ratings))+geom_point()+geom_line
 dFRatingsAnnee %>% ggplot(aes(annee, moy_ratings))+geom_point()+geom_line()
 dFSources %>% ggplot(aes(annee, nbAnimes, fill = source)) + geom_col()
 #Nombre sources des animes par an
 dfAnimes %>%
 filter(source %in% c("original", "manga", "light_novel", "game", "visual_novel", "other", "novel")) %>%
 group_by(source, annee) %>%
 count() %>%
 rename(nbAnimes = n) -> dFSources
 dFSources %>% ggplot(aes(annee, nbAnimes, fill = source)) + geom_col()
--- a/main2.R
+++ b/main2.R
@ -0,0 +1,115 @@
 library("jsonlite")
 library("tidyverse")
 data<-fromJSON(txt = "/home/labourde/Bureau/projet-analyse-exploratoire/db_animes/db_animes.json")
 dfAnimes <- as.data.frame(data)
 #Filtrage des animes sortis avant 1960 (pas de télé :() et après 2021 et des OVAs, films, etc
 dfAnimes %>%
  filter(start_season$year > 1960) %>%
  filter(start_season$year < 2021) %>%
  filter(media_type == "tv") -> dfAnimes
 #Dedoublage de la colonne saison
 dfAnimes %>% 
  mutate(annee = start_season$year) %>%
  mutate(saison = start_season$season) -> dfAnimes
 #Transformation de la colonne genre pour la rendre utilisable
 getgenre <- function(i){
  dfAnimes[i,13][[1]][[2]] -> res
  return(res)
 }
 dfAnimes %>%
  mutate(genres = lapply(1:4691, getgenre)) -> dfAnimes
 #Nettoyage des colonnes non utilisées
 dfAnimes <- select(dfAnimes, title, mean, rank, annee, saison, num_episodes, source, genres)
 ####### Distribution des genres
 distributeGenres <- function(i){
  line <- as.data.frame(i$genres)
  line %>%
    rename(genres = 1) -> Genres
  i[ , !(names(dfAnimes) %in% c("genres"))] -> anime
  newdf <- cbind(anime, Genres)
  return(newdf)
 }
 dfAnimesFinal <- data.frame(matrix(ncol = ncol(dfAnimes), nrow = 0))
 x <- names(dfAnimes)
 colnames(dfAnimesFinal) <- x
 dfAnimesFinal
 for(i in 1:nrow(dfAnimes)) {
  row <- dfAnimes[i,]
  animeWithGenres <- distributeGenres(row)
  dfAnimesFinal <- rbind(dfAnimesFinal,animeWithGenres)
 }
 dfAnimesFinal
 ####### Plot the genre the most represented
 dfAnimesFinal %>%
  mutate(Nombre=sum(1)) %>%
  group_by(genres) %>%
  summarise(NombreGenre=sum(Nombre)) %>%
  arrange(desc(NombreGenre)) -> mostCommonGenre
 mostCommonGenre <- head(mostCommonGenre,10)
 ggplot(mostCommonGenre,aes(x=reorder(genres,NombreGenre),y=NombreGenre)) +
  geom_bar(stat='Identity',aes(fill=genres)) +
  labs(y="Occurence", x = "Genre") +
  ggtitle("Les 10 genres les plus représentés")
 ####### Evolution des 5 genres les plus représentés sur les 5 dernières années
 dfAnimesFinal %>%
  filter(annee>1999) %>%
  mutate(Nombre=1) %>%
  group_by(genres,annee) %>%
  summarise(NombreGenre=sum(Nombre)) %>%
  arrange(desc(NombreGenre)) %>%
  group_by(annee) %>%
  slice_max(order_by = NombreGenre, n = 5) -> mostCommonGenrePast10Years
 ggplot(mostCommonGenrePast10Years,aes(x=annee,y=NombreGenre,color=genres)) +
  geom_point() +
  geom_line() +
  labs(y="Occurence", x = "Genre") +
  ggtitle("Evolution des 5 genres les plus représentés sur les 20 dernières années")
 #Nombre d'animes durant plus de 2 cours (estimés à 30 épisodes) par an => a améliorer
 dfAnimes %>%
  filter(num_episodes>30) %>%
  group_by(annee) %>%
  count() %>%
  rename(nbAnimes = n) -> longbois
 longbois %>% ggplot(aes(annee, nbAnimes)) + geom_col()
 #Evolution du nombre de lettre (moyenne et médiane) dans les titres par année
 dfAnimes %>%
  group_by(annee) %>%
  summarise(lettres=mean(nchar(data.title))) -> dfAnimes
 dfAnimes %>%
  group_by(annee) %>%
  summarise(lettres=median(nchar(data.title))) -> medLettersByYear
 meanLettersByYear %>% ggplot(aes(annee, lettres)) + geom_col()
 medLettersByYear %>% ggplot(aes(annee, lettres)) + geom_col()
 #Evolution des 5 genres les plus représentés
 # Explosion de la colonne tags
 dfAnimes %>% 
  mutate(annee = anime$year) %>%
  mutate(saison = start_season$season) -> animes_genres_doubles
--- a/main_Marianne.R
+++ b/main_Marianne.R
@ -0,0 +1,98 @@
 library("jsonlite")
 library("tidyverse")
 data<-fromJSON("C:\\Users\\Marianne\\Desktop\\projet-analyse-exploratoire\\db_animes\\db_animes.json")
 dfAnimes <- as.data.frame(data)
 #Filtrage des animes sortis avant 1960 (pas de télé :() et après 2021 et des OVAs, films, etc
 dfAnimes %>%
  filter(start_season$year > 1960) %>%
  filter(start_season$year < 2021) %>%
  filter(media_type == "tv") -> dfAnimes
 #Dedoublage de la colonne saison
 dfAnimes %>% 
  mutate(annee = start_season$year) %>%
  mutate(saison = start_season$season) -> dfAnimes
 #Transformation de la colonne genre pour la rendre utilisable
 getgenre <- function(i){
  dfAnimes[i,13][[1]][[2]] -> res
  return(res)
 }
 dfAnimes %>%
  mutate(genres = lapply(1:4691, getgenre)) -> dfAnimes
 #Nettoyage des colonnes non utilisées
 dfAnimes <- select(dfAnimes, title, mean, rank, annee, saison, num_episodes, source, genres)
 #Rename la colonne au nom débile
 rename(dfAnimes, note = mean) -> dfAnimes
 #Pourcentage d'animes durant plus de 2 cours (estimés à 30 épisodes) par an => a améliorer
 dfAnimes %>%
  filter(num_episodes>50) %>%
  group_by(annee) %>%
  count() %>%
  rename(nbAnimes = n) -> longbois
 longbois %>% ggplot(aes(annee, nbAnimes)) + geom_point() + geom_line()
 dfAnimes %>%
  group_by(annee) %>%
  count() %>%
  rename(nbAnimes = n) -> allbois
 left_join(longbois, allbois, by="annee", suffix = c("_long", "_all")) %>%
  mutate(pourcentage_long = (nbAnimes_long/nbAnimes_all*100)) -> dFLong
 dFLong %>% ggplot(aes(annee, pourcentage_long)) + geom_point() + geom_line()
 #Evolution du nombre de lettre (moyenne et médiane) dans les titres par année
 dfAnimes %>%
  group_by(annee) %>%
  summarise(lettres=mean(nchar(title))) -> meanLettersByYear
 dfAnimes %>%
  group_by(annee) %>%
  summarise(lettres=median(nchar(title))) -> medLettersByYear
 meanLettersByYear %>% ggplot(aes(annee, lettres)) + geom_point()+ geom_line()
 medLettersByYear %>% ggplot(aes(annee, lettres)) + geom_point()+ geom_line()
 #Evolution des 5 genres les plus représentés
 #Titouan
 #Nombre sources des animes par an
 dfAnimes %>%
  filter(source %in% c("original", "manga", "light_novel", "game", "visual_novel", "other", "novel")) %>%
  group_by(source, annee) %>%
  count() %>%
  rename(nbAnimes = n) -> dFSources
 dFSources %>% ggplot(aes(annee, nbAnimes, fill = source)) + geom_col()
 #On joue avec les ratings !
 #Les animes deviennent ils meilleurs avec le temps ?
 dfAnimes %>%
  group_by(annee)%>%
  filter(!is.na(note))%>%
  summarise(moy_ratings = mean(note)) -> dFRatingsAnnee
 dFRatingsAnnee %>% ggplot(aes(annee, moy_ratings))+geom_point()+geom_line()
 #En quelle saison sortent les meilleurs animes ?
 dfAnimes %>%
  group_by(saison)%>%
  filter(!is.na(note))%>%
  summarise(moy_ratings = mean(note)) -> dFRatingsSaison
 dFRatingsSaison %>% ggplot(aes(saison, moy_ratings, shape = saison, color = saison))+geom_point(size = 3)
--- a/plot_moy_ratings_annee.pdf
+++ b/plot_moy_ratings_annee.pdf
--- a/plot_moy_ratings_saison.pdf
+++ b/plot_moy_ratings_saison.pdf