library("jsonlite") data<-fromJSON(file="C:\\Users\\Marianne\\Desktop\\projet-analyse-exploratoire\\anime-offline-database-master\\anime-offline-database.json") data<-fromJSON("C:\\Users\\Marianne\\Desktop\\projet-analyse-exploratoire\\anime-offline-database-master\\anime-offline-database.json") dfAnimes <- as.data.frame(data) library("tidyverse") install.packages("tidyverse") library("tidyverse") dfAnimes #Nettoyage des colonnes non utilisées dfAnimes <- select(dfAnimes, data.title, data.type, data.episodes, data.status, data.animeSeason, data.tags) #Nombre d'animes durant plus de 2 cours (24 épisodes) par ans dfAnimes %>% filter(data.episodes>25) %>% longbois #Nombre d'animes durant plus de 2 cours (24 épisodes) par ans dfAnimes %>% filter(data.episodes>25) -> longbois #Nombre d'animes durant plus de 2 cours (24 épisodes) par an dfAnimes %>% filter(data.episodes>30) -> longbois #Nombre d'animes durant plus de 2 cours (estimés à 30 épisodes) par an dfAnimes %>% filter(data.episodes>30) %>% group_by(data.animeSeason) %>% count()-> longbois #Nombre d'animes durant plus de 2 cours (estimés à 30 épisodes) par an dfAnimes %>% filter(data.episodes>30) %>% group_by(data.animeSeason) %>% count(nbAnimes)-> longbois #Nombre d'animes durant plus de 2 cours (estimés à 30 épisodes) par an dfAnimes %>% filter(data.episodes>30) %>% group_by(data.animeSeason) %>% count() %>% rename(n = nbAnimes) -> longbois #Nombre d'animes durant plus de 2 cours (estimés à 30 épisodes) par an dfAnimes %>% filter(data.episodes>30) %>% group_by(data.animeSeason) %>% count() %>% rename(nbAnimes = n) -> longbois longbois %>% ggplot(aes(data, nbAnimes)) + ggcol() longbois %>% ggplot(aes(data, nbAnimes)) + ggcols() longbois %>% ggplot(aes(data, nbAnimes)) + geom_cols() longbois %>% ggplot(aes(data, nbAnimes)) + geom_col() longbois %>% ggplot(aes(data.animeSeason, nbAnimes)) + geom_col() longbois %>% ggplot(aes(data.animeSeason$year, nbAnimes)) + geom_col() #Evolution du nombre de lettre (moyenne et médiane) dans les titres par année dfAnimes %>% group_by(data.animeSeason$year) %>% summarise(Lettres=mean(nchar(data.title))) -> meanLettersByYear View(meanLettersByYear) #Evolution du nombre de lettre (moyenne et médiane) dans les titres par année dfAnimes %>% group_by(data.animeSeason$year) %>% summarise(lettres=mean(nchar(data.title))) -> meanLettersByYear dfAnimes %>% group_by(data.animeSeason$year) %>% summarise(lettres=median(nchar(data.title))) -> medLettersByYear meanLettersByYear %>% ggplot(aes(data.animeSeason$year, lettres)) + geom_col() dfAnimes %>% group_by(data.animeSeason$year) %>% mutate(lettres=median(nchar(data.title))) -> medLettersByYear dfAnimes %>% group_by(data.animeSeason$year) %>% summarise(lettres=median(nchar(data.title))) -> medLettersByYear meanLettersByYear %>% ggplot(aes(data.animeSeason$year, lettres)) + geom_col() dfAnimes %>% group_by(data.animeSeason$year) %>% summarise(lettres=median(nchar(data.title))) %>% rename(annee = data.animeSeason$year)-> medLettersByYear #Dedoublage de la colonne saison dfAnimes %>% mutate(annee = data.animeSeason$year) %>% mutate(saison = data.animeSeason$season) -> dfAnimes dfAnimes %>% group_by(annee) %>% summarise(lettres=median(nchar(data.title))) -> medLettersByYear View(medLettersByYear) View(dfAnimes) View(dfAnimes) #Evolution du nombre de lettre (moyenne et médiane) dans les titres par année dfAnimes %>% group_by(annee) %>% summarise(lettres=mean(nchar(data.title))) -> meanLettersByYear View(meanLettersByYear) meanLettersByYear %>% ggplot(aes(data.animeSeason$year, lettres)) + geom_col() meanLettersByYear %>% ggplot(aes(annee, lettres)) + geom_col() dfAnimes %>% group_by(annee) %>% summarise(lettres=median(nchar(data.title))) -> medLettersByYear medLettersByYear %>% ggplot(aes(annee, lettres)) + geom_col() filter(data, data.animeSeason$year > 1924) -> post1924 filter(dfAnimes, dfAnimes.animeSeason$year > 1924) -> post1924 dfAnimes filter(dfAnimes, dfAnimes$annee > 1924) -> post1924 filter(post1924,post1924$annee < 2022) -> animeCentury animeCentury View(dfAnimes) View(dfAnimes) #Filtrage des animes sortis avant 1925 et après 2021 et des OVAs, films, etc dfAnimes %>% filter(annee < 1924) %>% filter(annee > 2021) %>% filter(data.type == "TV") -> animeCentury #Filtrage des animes sortis avant 1925 et après 2021 et des OVAs, films, etc dfAnimes %>% filter(annee < 1924) %>% filter(annee > 2021) -> animeCentury #Filtrage des animes sortis avant 1925 et après 2021 et des OVAs, films, etc dfAnimes %>% filter(annee > 1924) %>% filter(annee < 2021) %>% filter(data.type == "TV") -> animeCentury View(animeCentury) #Nombre d'animes durant plus de 2 cours (estimés à 30 épisodes) par an => a améliorer animeCentury %>% filter(data.episodes>30) %>% group_by(annee) %>% count() %>% rename(nbAnimes = n) -> longbois longbois %>% ggplot(aes(annee, nbAnimes)) + geom_col() #Filtrage des animes sortis avant 1925 et après 2021 et des OVAs, films, etc dfAnimes %>% filter(annee > 1960) %>% filter(annee < 2021) %>% filter(data.type == "TV") -> animeCentury #Evolution du nombre de lettre (moyenne et médiane) dans les titres par année animeCentury %>% group_by(annee) %>% summarise(lettres=mean(nchar(data.title))) -> meanLettersByYear animeCentury %>% group_by(annee) %>% summarise(lettres=median(nchar(data.title))) -> medLettersByYear meanLettersByYear %>% ggplot(aes(annee, lettres)) + geom_col() medLettersByYear %>% ggplot(aes(annee, lettres)) + geom_col()