projet-analyse-exploratoire/.Rhistory
2021-12-08 18:31:26 +01:00

136 lines
5.4 KiB
Text

library("jsonlite")
data<-fromJSON(file="C:\\Users\\Marianne\\Desktop\\projet-analyse-exploratoire\\anime-offline-database-master\\anime-offline-database.json")
data<-fromJSON("C:\\Users\\Marianne\\Desktop\\projet-analyse-exploratoire\\anime-offline-database-master\\anime-offline-database.json")
dfAnimes <- as.data.frame(data)
library("tidyverse")
install.packages("tidyverse")
library("tidyverse")
dfAnimes
#Nettoyage des colonnes non utilisées
dfAnimes <- select(dfAnimes, data.title, data.type, data.episodes, data.status, data.animeSeason, data.tags)
#Nombre d'animes durant plus de 2 cours (24 épisodes) par ans
dfAnimes %>%
filter(data.episodes>25) %>% longbois
#Nombre d'animes durant plus de 2 cours (24 épisodes) par ans
dfAnimes %>%
filter(data.episodes>25) -> longbois
#Nombre d'animes durant plus de 2 cours (24 épisodes) par an
dfAnimes %>%
filter(data.episodes>30) -> longbois
#Nombre d'animes durant plus de 2 cours (estimés à 30 épisodes) par an
dfAnimes %>%
filter(data.episodes>30) %>%
group_by(data.animeSeason) %>%
count()-> longbois
#Nombre d'animes durant plus de 2 cours (estimés à 30 épisodes) par an
dfAnimes %>%
filter(data.episodes>30) %>%
group_by(data.animeSeason) %>%
count(nbAnimes)-> longbois
#Nombre d'animes durant plus de 2 cours (estimés à 30 épisodes) par an
dfAnimes %>%
filter(data.episodes>30) %>%
group_by(data.animeSeason) %>%
count() %>%
rename(n = nbAnimes) -> longbois
#Nombre d'animes durant plus de 2 cours (estimés à 30 épisodes) par an
dfAnimes %>%
filter(data.episodes>30) %>%
group_by(data.animeSeason) %>%
count() %>%
rename(nbAnimes = n) -> longbois
longbois %>% ggplot(aes(data, nbAnimes)) + ggcol()
longbois %>% ggplot(aes(data, nbAnimes)) + ggcols()
longbois %>% ggplot(aes(data, nbAnimes)) + geom_cols()
longbois %>% ggplot(aes(data, nbAnimes)) + geom_col()
longbois %>% ggplot(aes(data.animeSeason, nbAnimes)) + geom_col()
longbois %>% ggplot(aes(data.animeSeason$year, nbAnimes)) + geom_col()
#Evolution du nombre de lettre (moyenne et médiane) dans les titres par année
dfAnimes %>%
group_by(data.animeSeason$year) %>%
summarise(Lettres=mean(nchar(data.title))) -> meanLettersByYear
View(meanLettersByYear)
#Evolution du nombre de lettre (moyenne et médiane) dans les titres par année
dfAnimes %>%
group_by(data.animeSeason$year) %>%
summarise(lettres=mean(nchar(data.title))) -> meanLettersByYear
dfAnimes %>%
group_by(data.animeSeason$year) %>%
summarise(lettres=median(nchar(data.title))) -> medLettersByYear
meanLettersByYear %>% ggplot(aes(data.animeSeason$year, lettres)) + geom_col()
dfAnimes %>%
group_by(data.animeSeason$year) %>%
mutate(lettres=median(nchar(data.title))) -> medLettersByYear
dfAnimes %>%
group_by(data.animeSeason$year) %>%
summarise(lettres=median(nchar(data.title))) -> medLettersByYear
meanLettersByYear %>% ggplot(aes(data.animeSeason$year, lettres)) + geom_col()
dfAnimes %>%
group_by(data.animeSeason$year) %>%
summarise(lettres=median(nchar(data.title))) %>%
rename(annee = data.animeSeason$year)-> medLettersByYear
#Dedoublage de la colonne saison
dfAnimes %>%
mutate(annee = data.animeSeason$year) %>%
mutate(saison = data.animeSeason$season) -> dfAnimes
dfAnimes %>%
group_by(annee) %>%
summarise(lettres=median(nchar(data.title))) -> medLettersByYear
View(medLettersByYear)
View(dfAnimes)
View(dfAnimes)
#Evolution du nombre de lettre (moyenne et médiane) dans les titres par année
dfAnimes %>%
group_by(annee) %>%
summarise(lettres=mean(nchar(data.title))) -> meanLettersByYear
View(meanLettersByYear)
meanLettersByYear %>% ggplot(aes(data.animeSeason$year, lettres)) + geom_col()
meanLettersByYear %>% ggplot(aes(annee, lettres)) + geom_col()
dfAnimes %>%
group_by(annee) %>%
summarise(lettres=median(nchar(data.title))) -> medLettersByYear
medLettersByYear %>% ggplot(aes(annee, lettres)) + geom_col()
filter(data, data.animeSeason$year > 1924) -> post1924
filter(dfAnimes, dfAnimes.animeSeason$year > 1924) -> post1924
dfAnimes
filter(dfAnimes, dfAnimes$annee > 1924) -> post1924
filter(post1924,post1924$annee < 2022) -> animeCentury
animeCentury
View(dfAnimes)
View(dfAnimes)
#Filtrage des animes sortis avant 1925 et après 2021 et des OVAs, films, etc
dfAnimes %>%
filter(annee < 1924) %>%
filter(annee > 2021) %>%
filter(data.type == "TV") -> animeCentury
#Filtrage des animes sortis avant 1925 et après 2021 et des OVAs, films, etc
dfAnimes %>%
filter(annee < 1924) %>%
filter(annee > 2021) -> animeCentury
#Filtrage des animes sortis avant 1925 et après 2021 et des OVAs, films, etc
dfAnimes %>%
filter(annee > 1924) %>%
filter(annee < 2021) %>%
filter(data.type == "TV") -> animeCentury
View(animeCentury)
#Nombre d'animes durant plus de 2 cours (estimés à 30 épisodes) par an => a améliorer
animeCentury %>%
filter(data.episodes>30) %>%
group_by(annee) %>%
count() %>%
rename(nbAnimes = n) -> longbois
longbois %>% ggplot(aes(annee, nbAnimes)) + geom_col()
#Filtrage des animes sortis avant 1925 et après 2021 et des OVAs, films, etc
dfAnimes %>%
filter(annee > 1960) %>%
filter(annee < 2021) %>%
filter(data.type == "TV") -> animeCentury
#Evolution du nombre de lettre (moyenne et médiane) dans les titres par année
animeCentury %>%
group_by(annee) %>%
summarise(lettres=mean(nchar(data.title))) -> meanLettersByYear
animeCentury %>%
group_by(annee) %>%
summarise(lettres=median(nchar(data.title))) -> medLettersByYear
meanLettersByYear %>% ggplot(aes(annee, lettres)) + geom_col()
medLettersByYear %>% ggplot(aes(annee, lettres)) + geom_col()