Projet MSS Les Iris - example

Mon nom la date

Les Iris de Fisher est un fameux jeu de données, propice à la classification. Notre objectif est de montrer les rudiments d’un document RMarkdown tricoté avec RStudio, pour en faire un document Markdown visible sur GitHub. Si on renomme le fichier en README.md à la racine du dépôt, il s’affiche directement sous la liste des fichiers du dépôt. Bien sûr le tricotage pourrait créer un document html avec l’option html_document qu’on peut déposer sur GitHub, mais qui ne se visualise pas aussi facilement.

Pour commencer, on définit les options générales de knitr, à choisir…

# pour éditer avec les codes, sans les résultats
#knitr::opts_chunk$set(echo = T, message=F, eval=F, warning = F) 

# pour éditer sans les codes, avec les résultats
#knitr::opts_chunk$set(echo = F, message=F, eval=T, warning = F)

# pour éditer avec les codes et les résultats
knitr::opts_chunk$set(echo = T, message=F, eval=T, warning = F)
library(ggplot2)

Récupération des données

Le jeu de données iris est déjà dans RStudio pour pouvoir y accéder :

data(iris)

On peut alors le manipuler, par exemple, le visualiser. En prévision d’une conversion en Markdown (et pas seulement html), on utilise kable

knitr::kable(head(iris))

Sepal.Length	Sepal.Width	Petal.Length	Petal.Width	Species
5.1	3.5	1.4	0.2	setosa
4.9	3.0	1.4	0.2	setosa
4.7	3.2	1.3	0.2	setosa
4.6	3.1	1.5	0.2	setosa
5.0	3.6	1.4	0.2	setosa
5.4	3.9	1.7	0.4	setosa

Premiers graphes

Cette section est surtout pour montrer les possibilités de formater le texte. La cheat sheet de RMarkdown est visible ici sur cette page :https://rstudio.com/wp-content/uploads/2015/02/rmarkdown-cheatsheet.pdf

Et un résumé sympa de la syntaxe Markdown ici :https://guides.github.com/features/mastering-markdown/

Ce qu’il faut savoir : RMakdown et Markdown, c’est différent ! Bon, pour revenir à notre analyse, voici les graphes représentés

le nuage de points selon les longueurs et largeurs de sépales
le même pour les pétales
la boite à moustaches des longueurs de pétales selon l’espèce d’iris.

ggplot(data=iris, aes(x=Sepal.Length, y=Sepal.Width,col=Species)) + geom_point(size=3, alpha=0.7)+ggtitle('Graphe selon les Sépales')

ggplot(data=iris, aes(x=Petal.Length, y=Petal.Width,col=Species)) + geom_point(size=3, alpha=0.7)+ggtitle('Graphe selon les Pétales')

ggplot(data=iris, aes(x=Species, y=Petal.Length,col=Species)) + geom_boxplot()

Classification par kmeans

Cet exemple virtuel se propose de classifier les iris selon des variables numériques sélectionnées dans le jeu de données. Par exemple avec les deux premières :

selectedData <- iris[, c(1,2)]
clusters <- kmeans(selectedData,3)
plot(selectedData,
         col = clusters$cluster,pch = 20, cex = 3)
points(clusters$centers, pch = 4, cex = 4, lwd = 4)

La classification peut se faire sur la base de deux variables (et sa représentation aussi), mais on peut aussi imaginer une classification basée sur l’ensemble des variables, avec une représentation 2D. Comparons avec :

clusters <- kmeans(iris[,1:4],3) # les 4 variables numériques
plot(selectedData,
         col = clusters$cluster,pch = 20, cex = 3)
points(clusters$centers, pch = 4, cex = 4, lwd = 4)

On peut aussi proposer une table de classification pour comparer avec les espèces :

knitr::kable(table(clusters$cluster,iris$Species))

setosa	versicolor	virginica
0	48	14
0	2	36
50	0	0

Pour finir, après le tricotage et la création du html final, on peut voir dans le dossier un fichier créé avec l’extension .md. On change som nom en README.md, et on pousse sur GitHub.

Application Shiny

On retrouve l’application shiny correspondante à ce rapport à l’adresse :https://couallier.shinyapps.io/MSS-Projet_Final-les-Iris/

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
projet-les-Iris_files/figure-gfm		projet-les-Iris_files/figure-gfm
rsconnect/shinyapps.io/couallier		rsconnect/shinyapps.io/couallier
.gitignore		.gitignore
MSS-Projet_Final.Rproj		MSS-Projet_Final.Rproj
README.md		README.md
README.old.md		README.old.md
projet-les-Iris.rmd		projet-les-Iris.rmd
server.R		server.R
ui.R		ui.R

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Projet MSS Les Iris - example

Récupération des données

Premiers graphes

Classification par kmeans

Application Shiny

About

Releases

Packages

Languages

VCouallier/MSS-Projet_Final

Folders and files

Latest commit

History

Repository files navigation

Projet MSS Les Iris - example

Récupération des données

Premiers graphes

Classification par kmeans

Application Shiny

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages