Statistiques et Probabilités avec R et le Tidyverse
Introduction
I Les outils
1
Les logiciels R et RStudio
1.1
Qu’est-ce que R?
1.2
Qu’est-ce que RStudio?
1.3
Les bases de RStudio
1.3.1
La console
1.3.2
Environment/History/Connections
1.3.3
Files/Plots/Packages/Help/Viewer
1.3.4
Aller chercher de l’aide
2
Le tidyverse
2.1
Extensions
2.2
Installation
2.3
Les tidy data
2.4
Les tibbles
2.4.1
Prérequis
2.4.2
Un exemple de
tibble
2.4.3
La base de données flights
2.4.4
La base de données
diamonds
2.4.5
Comment explorer des “tibbles”
3
L’extension
questionr
3.1
Mise en place
3.2
L’interface graphique
II Introduction
4
La démarche scientifique
5
Les différents types de variables
5.1
Introduction
5.1.1
Mise en place
5.2
Les variables qualitatives
5.2.1
Les variables qualitatives à échelle nominale
5.2.2
Les variables qualitatives à échelle ordinale
5.3
Les variables quantitatives
5.3.1
Mise en place
5.3.2
Les variables quantitatives discrètes
5.3.3
Les variables quantitatives continues
6
Construire un questionnaire
6.1
Critères à respecter
6.2
Types de questions
6.2.1
Question ouverte
6.2.2
Questions fermées
7
Les échelles de mesure
8
Les techniques d’échantillonnage
8.1
Techniques d’échantillonnage aléatoires
8.2
Techniques d’échantillonnage non-aléatoires
8.3
Base de données pour les
M&M’s
III Présentation des données
9
Les variables qualitatives
9.1
Mise en place
9.2
Tableau de fréquences
9.3
Représentation graphique - Le diagramme à bandes
9.3.1
La variable
marital
9.3.2
La variable
relig
10
Les variables quantitatives discrètes
10.1
Mise en place
10.2
Tableau de fréquences
10.3
Représentation graphique - Le diagramme à bandes
11
Les variables quantitatives continues
11.1
Mise en place
11.2
Tableau de fréquences
11.3
Représentation graphique - L’histogramme
12
Deux variables
12.1
Mise en place
12.2
Croisement de deux variables qualitatives
12.2.1
Tableaux à double entrée
12.2.2
Représentation graphique - diagramme à bandes chevauchées
12.2.3
Représentation graphique - diagramme à bandes superposées
12.3
Croisement d’une variable qualitative et d’une variable quantitative
12.3.1
Représentation graphique - boîte à moustaches
12.3.2
Représentation graphique - diagramme en violon
12.4
Croisement de deux variables quantitatives
IV Les mesures
13
Les proportions
13.1
Mise en place
14
Les mesures de tendance centrale
14.1
Mise en place
14.2
Le mode
14.3
La médiane
14.4
La moyenne
15
Les mesures de dispersion
15.1
L’étendue
15.2
La variance
15.3
L’écart-type
15.4
Le coefficient de variation
16
Les mesures de position
16.1
La cote z
16.2
Les quantiles
16.3
La commande
summary
16.4
Le rang centile
V Les données construites
17
Les séries chronologiques
17.1
Mise en place
17.2
Criminalité à Montréal
17.3
Airbnb
17.3.1
Catégorie de logement
17.3.2
Availability
17.3.3
Nombre de logements par hôtes
17.4
DSLABS
17.5
FIVETHIRTYEIGHT
18
Les données construites
18.1
Mise en place
VI L’analyse de lien
19
La corrélation linéaire
19.1
Mise en place
19.2
Le nuage de points
19.3
Fake data
19.3.1
Corrélation positive
19.3.2
Corrélation négative
19.3.3
Aucune corrélation
19.3.4
Une autre façon de simuler
19.3.5
Autre essai moderndive
19.4
Le quartet d’Anscombe
19.5
DatasauRus
19.6
Challenger
19.6.1
Toutes les données
19.6.2
Sans incident
19.6.3
Probabilités en enlevant les incidents
19.6.4
Probabilités en gardant les incidents
19.6.5
GLM
Bibliographie
Publié avec bookdown
Statistiques et Probabilités avec R, RStudio et le Tidyverse
Chapitre 18
Les données construites
18.1
Mise en place
library
(tidyverse)
library
(questionr)
library
(knitr)