Chapitre 1 Les logiciels R et RStudio
Ce chapitre est inspiré de (Barnier 2018) et de (Ismay 2018).
1.1 Qu’est-ce que R?
R est un langage orienté vers le traitement et l’analyse quantitative de données. Il est développé depuis les années 90 par un groupe de volontaires de différents pays et par une large communauté d’utilisateurs. C’est un logiciel libre, publié sous licence GNU GPL. R a été créé par Ross Ihaka et Robert Gentleman en Nouvelle-Zélande à l’Université d’Auclkand.
Voici les avantages les plus importants de R:
- R est un logiciel gratuit.
- R est un logiciel très puissant, dont les fonctionnalités de base peuvent être étendues à l’aide d’extensions développées par la communauté. Il en existe plusieurs milliers.
- R est un logiciel dont le développement est très actif et dont la communauté d’utilisateurs et l’usage ne cessent de s’agrandir.
- Il est possible de trouver des réponses à ses questions assez facilement grâce à l’aide incluse, à la communauté, à Google, etc. Bien que l’aide soit en anglais, il existe des communautés francophones qui utilisent le logiciel.
- R n’est pas un logiciel au sens classique du terme, mais plutôt un langage de programmation. Il fonctionne à l’aide de scripts (des petits programmes) édités et exécutés au fur et à mesure de l’analyse. Ce point, qui peut apparaître comme un gros handicap, s’avère après un temps d’apprentissage être un mode d’utilisation d’une grande souplesse.
L’aspect langage de programmation et la difficulté qui en découle peuvent sembler des inconvénients importants. Le fait de structurer ses analyses sous forme de scripts (suite d’instructions effectuant les différentes opérations d’une analyse) présente cependant de nombreux avantages :
- le script garde par ordre chronologique l’ensemble des étapes d’une analyse, de l’importation des données à leur analyse en passant par les manipulations et les recodages
- on peut à tout moment revenir en arrière et modifier ce qui a été fait
- il est très rapide de réexécuter une suite d’opérations complexes
- on peut très facilement mettre à jour les résultats en cas de modification des données sources
- le script garantit, sous certaines conditions, la reproductibilité des résultats obtenus
Pour télécharger le logiciel R, vous allez à l’adresse suivante:
1.2 Qu’est-ce que RStudio?
RStudio n’est pas à proprement parler une interface graphique pour R
, il s’agit plutôt d’un environnement de développement intégré (integrated development environment en anglais), qui propose des outils et facilite l’écriture de scripts et l’usage de R au quotidien. C’est une interface bien supérieure à celles fournies par défaut lorsqu’on installe R sous Windows ou sous Mac.
Il existe plusieurs versions de RStudio:
- RStudio Desktop
- RStudio Server
- RStudio Cloud
Pour télécharger la version Desktop de RStudio (que vous pouvez utilisez sur votre ordinateur), vous allez à l’adresse suivante:
1.3 Les bases de RStudio
1.3.1 La console
Au premier lancement de RStudio, l’écran est séparé en trois grandes zones:

Figure 1.1: L’interface de RStudio
La zone de gauche se nomme Console. À son démarrage, RStudio a lancé une nouvelle session de R et c’est dans cette fenêtre que nous allons pouvoir interagir avec lui.
Vous devriez voir un texte ressemblant à celui-ci:
R version 3.4.4 (2018-03-15) -- "Someone to Lean On"
Copyright (C) 2018 The R Foundation for Statistical Computing
Platform: x86_64-w64-mingw32/x64 (64-bit)
R is free software and comes with ABSOLUTELY NO WARRANTY.
You are welcome to redistribute it under certain conditions.
Type 'license()' or 'licence()' for distribution details.
R is a collaborative project with many contributors.
Type 'contributors()' for more information and
'citation()' on how to cite R or R packages in publications.
Type 'demo()' for some demos, 'help()' for on-line help, or
'help.start()' for an HTML browser interface to help.
Type 'q()' to quit R.
La console ressemble à ceci:

Figure 1.2: La console R
La ligne qui débute avec le symbole >
est appelée l’invite de commande (ou prompt en anglais). Elle signifie que R est disponible et en attente de votre prochaine commande. C’est à cet endroit que nous pouvons entrer des commandes et les éxécuter en appuyabt sur Entrée
.
1.3.2 Environment/History/Connections

Figure 1.3: La zone Environment/History/Connections
1.3.3 Files/Plots/Packages/Help/Viewer

Figure 1.4: La zone Files/Plots/Packages/Help/Viewer
Vous pouvez chercher de l’aide dans l’onglet Help de l’interface de RStudio (voir la figure 1.4) et utiliser le moteur de recherche intégré.
Chaque page d’aide est très complète mais pas toujours très accessible. Elle est structurée selon différentes sections, notamment :
- Description : donne un résumé en une phrase de ce que fait la fonction
- Usage : indique la ou les manières de l’utiliser
- Arguments : détaille les arguments possibles et leur signification
- Value : indique la forme du résultat renvoyé par la fonction
- Details : apporte des précisions sur le fonctionnement de la fonction
- See Also : renvoit vers d’autres fonctions semblables ou liées, ce qui peut être très utile pour découvrir ou retrouver une fonction dont on a oublié le nom
- Examples : donne une série d’exemples d’utilisation
Les exemples d’une page d’aide peuvent être exécutés directement dans la console avec la fonction example
:
example("mean")
#>
#> mean> x <- c(0:10, 50)
#>
#> mean> xm <- mean(x)
#>
#> mean> c(xm, mean(x, trim = 0.10))
#> [1] 8.75 5.50
L’onglet Help de RStudio permet d’afficher mais aussi de naviguer dans les pages d’aide de R et dans d’autres ressources :
1.3.4 Aller chercher de l’aide
Il est possible d’obtenir à tout moment de l’aide (en anglais) sur une fonction en tapant help()
avec comme argument le nom de la fonction dans la console :
help("mean")
Il est aussi possible d’utiliser l’opérateur ?
. Par exemple:
?mean
Bibliographie
Barnier, Julien. 2018. Introduction à R et Au Tidyverse. https://juba.github.io/tidyverse/.
Ismay, Chester. 2018. Getting Used to R, Rstudio, and R Markdown. https://ismayc.github.io/rbasics-book/.