Initiation à R (2/3)

Après l'initiation à R de la séance 1, on poursuit notre exploration de R sous la forme d'exercices.

Soit ce jeu de données disponible en cliquant ici au format xl..

Ces données sont extraites de l'ouvrage « L'analyse de données » de J-M. Bouroche et G. Saporta, Que sais-je ? 1854, PUF, 6e édition, 1994. Elles représentent la répartition des dépenses de l'état français sur 24 années (une année par ligne : 1872, 1880, 1890, 1900, 1903, 1906, 1909, 1912, 1920, 1923, 1926, 1929, 1932, 1935, 1938, 1947, 1950, 1953, 1956, 1959, 1962, 1965, 1968 et 1971) dans 11 secteurs de l'économie (1 secteur par colonne, dans l'ordre : pouvoirs publics, agriculture, commerce et industrie, transports, logement et aménagement du territoire, éducation et culture, action sociale, anciens combattants, défense, dette et divers). Ceci constitue donc une matrice structurée en 24 lignes de 11 colonnes.

ACP

Les fonctions nécessaires à la réalisation d'une ACP sont disponibles dans la bibliothèque stats. Il faut donc taper la commande :

library(stats)

pour y avoir accès.

Ensuite, l'ACP est effectuée en utilisant la fonction prcomp() à laquelle on passe un data frame en paramètre ainsi que les paramètres center = TRUE, scale = TRUE pour que les données soient centrées et réduites.

Pour effectuer une ACP sur le budget, on ne s'intéresse pas à l'attribut « année ». Il faut donc l'indiquer en spécifiant que l'on veut :

En résumé, on obtiendra l'ACP du jeu de données budget par la commande suivante :

> budget.acp <- prcomp (budget [, -1], center = TRUE, scale = TRUE)

On peut alors :