Préambule

Ce document s’adresse en priorité aux étudiant·e·s du Master 2 IGAST de l’ENSG, dans le cadre du Module intitulé “Analyse Statistique”, dirigé par Ana-Maria Olteanu-Raimond, ainsi qu’aux étudiant·e·s du Master 2 DESIGEO/Data Science, dirigé par Sébastien Mustière et Malika Grimm.

Programme du cours et Contenu

Ce cours comporte une introduction générale pour situer les statistiques qui y sont abordées. Dans cette introduction, on parle beaucoup d’analyse spatiale, parce que c’est dans ce contexte que les rudiments de statistiques exposés ici vont être utilisé mais aucune technique purement spatiale n’est abordée ici.

Le programme stricto-sensu est le suivant :

Analyse Univariée:

  • Vocabulaire
  • Description de distribution : indicateurs de tendance centrale, quantiles, dispersion , symétrie , applatissement

Analyse Bivariée:

  • regression linéaire : R2, p-value
  • corrélation : r de Pearson , rho de Spearman, hypothèse nulle
  • Test du Chi 2 : Construction du tableau d’effectif théorique, calcul du Chi 2 , hypothèse nulle

Le reste, c’est du bonus !

Reférences

Pour constituer ce cours, j’ai utilisé les références suivantes:

J’ai également fait un usage immodéré de Wikipedia, Google, StackOverflow et je vous encourage à faire de même.

Pour les principes de la visualisation, j’essaye de suivre quelques uns des conseils prodigués par Claus O. Wilke dans son ouvrage Fundamentals of Data Visualization

Ressources pour l’apprentissage du langage R

R est un langage qui s’apprend «au fil de l’eau», en trouvant des exemples de manipulations et des réponses à des questions sur des forums et sites spécialisé (Stackoverflow principalement). Cependant, l’étudiant.e IGAST désireuse d’aller droit au but et de manipuler des données spatiales avec R pourra se référer en priorité à :