• Analyse Statistique
    M2 IGAST
  • Préambule
    • Programme du cours et Contenu
    • Reférences
    • Ressources pour l’apprentissage du langage R
  • 1 Introduction générale
    • 1.1 Analyse spatiale : définition
    • 1.2 Analyse spatiale & Analyse Statistique
    • 1.3 Deux approches en analyse spatiale
    • 1.4 Deux familles statistiques
      • 1.4.1 Statistiques inférentielles
      • 1.4.2 Statistiques inférentielles : l’exemple des pingouins
      • 1.4.3 Statistiques descriptives
      • 1.4.4 Les formats de données wide et long
    • 1.5 Vocabulaire
      • 1.5.1 Variables quantitatives
      • 1.5.2 Variables qualitatives
      • 1.5.3 Valeur et Nature des variables
      • 1.5.4 Types de variables et représentations
    • 1.6 Difficultés de la statistique
      • 1.6.1 Plusieurs discours sont possibles
      • 1.6.2 Taille et représentativité de l’échantillon
      • 1.6.3 Le paradoxe de Simpsons
      • 1.6.4 Échelle individuelle vs. Échelle agrégée
      • 1.6.5 Agrégation
      • 1.6.6 Désagrégation ou Ventilation
    • 1.7 À quelle échelle observer ? le MAUP
      • 1.7.1 Effet de zonage
      • 1.7.2 MAUP : exemples
    • 1.8 Rappel: La première “chose à faire”
  • 2 Analyse Univariée
    • 2.1 Le concept de distribution
      • 2.1.1 Interpréter la courbe de densité
      • 2.1.2 Bonus: Estimation la probabilité à partir de la densité de probabilité
    • 2.2 Exemples de distributions de lois connues
      • 2.2.1 Loi Gaussienne
      • 2.2.2 Loi uniforme
      • 2.2.3 Loi log-normale
    • 2.3 Histogramme d’une distribution réelle
    • 2.4 Afficher histogrammes et distributions en R
      • 2.4.1 Histogramme d’une variable quantitative
      • 2.4.2 Histogramme et variable qualitative
    • 2.5 La Tendance
      • 2.5.1 Moyenne(s)
      • 2.5.2 Mode
      • 2.5.3 Médiane
      • 2.5.4 Quelle mesure de tendance choisir ?
    • 2.6 La Dispersion
      • 2.6.1 Variance et Écart-type
      • 2.6.2 Quantiles
      • 2.6.3 Les boîtes à moustaches (boxplots) avec R
      • 2.6.4 Le coefficient de variation
      • 2.6.5 Comparer les dispersions de deux distributions.
    • 2.7 La Forme
      • 2.7.1 Asymétrie
      • 2.7.2 L’Aplatissement (kurtosis)
      • 2.7.3 Transformations des données
      • 2.7.4 Fat-tail distributions : un exemple
  • 3 Cartographie, Distribution et Échelle de couleurs
    • 3.1 Méthodes usuelles de discrétisation
    • 3.2 Les données
      • 3.2.1 Géométrie des quartiers de Paris
      • 3.2.2 Distribution des surfaces des quartiers
    • 3.3 Résultats des méthodes de classification
      • 3.3.1 Classification par défaut
      • 3.3.2 Méthode Jenks à 5 , 7 et 9 classes
      • 3.3.3 Effectifs égaux
      • 3.3.4 Intervalles égaux
      • 3.3.5 Écart-types
    • 3.4 Quelle méthode de classification choisir ?
  • 4 Visualiser une distribution avec R
    • 4.0.1 Histogramme : Code R + ggplot
    • 4.0.2 Distribution/densité : Code R + ggplot
    • 4.0.3 BoxPlot : Code R + ggplot
    • 4.0.4 Violin plot : Code R + ggplot
    • 4.0.5 Violin plot et Boxplot : Code R + ggplot 2
    • 4.0.6 Pyramides (histogrammes juxtaposés)
    • 4.0.7 Polygones de fréquences
    • 4.0.8 Distribution cumulée, Fonction de répartition, CDF
    • 4.0.9 Dot Strip Plot
  • 5 Analyse Bivariée
    • 5.1 Introduction
      • 5.1.1 Analyse bivariée, mais sans la localisation
      • 5.1.2 Ressources pour l’analyse des localisation et des distances
      • 5.1.3 Corrélation n’implique pas causalité
      • 5.1.4 Diverses formes de dépendances
      • 5.1.5 Les étapes de l’analyse bivariée
    • 5.2 Contenu du chapitre
    • 5.3 Régression linéaire
      • 5.3.1 Avant toute chose
      • 5.3.2 Principe et Vocabulaire
      • 5.3.3 Interpréter la droite de régression
      • 5.3.4 Utiliser un modèle linéaire
      • 5.3.5 Évaluer la qualité d’une régression linaire : le \(R^2\)
      • 5.3.6 Évaluer la qualité d’une régression linaire : la p-value
    • 5.4 Corrélation
      • 5.4.1 Calcul direct du coefficient de corrélation (de Pearson)
      • 5.4.2 Le coefficient de corrélation de Spearman
      • 5.4.3 Pearson ou Spearman ?
      • 5.4.4 Matrice de corrélations
      • 5.4.5 Sensibilité aux valeurs extrêmes
    • 5.5 Régression linéaire et corrélation avec R
      • 5.5.1 La commande lm
      • 5.5.2 Format des résultats
      • 5.5.3 Bonus: Critères de significativité du lien linéaire
      • 5.5.4 Tests de corrélation avec R
    • 5.6 “trucs” pour linéariser des relations non-linéaires
      • 5.6.1 Relation log-linéaire
      • 5.6.2 Relation géométrique (exponentielle)
      • 5.6.3 Relation logarithmique
      • 5.6.4 Relation logistique
    • 5.7 Lien entre deux variables qualitatives
      • 5.7.1 Table de contingence
      • 5.7.2 Test statistique du \(\chi^2\) ou “Khi carré”
      • 5.7.3 Interprétation de la valeur du \(\chi^2\)
      • 5.7.4 Résumé des étapes du \(\chi ^2\)
      • 5.7.5 Fréquences théoriques et fréquences marginales
    • 5.8 Lien entre une variable qualitative et une variable quantitative.
      • 5.8.1 Boxplot par catégories
      • 5.8.2 Superpositions de distributions
    • 5.9 Références supplémentaires
  • 6 Analyse spatiale
    • 6.1 Contenu du chapitre
      • 6.1.1 L’information géographique
      • 6.1.2 Précautions dans l’emploi de projections
    • 6.2 Semis de points
    • 6.3 Statistiques simples sur un semis
      • 6.3.1 Point moyen et point médian
      • 6.3.2 Dispersion et concentration d’un semis
    • 6.4 Autocorrélation spatiale : Moran et Geary
      • 6.4.1 L’autocorrélation spatiale
      • 6.4.2 Le modèle nul pour un semis de points
      • 6.4.3 Auto-corrélation spatiale : Moran et Geary
      • 6.4.4 L’indice de Moran
      • 6.4.5 L’indice de Geary
      • 6.4.6 Commandes R
      • 6.4.7 Interprétation de l’indice de Moran
    • 6.5 Les flux
      • 6.5.1 Matrice de flux
      • 6.5.2 Indices
      • 6.5.3 Cartographie des flux
    • 6.6 Exemple
      • 6.6.1 Pour aller plus loin
    • 6.7 Le modèle gravitaire
      • 6.7.1 Fin XIXe : Les lois de Ravenstein
      • 6.7.2 Le modèle gravitaire
      • 6.7.3 Distance et interaction
      • 6.7.4 Utilisation du modèle gravitaire
      • 6.7.5 Variantes du modèles gravitaires
    • 6.8 L’étape d’après : modèles dynamiques
      • 6.8.1 Modèles simples : les automates cellulaires
      • 6.8.2 Principe d’un modèle de mobilité
  • 7 Galerie de graphiques avec ggplot
    • 7.1 Lien entre deux variables quantitatives
      • 7.1.1 Nuage de points simple
      • 7.1.2 Ajouter un titre , étiqueter les axes
      • 7.1.3 Nuage de points colorés par variable continue (quantitative)
      • 7.1.4 Nuage de points colorés par variable discrète (qualitative)
      • 7.1.5 Nuage de points et droite de regression / de lissage
      • 7.1.6 À ne pas faire
      • 7.1.7 Ajouter les histogrammes marginaux
    • 7.2 Lien entre plusieurs variables quantitatives
      • 7.2.1 Correlogramme simple avec GGally
      • 7.2.2 Correlogramme plus complexe avec GGally
      • 7.2.3 Parallel plot
    • 7.3 Lien entre deux variables qualitatives
      • 7.3.1 Mosaic plot simple
      • 7.3.2 Moisaic plot de ggplot2
      • 7.3.3 dot plot
    • 7.4 Lien entre plusieurs variables qualitatives
      • 7.4.1 Flux sur axes paralllèles
    • 7.5 Distributions de variables quantitatives
      • 7.5.1 Distribution
      • 7.5.2 Histogramme
      • 7.5.3 Distribution et histogramme
      • 7.5.4 Pyramides (e.g. des âges)
    • 7.6 Distributions de variables qualitatives
      • 7.6.1 Bar chart
      • 7.6.2 bar chart empilé
    • 7.7 Graphiques “exotiques”
      • 7.7.1 Graphiques «en fleur»
      • 7.7.2 Chord diagramm
    • 7.8 Comparaisons d’individus, déviations
      • 7.8.1 Radar plot
  • References
    • 7.9 Apprendre R
    • 7.10 Visualisation
    • 7.11 R, visualisation et données spatiales
  • Published with bookdown

Analyse Statistique M2 IGAST, et DESIGEO

References

7.9 Apprendre R

https://mtes-mct.github.io/parcours-r/

7.10 Visualisation

https://r-statistics.co/Top50-Ggplot2-Visualizations-MasterList-R-Code.html

https://gramener.github.io/visual-vocabulary-vega/

https://r-graph-gallery.com/199-correlation-matrix-with-ggally.html

7.11 R, visualisation et données spatiales

https://statnmap.com/2018-07-14-introduction-to-mapping-with-sf-and-co/