Martin Cubaud
LASTIG-UGE-IGN/ENSG
2024-2025
L'analyse spatiale étudie la répartition et l'organisation d'ensembles d'objets qui sont localisés.
L'objectif est de :
"déceler en quoi la localisation apporte un élément utile à la connaissances des objets étudiés et peut en expliquer les caractéristiques"
[Pumain, Saint-Julien 97]
Analyse statistique :
Méthodes résumant et généralisant des observations
Analyse spatiale statistique :
Données spatiales :
Individus restreints spatialement (selection spatiale), ou variables de localisation géographique (e.g. Lieu de résidence, coordonnées) renseignées pour les individus
Quid des distances ? → modèle gravitaire, réseau etc.
Analyse géométrique :
Approche géométrique pour mieux décrire les données: analyse de forme, de réseaux, de proximité, méthodes de création de nouvelles entités à partir de la géométrie des objets.
Analyse de données :
Approche statistique permettant de faire émerger des relations (des groupes, des lois) pour aider l'étude de certains phénomènes.
A partir d’un échantillon , que peut-on attendre (=inférer) de la population ?
Penguins data were collected and made available by Dr. Kristen Gorman and the Palmer Station, Antarctica LTER, a member of the Long Term Ecological Research Network.
[https://github.com/allisonhorst/palmerpenguins]Décrire, résumer, synthétiser les propriétés d'une population à partir des variables qui décrivent ses individus.
Paradoxe de Simpsons
Nous ferons majoritairement de la statistique descriptive
(même si, pour bien décrire, il faut parfois inférer).
Ensemble d'individus
"données", "corpus", "échantillon", "data"
très souvent tabulaires
Unité statistique élémentaire : personnes, logements...
→ "les lignes du tableau"
Caractéristiques, propriétés d'un individu, mesurées par des enquêtes, des observations...
→ "les colonnes du tableau"
Qualitatives : facteurs e.g. couleur, genre, CSP, type de pokemon... → notion de modalité
Quantitatives : nombres e.g. taille, masse, revenu, surface, points de vie... parfois exprimés avec des unités : m, kg, s
Variables quantitatives continues : $var \in \R $
Valeurs réelles, toutes les valeurs de l'intervalle de mesures peuvent exister
Variables quantitatives discrètes : $var \in \N $
Valeurs entières, pour des attributs dénombrables (comptage)
parfois utilisées pour encoder une variable qualitative à deux modalités e.g. présence (1), absence (0)
Les valeurs sont prises dans un ensemble fini de valeurs possibles, défini par extension (i.e. on donne la liste des valeurs possibles)
→ notion de modalités
→ nominales (non ordonnées ex état civil) ou
→ ordinales (ordonnées ex échelle de Likert)
Spécificité de la statistique spatiale : à quelle échelle observer ?
Quel découpage, quelles unités spatiales ?
"Problème insoluble" : le MAUP (Modifiable Areal Unit Problem)
Mailles administratives :
agrégation/imbrication d’unités spatiales prédéfinies : comtés, départements, régions, pays...
e.g. Comprendre comment le taux de chômage d'un pays est distribué entre les régions pour guider les politiques économiques
Découpages :
identification d'unités spatiales ayant des catactéristiques semblables
e.g. IRIS, carroyage
Désagrégation ou Ventilation :
→ Inférer des caractéristiques individuelles à partir de l'analyse de données agrégées (ni facile ni immédiat)
Agrégation :
→ Inférer des caractéristiques concernant les unités agrégés d'après les caractéristiques individuelles
Problème d'agrégation spatiale : les résultats d'une analyse statistique spatiale dépendent du choix d'agrégation
→ biais "systématique et insoluble"
Exemples tirés du rapport ESPON :
https://www.espon.eu/sites/default/files/attachments/espon343_maup_final_version2_nov_2006.pdf