import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import geopandas as gpd

#lecture du fichier
arbres = gpd.read_file("les-arbres.geojson")
#Afficher le nom des colonnes
print(arbres.columns)
#Apercu des données
arbres.head()

Index(['idbase', 'typeemplacement', 'domanialite', 'arrondissement',
       'complementadresse', 'numero', 'adresse', 'idemplacement',
       'libellefrancais', 'genre', 'espece', 'varieteoucultivar',
       'circonferenceencm', 'hauteurenm', 'stadedeveloppement', 'remarquable',
       'geometry'],
      dtype='object')

#lecture du fichier
quartier = gpd.read_file("quartier_paris.shp")
#On met comme identifiant du dataframe le numéro du quartier
quartier = quartier.set_index("n_sq_qu")
quartier.head()

arbres = arbres.to_crs(epsg=2154)
quartier = quartier.to_crs(epsg=2154)

arbres.plot(figsize=(10, 10), markersize=0.01)#par défaut geopandas affiche la carte (kind="geo")

<Axes: >

arbres.plot(figsize=(10, 10), markersize=0.01, column="arrondissement", legend=True, cmap="tab20").set_title("arrondissement")

Text(0.5, 1.0, 'arrondissement')

arbres.plot(figsize=(10, 10), markersize=0.01, column="hauteurenm", legend=True, cmap="viridis", vmax=20).set_title("hauteur des arbres")

Text(0.5, 1.0, 'hauteur des arbres')

join = quartier.sjoin(
    arbres, how="left", predicate="contains"
    )

print(len(join))
join.head()

185151

grouped = join.groupby("n_sq_qu")
nb_arbres_par_quartiers = grouped["idbase"].aggregate("count")

nb_arbres_par_quartiers = join.index.value_counts()

quartier["nb_arbres"] = nb_arbres_par_quartiers

#Attention, vérifier d'avoir projeté les données avant de calculer la surface
quartier["dens_arbres"] = quartier["nb_arbres"] / quartier.area

print(f"nombre moyen d'arbres par quartier : {quartier['nb_arbres'].mean():.2f} arbres")
print(f"écart-type du nombre d'arbres par quartier : {quartier['nb_arbres'].std():.2f} arbres")

print(f"Densité moyenne par quartier : {quartier['dens_arbres'].mean():.2e} arbres par m²")
print(f"écart-type de densité par quartier : {quartier['dens_arbres'].std():.2e} arbres par m²")

nombre moyen d'arbres par quartier : 2314.39 arbres
écart-type du nombre d'arbres par quartier : 2284.97 arbres
Densité moyenne par quartier : 1.60e-03 arbres par m²
écart-type de densité par quartier : 8.10e-04 arbres par m²

plt.figure(figsize=(15, 10))
ax1 = plt.subplot(2, 1, 1)
quartier["nb_arbres"].plot(ax=ax1, kind="hist", title="Nombre d'arbres par quartier", xlabel="nombre d'arbres", ylabel="nombre de quartiers")
ax2 = plt.subplot(2, 1, 2, sharey=ax1)
(quartier["dens_arbres"]).plot(ax=ax2, kind="hist", title="Densité d'arbres par quartier", xlabel="densité d'arbres", ylabel="nombre de quartiers")

<Axes: title={'center': "Densité d'arbres par quartier"}, xlabel="densité d'arbres", ylabel='nombre de quartiers'>

print(f"kurtosis du nombre d'arbres par quartier : {quartier['nb_arbres'].kurtosis():.2e} arbres")
print(f"skewness du nombre d'arbres par quartier : {quartier['nb_arbres'].skew():.2e} arbres")

print(f"kurtosis de la densité par quartier : {quartier['dens_arbres'].kurtosis():.2e} arbres par m²")
print(f"skewness de la densité par quartier : {quartier['dens_arbres'].skew():.2e} arbres par m²")

kurtosis du nombre d'arbres par quartier : 1.86e+00 arbres
skewness du nombre d'arbres par quartier : 1.44e+00 arbres
kurtosis de la densité par quartier : 5.85e-01 arbres par m²
skewness de la densité par quartier : 7.15e-01 arbres par m²

count_by_genre = arbres.value_counts("libellefrancais")
count_by_genre.head(6)

arbres_filtres = arbres[arbres["libellefrancais"].isin(count_by_genre.head(6).index)]


arbres_filtres.plot(figsize=(10, 10), markersize=0.01, column="libellefrancais", legend=True, cmap="tab20").set_title("6 genres les plus fréquents")

Text(0.5, 1.0, '6 genres les plus fréquents')

arbres.plot(figsize=(10, 10), markersize=0.01, column="domanialite", legend=True, cmap="tab20").set_title("domanialite")

Text(0.5, 1.0, 'domanialite')

quartier.plot(figsize=(10, 10), column='nb_arbres', legend=True).set_title("Nombre d'arbres par quartier")

Text(0.5, 1.0, "Nombre d'arbres par quartier")

# Afficher les contours des quartiers
fig, ax = plt.subplots(1, 1, figsize=(10, 10))
quartier.plot(ax=ax, color='lightgray', edgecolor='black')

# Calcul de la taille des marqueurs
marker_size_multiplier = 0.1
marker_sizes = quartier["nb_arbres"] * marker_size_multiplier

plt.scatter(quartier.geometry.centroid.x, quartier.geometry.centroid.y, s=marker_sizes, marker='o', color='green', alpha = 0.5, edgecolor='black')

plt.title("Nombre d'arbres par quartier (Symboles proportionnels)")

#Creer une légende : On donne un label à des scatter vides
for s in [100, 1000, 3000]:
    plt.scatter([], [], s=s*marker_size_multiplier, c='green', alpha=0.5, edgecolor='black', label=f'{int(s)} arbres')
plt.legend(title="Nombre d'arbres")

plt.show()

from shapely.geometry import Polygon
xmin, ymin, xmax, ymax = quartier.total_bounds

size = 40

cols = list(np.linspace(xmin, xmax, size))
rows = list(np.linspace(ymin, ymax, size))
wide = cols[1]-cols[0]
length = rows[1]-rows[0]


polygons = []
for x in cols[:-1]:
    for y in rows[:-1]:
        polygons.append(Polygon([(x,y), (x+wide, y), (x+wide, y+length), (x, y+length)]))

grid = gpd.GeoDataFrame({'geometry':polygons}).set_crs("EPSG:2154")
grid.plot(figsize=(10, 10), edgecolor='black')

<Axes: >

quartier_dissolve = quartier.dissolve()
quartier_dissolve.plot(figsize=(10, 10))

<Axes: >

grid_intersection = gpd.overlay(grid, quartier_dissolve, how='intersection')
grid_intersection.plot(figsize=(10, 10), edgecolor='black')

<Axes: >

join = grid_intersection.sjoin(
    arbres, how="left", predicate="contains"
    )
grid_intersection["nb_arbres"] = join.index.value_counts()
grid_intersection.plot(figsize=(10, 10), column="nb_arbres", legend=True).set_title("Nombre d'arbres (rasterisé)")

Text(0.5, 1.0, "Nombre d'arbres (rasterisé)")

quartier.plot(figsize=(10, 10), column='dens_arbres', legend=True).set_title("Densité d'arbres par quartier")

Text(0.5, 1.0, "Densité d'arbres par quartier")

quartier.sort_values("dens_arbres", ascending=False).head(1)["l_qu"]

from scipy.stats import gaussian_kde

x = arbres.geometry.centroid.x
y = arbres.geometry.centroid.y

k = gaussian_kde([x,y])

xi, yi = np.meshgrid(
    np.linspace(x.min(), x.max(), 300),
    np.linspace(y.min(), y.max(), 300)
)
zi = k(np.vstack([
   xi.flatten(),
   yi.flatten()
])).reshape(xi.shape)

fig, ax = plt.subplots(1, 1, figsize=(10, 10))

plt.pcolormesh(xi, yi, zi)
plt.colorbar()
quartier.boundary.plot(ax=ax, edgecolor='white')

<Axes: >

arbres.to_file("arbres_paris.gpkg")
quartier.to_file("quartier_paris.gpkg")

	idbase	typeemplacement	domanialite	arrondissement	complementadresse	numero	adresse	idemplacement	libellefrancais	genre	espece	varieteoucultivar	circonferenceencm	hauteurenm	stadedeveloppement	remarquable	geometry
0	140175	Arbre	CIMETIERE	VAL-DE-MARNE	None	None	CIMETIERE DE THIAIS / AVENUE G / DIV 79	A11600079008	Tilleul	Tilia	x europaea	''Pallida''	20	5	None	NON	POINT (2.37771 48.75991)
1	209556	Arbre	Alignement	PARIS 16E ARRDT	None	None	AVENUE PRUDHON	000103003	Marronnier	Aesculus	x carnea	None	48	6	Jeune (arbre)	NON	POINT (2.26987 48.85852)
2	230176	Arbre	Alignement	PARIS 13E ARRDT	None	None	BOULEVARD DE L HOPITAL	001806005	Micocoulier	Celtis	australis	None	45	5	Jeune (arbre)	NON	POINT (2.35773 48.83504)
3	234439	Arbre	Alignement	PARIS 19E ARRDT	None	None	PLACE DES FETES	000102027	Tilleul	Tilia	cordata	None	100	16	Adulte	NON	POINT (2.39313 48.87658)
4	238396	Arbre	Alignement	PARIS 18E ARRDT	14	None	RUE RENE BINET	000206018	Marronnier	Aesculus	x carnea	''Briotii''	42	6	Jeune (arbre)	NON	POINT (2.34179 48.89944)

	c_qu	c_quinsee	l_qu	c_ar	n_sq_ar	perimetre	surface	geometry
n_sq_qu
750000008.0	8.0	7510204.0	Bonne-Nouvelle	2.0	750000002.0	2233.976030	281448.206577	POLYGON ((2.35152 48.86443, 2.35095 48.86341, ...
750000010.0	10.0	7510302.0	Enfants-Rouges	3.0	750000003.0	2139.625388	271750.323937	POLYGON ((2.3671 48.86163, 2.36727 48.86095, 2...
750000013.0	13.0	7510401.0	Saint-Merri	4.0	750000004.0	2346.004687	313040.396550	POLYGON ((2.35262 48.85491, 2.35249 48.85467, ...
750000014.0	14.0	7510402.0	Saint-Gervais	4.0	750000004.0	2678.340923	422028.171324	POLYGON ((2.36376 48.85568, 2.36294 48.85456, ...
750000018.0	18.0	7510502.0	Jardin-des-Plantes	5.0	750000005.0	4052.729521	798389.398463	POLYGON ((2.36456 48.84366, 2.3645 48.84358, 2...

	c_qu	c_quinsee	l_qu	c_ar	n_sq_ar	perimetre	surface	geometry	index_right	idbase	...	adresse	idemplacement	libellefrancais	genre	espece	varieteoucultivar	circonferenceencm	hauteurenm	stadedeveloppement	remarquable
n_sq_qu
750000008.0	8.0	7510204.0	Bonne-Nouvelle	2.0	750000002.0	2233.97603	281448.206577	POLYGON ((652426.165 6862905.834, 652383.463 6...	92706	229769	...	RUE DE TURBIGO	000501001	Chêne	Quercus	rubra	None	30	5	Jeune (arbre)	NON
750000008.0	8.0	7510204.0	Bonne-Nouvelle	2.0	750000002.0	2233.97603	281448.206577	POLYGON ((652426.165 6862905.834, 652383.463 6...	19676	229823	...	RUE DE TURBIGO	000501002	Chêne	Quercus	rubra	None	55	10	Adulte	NON
750000008.0	8.0	7510204.0	Bonne-Nouvelle	2.0	750000002.0	2233.97603	281448.206577	POLYGON ((652426.165 6862905.834, 652383.463 6...	40943	229824	...	RUE DE TURBIGO	000501003	Chêne	Quercus	rubra	None	75	10	Adulte	NON
750000008.0	8.0	7510204.0	Bonne-Nouvelle	2.0	750000002.0	2233.97603	281448.206577	POLYGON ((652426.165 6862905.834, 652383.463 6...	47543	229825	...	RUE DE TURBIGO	000501004	Chêne	Quercus	rubra	None	20	5	None	NON
750000008.0	8.0	7510204.0	Bonne-Nouvelle	2.0	750000002.0	2233.97603	281448.206577	POLYGON ((652426.165 6862905.834, 652383.463 6...	109556	189185	...	ECOLE MATERNELLE / 12 RUE DUSSOUBS	056801004	Tilleul	Tilia	x euchlora	None	75	12	Adulte	NON

	count
libellefrancais
Platane	42817
Marronnier	24904
Tilleul	22310
Erable	19811
Sophora	11558
Chêne	5031

TP1 ANALYSE UNIVARIEE¶

Import des librairies¶

Chargement des données¶

Projeter et afficher les données¶

1 Distribution statistique des arbres¶

1.1 Calculer le nombre d'arbres par quartier¶

1.2 Calculer la densité d'arbres par quartier¶

1.3 Comparaison des variables nombre et densité¶

2 Distribution spatiale des arbres¶

2.1 Cartes simples¶

2.1.1 Les 6 genres les plus fréquents¶

2.1.2 Carte de la dominialité¶

2.2 Cartographie du nombre d'arbres¶

2.2.1 Carte choroplèthe du nombre d'arbres par quartier¶

2.2.2 Carte avec symboles proportionnels¶

2.2.3 Carte de chaleur du nombre d'arbres sur une grille raster¶

2.3 Cartographie de la densité d’arbres¶

3 Export des données¶

	l_qu
n_sq_qu
750000079.0	PÃ¨re-Lachaise