Land-cover map around Shepparton

(English version here)

Peu de pays sont plus éloignés de la France que l'Australie. La carte d'occupation des sols dont nous parlons aujourd'hui concerne l'État du Victoria au Sud-Est de l'Australie. Cet État est quasiment diamétralement opposé à la Turquie avec des latitudes autour de 37°S et des longitudes autour de 145°E. Nous avons reproduit la méthode qui est utilisée pour créer la carte de la France par l'équipe OSO du CESBIO. Dans ce post, je parlerai des differentes étapes que nous avons suivies pour créer notre carte (qui, dans les grandes lignes, reprend les idées de la chaîne IOTA-2), et j'en profiterai pour vous montrer de belles images Sentinel-2 et leurs cartes associées.

La carte

Commençons par la fin, et donc par la carte complète ci-dessous.

Land cover map of Victoria, Australia
Carte d'occupation des sols de l'État du Victoria en Australie

Victoria fait à peu près la moitié de la taille de la France métropolitaine. Au Sud, vous pouvez voir la côte de la mer de Tasmanie avec la grande ville de Melbourne (en rose) à peu près au milieu, le long de la côte. Pour l'anecdote, la ville de Melbourne est très étendue et à peu près la même surface que Shanghai mais avec 5 fois moins d'habitants. Au Nord-Est de Melbourne, vous pouvez voir une large surface boisée (en vert plutôt foncé) : ce sont les Alpes victoriennes (eh oui, nous avons aussi nos Alpes !). Au Nord-ouest, on peut voir une large région agricole (en orange et en jaune) puis, à l'extrème Nord-Ouest, le désert.

Notre carte est la première carte d'occupation des sols créée à 10 m de résolution - la précédente avait été créée à 250 m (la résolution de MODIS). Je ne résiste pas à vous présenter un effet avant/après autour du Lac Eildon :

MODIS vs Sentinel LC
Comparaison de la précédente carte à 250 m avec notre carte à 10 m

Comment cette carte a-t-elle été créée ?

Dans les grandes lignes, nous avons suivi les idées de la chaîne IOTA-2 du CESBIO, mais nous avons développé nos propres scripts d'appel à la librairie OTB, en utilisant notre algorithme de classification développé par Dr Charlotte Pelletier (une ancienne du CESBIO) pendant son séjour à Monash University :  TempCNN. Voici les principales étapes du processus :

  1. Téléchargement de toutes les images Sentinel-2 de juillet 2017 à août 2018 (d'hiver à hiver) au niveau-2A. Pour cette étape, notre boulot a été grandement facilité par le service PEPS qui nous a permis de télécharger les produits Sentinel-2 au niveau 2A : nous avons donc collecté 4,000+ images, recouvrant 37 tuiles, et ce directement avec les corrections atmosphériques et les masques de nuages (grâce au traitement à la demande par le logiciel de corrections atmospĥériques  MAJA !).
  2. Prétraitement. Nous avons d'abord ré-interpolé à 10 m les bandes à 20 m (et n'avons pas utilisé les bandes à 60 m), puis construit deux cubes de données (un pour toutes les images de la série et un pour tous les masques), et finalement créé un cube de données ré-interpolées temporellement (pour avoir les mêmes dates pour toutes les tuiles et enlever les nuages). Tout ça a été fait grâce à l'OTB. Petite note en passant : notre NFS est tombé en panne et nous avons dû nous résoudre à utiliser 7 disques de 4To...

    Stack of hard drives
    Notre NFS est tombé en panne...
  3. Création du jeu d'entraînement. Nous avons pu bénéficier des campagnes de terrain de l'équipe d'Agriculture Victoria ; données qui avaient été collectées pour la création de la carte à résolution MODIS ci-dessus. Nous y avons ajouté quelques polygones d'urbain, puis mis en relation ces polygones aux données images de nos cubes ré-interpolés (un cube par tuile) et enregistré ces 'pixels' étiquetés (une série temporelle multi-variée par pixel) dans une base de données Sqlite.
  4. Apprentissage du modèle. Nous avons utilisé notre algorithme TempCNN basé sur un réseau convolutionnel, ayant pour objectif d'extraire des motifs de dynamiques temporelles dans l'évolution des bandes spectrales. Nous avons amélioré la précision de 1,5% de précision par rapport au Random Forest (et +3% pour le F-Score). L'apprentissage va assez vite pour nos 3,8M d'échantillons,  il a pris moins de deux heures.
  5. Création de la carte. Une fois le modèle entraîné, nous l'avons utilisé pour classifier les tuiles une par une, puis fusionné ces résultats (les tuiles ayant un recouvrement), et finalement recoupé la carte pour correspondre à l''mprise de l'État de Victoria.

Et voilà ! Nous avons mis un serveur à disposition ; vous pouvez donc allez voir le résultat sur http://MonashVegMap.org

Retour d'expérience

Du début à la fin, la création de la carte nous aura pris.e.s environ 6 mois : 3 mois pour obtenir un premier résultat puis 3 mois pour faire une deuxième passe et corriger quelques problèmes (principalement liés à des données manquantes - il n'est pas toujours facile de savoir que des données manquent quand on gère tant de données). Je pense que notre surprise principale a été que nous avions probablement sous-estimé le temps passé à pré-traiter les données : téléchargement et prétraitement nous ont pris 7 semaines alors même que nous récupérions directement les données au niveau 2A. Notre procédure aurait également pu être optimisée pour éviter les entrées/sorties sur les disques, ce que IOTA fait (pas de stockage de résultat intermédiaire). Globalement, nous étions surpris·e·s de nous rendre compte que le processus développé au CESBIO marcherait si facilement : nous nous attendions à devoir réinventer des traitements pour telle ou telle partie du processus, mais non (sauf peut-être la fusion des résultats des différentes tuiles). Donc, un grand merci s'impose pour l'équipe de Jordi Inglada qui a mis au point le processus.

La carte a été reçue très positivement avec de nombreux contacts et téléchargements du fichier GeoTiff final, notamment pour la modélisation des feux (un thème important en Australie, et la gestion des bassins versant et de l'agriculture.

Je ne pouvais pas finir ce post sans vous montrer une belle image de la région viticole australienne ; ci-dessous la ville de Shepparton dans laquelle nous cultivons du Shiraz (pensez Côte du Rhône poussant dans une terre ocre). On voit d'ailleurs bien les exploitations viticoles sur la carte en violet (et je recommande une visite si vous êtes dans la région).

Sentinel-2 picture of Sheparton
Shepparton, as viewed by Sentinel-2
Land-cover map around Shepparton
Shepparton, notre carte

6 thoughts on “Cartographier l'occupation des sols d'une partie de l'Australie à 10 m de résolution

  1. Merci pour cette découverte du sud australien.
    Petite question : au nord-ouest de la zone traitée, il y a deux fois des bandes horizontales tranchées entre zones boisées et cultures : pourquoi cette limite (un fleuve ? le relief ? la géologie ?).

    Shiraz : c'est pareil que le Syrah ???

    1. Merci Jean-François ! Pour les bandes horizontales, je ne suis pas certain de savoir de quelles bandes vous parlez, pourriez-vous situer un peu plus ? Quant au vin oui le Shiraz c'est le même raisin que le Sirah, la différence est le sol dans lequel il pousse, je ne sais pas pourquoi on a changé le nom.

      1. Ces bandes correspondent à 3 déserts australiens : little desert, big desert (on est bons pour les noms, hein ?!) et Murray-Sunset National Park. Je pense que ce sont des zones que les agriculteurs on progressivement récupérées pour l'agriculture (aride!). Si vous regardez sur la carte interactive à MonashVegMap, vous devriez pouvoir voir que les cultures sont en fait très sèches, avec même des sortes de dunes.

  2. Merci pour ce post et bravo ! Pour la prochaine carte n'oubliez pas d'ajouter une classe pour la neige 🙂

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *