FLAIR

Artificial Intelligence challenges organised around geo-data and deep learning


Project maintained by IGNF
🇬🇧 English version 🔙 Retour



FLAIR #1 : segmentation sémantique et adaptation de domaine 🌍🌱🏠🌳➡️🛩️

Challenge organisé par l'IGN avec le soutient de la SFPT. Ce challenge s'est déroulé du 21 Novembre 2022 au 21 Mars 2023. Vous pouvez consulter les résultats ici.


FLAIR #1 datapaper 📑 : https://arxiv.org/pdf/2211.12979.pdf
FLAIR #1 dépôt github 📁 : https://github.com/IGNF/FLAIR-1

Modèles pré-entraînés : https://huggingface.co/collections/IGNF/flair-models-landcover-semantic-segmentation-65bb67415a5dbabc819a95de



▶️ Description du dataset (cliquer pour agrandir)

Avec des données acquises sur 50 départements et plus de 20 milliards de pixels annotés, ce jeu de données représente la diversité du territoire métropolitain, ses climats, ses écosystèmes et ses sols, dans le but de produire une cartographie à grande échelle. Différentes bases de données IGN (BD Ortho, RGE Alti) ainsi que des annotations produites manuellement par des experts photo-interprètes ont été assemblées pour permettre l’entraînement de modèles IA.

Les images aériennes de télédétection à l'échelle d'un pays sont nécessairement acquises à des dates et des heures différentes et dans des conditions différentes. De même, à grande échelle, les caractéristiques des classes sémantiques peuvent varier et devenir hétérogènes. Cela soulève des challenges pour la généralisation spatiale et temporelle des modèles d'apprentissage profond !

Le dataset FLAIR#1 est composé de 77,412 patches de 512x512 (résolution spatiale de 0.2m) avec une sémantique à 19 classes. Spécifiquement pour le challenge et les baselines associées et en raison d'une fréquence par classe déséquilibrée, la sémantique a été modifiée à 13 classes (>12 -> 13). Rapportez-vous au datapaper pour plus de précisions.

ClasseValeurFreq.-entraînement (%)Freq.-test (%)
bâtiment18.148.6
zone perméable28.257.34
zone imperméable313.7214.98
sol nu43.474.36
eau54.885.98
conifères62.742.39
feuillus715.3813.91
brousaille86.956.91
vigne93.133.87
pelouse1017.8422.17
culture1110.986.95
terre labourée123.882.25
piscine130.030.04
neige140.15-
coupe150.150.01
mixte160.05-
ligneux170.010.03
serres180.120.2
autre190.14-

Le dataset couvre un total d'environ 812 km², avec des patches sélectionnés sur l'ensemble du territoire métropolitain afin de représenter sa diversité (domaines spatiaux). Les images aériennes incluent dans le dataset sont également acquisent à des mois et années différentes (domaines temporels).

Image aérienne ORTHO HR Labels
Image aérienne ORTHO HR® Annotations

Le dataset de test contient 15,700 patches de 10 domaines spatiaux supplémentaires. La fréquence des classes et les domaines temporels sont également distinct du dataset d'entraînement, permettant d'analyser les capacités de généralisation et d'adaptation de domaines des méthodes développées.


▶️ Modèle de référence (baseline): U-Net (cliquer pour agrandir)

Une architecture U-Net avec un encodeur ResNet34 pré-entraîné de la librairie segmentation-models-pytorch a été utilisée pour les baselines. L'architecture utilisée permet l'intégration d'informations de métadonnées à l'échelle du patch et utilise des techniques d'augmentation des données d'image couramment utilisées. Les codes sont disponibles dans le dépôt FLAIR #1.




▶️ Téléchargement du dataset (cliquer pour agrandir)
Données Volume Type Lien
Images aériennes - entraînement 50.7 Go .zip téléchargement
Images aériennes - test 13.4 Go .zip téléchargement
Annotations - entraînement 485 Mo .zip téléchargement
Annotations - test 124 Mo .zip téléchargement
Métadonnées aériennes 16.1 Mo .json téléchargement
Shapefile zones 392 Ko .gpkg téléchargement
Jeu de données exemple (entraînement et test réduits) 215 Mo .zip téléchargement




Citation

Si vous utilisez des données de FLAIR #1, merci d'inclure la citation suivante:

Texte brut:

Anatol Garioud, Stéphane Peillet, Eva Bookjans, Sébastien Giordano, and Boris Wattrelos. 2022. 
FLAIR #1: semantic segmentation and domain adaptation dataset. (2022). 
DOI:https://doi.org/10.13140/RG.2.2.30183.73128/1

BibTex:

@article{ign2022flair1,
  doi = {10.13140/RG.2.2.30183.73128/1},
  url = {https://arxiv.org/pdf/2211.12979.pdf},
  author = {Garioud, Anatol and Peillet, Stéphane and Bookjans, Eva and Giordano, Sébastien and Wattrelos, Boris},
  title = {FLAIR #1: semantic segmentation and domain adaptation dataset},
  publisher = {arXiv},
  year = {2022}
}