Artificial Intelligence challenges organised around geo-data and deep learning
Challenge organisé par l'IGN avec le soutient de la SFPT.
Ce challenge s'est déroulé du 21 Novembre 2022 au 21 Mars 2023. Vous pouvez consulter les résultats ici.
FLAIR #1 datapaper 📑 : https://arxiv.org/pdf/2211.12979.pdf
FLAIR #1 dépôt github 📁 : https://github.com/IGNF/FLAIR-1
Modèles pré-entraînés : https://huggingface.co/collections/IGNF/flair-models-landcover-semantic-segmentation-65bb67415a5dbabc819a95de
Avec des données acquises sur 50 départements et plus de 20 milliards de pixels annotés, ce jeu de données représente la diversité du territoire métropolitain, ses climats, ses écosystèmes et ses sols, dans le but de produire une cartographie à grande échelle. Différentes bases de données IGN (BD Ortho, RGE Alti) ainsi que des annotations produites manuellement par des experts photo-interprètes ont été assemblées pour permettre l’entraînement de modèles IA.
Les images aériennes de télédétection à l'échelle d'un pays sont nécessairement acquises à des dates et des heures différentes et dans des conditions différentes. De même, à grande échelle, les caractéristiques des classes sémantiques peuvent varier et devenir hétérogènes. Cela soulève des challenges pour la généralisation spatiale et temporelle des modèles d'apprentissage profond !
Le dataset FLAIR#1 est composé de 77,412 patches de 512x512 (résolution spatiale de 0.2m) avec une sémantique à 19 classes. Spécifiquement pour le challenge et les baselines associées et en raison d'une fréquence par classe déséquilibrée, la sémantique a été modifiée à 13 classes (>12 -> 13). Rapportez-vous au datapaper pour plus de précisions.
Classe | Valeur | Freq.-entraînement (%) | Freq.-test (%) | |
---|---|---|---|---|
bâtiment | 1 | 8.14 | 8.6 | |
zone perméable | 2 | 8.25 | 7.34 | |
zone imperméable | 3 | 13.72 | 14.98 | |
sol nu | 4 | 3.47 | 4.36 | |
eau | 5 | 4.88 | 5.98 | |
conifères | 6 | 2.74 | 2.39 | |
feuillus | 7 | 15.38 | 13.91 | |
brousaille | 8 | 6.95 | 6.91 | |
vigne | 9 | 3.13 | 3.87 | |
pelouse | 10 | 17.84 | 22.17 | |
culture | 11 | 10.98 | 6.95 | |
terre labourée | 12 | 3.88 | 2.25 | |
piscine | 13 | 0.03 | 0.04 | |
neige | 14 | 0.15 | - | |
coupe | 15 | 0.15 | 0.01 | |
mixte | 16 | 0.05 | - | |
ligneux | 17 | 0.01 | 0.03 | |
serres | 18 | 0.12 | 0.2 | |
autre | 19 | 0.14 | - |
Le dataset couvre un total d'environ 812 km², avec des patches sélectionnés sur l'ensemble du territoire métropolitain afin de représenter sa diversité (domaines spatiaux). Les images aériennes incluent dans le dataset sont également acquisent à des mois et années différentes (domaines temporels).
![]() |
![]() |
Image aérienne ORTHO HR® | Annotations |
Le dataset de test contient 15,700 patches de 10 domaines spatiaux supplémentaires. La fréquence des classes et les domaines temporels sont également distinct du dataset d'entraînement, permettant d'analyser les capacités de généralisation et d'adaptation de domaines des méthodes développées.
Une architecture U-Net avec un encodeur ResNet34 pré-entraîné de la librairie segmentation-models-pytorch a été utilisée pour les baselines. L'architecture utilisée permet l'intégration d'informations de métadonnées à l'échelle du patch et utilise des techniques d'augmentation des données d'image couramment utilisées. Les codes sont disponibles dans le dépôt FLAIR #1.
Données | Volume | Type | Lien |
---|---|---|---|
Images aériennes - entraînement | 50.7 Go | .zip | téléchargement |
Images aériennes - test | 13.4 Go | .zip | téléchargement |
Annotations - entraînement | 485 Mo | .zip | téléchargement |
Annotations - test | 124 Mo | .zip | téléchargement |
Métadonnées aériennes | 16.1 Mo | .json | téléchargement |
Shapefile zones | 392 Ko | .gpkg | téléchargement |
Jeu de données exemple (entraînement et test réduits) | 215 Mo | .zip | téléchargement |
Si vous utilisez des données de FLAIR #1, merci d'inclure la citation suivante:
Texte brut:
Anatol Garioud, Stéphane Peillet, Eva Bookjans, Sébastien Giordano, and Boris Wattrelos. 2022.
FLAIR #1: semantic segmentation and domain adaptation dataset. (2022).
DOI:https://doi.org/10.13140/RG.2.2.30183.73128/1
BibTex:
@article{ign2022flair1,
doi = {10.13140/RG.2.2.30183.73128/1},
url = {https://arxiv.org/pdf/2211.12979.pdf},
author = {Garioud, Anatol and Peillet, Stéphane and Bookjans, Eva and Giordano, Sébastien and Wattrelos, Boris},
title = {FLAIR #1: semantic segmentation and domain adaptation dataset},
publisher = {arXiv},
year = {2022}
}