=> 

We are happy to announce the publication of SEN2VENµS, a dataset for the training of Sentinel-2 super-resolution algorithms !

Julien Michel, Juan Vinasco-Salinas, Jordi Inglada, & Olivier Hagolle. (2022). SEN2VENµS, a dataset for the training of Sentinel-2 super-resolution algorithms (1.0.0) [Data set]. Zenodo. https://doi.org/10.5281/zenodo.6514159

A detailed description of the dataset has been submitted as a data paper to the MDPI Data journal, and the preprint can be found here.

Michel, J.; Vinasco-Salinas, J.; Inglada, J.; Hagolle, O. SEN2VENµS, a Dataset for the Training of Sentinel-2 Super-Resolution Algorithms. Preprints 2022, 2022050230 (doi: 10.20944/preprints202205.0230.v1).

The idea of SEN2VENµS comes from the Sentinel-HR phase-0 study : search for conjonctions between VENµS and Sentinel-2, i.e. images acquired on the same site and on the same day. During the phase-0, we used a reduced dataset involving 5 VENµS sites for a total of 11 105 patches. In SEN2VENµS we extended the search to 29 VENµS sites for which Theia produces Sentinel-2 L2A products, yielding a high landscape variability. Altogether, 132 955 triplets of patches have been generated: for a VENµS patch of 256×256 pixels at 5 meter resolution, containing bands corresponding to Sentinel-2 B2, B3, B4, B5, B6, B7, B8 and B8A, we have a Sentinel-2 patch of 128×128 pixels at 10 meter resolution containing bands B2, B3, B4, B8, as well as a Sentinel-2 patch of 64×64 pixels at 20 meter resolution containing bands B5, B6, B7 and B8A. Uncompressed, the dataset reaches no less than 116 Go!

This dataset can of course be used for training and evaluation of classical Single Image Super-Resolution approaches (SISR), it will also allow to develop and evaluate methods tailored for Sentinel-2, allowing to jointly bring 10 meter and 20 meter bands to 5 meter resolution.

SEN2VENµS is avaiable as an open dataset on Zenodo  with the licencing of the original products (Etalab Open Licence Version 2.0 for Sentinel-2 L2A products from Theia and Creative Commons BY-NC 4.0 for VENµS products from Theia).

Patch examples the the SEN2VENµS dataset

 

4 thoughts on “SEN2VENμS, a dataset for the training of Sentinel-2 super-resolution algorithms

  1. Bravo pour l’initiative !!!
    je suis très dubitatif sur les méthodes de SISR (ou MISR) basées Deep Learning qui introduisent des artefacts (plus ou moins lourds) , et fournissent des images avec des fréquences inventées statistiquement dont on n’est pas certain qu »elles correspondent parfaitement à la réalité. Une utilisation pour des simulations est très appropriée… Une utilisation par des analystes renseignement/sécurité est selon moi dangereuse.
    En espérant qu’un tel jeu de données puisse faire avancer le sujet !!!

  2. Merci beaucoup pour ce dataset, ça va être très utile pour l’analyse des méthodes de SISR !
    Petite question : pourquoi recaler Sentinel-2 sur VENµS (par interpolation bicubic), au lieu de recaler VENµS sur Sentinel-2 ? Les images à 5m semblent bien échantillonnées (donc interpolable), ce qui n’est pas vraiment le cas des images Sentinel-2. On perd donc de l’alias, qui pourrait autrement servir lors de la super-résolution.
    Qu’en pensez-vous ?

    1. Bonjour, vous avez raison, les images Sentinel-2 contiennent beaucoup d’aliasing, et leur ré-échantillonnage peut causer des dégâts. La raison pour faire les choses dans ce sens est que nous avons utilisé les mêmes outils pour générer des séries multi-temporelles (à 5m et à 10m), et que Venµs fournit une bien meilleure stabilité de la localisation dans le temps que Sentinel-2 … Dans ce cas, ré-échantillonner les images Sentinel-2 vers Venµs augmentait la cohérence géométrique de la pile multi-temporelle. Il faut néanmoins signaler que les produits Sentinel-2 de niveau supérieur au 1C subisse déjà du ré-échantillonnage en amont (notamment pour l’ortho-rectification), ce qui endommage sans doute déjà l’information que l’on peut espérer extraire de l’aliasing.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.