Publié le: Apr 14, 2022
Découvrez ci-dessous les 16 jeux de données nouveaux ou mis à jour du Space Telescope Science Institute, de DNAStack, de l'administration nationale des archives et de la documentation, et les autres jeux de données disponibles sur le registre des données ouvertes dans les catégories suivantes.
Astronomie :
- Le satellite Galaxy Evolution Explorer géré par le Space Telescope Science Institute
Climat et météorologie :
- Jeu de données CMIP5 Probabilistic Downscaling de la NOAA
- Analyse NOAA Real-Time Mesoscale de la NOAA
- Servicio Meteorológico Nacional (SMN) Hi-Res Weather Forecast over Argentina de SMN, the National Weather Service of Argentina (le service météorologique national de l'Argentine)
- NOAA Unified Forecast System Weather Model (UFS-WM) Regression Tests de la NOAA
Sciences géospatiales :
- Cloud to Street – Jeu de données Microsoft Flood et Clouds géré par Radiant Earth Foundation
Sciences de la vie :
- TIGER Training du centre médical de l'université Radboud
- Données DNAStack COVID19 SRA de DNAstack
- Données de référence bioinformatiques ouvertes pour Galaxy de projets Galaxy et Bioconductor
- Données GATK Structural Variation (SV) de Loka Inc.
Machine learning :
- YouTube 8 Million – Data Lakehouse Ready géré par Amazon Web Services
- Consented Activities of People de Visym Labs
- Jeu de données MultiCoNER d'Amazon
- TSBench géré par AWS
Statistiques et réglementation :
- 1950 Census de l'administration nationale des archives et de la documentation
Culturel :
- Ukrainian Cultural Heritage Web Archive de Saving Ukrainian Cultural Heritage Online (SUCHO)
Vous souhaitez rendre vos données disponibles ? Le programme de sponsoring des données ouvertes AWS couvre les frais de stockage des jeux de données optimisés pour le cloud à forte valeur accessibles au public. Nous collaborons avec les fournisseurs de données qui souhaitent :
- Démocratiser l'accès aux données en les rendant disponibles à l'analyse sous AWS ;
- Développer de nouvelles techniques, formats et outils natifs cloud pour réduire le coût des travaux avec les données ;
- Encourager le développement des communautés qui bénéficient de l'accès aux ensembles de données partagés.