Passer la navigation

Curated open data made easily accessible on Azure

NAIP

Imagerie aérienne du National Agricultural Imagery Program (NAIP), qui fournit des images aériennes à haute résolution à l’échelle des États-Unis.

NASADEM

NASADEM fournit des données topographiques mondiales dérivées principalement des données capturées par la Shuttle Radar Topography Mission de la NASA.

TartanAir: AirSim Simulation Dataset for Simultaneous Localization and Mapping

TartanAir AirSim - Génération de données de véhicules autonomes pour résoudre la cartographie et la localisation simultanées (SLAM).

US Population by ZIP Code

Population des États-Unis par sexe et par race pour chaque code postal américain tiré du recensement décennal de 2010. Ce jeu de données est fourni par le Bureau du recensement des États-Unis (United States Census Bureau).

US Population by County

Population des États-Unis par sexe et par race pour chaque comté américain tiré du recensement décennal de 2000 et 2010. Ce jeu de données est fourni par le Bureau du recensement des États-Unis (United States Census Bureau).

Russian Open Speech To Text

Russain Open STT est un jeu de données de reconnaissance vocale à grande échelle pour la langue russe

Public Holidays

Données sur les jours fériés dans le monde provenant du package de jours fériés PyPI et de Wikipédia, couvrant 38 pays ou régions de 1970 à 2099.

UK Met Office Global Weather Data for COVID-19 Analysis

Jeu de données météorologiques mondiales du UK Met Office destiné aux chercheurs afin d’explorer les relations entre l’incidence du COVID-19 et les facteurs environnementaux.

NYC Taxi & Limousine Commission - yellow taxi trip records

Les enregistrements de trajets en taxi jaune incluent des champs indiquant les dates et heures de début et fin de trajet, les lieux de départ et d’arrivée, la distance des trajets, les tarifs détaillés, les types de tarifs, les types de paiement et le nombre de passagers signalé par le conducteur.

NYC Taxi & Limousine Commission - green taxi trip records

Les enregistrements de trajets en taxi vert incluent des champs indiquant les dates et heures de début et fin de trajet, les lieux de départ et d’arrivée, la distance des trajets, les tarifs détaillés, les types de tarifs, les types de paiement et le nombre de passagers signalé par le conducteur.

NYC Taxi & Limousine Commission - For-Hire Vehicle (FHV) trip records

Les enregistrements de trajets des VTC incluent des champs indiquant le numéro de licence de la base de dispatch et la date de prise en charge, l’heure et l’ID d’emplacement de zone de taxi.

NOAA NEXRAD Level II

Données récentes de niveau II de NEXRAD, un réseau de 159 stations radar météorologiques réparties à travers les États-Unis.

Microsoft News Recommendation Dataset

MIcrosoft News Dataset (MIND) est un jeu de données à grande échelle pour que la recherche de suggestions d’actualités serve de jeu de données repère pour les suggestions d’actualités et facilite la recherche dans la zone des systèmes de recommandation et suggestion d’actualités.

NOAA Global Hydro Estimator (GHE)

Le jeu de données Global Hydro Estimator (GHE) fournit des estimations des précipitations mondiales à des intervalles de 15 minutes, dérivées de l’imagerie satellite et des données du Global Forecast System de la NOAA.

GOES-16

GOES-16 fournit des images météorologiques du satellite GOES-16 de la NOAA.

MODIS

Images satellite du Moderate Resolution Imaging Spectroradiometer (MODIS), qui a pris des images de la Terre tous les 1 à 2 jours depuis 1999.

Machine Learning Samples

Collection de différents types de jeux de données d’apprentissage automatique, tels que des jeux de données tabulaires, des jeux de données de série temporelle, des images, du texte et plus encore.

Harmonized Landsat Sentinel-2

Le jeu de données Harmonized Landsat Sentinel-2 (HLS) inclut des données d’imagerie satellite des satellites Landsat-8 (2013 à aujourd’hui) et Sentinel-2 (2015 à aujourd’hui), alignées sur une grille commune et traitées dans des espaces colorimétriques compatibles.

US Producer Price Index - Industry

L’indice des prix à la production (IPP) est une mesure de la variation moyenne dans le temps des prix de vente perçus par les producteurs nationaux pour leur production.

US Labor Force Statistics

Le jeu de données US Labor Force Statistics fournit des statistiques sur la population active, le taux d’activité et population civile non institutionnelle par âge, sexe, race et groupes ethniques. aux États-Unis.

US Consumer Price Index

L’indice des prix à la consommation (IPC) est une mesure de la variation moyenne dans le temps des prix payés par les consommateurs urbains pour un panier de biens et services à la consommation.

US Producer Price Index - Commodities

L’indice des prix à la production (IPP) est une mesure de la variation moyenne dans le temps des prix de vente perçus par les producteurs nationaux pour leur produits.

NOAA Integrated Surface Data (ISD)

Les données de surface intégrées (ISD) de la NOAA fournissent des données d’historique météorologique horaire à l’échelle mondiale provenant de la NOAA (National Oceanic and Atmospheric Administration).

US State Employment Hours and Earnings

Le programme Current Employment Statistics (CES) produit des estimations détaillées de l’emploi non agricole, des heures de travail et des revenus des travailleurs salariés aux États-Unis.

US Local Area Unemployment Statistics

Les jeux de données du programme de statistiques sur le chômage au niveau local produisent des données mensuelles et annuelles sur l’emploi, le chômage et la population active pour les régions et divisions de recensement, les États, les comtés, les régions métropolitaines et de nombreuses villes des États-Unis.

US National Employment Hours and Earnings

Le programme Current Employment Statistics (CES) produit des estimations détaillées de l’emploi non agricole, des heures de travail et des revenus des travailleurs salariés aux États-Unis.

NOAA Global Forecast System (GFS)

Données de prévisions météorologiques horaires (aux États-Unis) sur 15 jours générées par le système de prévisions mondiales (GFS) de la NOAA (National Oceanic and Atmospheric Administration).

Daymet

Estimations quadrillées des paramètres météorologiques quotidiens en Amérique du Nord à partir d’observations météorologiques.

Genomics Data Lake

Le lac de données Genomics fournit une variété de jeux de données publics accessibles gratuitement et intégrables à vos workflows d’analyse génomique ainsi qu’à vos applications. Les jeux de données contiennent des séquences de génome, diverses informations et des métadonnées sur le sujet/échantillon en formats de fichier BAM, FASTA, VCF et CSV.

San Francisco Safety Data

Appel au pompiers et incidents 311 à San Francisco. Ce jeu de données contient les enregistrements historiques accumulés de 2015 à aujourd’hui.

Seattle Safety Data

Dispatches du 911/des pompiers de Seattle. Ce jeu de données est mis à jour quotidiennement. Il contient les enregistrements historiques accumulés de 2010 à aujourd’hui

COVID-19 Open Research Dataset

Jeu de données de texte intégral et de métadonnées incluant des articles de recherche liés au COVID-19 et aux coronavirus. Il est optimisé pour la lisibilité par une machine et mis à disposition par la communauté mondiale de chercheurs.

COVID-19 Data Lake

La collection COVID-19 Data Lake contient des jeux de données liés à la pandémie de COVID-19 qui proviennent de diverses sources, couvrent les données de suivi des patients et des tests, la politique de distanciation sociale, la capacité hospitalière, la mobilité, etc.

New York City Safety Data

Ce jeu de données contient toutes les demandes de service 311 à New York de 2010 à nos jours. Il est stocké au format Parquet et mis à jour quotidiennement.

Chicago Safety Data

Données concernant les appels aux services d’urgence (311) signalés à la ville de Chicago. Ce jeu de données est stocké au format Parquet et il est mis à jour quotidiennement.

Boston Safety Data

Données concernant les appels aux services d’urgence (311) signalés à la ville de Boston. Ce jeu de données est stocké au format Parquet et il est mis à jour quotidiennement.

Can't find the data? Email us to request a dataset or contribute a dataset