Navigatie overslaan

Curated open data made easily accessible on Azure

NAIP

Luchtfoto's van het National Agricultural Imagery Program (NAIP), dat luchtfoto's met een hoge resolutie van de hele VS levert.

TartanAir: AirSim Simulation Dataset for Simultaneous Localization and Mapping

Gegevens van autonome TartanAir AirSim-voertuigen gegenereerd om SLAM (Simultaneous Localization and Mapping) op te lossen.

NASADEM

NASADEM biedt wereldwijde topografische gegevens die primair zijn afgeleid van gegevens die zijn vastgelegd via de Shuttle Radar Topograpy Mission van NASA.

US Population by ZIP Code

De bevolking van de Verenigde Staten, gerangschikt op geslacht en ras voor elke Amerikaanse postcode. Informatie afkomstig uit de volkstelling van 2010. Deze gegevensset is afkomstig van het United States Census Bureau.

US Population by County

De bevolking van de Verenigde Staten, gerangschikt op geslacht en ras voor elk Amerikaanse district. Informatie afkomstig uit de volkstellingen van 2000 en 2010. Deze gegevensset is afkomstig van het United States Census Bureau.

Public Holidays

Wereldwijde gegevens over nationale feestdagen zijn afkomstig van het PyPI-feestdagenpakket en Wikipedia, voor 38 landen of regio's tussen 1970 en 2099.

UK Met Office Global Weather Data for COVID-19 Analysis

UK Met Office wereldwijde weergegevensset voor onderzoekers om de relaties tussen COVID-19-incidentie en omgevingsfactoren te onderzoeken.

Russian Open Speech To Text

Russian Open STT is een grote open spraak-naar-tekst-gegevensset voor de Russische taal

NYC Taxi & Limousine Commission - yellow taxi trip records

De gele taxiritrecords bevatten velden met de datums/tijden waarop passagiers zijn opgehaald en afgezet, locaties voor ophalen en afzetten, ritafstanden, in items verdeelde tarieven, tarieftypen, betalingstypen en door de chauffeur gerapporteerde passagiersaantallen.

MODIS

Satellietafbeeldingen van de Moderate Resolution Imaging Spectroradiometer (MODIS) waarmee elke 1-2 dagen een afbeelding is gemaakt van de aarde sinds 1999.

NYC Taxi & Limousine Commission - For-Hire Vehicle (FHV) trip records

De records met FHV-ritten (For-Hire Vehicle) bevatten velden waarin het basislicentienummer van de centrale, de afhaaldatum en -tijd, en de locatie-id van de taxizone worden vastgelegd.

NYC Taxi & Limousine Commission - green taxi trip records

De groene taxiritrecords bevatten velden met de datums/tijden waarop passagiers zijn opgehaald en afgezet, locaties voor ophalen en afzetten, ritafstanden, in items verdeelde tarieven, tarieftypen, betalingstypen en door de chauffeur gerapporteerde passagiersaantallen.

NOAA NEXRAD Level II

Recente gegevens van niveau II van NEXRAD, een netwerk van 159 weerradarstations verspreid over de Verenigde Staten.

Microsoft News Recommendation Dataset

MIcrosoft News Dataset (MIND) is een grootschalige gegevensset voor onderzoek van nieuwsaanbevelingen om te fungeren als een benchmarkgegevensset voor nieuwsaanbevelingen en om het onderzoek op het gebied van nieuwsaanbevelingen en aanbevelingssystemen mogelijk te maken.

Machine Learning Samples

Een verzameling van verschillende typen machine learning-datasets zoals gegevenssets in tabelvorm, tijdseriegegevenssets, afbeeldingen, tekst en meer.

US Producer Price Index - Industry

De Producer Price Index (PPI) is een meting van de gemiddelde wijziging gedurende een bepaalde periode in de verkoopprijzen die nationale producenten ontvangen voor hun uitvoer.

US Producer Price Index - Commodities

De Producer Price Index (PPI) is een meting van de gemiddelde wijziging gedurende een bepaalde periode in de verkoopprijzen die nationale producenten ontvangen voor hun producten.

US Labor Force Statistics

US Labor Force Statistics levert beroepsbevolkingsstatistieken, beroepsbevolking, participatiegraad van de beroepsbevolking en de burgerbevolking (niet-institutioneel) op leeftijd, geslacht, ras en etnische bevolkingsgroepen. in de Verenigde Staten.

US Local Area Unemployment Statistics

De Amerikaanse LAUS-gegevenssets (Local Area Unemployment Statistics) leveren maandelijkse en jaarlijkse gegevens over de werkgelegenheid, werkeloosheid en beroepsbevolking voor volkstellingsregio's en -afdelingen, staten, districten, grootstedelijke gebieden en vele steden in de Verenigde Staten.

US State Employment Hours and Earnings

Het CES-programma (Current Employment Statistics) levert gedetailleerde bedrijfstakramingen voor de werkgelegenheid, uren en inkomsten van werknemers op loonlijsten in de niet-agrarische sector in de Verenigde Staten.

US Consumer Price Index

De Consumer Price Index (CPI) is een meting van de gemiddelde wijziging gedurende een bepaalde periode in de prijzen die worden betaald door stedelijke consumenten voor een pakket van consumptiegoederen en services.

NOAA Integrated Surface Data (ISD)

NOAA Integrated Surface Data (ISD) voorziet wereldwijd elk uur in weerhistorische gegevens afkomstig van de National Oceanic and Atmospheric Administration (NOAA).

US National Employment Hours and Earnings

Het CES-programma (Current Employment Statistics) levert gedetailleerde bedrijfstakramingen voor de werkgelegenheid, uren en inkomsten van werknemers op loonlijsten in de niet-agrarische sector in de Verenigde Staten.

GOES-16

GOES-16 levert weerbeelden van de GOES-16-satelliet van NOAA.

NOAA Global Hydro Estimator (GHE)

De GHE-gegevensset (Global Hydro Estimator) levert globale neerslagschattingen in intervallen van 15 minuten, afgeleid van satellietbeelden en gegevens van het Global Forecast System van NOAA.

Harmonized Landsat Sentinel-2

De HLS-gegevensset (Harmonized Landsat Sentinel-2) bevat satellietbeelden van de satellieten Landsat-8 (2013 tot heden) en Sentinel-2 (2015 tot heden), uitgelijnd op een gemeenschappelijk raster en verwerkt tot compatibele kleurruimten.

NOAA Global Forecast System (GFS)

Historische weergegevens per 15 dagen voor Verenigde Staten, geproduceerd door het Global Forecast System (GFS) en afkomstig van de National Oceanic and Atmospheric Administration (NOAA).

Genomics Data Lake

De Genomics Data Lake biedt diverse openbare gegevenssets die gratis toegankelijk zijn en die u kunt integreren in uw werkstromen en toepassingen voor genomica-analyses. De gegevenssets bevatten genoomsequenties, variantgegevens en onderwerp-/sample-metagegevens in BAM-, FASTA-, VCF- en CSV-bestandsindelingen.

Daymet

Gerasterde schattingen van de dagelijkse weerparameters in Noord-Amerika op basis van meteorologische waarnemingen.

Seattle Safety Data

911-meldingen voor de brandweer van Seattle. Deze gegevensset bevat historische records die vanaf 2010 tot heden zijn verzameld en wordt dagelijks bijgewerkt.

COVID-19 Open Research Dataset

Een gegevensset met volledige tekst en metagegevens van wetenschappelijke artikelen over COVID-19 en het coronavirus die zijn geoptimaliseerd om te kunnen worden gelezen door computers en die beschikbaar zijn voor gebruik door de wereldwijde onderzoekscommunity.

COVID-19 Data Lake

De COVID-19 Data Lake-verzameling bevat aan COVID-19 verwante gegevenssets uit verschillende bronnen en omvat traceringsgegevens voor testen en patiëntresultaten, beleid met betrekking tot social distancing, ziekenhuiscapaciteit, mobiliteit enzovoort.

San Francisco Safety Data

Oproepen aan de brandweercentrale voor service- en 311-cases in San Francisco. Deze gegevensset bevat historische records die vanaf 2015 tot heden zijn verzameld.

New York City Safety Data

Deze gegevensset bevat alle 311-serviceaanvragen van 2010 tot heden voor New York City. Deze wordt opgeslagen in Parquet-indeling en dagelijks bijgewerkt.

Chicago Safety Data

Lees gegevens over 311-oproepen gemeld in de stad Chicago. Deze gegevensset wordt in Parquet-indeling opgeslagen en wordt dagelijks bijgewerkt.

Boston Safety Data

Lees over de 311-oproepen die in de stad Boston worden gemeld. Deze gegevensset wordt in Parquet-indeling opgeslagen en wordt dagelijks bijgewerkt.

Can't find the data? Email us to request a dataset or contribute a dataset