Navigation überspringen

Curated open data made easily accessible on Azure

MODIS

Satellitenbilder des Moderate Resolution Imaging Spectroradiometer (MODIS), das seit 1999 alle ein bis zwei Tage Bilder von der Erde erstellt

NYC Taxi & Limousine Commission - yellow taxi trip records

Datensätze zu Fahrten mit gelben Taxis enthalten Felder mit Datum/Uhrzeit für Abholung und Ankunft, Start- und Zielort, Fahrtentfernungen, Einzelkosten, Tarifarten, Zahlungsarten und vom Fahrer gemeldeten Fahrgastzahlen.

Public Holidays

Daten zu Feiertagen weltweit aus dem Feiertagspaket von PyPI und von Wikipedia (38 Länder oder Regionen von 1970–2099).

Microsoft News Recommendation Dataset

Das Microsoft News Dataset (MIND) ist ein umfangreiches Dataset für die Recherche von Nachrichtenempfehlungen, das als Benchmarkdataset für diese Empfehlungen dient und die Recherche im Bereich Nachrichtenempfehlungen und -empfehlungssysteme erleichtern soll.

NASADEM

NASADEM stellt globale topografische Daten bereit, die hauptsächlich bei der Shuttle Radar Topography Mission (SRTM) der NASA erfasst wurden.

NYC Taxi & Limousine Commission - For-Hire Vehicle (FHV) trip records

Die Datensätze zu Fahrten mit Taxis und Limousinen umfassen Felder für die jeweiligen Lizenznummern der Zentrale, das Datum und die Uhrzeit der Abholung und die Standort-ID der Taxizone.

Machine Learning Samples

Eine Sammlung verschiedener Machine-Learning-Datasets, z. B. Tabellendatasets, Zeitreihendatasets, Bilder und Texte

NAIP

Luftaufnahmen des National Agricultural Imagery Program (NAIP), das hoch aufgelöste Luftaufnahmen der gesamten USA bereitstellt.

US Local Area Unemployment Statistics

Die Datasets „US Local Area Unemployment Statistics“ produzieren monatliche und jährliche Daten zu Beschäftigung, Arbeitslosigkeit und Arbeitskräften für Volkszählungsregionen und -abteilungen, Staaten, Landkreise, Metropolregionen und zahlreiche Städte in den Vereinigten Staaten.

US Producer Price Index - Industry

Der Erzeugerpreisindex (EPI) ist ein Maß für die durchschnittliche zeitliche Veränderung der Verkaufspreise, die inländische Erzeuger für ihre Leistungen erzielen.

US State Employment Hours and Earnings

Das CES-Programm (Current Employment Statistics) produziert detaillierte Branchenschätzungen für nicht landwirtschaftliche Beschäftigung, Arbeitszeit und Einnahmen von Arbeitnehmern in den USA, die Gehaltsabrechnungen erhalten.

NYC Taxi & Limousine Commission - green taxi trip records

Datensätze zu Fahrten mit grünen Taxis enthalten Felder mit Datum/Uhrzeit für Abholung und Ankunft, Start- und Zielort, zurückgelegten Entfernungen, Einzelkosten, Tarifarten, Zahlungsarten und vom Fahrer gemeldeten Fahrgastzahlen.

TartanAir: AirSim Simulation Dataset for Simultaneous Localization and Mapping

TartanAir AirSim-Daten für autonome Fahrzeuge für Simultaneous Localization and Mapping (SLAM) generiert

US Population by County

US-Bevölkerung nach Geschlecht und ethnischer Gruppe für alle US-Countys nach den Volkszählungen von 2000 und 2010. Dieses Dataset stammt von der Behörde United States Census Bureau.

US Producer Price Index - Commodities

Der Erzeugerpreisindex (EPI) ist ein Maß für die durchschnittliche zeitliche Veränderung der Verkaufspreise, die inländische Erzeuger für ihre Waren erzielen.

NOAA NEXRAD Level II

Aktuelle und vergangene Level II-Daten von NEXRAD, einem Netzwerk aus 159 Wetterradarstationen, die an verschiedenen Orten in den USA positioniert sind

US Labor Force Statistics

Das Dataset „US Labor Force Statistics“ enthält Statistiken zur Erwerbstätigkeit, zur Erwerbsquote und zur nichtstaatlichen zivilen Bevölkerung nach Alter, Geschlecht und ethnischer Gruppierung. in den USA.

UK Met Office Global Weather Data for COVID-19 Analysis

Das Dataset „UK Met Office“ mit weltweiten Wetterdaten kann von Forschern verwendet werden, um Beziehungen zwischen COVID-19-Fällen und Umgebungsfaktoren zu untersuchen.

Russian Open Speech To Text

„Russain Open STT“ ist ein großes Open-Source-Dataset für die Spracherkennung für die russische Sprache

US Population by ZIP Code

US-Bevölkerung nach Geschlecht und ethnischer Gruppe für alle US-Postleitzahlen nach der alle zehn Jahre stattfindenden Volkszählung von 2010. Dieses Dataset stammt von der Behörde United States Census Bureau.

US National Employment Hours and Earnings

Das CES-Programm (Current Employment Statistics) produziert detaillierte Branchenschätzungen für nicht landwirtschaftliche Beschäftigung, Arbeitszeit und Einnahmen von Arbeitnehmern in den USA, die Gehaltsabrechnungen erhalten.

NOAA Global Hydro Estimator (GHE)

Das Dataset „Global Hydro Estimator“ (GHE) stellt weltweite Schätzwerte zur Regenwahrscheinlichkeit in Intervallen von 15 Minuten zur Verfügung, die anhand von Satellitenbildern und -daten des Global Forecast System der National Oceanic and Atmospheric Administration (NOAA) bestimmt werden.

Boston Safety Data

Daten zu Anrufen der Nummer 311, die der Stadt Boston gemeldet wurden. Dieses Dataset wird im Parquet-Format gespeichert und täglich aktualisiert.

Seattle Safety Data

911-Einsätze des Seattle Fire Department. Dieses Dataset wird täglich aktualisiert und enthält Datensätze zum Verlauf, die von 2010 bis heute gesammelt wurden.

San Francisco Safety Data

Anrufe bei der Feuerwehrdienststelle und 311-Fälle in San Francisco. Dieses Dataset enthält historische Datensätze, die von 2015 bis heute gesammelt wurden.

Harmonized Landsat Sentinel-2

Das Dataset „Harmonized Landsat Sentinel-2“ enthält Daten zu Bildern der Satelliten Landsat-8 (2013 bis heute) und Sentinel-2 (2015 bis heute), die auf ein übliches Raster ausgerichtet sind und anhand von kompatiblen Farbräumen verarbeitet werden.

Chicago Safety Data

Daten zu Anrufen der Nummer 311, die der Stadt Chicago gemeldet wurden. Dieses Dataset wird im Parquet-Format gespeichert und täglich aktualisiert.

GOES-16

GOES-16 stellt Wetterbilder des Satelliten GOES-16 der NOAA bereit.

COVID-19 Open Research Dataset

Ein Volltext- und Metadatendataset von wissenschaftlichen Artikeln im Zusammenhang mit COVID-19 und dem Coronavirus, die für Maschinenlesbarkeit optimiert und Forschern auf der ganzen Welt zur Nutzung zur Verfügung gestellt wurden.

COVID-19 Data Lake

Die Sammlung „COVID-19 Data Lake“ enthält Datasets zu COVID-19 aus unterschiedlichen Quellen, die Tracking- und Testdaten zu Patientenergebnissen, Social-Distancing-Vorgaben, Krankenhauskapazitäten, Mobilität und weitere Informationen umfassen.

Daymet

Schätzdaten (in Rastern) zu täglichen Wetterparametern in Nordamerika anhand von meteorologischen Beobachtungen

NOAA Integrated Surface Data (ISD)

Das Dataset „NOAA Integrated Surface Data“ stellt stundengenaue Verlaufsdaten zum weltweiten Wetter der Behörde National Oceanic and Atmospheric Administration (NOAA) zur Verfügung.

NOAA Global Forecast System (GFS)

Stundengenaue Daten zum Wetterbericht für die nächsten 15 Tage in den USA, die vom Global Forecast System (GFS) und der Behörde National Oceanic and Atmospheric Administration (NOAA) erstellt werden.

Genomics Data Lake

Der Genomics Data Lake enthält eine Vielzahl öffentlicher Datasets, die Sie kostenlos nutzen und in Ihre Analyseworkflows und -anwendungen zur Genomik integrieren können. Die Datasets enthalten Genomsequenzen, Varianteninformationen und Metadaten zu Probanden und Proben in den Dateiformaten BAM, FASTA, VCF und CSV.

New York City Safety Data

Dieses Dataset enthält alle Anforderungen des 311-Service in New York City von 2010 bis heute. Es ist im Parquet-Format gespeichert und wird regelmäßig aktualisiert.

US Consumer Price Index

Der Verbraucherpreisindex zeigt die durchschnittliche Veränderung der Preise, die von Konsumenten in Städten für bestimmte Waren und Dienstleistungen bezahlt werden, im Laufe der Zeit.

Can't find the data? Email us to request a dataset or contribute a dataset