Přeskočit navigaci

Curated open data made easily accessible on Azure

NAIP

Letecké snímky z programu NAIP (National Agricultural Imagery Program) z USA jsou poskytované ve vysokém rozlišení.

TartanAir: AirSim Simulation Dataset for Simultaneous Localization and Mapping

Data autonomních vozidel TartanAir AirSim generovaná pro řešení simultánní lokalizace a mapování (SLAM).

Russian Open Speech To Text

Russain Open STT je rozsáhlá otevřená datová sada převodu řeči na text pro ruštinu.

US Population by ZIP Code

Informace o obyvatelstvu USA pro jednotlivá PSČ podle pohlaví a rasy vyplývající z desetiletého sčítání lidu z roku 2010. Zdrojem této datové sady je statistický úřad USA (United States Census Bureau).

US Population by County

Informace o obyvatelstvu jednotlivých okresů USA podle pohlaví a rasy vyplývající z desetiletého sčítání lidu z let 2000 a 2010. Zdrojem této datové sady je statistický úřad USA (United States Census Bureau).

UK Met Office Global Weather Data for COVID-19 Analysis

Datová sada globálního počasí britského meteorologického úřadu pro výzkumníky, kteří hledají vztahy mezi incidencí COVID-19 a environmentálními faktory.

Public Holidays

Data o celosvětových svátcích pocházející z balíčku PyPI holidays a z Wikipedie, která pokrývají 38 zemí nebo oblastí od roku 1970 do roku 2099.

NYC Taxi & Limousine Commission - For-Hire Vehicle (FHV) trip records

Záznamy o jízdách pronajatými vozidly obsahují pole zachycující číslo licence dispečinku, datum a čas vyzvednutí a ID oblasti taxi zóny.

NYC Taxi & Limousine Commission - yellow taxi trip records

Záznamy o cestách žlutým taxíkem obsahují pole zachytávající data a časy vyzvednutí a vysazení, místa vyzvednutí a vysazení, ujeté vzdálenosti, jízdné rozdělené na položky, typy sazeb, typy plateb a počty cestujících nahlášené řidičem.

NYC Taxi & Limousine Commission - green taxi trip records

Záznamy o cestách zeleným taxíkem obsahují pole zachytávající data a časy vyzvednutí a vysazení, místa vyzvednutí a vysazení, ujeté vzdálenosti, jízdné rozdělené na položky, typy sazeb, typy plateb a počty cestujících nahlášené řidičem.

NASADEM

NASADEM poskytuje globální topografické údaje odvozené především z dat zachycených v rámci programu Shuttle Radar Topography Mission agentury NASA.

MODIS

Satelitní snímky ze systému MODIS (Moderate Resolution Imaging Spectroradiometer), které zaznamenávají Zemi každý 1–2 dny od roku 1999.

NOAA NEXRAD Level II

Nedávná data úrovně II ze sítě NEXRAD tvořené 159 meteorologickými radary umístěnými po celých Spojených státech.

Microsoft News Recommendation Dataset

MIcrosoft News Dataset (MIND) je rozsáhlá datová sada pro výzkum doporučení pro zpravodajství. Klade si za cíl sloužit jako srovnávací datová sada pro doporučení zpravodajství a podporovat výzkum v oblasti doporučení zpravodajství a doporučovacích systémů.

Machine Learning Samples

Kolekce různých typů datových sad strojového učení, jako jsou tabulkové datové sady, datové sady časových řad, obrázky, text a další.

Harmonized Landsat Sentinel-2

Datová sada Harmonized Landsat Sentinel-2 (HLS) obsahuje data satelitních snímků z družic Landsat-8 (od 2013 do současnosti) a Sentinel-2 (od 2015 do současnosti), které jsou zarovnané do sítě souřadnic a zpracované do kompatibilních barevných prostorů.

GOES-16

GOES-16 poskytuje snímky počasí ze satelitu GOES-16 úřadu NOAA.

US Producer Price Index - Commodities

Index cen výrobců (PPI) měří průměrnou změnu prodejních cen, za které domácí výrobci prodávají své komodity, v průběhu času.

US Labor Force Statistics

Statistika pracovní síly USA poskytuje statistické údaje o pracovní síle, míře zapojení pracovní síly a civilním svéprávném obyvatelstvu podle věku, pohlaví, rasy a etnických skupin v USA.

US Producer Price Index - Industry

Index cen výrobců (PPI) měří průměrnou změnu prodejních cen, za které domácí výrobci prodávají své výstupy, v průběhu času.

US Local Area Unemployment Statistics

Datové sady statistiky místní nezaměstnanosti v USA poskytují měsíční a roční údaje o zaměstnanosti, nezaměstnanosti a pracovní síle pro účely sčítání lidu v jednotlivých oblastech a okresech, státech, okresech, metropolitních oblastech a řadě měst v USA.

US State Employment Hours and Earnings

Program Statistika aktuální zaměstnanosti (CES) generuje podrobné odhady zaměstnanosti, pracovních hodin a mezd pracovníků v nezemědělských odvětvích v USA.

US National Employment Hours and Earnings

Program Statistika aktuální zaměstnanosti (CES) generuje podrobné odhady zaměstnanosti, pracovních hodin a mezd pracovníků v nezemědělských odvětvích v USA.

NOAA Integrated Surface Data (ISD)

NOAA Integrated Surface Data (ISD) poskytuje hodinová historická data o počasí na celém světě z Národního úřadu pro oceán a atmosféru (NOAA).

US Consumer Price Index

Index spotřebitelských cen (CPI) měří průměrnou změnu cen, které městští spotřebitelé zaplatí za spotřební koš zboží a služeb, v průběhu času.

NOAA Global Hydro Estimator (GHE)

Datová sada Global Hydro Estimator (GHE) poskytuje globální odhad dešťových srážek v 15minutových intervalech na základě satelitních snímků a dat ze systému Global Forecast System agentury NOAA.

NOAA Global Forecast System (GFS)

Data pro předpověď počasí v USA na 15 dnů vygenerovaná systémem Global Forecast System (GFS) z Národního úřadu pro oceán a atmosféru (NOAA).

Genomics Data Lake

Datové jezero Genomics poskytuje různé veřejné datové sady, ke kterým máte přístup zdarma a které můžete integrovat do aplikací a pracovních postupů genomových analýz. Tyto datové sady obsahují sekvence genomů, informace o variantách a metadata jednotlivých subjektů/ukázek ve formátech souborů BAM, FASTA, VCF a CSV.

Daymet

Odhady parametrů denního počasí opatřené souřadnicemi v Severní Americe z meteorologických pozorování.

COVID-19 Data Lake

Kolekce Datové jezero COVID-19 je kolekcí datových sad souvisejících s COVID-19 z různých zdrojů a zahrnuje data týkající se testování a výsledků pacientů, zásady společenského odstupu, kapacity nemocnic, mobility atd.

COVID-19 Open Research Dataset

Datová sada metadat a úplného znění pro vědecké články související s COVID-19 a koronavirem, která je optimalizovaná pro strojovou čitelnost a zpřístupněná globální komunitě výzkumných pracovníků

Seattle Safety Data

Výjezdy hasičů v Seattlu v reakci na zavolání na linku 911. Tato datová sada se denně aktualizuje a obsahuje historické záznamy shromážděné od roku 2010 až do současnosti.

San Francisco Safety Data

Volání o zásah hasičů a případy 311 v San Francisku. Tato datová sada obsahuje historické záznamy shromážděné od roku 2015 až do současnosti.

New York City Safety Data

Tato datová sada obsahuje všechny žádosti o služby 311 v New Yorku od roku 2010 až do současnosti. Uchovává ve formátu Parquet a je denně aktualizovaná.

Chicago Safety Data

Prohlédněte si data o nahlášených voláních na linku 311 ve městě Chicago. Tato datová sada se uchovává ve formátu Parquet a je denně aktualizovaná.

Boston Safety Data

Prohlédněte si data o nahlášených voláních na linku 311 ve městě Boston. Tato datová sada se uchovává ve formátu Parquet a je denně aktualizovaná.

Can't find the data? Email us to request a dataset or contribute a dataset