Pomiń nawigację

Curated open data made easily accessible on Azure

Boston Safety Data

Przeczytaj dane dotyczące połączeń z numerem 311 zgłoszonych w Bostonie. Ten zestaw danych jest przechowywany w formacie Parquet i jest codziennie aktualizowany.

Chicago Safety Data

Przeczytaj dane dotyczące połączeń z numerem 311 zgłoszonych w Chicago. Ten zestaw danych jest przechowywany w formacie Parquet i jest codziennie aktualizowany.

New York City Safety Data

Ten zestaw danych zawiera wszystkie zgłoszenia na numer 311 w Nowym Jorku od roku 2010. Jest on przechowywany w formacie Parquet i jest codziennie aktualizowany.

US Population by County

Populacja USA według płci i rasy dla każdego amerykańskiego hrabstwa, na podstawie spisów ludności z roku 2000 i 2010. Źródłem tego zestawu danych jest agencja United States Census Bureau.

US Population by ZIP Code

Populacja USA według płci i rasy dla każdego amerykańskiego kodu pocztowego, na podstawie spisu ludności z roku 2010. Źródłem tego zestawu danych jest agencja United States Census Bureau.

TartanAir: AirSim Simulation Dataset for Simultaneous Localization and Mapping

Dane autonomicznych pojazdów TartanAir AirSim wygenerowane w celu rozwiązania jednoczesnego lokalizowania i mapowania (SLAM).

NYC Taxi & Limousine Commission - yellow taxi trip records

Rekordy dotyczące przejazdów żółtymi taksówkami zawierają pola daty i godziny rozpoczęcia oraz zakończenia kursu, miejsca rozpoczęcia i zakończenia kursu, pokonanej odległości, wyszczególnionych opłat, taryfy, metody płatności oraz liczby pasażerów podanej przez kierowcę.

Public Holidays

Dane dotyczące świąt na całym świecie pobrane z pakietu PyPI holidays oraz witryny Wikipedia, obejmujące 38 krajów i regionów w latach 1970–2099.

Russian Open Speech To Text

Russian Open STT to otwarty zestaw danych zamiany mowy na tekst dla języka rosyjskiego o dużej skali

NYC Taxi & Limousine Commission - For-Hire Vehicle (FHV) trip records

Rekordy przejazdów pojazdami na wynajem obejmują pola zawierające numer licencji centrali oraz datę i godzinę odebrania pasażera, jak również identyfikator lokalizacji strefy taksówkowej.

NYC Taxi & Limousine Commission - green taxi trip records

Rekordy dotyczące przejazdów zielonymi taksówkami zawierają pola daty i godziny rozpoczęcia oraz zakończenia kursu, miejsca rozpoczęcia i zakończenia kursu, pokonanej odległości, wyszczególnionych opłat, taryfy, metody płatności oraz liczby pasażerów podanej przez kierowcę.

US Producer Price Index - Industry

Wskaźnik cen dóbr produkcyjnych (producer price index, PPI) mierzy średnią zmianę cen sprzedaży, które otrzymują krajowi producenci za swoje towary, w czasie.

Microsoft News Recommendation Dataset

MIcrosoft News Dataset (MIND) to zestaw danych o dużej skali na potrzeby badań rekomendacji wiadomości, który służy jako zestaw danych testu porównawczego dla rekomendacji wiadomości i ułatwia badania w obszarze rekomendacji wiadomości oraz systemów rekomendacji.

US Producer Price Index - Commodities

Wskaźnik cen dóbr produkcyjnych (producer price index, PPI) mierzy średnią zmianę cen sprzedaży, które otrzymują krajowi producenci za swoje towary, w czasie.

Machine Learning Samples

Kolekcja różnych typów zestawów danych uczenia maszynowego, np. zestawów danych tabelarycznych, zestawów danych szeregów czasowych, obrazów, tekstu i innych.

US Labor Force Statistics

US Labor Force Statistics (Statystyki dotyczące siły roboczej w USA) dostarczają statystyk dotyczących siły roboczej — zasób siły roboczej, odsetek ludności aktywnej zawodowo oraz populacja z wyłączeniem wojskowych i osób przebywających w instytucjach, z podziałem według wieku, płci, rasy i pochodzenia etnicznego. w Stanach Zjednoczonych.

NOAA Integrated Surface Data (ISD)

Baza danych Integrated Surface Database (ISD) agencji NOAA zapewnia godzinowe dane historyczne dotyczące pogody na świecie pochodzące z amerykańskiej agencji ds. oceanów i atmosfery (NOAA).

US Local Area Unemployment Statistics

Zestawy danych programu US Local Area Unemployment Statistics (Lokalne statystyki bezrobocia w Stanach Zjednoczonych) dostarczają miesięcznych i rocznych danych dotyczących zatrudnienia, bezrobocia i zasobu siły roboczej w poszczególnych regionach i okręgach spisowych, stanach, hrabstwach, obszarach metropolitalnych i wielu miastach w Stanach Zjednoczonych.

US Consumer Price Index

Wskaźnik cen towarów i usług konsumpcyjnych (CPI) mierzy średnią zmianę w czasie cen zakupu rynkowego koszyka towarów i usług konsumpcyjnych dla konsumentów mieszkających w miastach.

US National Employment Hours and Earnings

Program CES (Current Employment Statistics — aktualne statystyki zatrudnienia) generuje szczegółowe szacunkowe dane dotyczące zatrudnienia poza sektorem rolniczym, czasu pracy oraz wynagrodzeń pracowników zatrudnionych w różnych branżach w Stanach Zjednoczonych.

US State Employment Hours and Earnings

Program CES (Current Employment Statistics — aktualne statystyki zatrudnienia) generuje szczegółowe szacunkowe dane dotyczące zatrudnienia poza sektorem rolniczym, czasu pracy oraz wynagrodzeń pracowników zatrudnionych w różnych branżach w Stanach Zjednoczonych.

NOAA Global Forecast System (GFS)

Godzinowe dane prognozy pogody na 15 dni dla Stanów Zjednoczonych utworzone przez system Global Forecast System (GFS) agencji NOAA (National Oceanic and Atmospheric Administration — Krajowej Agencji ds. Oceanów i Atmosfery).

Genomics Data Lake

Zestaw Genomics Data Lake dostarcza różnych publicznych zestawów danych, do których można uzyskiwać dostęp bezpłatnie, i które można zintegrować z własnymi aplikacjami i przepływami pracy usługi Genomics. Zestawy danych obejmują sekwencje genów, informacje o odmianie oraz metadane podmiotu/próbki w formatach plików BAM, FASTA, VCF i CSV.

Seattle Safety Data

Zgłoszenia na numer 911 straży pożarnej miasta Seattle. Ten zestaw danych jest codziennie aktualizowany i zawiera historyczne rekordy od roku 2010

San Francisco Safety Data

Wezwania straży pożarnej oraz zgłoszenia na numer 311 w San Francisco. Ten zestaw danych zawiera historyczne rekordy od roku 2015.

COVID-19 Open Research Dataset

Zestaw danych obejmujący pełne teksty i metadane artykułów naukowych dotyczących epidemii COVID-19 i koronawirusa, zoptymalizowany pod kątem odczytu przez maszyny i udostępniony do użytku przez globalną społeczność badaczy.

COVID-19 Data Lake

Kolekcja usługi COVID-19 Data Lake zawiera zestawy danych związane z chorobą COVID-19, pochodzące z różnych źródeł, obejmujące dane śledzenia testowania i wyników pacjentów, politykę utrzymania dystansu społecznego, przepustowość szpitali, mobilność itp.

Can't find the data? Email us to request a dataset or contribute a dataset