탐색 건너뛰기

Curated open data made easily accessible on Azure

Microsoft News Recommendation Dataset

MIND(MIcrosoft News Dataset)는 뉴스 추천 연구를 위한 대규모 데이터 세트로, 뉴스 추천의 벤치마크 데이터 세트 역할을 하고 뉴스 추천 및 추천 시스템 영역을 쉽게 연구할 수 있게 해 줍니다.

MODIS

1999년부터 1~2일마다 지구 이미지를 만들어 온 MODIS(Moderate Resolution Imaging Spectroradiometer)의 위성 이미지입니다.

NASADEM

NASADEM은 NASA의 Shuttle Radar Topography Mission을 통해 캡처된 데이터에서 주로 파생된 전 세계 지형 데이터를 제공합니다.

Machine Learning Samples

테이블 형식 데이터 세트, 시계열 데이터 세트, 이미지, 텍스트 등 다양한 형식의 기계 학습 데이터 세트 컬렉션입니다.

Daymet

기상 관측의 북아메리카 일별 기상 한도 좌표형 예측치입니다.

COVID-19 Open Research Dataset

머신 가독성을 위해 최적화되었으며 전 세계 연구계에서 사용할 수 있도록 제공되는, 코로나19 및 코로나바이러스 관련 학술 문건의 전문 및 메타데이터 데이터 세트입니다.

COVID-19 Data Lake

코로나19 데이터 레이크 컬렉션은 검사 및 환자 결과 추적 데이터, 사회적 거리두기 정책, 병원 수용 능력, 이동성 등 다양한 원본의 코로나19 관련 데이터 세트 컬렉션입니다.

NAIP

미국 전역의 고해상도 항공 이미지를 제공하는 NAIP(National Agricultural Imagery Program)의 항공 이미지입니다.

TartanAir: AirSim Simulation Dataset for Simultaneous Localization and Mapping

SLAM(Simultaneous Localization and Mapping)을 해결하기 위해 생성된 TartanAir AirSim 자율주행차 데이터입니다.

US Population by County

2000년 및 2010년 10년 단위 인구 조사에서 제공된 미국 각 자치주의 성별 및 인종별 미국 인구입니다. 이 데이터 세트의 출처는 미국 인구 조사국입니다.

US Population by ZIP Code

2010 Decennial Census에서 제공된 각 미국 우편 번호에 대한 성별 및 인종별 미국 인구입니다. 이 데이터 세트의 출처는 미국 인구 조사국입니다.

US State Employment Hours and Earnings

CES(Current Employment Statistics) 프로그램은 미국의 급여 대장에 있는 노동자의 농장 이외 고용, 시간 및 소득의 자세한 산업 예상치를 생성합니다.

US Local Area Unemployment Statistics

미국 지역 실업 통계 데이터 세트는 미국의 인구 조사 지역 및 구역, 주, 카운티, 대도시 지역 및 여러 도시에 대한 월별 및 연간 고용, 실업 및 노동력 데이터를 제공합니다.

Harmonized Landsat Sentinel-2

HLS(Harmonized Landsat Sentinel)-2 데이터 세트는 표준 좌표에 맞춰지고 호환되는 색 공간으로 처리된, Landsat-8(2013년부터 현재까지) 및 Sentinel-2(2015년부터 현재까지) 위성의 위성 이미지 데이터를 포함합니다.

GOES-16

GOES-16은 NOAA GOES-16 위성의 기상 이미지를 제공합니다.

Russian Open Speech To Text

러시아의 Open STT는 러시아어용 대규모 오픈 음성 텍스트 변환 데이터 세트입니다.

Public Holidays

전 세계 공휴일 데이터는 PyPI 휴일 패키지 및 Wikipedia에서 가져왔으며 1970년부터 2099까지 38개 국가 및 지역을 포함합니다.

UK Met Office Global Weather Data for COVID-19 Analysis

연구원이 코로나19 발생 정도와 환경 요소 간의 관계를 탐색하는 데 이용할 수 있는 영국 Met Office 전 세계 기상 데이터 세트입니다.

NYC Taxi & Limousine Commission - yellow taxi trip records

노란색 택시 이동 레코드에는 승차 및 하차 날짜/시간, 승차 및 하단 위치, 이동 거리, 항목별 요금, 요율 종류, 지불 유형 및 운전자가 보고한 승객 수를 캡처하는 필드가 포함됩니다.

NYC Taxi & Limousine Commission - green taxi trip records

녹색 택시 이동 레코드에는 승차 및 하차 날짜/시간, 승차 및 하단 위치, 이동 거리, 항목별 요금, 요율 종류, 지불 유형 및 운전자가 보고한 승객 수를 캡처하는 필드가 포함됩니다.

NYC Taxi & Limousine Commission - For-Hire Vehicle (FHV) trip records

For-Hire Vehicle 이동 레코드는 배차 기준 면허증 번호 및 픽업 날짜/시간, 택시 승차 구역 위치 ID를 캡처하는 필드를 포함합니다.

NOAA NEXRAD Level II

미국 전역에 분포된 159개의 기상 레이더 관측소 네트워크인 NEXRAD의 최근 수준 II 데이터입니다.

US Producer Price Index - Industry

PPI(생산자 물가 지수)는 국내 생산자가 얻는 산출물 판매 가격의 시간에 따른 평균 변동을 측정한 값입니다.

NOAA Global Hydro Estimator (GHE)

GHE(Global Hydro Estimator) 데이터 세트는 NOAA의 Global Forecast System의 위성 이미지와 데이터에서 파생된 15분 간격의 전 세계 강우량 예측치를 제공합니다.

US Producer Price Index - Commodities

PPI(생산자 물가 지수)는 국내 생산자가 얻는 상품 판매 가격의 시간에 따른 평균 변동을 측정한 값입니다.

US Labor Force Statistics

미국 노동력 통계는 연령, 성별, 인종 및 민족 집단별 노동력 통계, 노동력 인구 비율 및 생산 가능 인구를 제공합니다. (미국)

US National Employment Hours and Earnings

CES(Current Employment Statistics) 프로그램은 미국의 급여 대장에 있는 노동자의 농장 이외 고용, 시간 및 소득의 자세한 산업 예상치를 생성합니다.

NOAA Integrated Surface Data (ISD)

NOAA(미국해양대기관리처) ISD(Integrated Surface Data)는 NOAA가 출처인 전 세계 시간별 기상 기록 데이터를 제공합니다.

US Consumer Price Index

CPI(소비자 물가 지수)는 도시 소비자가 장바구니 소비재 및 서비스에 지불한 가격의 시간에 따른 평균 변동을 측정한 값입니다.

NOAA Global Forecast System (GFS)

NOAA(미국해양대기관리처)의 GFS(Global Forecast System)에서 생성된 15일간의 미국 시간별 기상 예측 데이터입니다.

Genomics Data Lake

게놈 데이터 레이크는 무료로 액세스하고 게놈 분석 워크플로 및 애플리케이션에 통합할 수 있는 다양한 공개 데이터 세트를 제공합니다. 이 데이터 세트는 BAM, FASTA, VCF, CSV 파일 형식의 게놈 시퀀스, 변이 정보 및 주제/샘플 메타데이터를 포함합니다.

Seattle Safety Data

시애틀 소방서 911 파견입니다. 이 데이터 세트는 매일 업데이트되며 2010년부터 현재까지 누적된 기록 레코드를 포함합니다.

San Francisco Safety Data

샌프란시스코 소방서에서 서비스 및 311 사례를 요청합니다. 이 데이터 세트는 2015년부터 현재까지 누적된 기록 레코드를 포함합니다.

New York City Safety Data

이 데이터 세트는 2010년부터 현재까지의 모든 뉴욕시 311 서비스 요청을 포함하며, Parquet 형식으로 저장되고 매일 업데이트됩니다.

Chicago Safety Data

시카고시에 신고된 311 통화에 대한 데이터를 읽어보세요. 이 데이터 세트는 Parquet 형식으로 저장되며 매일 업데이트됩니다.

Boston Safety Data

보스턴시에 신고된 311 통화에 대한 데이터를 읽어보세요. 이 데이터 세트는 Parquet 형식으로 저장되며 매일 업데이트됩니다.

Can't find the data? Email us to request a dataset or contribute a dataset