跳过导航

Curated open data made easily accessible on Azure

US Labor Force Statistics

美国劳动力统计数据提供了劳动力统计信息、劳动力参与率,以及按年龄、性别、种族和人种划分的非集体户就业人口。 。

US Local Area Unemployment Statistics

美国当地失业率统计数据库为美国人口普查地区及分区、州、县、大都市区和许多城市提供月度和年度就业、失业和劳动力数据。

US Producer Price Index - Commodities

生产价格指数 (PPI) 是国内生产者商品出售价格随时间变化平均值的测量值。

US Producer Price Index - Industry

生产价格指数 (PPI) 是国内生产者产品出售价格随时间变化平均值的测量值。

Microsoft News Recommendation Dataset

Microsoft 新闻数据集 (MIND) 是一个用于新闻推荐研究的大规模数据集,它用作新闻推荐的基准数据集,并辅助新闻推荐和推荐器系统领域的研究。

Machine Learning Samples

不同类型的机器学习数据集(例如表格数据集、时间序列数据集、图像、文本等)的集合。

US State Employment Hours and Earnings

当前就业统计 (CES) 计划对美国非农就业、工时和工人收入进行了详细的行业估计。

US National Employment Hours and Earnings

当前就业统计 (CES) 计划对美国非农就业、工时和工人收入进行了详细的行业估计。

GOES-16

GOES-16 提供了 NOAA 的 GOES-16 卫星返回的天气图像。

US Consumer Price Index

消费者价格指数 (CPI) 是衡量城市消费者为一系列市场消费商品和服务所支付的价格随时间变化的平均值。

Harmonized Landsat Sentinel-2

Harmonized Landsat Sentinel-2 (HLS) 数据集包含来自 Landsat-8 卫星(2013 年至今)和 Sentinel-2 卫星(2015 年至今)的卫星图像数据,这些数据与常用网格对齐且经过处理,适合兼容的颜色空间。

NOAA Integrated Surface Data (ISD)

NOAA 综合地表数据 (ISD) 提供了来自美国国家海洋和大气管理局 (NOAA) 每小时记录的全球天气历史数据。

NOAA Global Hydro Estimator (GHE)

Global Hydro Estimator (GHE) 数据集提供从卫星图像得到的 15 分钟时间间隔的全球降雨量预估,以及来自 NOAA 全球预测系统的数据。

NOAA Global Forecast System (GFS)

美国国家海洋和大气管理局 (NOAA) 的全球预报系统 (GFS) 所生成的美国天气预报数据,周期为 15 天,每小时记录一次。

Genomics Data Lake

基因组数据湖中有各种公共数据集,你可免费访问它们,也可将它们集成到你的基因组分析工作流和应用程序中。 该数据集包含 BAM、FASTA、VCF 和 CSV 文件格式的基因组序列、变体信息和受试者/样本元数据。

Daymet

通过气象观测得到的北美每天天气参数预估值(经过网格处理)。

COVID-19 Data Lake

新冠肺炎数据湖集合包含来自各种来源的新冠肺炎相关数据集,它涵盖了测试和患者结果跟踪数据、社交距离策略、医院容纳能力和流动性等等。

COVID-19 Open Research Dataset

新冠肺炎和冠状病毒相关学术文章的全文内容和元数据数据集已经过优化,便于计算机阅读,同时还提供给全球研究者使用。

Seattle Safety Data

西雅图消防部门 911 调遣。 该数据集每日都会更新,它包含 2010 年至今累积的历史记录

San Francisco Safety Data

旧金山市消防部门呼叫服务和 311 事件。 此数据集包含从 2015 年至今累积的历史记录。

New York City Safety Data

该数据集包含 2010 年至今纽约市的所有 311 服务请求。 它以 Parquet 格式存储,每日都会更新。

Chicago Safety Data

阅读报告给芝加哥市的 311 电话的相关数据。 该数据集以 Parquet 格式存储,每日都会更新。

Boston Safety Data

阅读报告给波士顿市的 311 电话的相关数据。 该数据集以 Parquet 格式存储,每日都会更新。

NYC Taxi & Limousine Commission - green taxi trip records

绿色的出租车行程记录包括捕获以下信息的字段:上车和下车日期/时间、上车和下车位置、行程距离、逐条记录的车费、费率类型、付款类型和司机报告的乘客数。

NASADEM

NASADEM 提供全球地形数据,它们主要来自 NASA 的航天飞机雷达地形测量任务捕获的数据。

NAIP

来自美国国家农业图像计划 (NAIP) 的航拍图像,它提供了高度清晰的全美航拍图像。

NYC Taxi & Limousine Commission - For-Hire Vehicle (FHV) trip records

营运车辆的行程记录包含捕获调度基地许可证号,搭车日期、时间和出租车区域位置 ID 的字段。

Public Holidays

全球公共假日数据的来源是 PyPI holidays 数据包和 Wikipedia,涵盖自 1970 年至 2099 年的 38 个国家或地区。

US Population by County

源自 2000 年和 2010 年人口普查(每十年一次)的每个美国县按性别和人种划分的美国人口。 该数据集来自美国人口调查局。

TartanAir: AirSim Simulation Dataset for Simultaneous Localization and Mapping

TartanAir AirSim Autonomous 汽车数据,生成用来实现即时定位与地图构建 (SLAM)。

UK Met Office Global Weather Data for COVID-19 Analysis

UK Met Office 全球天气数据集,供研究人员用来探索新冠肺炎发病率与环境因素之间的关系。

NOAA NEXRAD Level II

来自 NEXRAD 的最新的级别 II 数据 - NEXRAD 是遍布美国的 159 部天气雷达卫星组成的网络。

US Population by ZIP Code

源自 2010 年人口普查(每十年一次)的每个美国邮政编码按性别和人种划分的美国人口。 该数据集来自美国人口调查局。

Russian Open Speech To Text

Russain Open STT 是一个大规模开放式的语音转文本数据集,它供俄语使用

NYC Taxi & Limousine Commission - yellow taxi trip records

黄色的出租车行程记录包括捕获以下信息的字段:上车和下车日期/时间、上车和下车位置、行程距离、逐条记录的车费、费率类型、付款类型和司机报告的乘客数。

MODIS

中分辨率成像光谱仪 (MODIS) 的卫星影像,它自 1999 年起每 1-2 天拍摄一张地球图像。

Can't find the data? Email us to request a dataset or contribute a dataset