Пропустить навигацию

Curated open data made easily accessible on Azure

US Population by ZIP Code

Население США с классификацией по полу и расовой принадлежности для каждого почтового индекса США. Источник — перепись, проводящаяся каждые 10 лет, за 2010 год. Источник данных — Бюро переписи населения США.

Harmonized Landsat Sentinel-2

Набор данных Harmonized Landsat Sentinel-2 (HLS) содержит снимки со спутников Landsat-8 (с 2013 года до текущего времени) и Sentinel-2 (с 2015 года до текущего времени), приведенные в соответствие с общей координатной сеткой и обработанные для обеспечения совместимости цветовых пространств.

US Consumer Price Index

Индекс розничных цен (CPI) — это измерение среднего изменения цен на потребительскую корзину, выплачиваемых городскими потребителями, в динамике.

NOAA Global Hydro Estimator (GHE)

Набор данных Global Hydro Estimator (GHE) предоставляет данные прогнозов дождевых осадков с интервалом в 15 минут. Источник данных — снимки со спутника и глобальная система прогнозирования погоды Национального управления океанических и атмосферных исследований.

NAIP

Аэроснимки, полученные в рамках программы National Agricultural Imagery Program (NAIP), которая обеспечивает аэросъемку с высоким разрешением по всей территории США.

MODIS

Спутниковые снимки со спектрорадиометра для получения изображений с умеренным разрешением (MODIS). Прибор осуществляет съемку поверхности Земли каждые 1–2 дня с 1999 года.

US Population by County

Данные о населении каждого округа США по полу и расе, полученные в результате переписи населения за 2000–2010 гг. Источник данных — Бюро переписи населения США.

UK Met Office Global Weather Data for COVID-19 Analysis

Глобальный метеорологический набор данных UK Met Office для исследователей, помогающий изучать связь между заболеваемостью COVID-19 и экологическими факторами.

Public Holidays

Данные о государственных праздниках 38 стран или регионов с 1970 по 2099 гг. из Википедии и пакета данных PyPI.

TartanAir: AirSim Simulation Dataset for Simultaneous Localization and Mapping

Данные автономных транспортных средств AirSim TartanAir, созданные для одновременной локализации и построения карты (SLAM).

Russian Open Speech To Text

Russain Open STT — это крупномасштабный открытый набор данных преобразования речи в текст для русского языка.

NYC Taxi & Limousine Commission - yellow taxi trip records

Записи поездок в такси, отмеченные желтым, включают такие поля, как время или дата посадки и высадки пассажиров, пункты посадки и высадки, расстояние поездки, детализированные пассажирские тарифы, виды тарифа, виды оплаты и отчет водителя о количестве пассажиров.

NYC Taxi & Limousine Commission - green taxi trip records

Необработанные записи поездок в такси включают такие поля, как время или дата посадки и высадки пассажиров, пункты посадки и высадки, дальность поездки, детализированные пассажирские тарифы, виды тарифов, виды оплаты и отчет водителя о количестве пассажиров.

NYC Taxi & Limousine Commission - For-Hire Vehicle (FHV) trip records

Записи о поездках, предоставленные For-Hire Vehicle, которые содержат поля с номером лицензии в диспетчерском центре, дату и время посадки пассажиров, а также идентификатор местоположения такси.

NOAA NEXRAD Level II

Недавние данные уровня II от NEXRAD, сети из 159 радарных метеорологических станций, распределенных по территории США.

NASADEM

NASADEM предоставляет топографические сведения со всего земного шара, полученные на основе данных, которые собираются в рамках проекта НАСА Shuttle Radar Topography Mission (Радиолокационная топографическая миссия шаттла).

NOAA Integrated Surface Data (ISD)

NOAA Integrated Surface Data (ISD) предоставляет исторические погодные данные со всего земного шара за каждый час. Источник данных — Национальное управление океанических и атмосферных исследований (NOAA).

US National Employment Hours and Earnings

Программа статистики текущей занятости (CES) предоставляет подробную оценку отрасли в плане занятости несельскохозяйственного персонала, рабочем времени и окладах в Соединенных Штатах.

Microsoft News Recommendation Dataset

MIcrosoft News Dataset (MIND) — это крупномасштабный набор данных для исследования рекомендаций новостей. Его задача — служить эталонным набором данных для рекомендаций по новостям и содействовать исследованиям в области рекомендаций новостей и систем рекомендаций.

Machine Learning Samples

Ряд различных типов наборов данных для машинного обучения, например табличных наборов данных, наборов данных с временными рядами, изображений, текстовых данных и т. д.

US Labor Force Statistics

Набор данных US Labor Force Statistics предоставляет сведения Бюро трудовой статистики США о трудовых ресурсах, уровне экономической активности населения, а также о гражданском неинституциональном населении с классификацией по возрасту, полу, расовой и этнической принадлежности. в США.

US Producer Price Index - Commodities

Индекс цен производителей (PPI) — это показатель среднего изменения отпускных цен, выплаченных отечественным производителям за их товары, с течением времени.

US Producer Price Index - Industry

Индекс цен производителей (PPI) — это показатель среднего изменения отпускных цен, выплаченных отечественным производителям за их продукцию, с течением времени.

GOES-16

GOES-16 предоставляет метеорологические снимки со спутника NOAA GOES-16.

US Local Area Unemployment Statistics

Наборы данных US Local Area Unemployment Statistics предоставляют данные о трудоустройстве, безработице и занятости населения по регионам, округам, штатам, крупным городам с пригородами и многим городам США за месяц и за год.

US State Employment Hours and Earnings

Программа статистики текущей занятости (CES) предоставляет подробную оценку отрасли в плане занятости несельскохозяйственного персонала, рабочем времени и окладах в Соединенных Штатах.

NOAA Global Forecast System (GFS)

15-дневный почасовой прогноз погоды в США из глобальной системы прогнозирования (GFS) от Национального управления океанических и атмосферных исследований (NOAA).

Genomics Data Lake

Набор данных Genomics Data Lake содержит различные общедоступные бесплатные наборы данных, которые можно включать в рабочие процессы и приложения для анализа генома. Эти наборы данных содержат геномные последовательности, сведения о вариантах и метаданные subject/sample (субъект/выборка) в форматах BAM, FASTA, VCF и CSV.

Daymet

Представленные на координатной сетке данные оценки суточных параметров погоды в Северной Америке, полученные на основе метеорологических наблюдений.

San Francisco Safety Data

Вызовы пожарной службы и обращения в службу 311 в Сан-Франциско. Этот набор данных содержит архивные записи, собранные с 2015 года по сегодняшний день.

Chicago Safety Data

Данные для чтения о вызовах 311 в Чикаго. Этот набор данных хранится в формате Parquet и обновляется ежедневно.

Seattle Safety Data

Отправка по вызовам 911 в управлении пожарной охраны Сиэтла. Этот набор данных обновляется ежедневно и содержит архивные записи, собранные с 2010 года по сегодняшний день.

New York City Safety Data

Этот набор данных содержит все запросы в службу 311 города Нью-Йорка с 2010 г. до текущего момента. Набор данных хранится в формате Parquet и обновляется ежедневно.

COVID-19 Data Lake

COVID-19 Data Lake — это коллекция наборов данных о COVID-19, полученных из разных источников. Это данные системы отслеживания результатов тестирования и лечения, а также сведения о соблюдении правил социального дистанцирования, вместимости больниц, перемещениях и т. д.

Boston Safety Data

Данные для чтения о вызовах 311 в Бостоне. Этот набор данных хранится в формате Parquet и обновляется ежедневно.

COVID-19 Open Research Dataset

Машиночитаемый набор данных, состоящий из метаданных и полнотекстовых научных статей, посвященных COVID-19 и семейству коронавирусов. Набор доступен для мирового исследовательского сообщества.

Can't find the data? Email us to request a dataset or contribute a dataset