Zlepšete přesnost svých modelů strojového učení s využitím veřejně dostupných datových sad. Ušetřete čas při zjišťování a přípravě dat pomocí kurátorovaných datových sad, které jsou připravené k použití v projektech strojového učení.
Žluté záznamy o jízdě taxíkem zahrnují vyzvednutí a odkládací data a časy, vyzvednutí a odkládací místa, vzdálenosti jízdy, položky jízdné, typy sazeb, typy plateb a počty cestujících hlášených řidičem.
Mezi zelené záznamy o jízdě taxíkem patří vyzvednutí a odkládací data a časy, vyzvednutí a odkládací místa, vzdálenosti jízdy, položky jízdné, typy sazeb, typy plateb a počty cestujících hlášených řidičem.
Kolekce Datové jezero COVID-19 je kolekcí datových sad souvisejících s COVID-19 z různých zdrojů a zahrnuje data týkající se testování a výsledků pacientů, zásady společenského odstupu, kapacity nemocnic, mobility atd.
Datová sada metadat a úplného znění pro vědecké články související s COVID-19 a koronavirem, která je optimalizovaná pro strojovou čitelnost a zpřístupněná globální komunitě výzkumných pracovníků
Genomics Data Lake poskytuje různé veřejné datové sady, ke kterým můžete získat přístup zdarma a integrovat je do pracovních postupů a aplikací pro analýzu genomiky. Tyto datové sady obsahují sekvence genomů, informace o variantách a metadata jednotlivých subjektů/ukázek ve formátech souborů BAM, FASTA, VCF a CSV.
Statistika pracovní síly USA poskytuje statistické údaje o pracovní síle, míře zapojení pracovní síly a civilním svéprávném obyvatelstvu podle věku, pohlaví, rasy a etnických skupin v USA.
Program Statistika aktuální zaměstnanosti (CES) generuje podrobné odhady zaměstnanosti, pracovních hodin a mezd pracovníků v nezemědělských odvětvích v USA.
Program Statistika aktuální zaměstnanosti (CES) generuje podrobné odhady zaměstnanosti, pracovních hodin a mezd pracovníků v nezemědělských odvětvích v USA.
Datové sady statistiky místní nezaměstnanosti v USA poskytují měsíční a roční údaje o zaměstnanosti, nezaměstnanosti a pracovní síle pro účely sčítání lidu v jednotlivých oblastech a okresech, státech, okresech, metropolitních oblastech a řadě měst v USA.
Informace o obyvatelstvu jednotlivých okresů USA podle pohlaví a rasy vyplývající z desetiletého sčítání lidu z let 2000 a 2010. Zdrojem této datové sady je statistický úřad USA (United States Census Bureau).
Informace o obyvatelstvu USA pro jednotlivá PSČ podle pohlaví a rasy vyplývající z desetiletého sčítání lidu z roku 2010. Zdrojem této datové sady je statistický úřad USA (United States Census Bureau).
Tato datová sada obsahuje všechny žádosti o služby 311 v New Yorku od roku 2010 až do současnosti. ™Je uložená ve formátu Parquet a denně aktualizována.
Výjezdy hasičů v Seattlu v reakci na zavolání na linku 911. Tato datová sada se denně aktualizuje a obsahuje historické záznamy shromážděné od roku 2010 až do současnosti.
Tato datová sada je odvozená od datové sady Dominick OJ a zahrnuje navíc simulovaná data s cílem poskytnout datovou sadu, která usnadňuje souběžné trénování tisíců modelů na azure Machine Učení.
Databáze MNIST ručně psaných číslic obsahuje trénovací sadu 60 000 příkladů a testovací sadu 10 000 příkladů. Číslice mají normalizovanou velikost a jsou umístěné ve středu obrázku s pevnou velikostí.
Microsoft News Dataset (MIND) je rozsáhlá datová sada pro výzkum doporučení zpráv. Slouží jako srovnávací datová sada pro doporučení zpráv a usnadňuje výzkum v systémech doporučení a doporučovačů.