Hoppa över navigering

Genomics Data Lake

Genomics Collection Data Lake

Genomics-datasjön innehåller en rad olika offentliga datamängder som du kan använda utan kostnad och integrera i arbetsflöden och tillämpningar för genomikanalyser. Datamängderna innehåller genomsekvenser, information om varianter samt metadata för element/urval i filformaten BAM, FASTA, VCF och CSV.

Genomics-datasjön hanteras i Azure-regionerna USA, västra 2 och USA, västra centrala. Vi rekommenderar att beräkningsresurser allokeras i USA, västra 2 och USA, västra centrala av tillhörighetsskäl.

ANVÄNDNINGEN AV DATAUPPSÄTTNINGARNA REGLERAS AV DATAUPPSÄTTNINGSÄGARENS VILLKOR. GÄLLANDE VILLKOR FINNS PÅ DETALJSIDAN FÖR RESPEKTIVE DATAUPPSÄTTNING.

DatauppsättningarBeskrivning
Illumina Platinum GenomesIllumina Platinum Genomes
Human Reference GenomesMänskligt referensgenom
ClinVar AnnotationsClinVar-annoteringar
Genome in a BottleGenome in a Bottle
SnpEffSnpEff: Genomic variant annotations and functional effect prediction toolbox
gnomADgnomAD: Genome Aggregation Database