Přeskočit navigaci

Genomics Data Lake

Genomics Collection Data Lake

Datové jezero Genomics poskytuje různé veřejné datové sady, ke kterým máte přístup zdarma a které můžete integrovat do aplikací a pracovních postupů genomových analýz. Tyto datové sady obsahují sekvence genomů, informace o variantách a metadata jednotlivých subjektů/ukázek ve formátech souborů BAM, FASTA, VCF a CSV.

Datové jezero Genomics je hostované v těchto oblastech Azure: USA – středozápad a USA – západ 2. Kvůli přidružení se doporučuje přidělovat výpočetní prostředky v oblasti USA – středozápad a USA – západ 2.

POUŽITÍ DATOVÝCH SAD PODLÉHÁ PODMÍNKÁM A UJEDNÁNÍM STANOVENÝM VLASTNÍKEM DATOVÝCH SAD. PŘÍSLUŠNÉ PODMÍNKY A UJEDNÁNÍ JSOU UVEDENÉ NA STRÁNKÁCH S PODROBNOSTMI JENDOTLIVÝCH DATOVÝCH SAD.

Datové sadyPopis
Illumina Platinum GenomesIllumina Platinum Genomes
Human Reference GenomesLidské referenční genomy
ClinVar AnnotationsPoznámky ClinVar
Genome in a BottleGenome in a Bottle
SnpEffSnpEff: Genomic variant annotations and functional effect prediction toolbox
gnomADgnomAD: Genome Aggregation Database