Navigáció kihagyása

Genomics Data Lake

Genomics Collection Data Lake

A Genomics Data Lake számos, ingyenesen elérhető nyilvános adatkészletet tartalmaz, amelyeket integrálhat a genomikai munkafolyamatokba és az alkalmazásokba. Az adathalmaz genomszekvenciákat, variánsadatokat és alany/minta metaadatokat tartalmaz BAM, FASTA, VCF és CSV fájlformátumokban.

A Genomics Data Lake tárolási helye az USA 2. nyugati régiója és az USA nyugati középső régiója. Az affinitás érdekében az USA 2. nyugati régióján és az USA nyugati középső régióján belüli számítási erőforrások lefoglalását javasoljuk.

AZ ADATKÉSZLETEK HASZNÁLATA CSAK A TULAJDONOS HASZNÁLATI FELTÉTELEINEK ÉS KIKÖTÉSEINEK FÜGGVÉNYÉBEN ENGEDÉLYEZETT. AZ ÉRVÉNYES HASZNÁLATI FELTÉTELEKET ÉS KIKÖTÉSEKET AZ EGYES ADATHALMAZOK OLDALAIN TALÁLHATJA MEG.

AdathalmazokLeírás
Illumina Platinum GenomesIllumina Platinum Genomes
Human Reference GenomesHuman Reference Genomes
ClinVar AnnotationsClinVar Annotations
SnpEffSnpEff: Genomic variant annotations and functional effect prediction toolbox
gnomADgnomAD: Genome Aggregation Database
1000 Genomes1000 Genomes
OpenCravatOpenCravat: Open Custom Ranked Analysis of Variants Toolkit
ENCODEENCODE: Encyclopedia of DNA Elements
GATK Resource BundleGATK Resource bundle