Navigatie overslaan

Genomics Data Lake

Genomics Collection Data Lake

De Genomics Data Lake biedt diverse openbare gegevenssets die gratis toegankelijk zijn en die u kunt integreren in uw werkstromen en toepassingen voor genomica-analyses. De gegevenssets bevatten genoomsequenties, variantgegevens en onderwerp-/sample-metagegevens in BAM-, FASTA-, VCF- en CSV-bestandsindelingen.

De Genomics Data Lake wordt gehost in de Azure-regio’s US - west 2 en VS - west-centraal. Het wordt aanbevolen om rekenresources in US - west 2 en VS - west-centraal toe te wijzen voor affiniteit.

HET GEBRUIK VAN GEGEVENSSETS IS ONDERHEVIG AAN DE VOORWAARDEN VAN DE EIGENAAR VAN DE GEGEVENSSET. ZIE DE DETAILPAGINA VOOR ELKE GEGEVENSSET VOOR TOEPASSELIJKE VOORWAARDEN.

GegevenssetsBeschrijving
Illumina Platinum GenomesIllumina Platinum Genomes
Human Reference GenomesMenselijke referentiegenomen
ClinVar AnnotationsClinVar Annotations
Genome in a BottleGenome in a Bottle
SnpEffSnpEff: Genomic variant annotations and functional effect prediction toolbox
gnomADgnomAD: Genome Aggregation Database