Ignorar navegação

Genomics Data Lake

Genomics Collection Data Lake

O Data Lake do Genomics conta com uma variedade de conjuntos de dados públicos que podem ser acessados gratuitamente e integrados aos seus aplicativos e fluxos de trabalho de análise genômica. Os conjuntos de dados incluem: sequências de genomas, informações sobre variantes e metadados de indivíduos/amostras nos formatos de arquivo BAM, FASTA, VCF e CSV.

O Data Lake do Genomics está armazenado nas regiões do Azure Oeste dos EUA 2 e Centro-Oeste dos EUA. É recomendável alocar recursos de computação no Oeste dos EUA 2 e no Centro-Oeste dos EUA por questão de afinidade.

O USO DE CONJUNTOS DE DADOS ESTÁ SUJEITO AOS TERMOS E CONDIÇÕES DEFINIDOS PELOS PROPRIETÁRIOS DO CONJUNTO DE DADOS. CONSULTE A PÁGINA DE DETALHES DE CADA CONJUNTO DE DADOS PARA VER OS TERMOS E CONDIÇÕES APLICÁVEIS.

Conjuntos de dadosDescrição
Illumina Platinum GenomesIllumina Platinum Genomes
Human Reference GenomesGenomas de referência humanos
ClinVar AnnotationsAnotações do ClinVar
Genome in a BottleGenome in a Bottle
SnpEffSnpEff: Genomic variant annotations and functional effect prediction toolbox
gnomADgnomAD: Genome Aggregation Database