Ignorar Navegação

Genomics Data Lake

Genomics Collection Data Lake

O Data Lake do Genomics fornece um vasto leque de conjuntos de dados públicos a que pode aceder gratuitamente e integrar nos seus fluxos de trabalho e aplicações de análise genómica. Os conjuntos de dados incluem sequenciação de genomas, informações sobre variantes e metadados de sujeitos de experiências/exemplo nos formatos de ficheiro BAM, FASTA, VCF e CSV.

O Data Lake do Genomics está alojado nas regiões E.U.A. Oeste 2 e E.U.A. Centro-Oeste do Azure. A alocação de recursos de computação nas regiões E.U.A. Oeste 2 e E.U.A. Centro-Oeste é recomendada por questões de afinidade.

A UTILIZAÇÃO DE CONJUNTOS DE DADOS ESTÁ SUJEITA AOS TERMOS E CONDIÇÕES DEFINIDOS PELOS PROPRIETÁRIOS DOS CONJUNTOS DE DADOS. VEJA A PÁGINA DE DETALHES DE CADA CONJUNTO DE DADOS PARA VER OS TERMOS E CONDIÇÕES APLICÁVEIS.

Conjuntos de dadosDescrição
Illumina Platinum GenomesIllumina Platinum Genomes
Human Reference GenomesHuman Reference Genomes
ClinVar AnnotationsClinVar Annotations
Genome in a BottleGenome in a Bottle
SnpEffSnpEff: Genomic variant annotations and functional effect prediction toolbox
gnomADgnomAD: Genome Aggregation Database