Пропустить навигацию

Genomics Data Lake

Genomics Collection Data Lake

Набор данных Genomics Data Lake содержит различные общедоступные бесплатные наборы данных, которые можно включать в рабочие процессы и приложения для анализа генома. Эти наборы данных содержат геномные последовательности, сведения о вариантах и метаданные subject/sample (субъект/выборка) в форматах BAM, FASTA, VCF и CSV.

Набор данных Genomics Data Lake хранится в регионах Azure “Западная часть США 2” и “Центрально-западная часть США”. Для обеспечения приближенности рекомендуется выделять вычислительные ресурсы в регионах “Западная часть США 2” и “Центрально-западная часть США”.

ИСПОЛЬЗОВАНИЕ НАБОРОВ ДАННЫХ РЕГУЛИРУЕТСЯ УСЛОВИЯМИ, УСТАНОВЛЕННЫМИ ВЛАДЕЛЬЦАМИ НАБОРОВ ДАННЫХ. ПРИМЕНИМЫЕ УСЛОВИЯ ИСПОЛЬЗОВАНИЯ СМ. НА СТРАНИЦЕ СО СВЕДЕНИЯМИ О КАЖДОМ НАБОРЕ ДАННЫХ.

Наборы данныхОписание
Illumina Platinum GenomesIllumina Platinum Genomes
Human Reference GenomesHuman Reference Genomes
ClinVar AnnotationsClinVar Annotations
SnpEffSnpEff: Genomic variant annotations and functional effect prediction toolbox
gnomADgnomAD: Genome Aggregation Database
1000 Genomes1000 Genomes
OpenCravatOpenCravat: Open Custom Ranked Analysis of Variants Toolkit
ENCODEENCODE: Encyclopedia of DNA Elements
GATK Resource BundleGATK Resource bundle