탐색 건너뛰기

Genomics Data Lake

Genomics Collection Data Lake

게놈 데이터 레이크는 무료로 액세스하고 게놈 분석 워크플로 및 애플리케이션에 통합할 수 있는 다양한 공개 데이터 세트를 제공합니다. 이 데이터 세트는 BAM, FASTA, VCF, CSV 파일 형식의 게놈 시퀀스, 변이 정보 및 주제/샘플 메타데이터를 포함합니다.

게놈 데이터 레이크는 미국 서부 2 및 미국 중서부 Azure 지역에서 호스트됩니다. 선호도를 위해 미국 서부 2 및 미국 중서부에 컴퓨팅 리소스를 할당하는 것이 좋습니다.

데이터 세트 사용에는 데이터 세트 소유자가 설정한 사용 약관이 적용됩니다. 해당 사용 약관을 보려면 각 데이터 세트의 세부 정보 페이지를 참조하세요.

데이터 세트설명
Illumina Platinum GenomesIllumina Platinum Genomes
Human Reference GenomesHuman Reference Genomes
ClinVar AnnotationsClinVar Annotations
Genome in a BottleGenome in a Bottle
SnpEffSnpEff: Genomic variant annotations and functional effect prediction toolbox
gnomADgnomAD: Genome Aggregation Database