ナビゲーションをスキップする

Genomics Data Lake

Genomics Collection Data Lake

Genomics Data Lake は、無料でアクセスでき、お使いのゲノミクス解析のワークフローやアプリケーションに統合できるさまざまな公開データセットを提供しています。 データセットには、ゲノム配列、変異情報、被験者/サンプルのメタデータが BAM、FASTA、VCF、CSV ファイル形式で含まれています。

Genomics Data Lake は米国西部 2 および米国中西部 Azure リージョンでホストされています。 アフィニティのため、米国西部 2 と米国中西部にコンピューティング リソースを割り当てることをお勧めします。

データセットの使用は、データセットの所有者により設定された使用条件に基づきます。 該当する使用条件については、各データセットの詳細ページをご覧ください。

データセット説明
Illumina Platinum GenomesIllumina Platinum Genomes
Human Reference GenomesHuman Reference Genomes
ClinVar AnnotationsClinVar Annotations
Genome in a BottleGenome in a Bottle
SnpEffSnpEff: Genomic variant annotations and functional effect prediction toolbox
gnomADgnomAD: Genome Aggregation Database
1000 Genomes1000 Genomes