Genomics Data Lake は、無料でアクセスでき、お使いのゲノミクス解析のワークフローやアプリケーションに統合できるさまざまな公開データセットを提供しています。 データセットには、ゲノム配列、変異情報、被験者/サンプルのメタデータが BAM、FASTA、VCF、CSV ファイル形式で含まれています。
Genomics Data Lake は米国西部 2 および米国中西部 Azure リージョンでホストされています。 アフィニティのため、米国西部 2 と米国中西部にコンピューティング リソースを割り当てることをお勧めします。
データセットの使用は、データセットの所有者により設定された使用条件に基づきます。 該当する使用条件については、各データセットの詳細ページをご覧ください。
データセット | 説明 |
---|---|
Illumina Platinum Genomes | Illumina Platinum Genomes |
Human Reference Genomes | Human Reference Genomes |
ClinVar Annotations | ClinVar Annotations |
Genome in a Bottle | Genome in a Bottle |
SnpEff | SnpEff: Genomic variant annotations and functional effect prediction toolbox |
gnomAD | gnomAD: Genome Aggregation Database |
1000 Genomes | 1000 Genomes |