跳过导航

Genomics Data Lake

Genomics Collection Data Lake

基因组数据湖中有各种公共数据集,你可免费访问它们,也可将它们集成到你的基因组分析工作流和应用程序中。 该数据集包含 BAM、FASTA、VCF 和 CSV 文件格式的基因组序列、变体信息和受试者/样本元数据。

基因组数据湖托管在 Azure 美国西部 2 和美国中西部区域。 为实现相关性,建议将计算资源分配到美国西部 2 和美国中西部区域。

需根据数据集所有者规定的条款和条件使用数据集。 请查看各数据集的详细信息页面,了解适用的条款和条件。

数据集描述
Illumina Platinum GenomesIllumina Platinum Genomes
Human Reference Genomes人类参考基因组
ClinVar AnnotationsClinVar 注释
Genome in a Bottle瓶中基因组联盟
SnpEffSnpEff: Genomic variant annotations and functional effect prediction toolbox
gnomADgnomAD: Genome Aggregation Database