Azure でゲノミクスのワークフローとデータ分析を加速させる
ゲノミクスは、標的治療薬の開発や精密医療の基盤となるものです。DNA シーケンシング技術の進歩により、ゲノミクスに基づく研究に革命が起こり、人間の生物学や疾病の状態についての理解が深まっています。このような知識の拡大により、疾病の予防、診断、治療を目的とした、パーソナライズされた医療戦略が普及してきています。この傾向は今後 10 年間でさらに加速し、ゲノミクス情報の利用が臨床上の意思決定支援や医療提供の中心となっていくでしょう。 疾病のゲノム フィンガープリントを解読し、進行や治療効果の個人差を予測し、臨床上の意思決定支援のためのモデルを開発するためには、集団レベルでのゲノム シーケンシングが必要となります。その結果、ゲノミクス データと解析に必要なコンピューティング能力が爆発的に増加し (今後 5 年間で数十エクサバイト、数兆コア時間1)、アジリティ、容易な管理、データ セキュリティ、スケーラブルなストレージとコンピューティング容量へのアクセスが必要となります。 クラウドベースのソリューションへの需要は明らかです。データのアクセス性、ツールの相互運用性、結果やモデルの信頼性を実現するためには、コミュニティ主導の標準やオープンソースのツールが必要であることがますます認識されています。Microsoft はオープン標準やオープンソース プロジェクトをサポートするだけでなく、これらのツールやソフトウェアを Azure 上で簡単に使用できるようにすることで、このコミュニティ主導の取り組みに積極的に貢献しています。 それに向けて、Microsoft Genomics は、Cromwell on Azure、Genomics Notebooks、Bioconductor support for Azure などのオープンソース プロジェクトを GitHub でリリースしました。また、Azure Open Dataset プラットフォームでは、ゲノミクスのパブリック データセットが次々と公開されています。 Cromwell による Azure 上でのゲノミクス ワークフローのスケーリングと自動化 Cromwell は、当初 Broad Institute が開発した科学向けワークフローに特化した、オープンソースのワークフロー管理システムです。Cromwell on