ソリューションのアイデア
このアーティクルはソリューションのアイデアです。 このコンテンツにさらに多くの情報 (想定されるユース ケース、代替サービス、実装に関する考慮事項、価格ガイダンスなど) の掲載をご希望の方は、GitHub のフィードバックでお知らせください。
このアーキテクチャを使用すると、任意のスケールの任意のデータをカスタム機械学習と結合し、ストリーミング サービスでほぼリアルタイムの Data Analytics を入手できます。
アーキテクチャ
このアーキテクチャの Visio ファイルをダウンロードします。
データフロー
- Synapse パイプラインを使用して、構造化データ、非構造化データ、半構造化データ (ログ、ファイル、メディア) をすべて結合し、Azure Data Lake Storage に格納します。
- Apache Spark プールを使用すると、構造化されていないデータ セットをクリーニングおよび変換し、運用データベースまたはデータ ウェアハウスの構造化データと組み合わせることができます。
- スケーラブルな機械学習またはディープ ラーニング手法を使用して、Apache Spark プールのノートブック エクスペリエンスで、Python、Scala、または .NET を使用してこのデータから詳細な分析情報を導き出します。
- Azure Synapse Analytics の Apache Spark プールと Synapse パイプラインを活用すると、大規模なデータにアクセスし、それらを移動できます。
- Power BI のデータに対してクエリを実行し、報告します。
- Apache Spark プールから Azure Cosmos DB に分析情報を取り込み、Web とモバイルの各アプリからアクセスできるようにします。
ワークフロー
- Azure Synapse Analytics は、高速で柔軟性のある、信頼性の高いクラウド データ ウェアハウスです。これにより、超並列処理アーキテクチャを使用して、弾力的かつ個別にスケーリング、計算、格納を行うことができます。
- Synapse パイプラインのドキュメントを使用すると、ETL または ELT ワークフローを作成、スケジュール、調整できます。
- Azure Blob Storage は、あらゆる種類の非構造化データ (画像、ビデオ、音声、ドキュメントなど) を簡単かつコスト効果よく保存できる非常にスケーラブルなオブジェクト ストレージです。
- Azure Synapse Analytics Spark プールは、高速で使いやすい、コラボレーション対応の Apache Spark ベースの分析プラットフォームです。
- Azure Cosmos DB は、グローバル分散型のマルチモデル データベース サービスです。 任意の数の Azure リージョンとの間でデータをレプリケートし、ストレージから独立してスループットをスケーリングする方法について学習します。
- Azure Synapse Link for Azure Cosmos DB を使用すると、Azure Synapse ワークスペースから利用できる SQL Serverless および Spark Pools の 2 つの分析エンジンを使用して、トランザクション ワークロードにパフォーマンスまたはコストの影響を与えることなく、Azure Cosmos DB のオペレーショナル データに対して凖リアルタイムの分析を実行できます。
- Azure Analysis Services は、サービスとしてのエンタープライズ グレードの分析です。これにより、BI ソリューションを自信を持って管理、デプロイ、テスト、配信できます。
- Power BI は、組織全体に分析情報を提供できるビジネス分析ツール スイートです。 数百のデータ ソースに接続でき、データの準備が簡素化され、計画外の分析が促進されます。 優れたレポートを生成し、組織に公開して、Web やモバイル デバイスで使用できます。
代替
- Synapse Link は、Azure Cosmos DB データに対して分析を行うための Microsoft の推奨ソリューションです。
シナリオの詳細
クラス最高レベルの機械学習ツールを使用して、データを実用的な分析情報に変換できます。 このソリューションを使うと、あらゆるデータを任意のスケールで結合し、カスタムの機械学習モデルを大規模に構築してデプロイすることができます。 エンタープライズ規模のデータ プラットフォームをエンタープライズ ランディング ゾーンの一部として設計する方法については、クラウド導入フレームワークのデータ ランディング ゾーンのドキュメントを参照してください。
考えられるユース ケース
組織は、これまで以上に多くのデータにアクセスできます。 高度な分析は、データの分析情報を活用するのに役立ちます。 領域には次のものが含まれます。
- カスタマー サービス。
- 予測メンテナンス。
- 製品またはサービスの推奨。
- サプライ チェーンからデータ センター運用まで、あらゆるもののシステム最適化。
- 製品とサービスの開発。
考慮事項
コスト最適化
コストの最適化とは、不要な費用を削減し、運用効率を向上させる方法を検討することです。 詳しくは、コスト最適化の柱の概要に関する記事をご覧ください。
次のステップ
- エンタープライズ規模のデータ プラットフォーム設計について確認する
- エンド ツー エンドのデータ分析プラットフォームを設計してデプロイする方法について確認する
このアーキテクチャで紹介されているサービスについては、次のドキュメントを参照してください。
- Synapse Analytics のドキュメント
- Synapse パイプラインのドキュメント
- Azure のオブジェクト ストレージの概要
- Azure Synapse Analytics Spark プール
- Azure Cosmos DB のドキュメント
- Analysis Services のドキュメント
- Power BI のドキュメント