Trace Id is missing
跳至主要內容

Data Lake

支援智慧行動的無限制資料湖。

  • 儲存並分析 PB 大小的檔案和數兆個物件
  • 輕鬆對您的巨量資料程式偵錯並進行最佳化
  • 幾秒內開始進行、立即調整規模並按工作付費
  • 簡單開發大規模進行平行處理的程式
  • 企業級安全性、稽核與支援
  • 以 YARN 為建置基礎,專為雲端所設計

Azure Data Lake 包含開發人員、資料科學家和分析師需要的所有功能,可輕鬆儲存任何大小、圖形與速率的資料,以及跨各平台和語言進行所有類型的處理和分析。這項服務移除了內嵌和儲存所有資料所帶來的複雜性,同時可加速啟動並執行批次、串流與互動式分析。Azure Data Lake 可與現有 IT 投資搭配使用,以便進行身分識別、管理和安全性維護,讓管理和控管資料更加簡單。這也會與作業存放區和資料倉儲無縫整合,讓您能夠擴充目前的資料應用程式。我們把與企業客戶合作及處理並分析全球巨大規模資料的經驗運用於 Microsoft 業務,像是 Office 365、Xbox Live、Azure、Windows、Bing 和 Skype。Azure Data Lake 解決了許多生產力和可擴縮性的相關問題,可讓您最大化資料資產價值,且此服務能符合您目前的商務需求,也能滿足您未來的需要。

Azure Data Lake 包含開發人員、資料科學家和分析師需要的所有功能,可輕鬆儲存任何大小、圖形與速率的資料,以及跨各平台和語言進行所有類型的處理和分析。這項服務移除了內嵌和儲存所有資料所帶來的複雜性,同時可加速啟動並執行批次、串流與互動式分析。Azure Data Lake 可與現有 IT 投資搭配使用,以便進行身分識別、管理和安全性維護,讓管理和控管資料更加簡單。這也會與作業存放區和資料倉儲無縫整合,讓您能夠擴充目前的資料應用程式。我們把與企業客戶合作及處理並分析全球巨大規模資料的經驗運用於 Microsoft 業務,像是 Office 365、Xbox Live、Azure、Windows、Bing 和 Skype。Azure Data Lake 解決了許多生產力和可擴縮性的相關問題,可讓您最大化資料資產價值,且此服務能符合您目前的商務需求,也能滿足您未來的需要。

資料湖圖表

Data Lake Analytics:支援智慧行動的無限制分析工作服務

這是前所未有的雲端分析服務,可讓您以 U-SQL、R、Python 和 .Net 輕鬆開發並執行大規模平行轉換和處理資料的程式,用以處理 PB 規模的資料。您無需管理基礎結構,且可以視需要處理資料、立即調整規模,並只按工作付費。 深入了解

《設計分散式系統》的書封

HDInsight:適用於企業的雲端 Apache Spark 和 Hadoop® 服務

HDInsight 是唯一完全受控的雲端 Hadoop 產品,為 Spark、Hive、Map Reduce、HBase、Storm、Kafka 和 R 伺服器提供最佳化開放原始碼分析叢集,並提供 99.9% SLA 的支援。每個巨量資料技術和 ISV 應用程式都可輕鬆部署為受控叢集,以提供企業級的安全性和監控功能。 深入了解

Data Lake Store:支援巨量資料分析的無限制資料湖

這是適用於企業的第一個雲端資料湖,既安全又可大規模調整,且符合開放 HDFS 標準。這項服務不限制資料大小,並具有執行大規模平行處理分析的能力,讓您現在可以充分發揮所有非結構化、半結構化和結構化資料中的價值。 深入了解

輕鬆開發巨量資料程式、對其偵錯並進行最佳化

找到適合的工具來設計和調整您的巨量資料查詢,並非一件容易的事。Data Lake 與 Visual Studio、Eclipse 和 IntelliJ 的深度整合,不僅讓這件事變得輕鬆簡單,而您也可使用熟悉的工具執行、診斷和調整您的程式碼。將 U-SQL、Apache Spark、Apache Hive 與 Apache Storm 等工作以視覺化呈現,能讓您了解程式碼在大規模執行時的狀況,從而找出效能瓶頸與最佳成本效益,方便您調整查詢。我們的執行環境會在您的程式執行時主動加以分析,並提供建議以提升效能與降低成本。資料工程師、資料庫管理員 (DBA) 和資料架構師可以使用現有技能 (例如 SQL、Apache Hadoop、Apache Spark、R、Python、Java 與 .NET),在一開始就能發揮極大的生產力。

與您現有的 IT 投資無縫整合

巨量資料的最大挑戰之一,就是如何與現有的 IT 投資互相整合。Data Lake 是 Cortana Intelligence 的關鍵部分,代表它會與 Azure Synapse Analytics、Power BI 和 Data Factory 搭配運作,以提供完整的雲端巨量資料與進階分析平台,從準備資料到執行大規模資料集的互動式分析都能助您一臂之力。Data Lake Analytics 可讓您使用虛擬機器上的 Azure SQL Server、Azure SQL Database 和 Azure Synapse Analytics 等關聯式來源的最佳化資料虛擬化,以處理所有資料。查詢會自動最佳化,做法是將處理程序移到來源資料附近而不移動資料,藉此提升效能並降低延遲。最後,因為 Data Lake 屬於 Azure,所以您可以連接到任何由應用程式產生的資料,或在物聯網 (IoT) 情境中由裝置嵌入的資料。

儲存並分析 PB 大小的檔案和數兆個物件

Data Lake 專為雲端規模和效能進行架構。透過 Azure Data Lake Store,貴組織可以在單一位置分析所有資料,而不會有任何人為限制。您的 Data Lake Store 可以儲存數兆個檔案,其中單一檔案的大小可大於 1 PB,這比其他雲端存放區大了 200 倍。這表示當您儲存的資料量有所增減,或是運算量微往上調時,也無需重新編寫程式碼。這樣您就可以將心力全數投入在商務邏輯,而無需分神在處理與儲存大型資料集的方式上。除此之外,Data Lake 也消弭了一些雲端巨量資料常會出現的複雜問題,確保其不僅符合您目前的商務需求,也能滿足您未來的需要。

經濟實惠並符合成本效益

Data Lake 可用來執行巨量資料工作負載,這是符合成本效益的解決方案。在處理資料方面,您可以選擇隨選叢集或是依每次工作付費的模式。這兩種方式皆無需您簽訂任何硬體、授權或服務相關的支援合約。系統可相應擴張或縮減來符合您的商務需求,讓您無需為不必要的事物支付費用。此方式同時可讓您個別調整儲存體與運算的規模,比傳統巨量資料解決方案更具有經濟彈性。不僅如此,這還能將招聘專業作業小組 (通常與執行巨量資料基礎結構相關) 的需求降至最低。Data Lake 可以最小化您的成本花費,並最大化您的資料投資報酬率。最近的研究顯示,在過去五年內,HDInsight 產生的 TCO 比在內部部署 Hadoop 所產生的 TCO 低了 63%。

企業級安全性、稽核與支援

Data Lake 是完全受控的服務,且由 Microsoft 支援,並擁有企業級的 SLA 和支援做為後盾。全天候的客戶支援服務讓您可以隨時與我們連絡,協助您解決整個巨量資料解決方案所帶來的挑戰。我們的小組會負責監控您的部署,以確保部署過程不會中斷。Data Lake 會保護您的資料資產,並可輕鬆將您的內部部署安全性和管理控制擴充到雲端。資料會一律加密;在運行時使用 SSL,而在待用時則使用 Azure Key Vault 中受服務或使用者管理的 HSM 型金鑰。透過 Azure Active Directory,使用內建單一登入 (SSO)、多重要素驗證和流暢管理數百萬個身分識別等功能。您可以針對 Store 中所有資料啟用角色型存取控制,將細微的 POSIX 型 ACL 授權給使用者和群組。最後,您可以稽核每個存取權或系統的組態變更,以符合安全性和法規合規性需求。

使用這些強大的解決方案來建置 Data Lake 解決方案

HDInsight

佈建雲端 Hadoop、Spark、R 伺服器、HBase 和 Storm 叢集。

Data Lake Analytics

可輕鬆處理巨量資料的分散式分析服務。

Azure Data Lake Storage

適用於高效能分析的安全可調整資料湖。

Apache Hadoop® 與相關聯的開放原始碼專案名稱,皆為 Apache Software Foundation 的商標。