Data Lake

Data Lake bez omezení k zajištění chytrých akcí

Azure Data Lake obsahuje všechny funkce potřebné k tomu, aby mohli vývojáři, odborníci na zpracování dat a analytici snadněji ukládat data libovolné velikosti, v libovolném formátu a při libovolné rychlosti a všemi možnými způsoby je zpracovávat a analyzovat napříč platformami a jazyky. Zjednodušuje složité procesy přijímání a ukládání všech vašich dat a zároveň zrychluje zprovoznění analýz dávek, streamování a interaktivních analýz. Azure Data Lake využívá vaše současné investice do IT v oblasti identit, správy a zabezpečení pro jednodušší správu a řízení dat. Taky se bez problémů integruje s provozními úložišti a datovými sklady, což umožňuje rozšířit aktuální datové aplikace. Stavíme na našich zkušenostech ze spolupráce s podnikovými zákazníky a zkušenostech se spouštěním procesů zpracování a analýz, které patří k těm nejrozsáhlejším na světě, pro služby od Microsoftu jako jsou Office 365, Xbox Live, Azure, Windows, Bing nebo Skype. Azure Data Lake řeší celou řadu výzev v oblasti produktivity a škálovatelnosti, které brání maximalizaci hodnoty vašich datových prostředků, a to pomocí služby, která je připravená vyhovět vašim současným i budoucím obchodním potřebám.

Přehled najdete v tomto krátkém videu.

Data Lake Analytics – služba analytických úloh bez omezení k zajištění chytrých akcí

První cloudová analytická služba, ve které můžete snadno vyvíjet a spouštět programy v jazycích U-SQL, R, Python a .NET pro zpracování a transformaci rozsáhlých paralelních dat, a to nad petabajty dat. Protože nemusíte spravovat žádnou infrastrukturu, zpracovávejte data na vyžádání, okamžitě škálujte a plaťte pouze podle počtu úloh. Další informace

HDInsight – cloudová služba Apache Spark a Hadoop® pro podniky

HDInsight je jediná plně spravovaná cloudová nabídka Hadoopu, která poskytuje pro Spark, Hive, Map Reduce, HBase, Storm, Kafku a R Server opensourcové analytické clustery s 99,9% dostupností, kterou zajišťuje smlouva SLA. Každou z těchto technologií pro velké objemy dat, stejně jako aplikace nezávislých výrobců softwaru, je možné jednoduše nasadit jako spravovaný cluster se zabezpečením a monitorováním na podnikové úrovni. Další informace

Data Lake Store – datové jezero bez omezení, které zajišťuje analýzy velkých objemů dat

První cloudové datové jezero pro podniky, které je bezpečné, rozsáhle škálovatelné a vytvořené v souladu s otevřeným standardem HDFS. Díky neomezené velikosti dat a schopnosti spouštět výkonné paralelní analýzy nyní můžete získat maximum ze svých nestrukturovaných, částečně strukturovaných a strukturovaných dat. Další informace

Snadný vývoj, ladění a optimalizace programů pro velké objemy dat

Nalezení těch správných nástrojů pro návrh a ladění dotazů na velké objemy dat může být obtížné. Data Lake to zjednodušuje díky těsné integraci se sadou Visual Studio, Eclipse a IntelliJ, která umožňuje používat ke spouštění a ladění kódu nástroje, které důvěrně znáte. Vizualizace úloh U-SQL, Apache Sparku, Apache Hivu a Apache Stormu vám umožňují získat přehled o tom, jak váš kód poběží při různém škálování, a identifikovat kritické body výkonu a možnosti optimalizace nákladů. To vám usnadní vyladění vašich dotazů. Naše spouštěcí prostředí aktivně za běhu analyzuje vaše programy a nabízí doporučení, díky kterým můžete zvýšit výkon a snížit náklady. Datoví architekti, správci databází a technici specializující se na data můžou využít svoje stávající znalosti nástrojů, jako jsou SQL, Apache Hadoop, Apache Spark, R, Python, Java nebo .NET, a být tak produktivní už od prvního dne.

Bez problémů se integruje s vašimi stávajícími investicemi do IT.

Mezi největší výzvy při práci s velkými objemy dat patří integrace s existujícími investicemi do IT. Data Lake je klíčovou součástí Cortana Intelligence, což znamená, že pracuje s Azure SQL Data Warehouse, Power BI a Data Factory na zajištění úplné cloudové platformy pro velké objemy dat a pokročilé analýzy, která vám pomůže se vším od přípravy dat až po provádění interaktivních analýz rozsáhlých datových sad. Data Lake Analytics vám dává možnost jednat na základě všech vašich dat pomocí optimalizované virtualizace dat z relačních zdrojů, jako jsou Azure SQL Server na virtuálních počítačích, Azure SQL Database a Azure SQL Data Warehouse. Dotazy se automaticky optimalizují přesunutím zpracování blíže ke zdrojovým datům bez pohybu samotných dat, čímž se maximalizuje výkon a minimalizuje latence. A protože je Data Lake v Azure, můžete se připojit k libovolným datům vygenerovaným aplikacemi nebo přijatým zařízeními ve scénářích IoT (Internet of Things).

Ukládání a analýza petabajtových velikostí souborů a trilionů objektů

Data Lake je od základu navržené pro škálování a výkon cloudu. Pomocí Azure Data Lake Store může vaše organizace analyzovat veškerá svá data na jednom místě bez umělých omezení. Vaše služba Data Lake Store může uchovávat triliony souborů a velikost jednotlivých souborů může být větší než petabajt, což je 200krát více než u ostatních cloudových úložišť. Díky tomu nemusíte přepisovat kód při každém zvýšení nebo snížení objemu uložených dat nebo množství prováděných výpočtů. To vám umožní zaměřit se jenom na obchodní logiku místo toho, abyste se zabývali způsobem zpracování a ukládání velkých datových sad. Data Lake taky zjednodušuje složité postupy obvykle spojované s velkými objemy dat v cloudu a zaručuje, že dokáže vyhovět vašim současným i budoucím obchodním potřebám.

Dostupné a cenově výhodné řešení

Data Lake je nákladově efektivní řešení pro spouštění úloh s velkými objemy dat. Při zpracování dat si můžete zvolit mezi clustery na vyžádání a modelem účtování poplatků za úlohu. Ani v jednom z těchto dvou případů se nevyžaduje smlouva o podpoře na určitý hardware, licenci nebo službu. Systém jde škálovat směrem nahoru i dolů podle potřeb vaší firmy, takže nikdy neplatíte za nic, co nepotřebujete. Umožňuje taky škálovat nezávisle úložiště a objem výpočtů, takže je ekonomicky flexibilnější než tradiční řešení pro velké objemy dat. A konečně minimalizuje potřebu najímat týmy specializované na určité operace typicky spojované se spouštěním infrastruktury velkých objemů dat. Data Lake minimalizuje náklady a maximalizuje návratnost investic do dat. Nedávná studie ukázala, že služba HDInsight v průběhu pěti let umožnila snížení celkových nákladů na vlastnictví o 63 % oproti místnímu nasazení Hadoopu.

Zabezpečení, auditování a podpora na podnikové úrovni

Microsoft službu Data Lake plně spravuje a podporuje. Služba Data Lake je zajištěná smlouvou SLA podnikové úrovně a podporou. Díky nepřetržité zákaznické podpoře nás můžete kontaktovat s libovolnými problémy, se kterými se setkáte kdekoli v rámci celého řešení pro velké objemy dat. Náš tým sleduje vaše nasazení, takže se o ně nemusíte starat, a zajišťuje jeho nepřetržitý provoz. Data Lake snadno chrání vaše datové prostředky a rozšiřuje místní zabezpečení a kontrolu zásad správného řízení do cloudu. Data jsou vždy šifrována – přenášená data pomocí protokolu SSL, neaktivní uložená data pomocí službou nebo uživatelem spravovaných klíčů HSM v Azure Key Vault. Možnosti, jako jsou jednotné přihlašování (SSO), vícefaktorové ověřování a bezproblémová správa milionů identit, jsou integrované prostřednictvím Azure Active Directory. Můžete ověřovat uživatele a skupiny pomocí propracovaných seznamů ACL založených na POSIX pro veškerá data ve službě Store a zajistit tak řízení přístupu založené na rolích. A konečně, dokážete splnit požadavky na dodržování bezpečnostních a legislativních předpisů díky auditování všech přístupů k systému a změn konfigurace systému.

Tvorba řešení Data Lake pomocí těchto výkonných nástrojů

HDInsight

Zřízení cloudových clusterů Hadoop, Spark, R Server, HBase a Storm

Data Lake Analytics

Distribuovaná služba analýzy usnadňující zpracování velkých objemů dat

Azure Data Lake Storage

Zabezpečené funkce Data Lake s rozsáhlou škálovatelností založené na službě Azure Blob Storage

Apache Hadoop® a přidružené názvy projektů open source jsou ochranné známky nadace Apache Software Foundation.