Co je Azure Data Lake Storage Gen1?

Poznámka

Azure Data Lake Storage Gen1 je teď vyřazený. Podívejte se na oznámení o vyřazení z provozu tady. Data Lake Storage Gen1 prostředky už nejsou přístupné. Pokud potřebujete zvláštní pomoc, kontaktujte nás.

Azure Data Lake Storage Gen1 je podnikové úložiště s hyperškálem pro analytické úlohy s velkými objemy dat. Azure Data Lake umožňuje zaznamenávat data libovolné velikosti, typu a rychlosti příjmu do jediného místa pro účely provozní a zjišťovací analýzy.

Data Lake Storage Gen1 je možné získat přístup z Hadoopu (k dispozici s clusterem HDInsight) pomocí rozhraní REST API kompatibilních s WebHDFS. Je navržená tak, aby umožňovala analýzu uložených dat, a je vyladěná na výkon pro scénáře analýzy dat. Data Lake Storage Gen1 zahrnuje všechny možnosti na podnikové úrovni: zabezpečení, možnosti správy, škálovatelnost, spolehlivost a dostupnost.

Azure Data Lake

Klíčové funkce

Mezi klíčové funkce Data Lake Storage Gen1 patří následující:

Sestaveno pro Hadoop

Data Lake Storage Gen1 je systém souborů Apache Hadoop, který je kompatibilní se systémem souborů HDFS (Hadoop Distributed File System) a funguje s ekosystémem Hadoop. Vaše stávající aplikace nebo služby HDInsight, které používají rozhraní API WebHDFS, se můžou snadno integrovat s Data Lake Storage Gen1. Data Lake Storage Gen1 také zpřístupňuje rozhraní REST kompatibilní s WebHDFS pro aplikace.

Data uložená v Data Lake Storage Gen1 můžete snadno analyzovat pomocí analytických architektur Hadoop, jako je MapReduce nebo Hive. Clustery Azure HDInsight můžete zřídit a nakonfigurovat pro přímý přístup k datům uloženým v Data Lake Storage Gen1.

Neomezené úložiště, petabajtové soubory

Data Lake Storage Gen1 poskytuje neomezené úložiště a může ukládat různá data pro účely analýzy. Neukládá žádná omezení velikosti účtů, velikostí souborů ani objemu dat, která se dají uložit v datovém jezeře. Velikost jednotlivých souborů může být v rozsahu od kilobajtů až po petabajty. Data jsou trvale uložena vytvářením více kopií. Doba, po kterou mohou být data uložená v datovém jezeře, není nijak omezena.

Optimalizace výkonu pro analýzu velkých objemů dat

Data Lake Storage Gen1 je vytvořená pro provozování rozsáhlých analytických systémů, které vyžadují obrovskou propustnost pro dotazování a analýzu velkých objemů dat. Úložiště Data Lake rozděluje části souborů do několika jednotlivých serverů úložiště. Tím se zvyšuje propustnost čtení při paralelním čtení souboru pro provádění analýz dat.

Připravenost pro podniky: Vysoce dostupná a zabezpečená

Data Lake Storage Gen1 poskytuje standardní dostupnost a spolehlivost. Vaše datové prostředky se ukládají odolným způsobem díky vytváření redundantních kopií, které chrání před neočekávaným selháním.

Data Lake Storage Gen1 také poskytuje zabezpečení uložených dat na podnikové úrovni. Další informace najdete v tématu Zabezpečení dat v Azure Data Lake Storage Gen1.

Všechna data

Data Lake Storage Gen1 mohou ukládat jakákoli data ve svém nativním formátu, aniž by bylo nutné provádět předchozí transformace. Data Lake Storage Gen1 nevyžaduje, aby před načtením dat bylo definováno schéma, takže je na individuálním analytickém rozhraní, které bude interpretovat data a definovat schéma v době analýzy. Možnost ukládat soubory libovolných velikostí a formátů umožňuje Data Lake Storage Gen1 zpracovávat strukturovaná, částečně strukturovaná a nestrukturovaná data.

Data Lake Storage Gen1 kontejnery pro data jsou v podstatě složky a soubory. S uloženými daty pracujete pomocí sad SDK, Azure Portal a Azure PowerShell. Pokud vložíte data do úložiště pomocí těchto rozhraní a odpovídajících kontejnerů, můžete uložit libovolný typ dat. Data Lake Storage Gen1 neprovádí žádné zvláštní zpracování dat na základě typu uložených dat.

Zabezpečení dat

Data Lake Storage Gen1 používá k ověřování Microsoft Entra ID a seznamy řízení přístupu (ACL) ke správě přístupu k vašim datům.

Funkce Popis
Authentication Data Lake Storage Gen1 se integruje s Microsoft Entra ID pro správu identit a přístupu pro všechna data uložená v Data Lake Storage Gen1. Díky integraci Data Lake Storage Gen1 výhod všech funkcí Microsoft Entra, jako je vícefaktorové ověřování, podmíněný přístup, řízení přístupu na základě role v Azure, monitorování využití aplikací, monitorování zabezpečení a upozorňování atd. Data Lake Storage Gen1 podporuje protokol OAuth 2.0 pro ověřování v rámci rozhraní REST. Viz Data Lake Storage Gen1 ověřování.
Řízení přístupu Data Lake Storage Gen1 poskytuje řízení přístupu podporou oprávnění ve stylu POSIX vystavených protokolem WebHDFS. Seznamy ACL můžete povolit v kořenové složce, v podsložkách a v jednotlivých souborech. Další informace o tom, jak seznamy ACL fungují v kontextu Data Lake Storage Gen1, najdete v tématu Řízení přístupu v Data Lake Storage Gen1.
Šifrování Data Lake Storage Gen1 také poskytuje šifrování dat uložených v účtu. Nastavení šifrování zadáte při vytváření účtu Data Lake Storage Gen1. Můžete se rozhodnout, jestli chcete data šifrovat, nebo se rozhodnout pro žádné šifrování. Další informace najdete v tématu Šifrování v Data Lake Storage Gen1. Pokyny k poskytnutí konfigurace související s šifrováním najdete v tématu Začínáme s Data Lake Storage Gen1 používáním Azure Portal.

Pokyny k zabezpečení dat v Data Lake Storage Gen1 najdete v tématu Zabezpečení dat v Azure Data Lake Storage Gen1.

Kompatibilita aplikací

Data Lake Storage Gen1 je kompatibilní s většinou opensourcových komponent v ekosystému Hadoop. Také se dobře integruje s dalšími službami Azure. Další informace o tom, jak používat Data Lake Storage Gen1 s opensourcovými komponentami a dalšími službami Azure, najdete na následujících odkazech:

Data Lake Storage Gen1 systému souborů

Data Lake Storage Gen1 je možné získat přístup prostřednictvím systému souborů AzureDataLakeFilesystem (adl://) v prostředích Hadoop (k dispozici v clusteru HDInsight). Aplikace a služby, které používají adl://, můžou využívat další optimalizace výkonu, které v současnosti nejsou v systému WebHDFS dostupné. Díky tomu vám Data Lake Storage Gen1 poskytuje flexibilitu, abyste mohli buď využít nejlepšího výkonu s doporučenou možností použití adl://, nebo zachovat stávající kód tím, že budete pokračovat v přímém používání rozhraní API WebHDFS. Azure HDInsight plně využívá systém AzureDataLakeFilesystem k zajištění nejlepšího výkonu při Data Lake Storage Gen1.

K datům v Data Lake Storage Gen1 můžete přistupovat pomocí .adl://<data_lake_storage_gen1_name>.azuredatalakestore.net Další informace o tom, jak získat přístup k datům v Data Lake Storage Gen1, najdete v tématu Zobrazení vlastností uložených dat.

Další kroky