Mi az az 1. generációs Azure Data Lake Storage?

Megjegyzés

Azure Data Lake Storage Gen1 ki lett vonva. A nyugdíjba vonulási bejelentést itt találja. Data Lake Storage Gen1 erőforrások már nem érhetők el. Ha különleges segítségre van szüksége, kérjük, vegye fel velünk a kapcsolatot.

Azure Data Lake Storage Gen1 egy nagyvállalati szintű, nagyvállalati szintű hiperskálázási adattár big data elemzési számítási feladatokhoz. Az Azure Data Lake lehetővé teszi mindenféle méretű, típusú és feldolgozási sebességű adatok egy helyen történő műveleti és felderítési jellegű feldolgozását.

Data Lake Storage Gen1 a Hadoopból (amely a HDInsight-fürttel érhető el) a WebHDFS-kompatibilis REST API-k használatával érhető el. Úgy tervezték, hogy lehetővé tegye a tárolt adatok elemzését, és az adatelemzési forgatókönyvek teljesítményének megfelelően van hangolva. Data Lake Storage Gen1 minden nagyvállalati szintű képességet magában foglal: biztonságot, kezelhetőséget, méretezhetőséget, megbízhatóságot és rendelkezésre állást.

Azure Data Lake

Főbb képességek

A Data Lake Storage Gen1 fő képességei közé tartoznak a következők.

Hadoop-kompatibilis

Data Lake Storage Gen1 egy Apache Hadoop fájlrendszer, amely kompatibilis a Hadoop elosztott fájlrendszerrel (HDFS), és együttműködik a Hadoop ökoszisztémájával. A WebHDFS API-t használó meglévő HDInsight-alkalmazások vagy -szolgáltatások egyszerűen integrálhatók Data Lake Storage Gen1. Data Lake Storage Gen1 egy WebHDFS-kompatibilis REST-felületet is elérhetővé tesz az alkalmazások számára.

A Data Lake Storage Gen1 tárolt adatokat egyszerűen elemezheti Hadoop-elemzési keretrendszerek, például a MapReduce vagy a Hive használatával. Azure HDInsight-fürtöket építhet ki, és konfigurálhatja őket a Data Lake Storage Gen1 tárolt adatok közvetlen elérésére.

Korlátlan tárterület, petabájtnyi fájlok

Data Lake Storage Gen1 korlátlan tárterületet biztosít, és számos adatot tárolhat elemzés céljából. Nem szab korlátozásokat a fiókméretekre, a fájlméretekre és a data lake-ben tárolható adatok mennyiségére. Az egyes fájlok mérete kilobájttól petabájtig terjedhet. Az adatok tárolása tartósan történik több másolat készítésével. Az adatok a data lake-ben való tárolásának időtartama nincs korlátozva.

A teljesítmény a big data koncepción alapuló adatelemzéshez lett igazítva

Data Lake Storage Gen1 olyan nagy méretű elemzési rendszerek futtatására készült, amelyek nagy átviteli sebességet igényelnek nagy mennyiségű adat lekérdezéséhez és elemzéséhez. A data lake több egyéni tárolókiszolgáló között osztja el egy fájl részeit. Ez javítja az olvasás átviteli sebességét a fájl adatelemzés céljából történő párhuzamos beolvasásakor.

Vállalati használatra kész: Magas rendelkezésre állású és biztonságos

Data Lake Storage Gen1 iparági szabványoknak megfelelő rendelkezésre állást és megbízhatóságot biztosít. Adatvagyonának tartós tárolását a redundáns másolatok teszik lehetővé, amelyek védelmet biztosítanak a váratlan meghibásodások esetén.

Data Lake Storage Gen1 vállalati szintű biztonságot is nyújt a tárolt adatokhoz. További információ: Adatok védelme Azure Data Lake Storage Gen1-ben.

Minden adat

Data Lake Storage Gen1 bármilyen adatot tárolhat natív formátumban, előzetes átalakítások nélkül. Data Lake Storage Gen1 nem szükséges sémát definiálni az adatok betöltése előtt, az egyes elemzési keretrendszerre hagyva azokat az adatok értelmezéséhez és a séma meghatározásához az elemzés időpontjában. A tetszőleges méretű és formátumú fájlok tárolásának lehetősége lehetővé teszi a Data Lake Storage Gen1 számára a strukturált, részben strukturált és strukturálatlan adatok kezelését.

Data Lake Storage Gen1 adatok tárolói lényegében mappák és fájlok. A tárolt adatokon SDK-kkal, a Azure Portal és Azure PowerShell kell dolgoznia. Ha ezeket a felületeket és a megfelelő tárolókat használva helyezi az adatokat a tárolóba, bármilyen típusú adatot tárolhat. Data Lake Storage Gen1 nem végez különleges adatkezelést az általa tárolt adatok típusa alapján.

Adatok védelme

Data Lake Storage Gen1 Microsoft Entra ID használ a hitelesítéshez, valamint hozzáférés-vezérlési listákat (ACL-eket) az adatokhoz való hozzáférés kezeléséhez.

Szolgáltatás Leírás
Hitelesítés Data Lake Storage Gen1 integrálható a Microsoft Entra ID a Data Lake Storage Gen1 tárolt összes adat identitás- és hozzáférés-kezelési szolgáltatásával. Az integrációnak köszönhetően Data Lake Storage Gen1 minden olyan Microsoft Entra funkció előnyeit élvezheti, mint a többtényezős hitelesítés, a feltételes hozzáférés, az Azure szerepköralapú hozzáférés-vezérlése, az alkalmazáshasználat monitorozása, a biztonsági figyelés és a riasztások stb. Data Lake Storage Gen1 támogatja az OAuth 2.0 protokollt a REST-felületen belüli hitelesítéshez. Lásd: Data Lake Storage Gen1 hitelesítés.
Hozzáférés-vezérlés Data Lake Storage Gen1 hozzáférés-vezérlést biztosít a WebHDFS protokoll által közzétett POSIX-stílusú engedélyek támogatásával. Engedélyezheti az ACL-eket a gyökérmappában, az almappákban és az egyes fájlokon. Az ACL-ek a Data Lake Storage Gen1 környezetében való működésével kapcsolatos további információkért lásd: Hozzáférés-vezérlés Data Lake Storage Gen1.
Titkosítás Data Lake Storage Gen1 a fiókban tárolt adatok titkosítását is biztosítja. A titkosítási beállításokat Data Lake Storage Gen1 fiók létrehozásakor kell megadnia. Dönthet úgy, hogy titkosítja az adatokat, vagy nem választja a titkosítást. További információ: Titkosítás Data Lake Storage Gen1. A titkosítással kapcsolatos konfiguráció megadására vonatkozó utasításokért lásd: Ismerkedés a Data Lake Storage Gen1 a Azure Portal használatával.

Az adatok Data Lake Storage Gen1 való védelmére vonatkozó utasításokért lásd: Adatok védelme Azure Data Lake Storage Gen1-ben.

Alkalmazáskompatibilitás

Data Lake Storage Gen1 kompatibilis a Hadoop-ökoszisztéma legtöbb nyílt forráskódú összetevőjével. Emellett jól integrálható más Azure-szolgáltatásokkal is. Ha többet szeretne megtudni arról, hogyan használhatja a Data Lake Storage Gen1 nyílt forráskódú összetevőkkel és más Azure-szolgáltatásokkal, használja az alábbi hivatkozásokat:

Data Lake Storage Gen1 fájlrendszer

Data Lake Storage Gen1 az AzureDataLakeFilesystem (adl://) fájlrendszeren keresztül érhető el Hadoop-környezetekben (HDInsight-fürttel érhető el). Az adl:// használó alkalmazások és szolgáltatások kihasználhatják a WebHDFS-ben jelenleg nem elérhető további teljesítményoptimalizálásokat. Ennek eredményeképpen a Data Lake Storage Gen1 rugalmasan kihasználhatja a legjobb teljesítményt a adl:// használatának ajánlott lehetőségével, vagy fenntarthatja a meglévő kódot, ha továbbra is közvetlenül használja a WebHDFS API-t. Az Azure HDInsight teljes mértékben kihasználja az AzureDataLakeFilesystem szolgáltatást, hogy a legjobb teljesítményt nyújtsa Data Lake Storage Gen1.

Az adatokat Data Lake Storage Gen1 a használatával adl://<data_lake_storage_gen1_name>.azuredatalakestore.netérheti el. Az adatok Data Lake Storage Gen1 való eléréséről további információt a Tárolt adatok tulajdonságainak megtekintése című témakörben talál.

Következő lépések