Data Lake

Een onbeperkte data lake van gegevens die de basis van intelligente actie vormt

Azure Data Lake biedt alle mogelijkheden die het voor ontwikkelaars en (gegevens)analisten gemakkelijk maken gegevens van elke omvang, vorm en met elke snelheid op te slaan, en om alle soorten verwerkingen uit te voeren op diverse platformen en in diverse talen. Data Lake elimineert de complicaties van het opnemen en opslaan van al uw gegevens terwijl u sneller aan de slag kunt met het uitvoeren van batchanalyses, streamanalyses en interactieve analyses. Azure Data Lake werkt met uw huidige IT-middelen voor identificatie, beheer en beveiliging om het beheer en bestuur van gegevens verder te vereenvoudigen. Azure Data Lake integreert ook probleemloos met de operationele stores en datawarehouses ter uitbreiding van uw huidige gegevenstoepassingen. We bouwen verder op onze ervaring van samenwerking met zakelijke klanten en onze ervaring met het uitvoeren van de omvangrijkste verwerkingen en analyses voor Microsoft-producten als Office 365, Xbox Live, Azure, Windows, Bing en Skype. Azure Data Lake vormt een oplossing voor veel van de problemen op het gebied van productiviteit en schaalbaarheid. Dit zijn de problemen die u ervan weerhouden de waarde van uw gegevensassets te maximaliseren met behulp van een service die tegemoetkomt aan uw huidige en toekomstige behoeften.

Bekijk deze korte video voor een overzicht

Data Lake Analytics: een onbeperkte service voor het uitvoeren van analysetaken, waardoor u slimme keuzen kunt maken

De eerste analyseservice in de cloud waarmee u op grote schaal gemakkelijk programma’s voor parallelle gegevenstransformatie en -verwerking kunt ontwikkelen en uitvoeren in U-SQL, R, Python en .Net. Daarvoor hoeft u geen infrastructuur te beheren. U kunt gegevens op aanvraag verwerken en direct schalen, en u betaalt gewoon per taak. Meer informatie

HDInsight: Apache Spark- en Hadoop®-cloudservice voor bedrijven

HDInsight is het enige volledig beheerde Cloud Hadoop-product met geoptimaliseerde clusters voor open source-analytics voor Spark, Hive, MapReduce, HBase, Storm, Kafka en R Server, ondersteund door een SLA van 99,9%. Elk van deze big data-technologieën evenals ISV-toepassingen zijn eenvoudig te implementeren als beheerde clusters met beveiliging en bewaking van bedrijfskwaliteit. Meer informatie

Data Lake Store: een onbeperkte data lake-oplossing die de basis vormt voor het uitvoeren van analyses op big data

De eerste veilige en uiterst schaalbare data lake-versie in de cloud voor bedrijven, die is ontwikkeld op basis van de open HDFS-standaard. Er gelden geen limieten voor de grootte van gegevens en evenmin voor de mogelijkheid om parallel aan elkaar zware analyses uit te voeren. U kunt nu het potentieel ontketenen van al uw ongestructureerde, semigestructureerde en gestructureerde gegevens. Meer informatie

Ontwikkel zonder problemen uw big data-programma's, spoor fouten op en zorg voor een optimale werking

Het vinden van de juiste hulpprogramma's voor het ontwerpen en afstemmen van uw big data-query's kan moeilijk zijn. Data Lake maakt dit gemakkelijk voor u door de hechte integratie met Visual Studio, Eclipse en IntelliJ zodat u vertrouwde hulpprogramma’s kunt gebruiken om uw code uit te voeren, fouten in code op te sporen en op te lossen en de code af te stemmen. Visualisaties van uw U-SQL-, Apache Spark-, Apache Hive- en Apache Storm-taken tonen u hoe uw code op schaal werkt, en laten zien waar zich knelpunten in de prestaties voordoen en waar kosten geoptimaliseerd kunnen worden, waardoor het gemakkelijker wordt om uw query's af te stemmen. In onze uitvoeringsomgeving worden uw programma’s actief geanalyseerd terwijl ze worden uitgevoerd, en u ontvangt aanbevelingen waarmee de prestaties kunnen worden verbeterd en de kosten verlaagd. Data-analisten, DBA's en gegevensarchitecten kunnen hun bestaande kennis van bijvoorbeeld SQL, Apache Hadoop, Apache Spark, R, Python, Java en .NET inzetten om vanaf dag een productief te zijn.

Integreert probleemloos met uw huidige IT-middelen

Een van de grote uitdagingen voor het werken met big data is de integratie met bestaande IT-middelen. Data Lake is een belangrijk onderdeel van Cortana Intelligence, wat inhoudt dat het werkt met Azure SQL Data Warehouse, Power BI en Data Factory voor een volledige big data-cloud en met een geavanceerd analyseplatform dat u helpt bij alles: van de voorbereiding van gegevens tot het uitvoeren van interactieve analyses op omvangrijke gegevenssets. Data Lake Analytics biedt u de mogelijkheid om actie te ondernemen op al uw gegevens, via de geoptimaliseerde virtualisatie van uw relationele resources, zoals Azure SQL Server op virtuele machines, Azure SQL Database en Azure SQL Data Warehouse. Query's worden automatisch geoptimaliseerd door de verwerking ervan dicht bij de brongegevens te laten plaatsvinden zonder dat er gegevens worden verplaatst. Hierdoor zijn de prestaties maximaal en is de latentie minimaal. Ten slotte, omdat Data Lake deel uitmaakt van Azure, kunt u een verbinding leggen met alle gegevens die door toepassingen zijn gegenereerd of die door apparaten in het kader van IoT-scenario's (Internet der dingen) zijn opgenomen.

Sla bestanden met een grootte van petabytes en triljoenen objecten op en voer er analyses op uit

Data Lake is vanaf de grond opgebouwd om tegemoet te komen aan schaal- en prestatievereisten op cloudniveau. Met Azure Data Lake Store kan uw bedrijf al uw gegevens op één plaats analyseren zonder dat er kunstmatig opgelegde beperkingen gelden. In uw Data Lake Store kunnen biljoenen bestanden worden opslagen, waarbij een enkel bestand groter kan zijn dan een petabyte, wat 200x keer groter is dan andere cloudopslagvoorzieningen. Dit betekent dat u geen code hoeft te herschrijven naarmate u de omvang van de opgeslagen gegevens vergroot of verkleint of de hoeveelheid rekenkracht opvoert. Zo kunt u zich helemaal concentreren op de bedrijfslogica en hoeft u zich niet bezig te houden met hoe u grote gegevenssets moet verwerken en opslaan. Data Lake elimineert ook de complicaties die doorgaans gepaard gaan met big data in de cloud, zodat altijd wordt voldaan aan de huidige en toekomstige behoeften van uw bedrijf.

Betaalbaar en voordelig

Data Lake is een voordelig geprijsde oplossing voor het verwerken van workloads met big data. U kunt kiezen tussen een model met on-demand clusters of u kunt per taak betalen nadat de gegevens zijn verwerkt. In beide gevallen hebt u geen hardware, licenties of servicespecifieke ondersteuningsovereenkomsten nodig. Er wordt omhoog of omlaag geschaald naarmate de behoeften van uw bedrijf veranderen, wat betekent dat u nooit voor meer betaalt dan u nodig hebt. U kunt er ook afzonderlijk de schaal van de opslag en de rekenkracht mee veranderen, waardoor u over meer economische flexibiliteit beschikt dan de traditionele big data-oplossingen hebben te bieden. En ten slotte wordt de noodzaak om gespecialiseerde uitvoerende teams die doorgaans verantwoordelijk zijn voor het beheer van een big data-infrastructuur, tot een minimum teruggebracht. Data Lake minimaliseert uw kosten en maximaliseert het rendement op uw investeringen in gegevens. Uit een recent onderzoek is gebleken dat met HDInsight over een periode van 5 jaar een 63% lagere TCO wordt gerealiseerd dan met het on-premises implementeren van Hadoop.

Beveiliging, controle en ondersteuning van bedrijfskwaliteit

Data Lake wordt volledig beheerd en ondersteund door Microsoft, met een SLA en ondersteuning van ondernemingsklasse. Als onderdeel van de 24/7-klantondersteuning kunt u contact met ons opnemen over elk probleem dat zich voordoet waar dan ook in uw big data-oplossing. Ons team houdt uw implementatie in de gaten zodat u dat niet hoeft te doen. Zo weet u zeker dat deze ononderbroken werkt. Met Data Lake beschermt u op een eenvoudige manier uw gegevensassets en breidt u het regelen van uw on-premises beveiliging en governance uit naar de cloud. Gegevens worden altijd versleuteld; in-motion met behulp van SSL en at-rest met behulp van door services of gebruikers beheerde HSM-sleutels in Azure Key Vault. Functies als eenmalige aanmelding (SSO), Multi-Factor Authentication en een naadloos beheer van miljoenen identiteiten zijn ingebouwd via Azure Active Directory. U kunt voor alle gegevens in de Store gebruikers en groepen machtigen via de uiterst gedetailleerde op POSIX gebaseerde toegangsbeheerlijsten, waardoor u in staat bent toegangsbeheer op basis van rollen uit te voeren. Eindelijk kunt u voldoen aan de nalevingsvereisten op het gebied van beveiliging en van wet- en regelgeving, door elke wijziging in de toegang tot of configuratie in het systeem te controleren.

Bouw Data Lake-oplossingen met deze krachtige oplossingen

Apache Hadoop® en gerelateerde open source projectnamen zijn handelsmerken van de Apache Software Foundation.