Trace Id is missing
Hoppa till huvudinnehåll

Data Lake

Obegränsad datasjö för kraftfulla intelligenta åtgärder.

  • Lagra och analysera filer i petabyte-storlek och flera biljoner objekt
  • Felsök och optimera dina stordataprogram på ett enkelt sätt
  • Kom igång på några sekunder, skala direkt och betala per jobb
  • Utveckla massiva parallella program med enkelhet
  • Säkerhet, granskning och support i företagsklass
  • Byggt på YARN, designat för molnet

Azure Data Lake innehåller alla funktioner som krävs för att göra det lättare för utvecklare, dataexperter och analytiker att lagra data i valfri storlek, form och hastighet, samt att utföra alla typer av bearbetning och analyser på olika plattformar och språk. Tjänsten minskar svårigheterna med att mata in och lagra alla data, samtidigt som det går snabbare att komma igång med batcher, strömning och interaktiva analyser. Azure Data Lake används med befintliga IT-investeringar för identitet, hantering och säkerhet till förenklad datahantering och styrning. Tjänsten integreras även på ett smidigt sätt med driftlager och datalager så att du kan utöka dina nuvarande dataprogram. Vi har använt oss av vår erfarenhet från att arbeta med företagskunder och från att köra bearbetningar och analyser i extremt hög skala för Microsoft-verksamheter som Office 365, Xbox Live, Azure, Windows, Bing och Skype. Azure Data Lake löser flera av problemen med produktivitet och skalbarhet som hindrar dig från att öka värdet på dataresurserna med en tjänst som är redo att uppfylla dina nuvarande och framtida affärsbehov.

Azure Data Lake innehåller alla funktioner som krävs för att göra det lättare för utvecklare, dataexperter och analytiker att lagra data i valfri storlek, form och hastighet, samt att utföra alla typer av bearbetning och analyser på olika plattformar och språk. Tjänsten minskar svårigheterna med att mata in och lagra alla data, samtidigt som det går snabbare att komma igång med batcher, strömning och interaktiva analyser. Azure Data Lake används med befintliga IT-investeringar för identitet, hantering och säkerhet till förenklad datahantering och styrning. Tjänsten integreras även på ett smidigt sätt med driftlager och datalager så att du kan utöka dina nuvarande dataprogram. Vi har använt oss av vår erfarenhet från att arbeta med företagskunder och från att köra bearbetningar och analyser i extremt hög skala för Microsoft-verksamheter som Office 365, Xbox Live, Azure, Windows, Bing och Skype. Azure Data Lake löser flera av problemen med produktivitet och skalbarhet som hindrar dig från att öka värdet på dataresurserna med en tjänst som är redo att uppfylla dina nuvarande och framtida affärsbehov.

datasjödiagram

Data Lake Analytics – en obegränsad tjänst för analysjobb som lägger grunden till intelligenta åtgärder

Den första molnbaserade analystjänsten där du enkelt kan utveckla och köra massiva parallella datatransformeringar och bearbetningsprogram i U-SQL, R, Python och .Net mot flera petabyte data. Bearbeta data på begäran, skala direkt och betala bara per jobb – utan någon infrastruktur som du måste hantera. Mer information

Omslag till boken Designing Distributed Systems

HDInsight – molnbaserad Apache Spark- och Hadoop®-tjänst för företag

HDInsight är den enda fullständigt hanterade Hadoop-molnprodukten som innehåller optimerade analyskluster med öppen källkod för Spark, Hive, Map Reduce, HBase, Storm, Kafka och R-Server, med ett SLA som garanterar 99,9 % tillgänglighet. Var och en av dessa tekniker för stordata samt ISV-program kan enkelt distribueras som hanterade kluster med säkerhet och övervakning på företagsnivå. Mer information

Data Lake Store – en obegränsad datasjö med stöd för stordataanalys

Den första molnbaserade datasjön för företag som är säker, extremt skalbar och som bygger på den öppna HDFS-standarden. Utan gränser för datastorlek och med möjligheten att köra massiva parallella analyser kan du frigöra värdet från alla dina ostrukturerade, halvstrukturerade och strukturerade data. Mer information

Utveckla, felsök och optimera stordataprogram på ett enkelt sätt

Det kan vara svårt att hitta rätt verktyg för att utforma och justera stordatafrågor. Med Data Lake är det enkelt att integrera med Visual Studio, Eclipse och IntelliJ, så att du kan använda välkända verktyg till att köra, felsöka och finjustera koden. Med visualiseringar av U-SQL-, Apache Spark-, Apache Hive- och Apache Storm-jobb kan du se hur koden körs i stor skala och identifiera flaskhalsar i prestandan samt kostnadsoptimeringar, vilket gör det enklare att finjustera frågorna. Vår körningsmiljö analyserar aktivt dina program när de körs och erbjuder rekommendationer för att förbättra prestandan och minska kostnaderna. Datatekniker, databasadministratörer och dataarkitekter kan använda sina kunskaper i exempelvis SQL, Apache Hadoop, Apache Spark, R, Python, Java och .NET och vara produktiva från första dagen.

Integreras på ett smidigt sätt med dina befintliga IT-investeringar

En av de största utmaningarna med stordata är integreringen med befintliga IT-investeringar. Data Lake är en viktig del i Cortana Intelligence. Det innebär att tjänsten tillsammans med Azure Synapse Analytics, Power BI och Data Factory utgör en komplett molnplattform för stordata med avancerade analyser som hjälper dig med allt från dataförberedelser till interaktiva analyser av stora datamängder. Med Data Lake Analytics kan du agera på alla dina data med optimerad datavirtualisering av relationella källor som Azure SQL Server på virtuella datorer, Azure SQL Database och Azure Synapse Analytics. Frågor optimeras automatiskt genom att bearbetningen flyttas nära källdatan utan någon dataflytt, vilket maximerar prestandan och minimerar svarstiderna. Eftersom Data Lake finns i Azure kan du dessutom ansluta till alla data som genererats av program eller matats in av enheter i IoT-scenarier (Sakernas Internet).

Lagra och analysera filer i petabyte-storlek och flera biljoner objekt

Data Lake har skapats från grunden för skalning och prestanda i molnet. Med Azure Data Lake Store kan din organisation analysera alla sina data på ett enda ställe, utan några artificiella begränsningar. Data Lake Store kan lagra flera biljoner filer där en enskild fil kan vara större än en petabyte, vilket är 200 gånger större än i andra molnbaserade datalager. Det innebär att du inte behöver skriva om koden när storleken på datan som lagras ökar eller minskar, eller när antalet beräkningar påskyndas. På så sätt kan du fokusera enbart på affärslogiken, inte på hur bearbetningen och lagringen av stora datauppsättningar fungerar. Med Data Lake slipper du också svårigheterna som normalt förknippas med stordata i molnet och kan i stället se till att uppfylla dina nuvarande och framtida affärsbehov.

Prisvärt och kostnadseffektivt

Data Lake är en kostnadseffektiv lösning för att köra arbetsbelastningar med stordata. Du kan välja mellan kluster på begäran eller en modell för betalning per jobb när datan har bearbetats. Inget av fallen kräver maskinvara, licenser eller tjänstespecifika supportavtal. Systemet skalar upp eller ned beroende på företagets behov, vilket innebär att du aldrig betalar för mer än du behöver. Du kan även skala lagringsutrymme och beräkningar oberoende av varandra, vilket ökar den ekonomiska flexibiliteten jämfört med traditionella stordatalösningar. Slutligen minskar det behovet av att anlita specialiserade driftteam, något som är vanligt vid körning av infrastrukturer med stordata. Med Data Lake minskar kostnaderna samtidigt som avkastningen på din datainvestering ökar. En nyligen genomförd undersökning visade att HDInsight ger 63 % lägre total ägandekostnad (TCO) jämfört med en lokal Hadoop-distribution under en femårsperiod.

Säkerhet, granskning och support i företagsklass

Data Lake är fullständigt hanterat och stöds av Microsoft, med ett SLA och support i företagsklass. Kundsupporten är öppen dygnet runt så att du kan kontakta oss med eventuella problem som du stöter på med hela din stordatalösning. Vårt team övervakar distributionen så att du slipper det och garanterar kontinuerlig körning. Data Lake skyddar dina datatillgångar och utökar enkelt den lokala säkerheten och styrningskontrollerna till molnet. Data krypteras alltid – vid överföring med hjälp av SSL och i vila med hjälp av tjänst- eller användarhanterade HSM-baserade nycklar i Azure Key Vault. Funktioner som enkel inloggning (SSO), multifaktorautentisering och sömlös hantering av flera miljoner identiteter är inbyggda i Azure Active Directory. Du kan auktorisera användare och grupper med detaljerade POSIX-baserade åtkomstkontrollistor (ACL) för alla data i Data Lake Store om du vill använda rollbaserade åtkomstkontroller. Avslutningsvis kan du också uppfylla relevanta säkerhets- och efterlevnadskrav genom att granska varje åtkomst- eller konfigurationsändring i systemet.

Bygg Data Lake-lösningar med hjälp av de här kraftfulla lösningarna

HDInsight

Erbjud Hadoop, Spark, R Server, HBase och Storm-kluster i molnet.

Data Lake Analytics

Distribuerad analystjänst som förenklar stordata.

Azure Data Lake Storage

Skalbar och säker datasjö för analys med höga prestanda.

Apache Hadoop® och associerade namn på projekt med öppen källkod är varumärken som tillhör Apache Software Foundation.