Hoppa över navigering

Datasjö

Obegränsad Data Lake för intelligenta åtgärder

  • Lagra och analysera filer i petabyte-storlek och flera biljoner objekt
  • Utveckla enkelt massivt parallella program
  • Felsök och optimera enkelt dina stordataprogram
  • Säkerhet, granskning och support i företagsklass
  • Kom igång på några sekunder, skala direkt och betala per jobb
  • Byggt på YARN, designat för molnet
Azure Data Lake innehåller alla funktioner som krävs för att göra det lättare för utvecklare, dataexperter och analytiker att lagra data i valfri storlek, form och hastighet, samt att utföra alla typer av bearbetning och analyser på olika plattformar och språk. Tjänsten minskar svårigheterna med att samla in och lagra alla data samtidigt som det går snabbare att komma igång med batcher, strömning och interaktiva analyser. Azure-datasjö fungerar med befintliga IT-investeringar för identitet, hantering och säkerhet för förenklad datahantering och -styrning. Tjänsten integreras även smidigt med driftlager och datalager så att du kan utöka dina nuvarande dataprogram. Vi har använt oss av vår erfarenhet från att arbeta med företagskunder och från att köra bearbetningar och analyser i extremt hög skala för Microsoft-verksamheter som Office 365, Xbox Live, Azure, Windows, Bing och Skype. Azure-datasjö löser flera av problemen med produktivitet och skalbarhet som hindrar dig från att öka värdet på dataresurserna med en tjänst som är redo att uppfylla dina nuvarande och framtida affärsbehov.

Data Lake Analytics – en obegränsad tjänst för analysjobb som lägger grunden till intelligenta åtgärder

Den första molnanalystjänsten där du enkelt kan utveckla och köra massivt parallella datatransformerings- och bearbetningsprogram i U-SQL, R, Python och .Net över petabyte med data. Utan infrastruktur att hantera kan du bearbeta data på begäran, skala direkt och bara betala per jobb. Läs mer

HDInsight – molnbaserad Apache Spark- och Hadoop®-tjänst för företaget

HDInsight är den enda helt hanterade Hadoop-molnprodukten som tillhandahåller optimerade analyskluster med öppen källkod för Spark, Hive, Map Reduce, HBase, Storm, Kafka och R-Server, med ett SLA som garanterar 99,9 % tillgänglighet. Var och en av dessa tekniker för stordata samt ISV-program kan enkelt distribueras som hanterade kluster med säkerhet och övervakning på företagsnivå. Läs mer

Data Lake Store – en obegränsad datasjö som stöder stordataanalyser

Den första molnbaserade datasjön för företag som är säker, extremt skalbar och som bygger på den öppna HDFS-standarden. Utan gränser för datastorlek och möjligheten att köra massivt parallelliserade analyser kan du frigöra värde från alla dina ostrukturerade, halvstrukturerade och strukturerade data. Läs mer

Utveckla, felsök och optimera enkelt stordataprogram

Det kan vara svårt att hitta rätt verktyg för att designa och justera frågekörning på stordata. Med Data Lake är det enkelt att integrera med Visual Studio, Eclipse och IntelliJ, så att du kan använda välkända verktyg för att köra, felsöka och finjustera koden. Med visualiseringar av U-SQL-, Apache Spark-, Apache Hive- och Apache Storm-jobb kan du se hur koden körs i hög skala och identifiera flaskhalsar i prestanda och kostnadsoptimeringar, vilket gör det enklare att finjustera dina frågor. Vår körningsmiljö analyserar aktivt dina program när de körs och erbjuder rekommendationer för att förbättra prestanda och minska kostnaderna. Datatekniker, databasadministratörer och dataarkitekter kan använda sina kunskaper i exempelvis SQL, Apache Hadoop, Apache Spark, R, Python, Java och .NET och vara produktiva från dag ett.

Integreras smidigt med dina befintliga IT-investeringar

En av de största utmaningarna med stordata är integreringen med befintliga IT-investeringar. Data Lake är en viktig del av Cortana Intelligence. Det innebär att tjänsten fungerar med Azure Synapse Analytics, Power BI och Data Factory för en komplett molnplattform för stordata och avancerade analyser som hjälper dig med allt från dataförberedelser till interaktiva analyser av stora datamängder. Med Data Lake Analytics kan du agera på alla dina data med optimerad datavirtualisering av relationella källor som Azure SQL Server på virtuella datorer, Azure SQL Database och Azure Synapse Analytics. Frågor optimeras automatiskt genom att bearbetningen flyttas nära källdata, utan dataflyttning, vilket maximerar prestanda och minimerar svarstiderna. Eftersom Datasjö finns i Azure kan du dessutom koppla alla data som genererats av program eller samlats in av enheter i IoT-scenarier (Sakernas Internet).

Lagra och analysera filer i petabyte-storlek och flera biljoner objekt

Datasjö har skapats från grunden för skalning och prestanda i molnet. Med Azure Data Lake Store kan din organisation analysera alla sina data på samma ställe, utan artificiella begränsningar. Data Lake Store kan lagra flera biljoner filer där en enskild fil kan vara större än en petabyte, vilket är 200 gånger större än med andra molnbaserade datalager. Det innebär att du inte behöver skriva om koden när storleken på data som lagras ökar eller minskar eller när antalet beräkningar påskyndas. På så sätt kan du fokusera enbart på affärslogiken, inte på hur bearbetningen och lagringen av stora datauppsättningar fungerar. Med Datasjö slipper du också svårigheterna som normalt förknippas med stordata i molnet och kan istället se till att uppfylla dina nuvarande och framtida affärsbehov.

Prisvärt och kostnadseffektivt

Datasjö är en kostnadseffektiv lösning för att köra arbetsbelastningar med stordata. Du kan välja mellan kluster på begäran eller en modell för betalning per jobb när data har bearbetats. Inget av fallen kräver maskinvara, licenser eller tjänstespecifika supportavtal. Systemet skalar upp eller ned beroende på företagets behov, vilket innebär att du aldrig betalar mer än du behöver. Du kan även skala lagringsutrymme och beräkningar oberoende av varandra, vilket ökar den ekonomiska flexibiliteten jämfört med traditionella stordatalösningar. Slutligen minskar det behovet av att anlita specialiserade driftteam, något som är vanligt vid körning av infrastrukturer med stordata. Datasjö minskar kostnaderna och ökar avkastningen på din datainvestering. En nyligen genomförd undersökning visade att HDInsight ger 63 % lägre total ägandekostnad (TCO) jämfört med en lokal Hadoop-distribution under en femårsperiod.

Säkerhet, granskning och support i företagsklass

Data Lake är helt hanterat och uppbackat av Microsoft, med ett SLA och support i företagsklass. Kundsupporten är öppen dygnet runt så att du kan kontakta oss med eventuella problem som du stöter på med hela din stordatalösning. Vårt team övervakar distributionen så att du slipper det och garanterar kontinuerlig körning. Data Lake skyddar dina datatillgångar och utökar enkelt den lokala säkerheten och styrningskontroller till molnet. Data krypteras alltid – vid överföring med hjälp av SSL, och i vila med hjälp av tjänst- och användarhanterade HSM-baserade nycklar i Azure Key Vault. Funktioner som enkel inloggning (SSO), multifaktorautentisering och sömlös hantering av flera miljoner identiteter är inbyggda i Azure Active Directory. Du kan auktorisera användare och grupper med detaljerade POSIX-baserade åtkomstkontrollistor (ACL) för alla data i Data Lake Store om du vill använda rollbaserade åtkomstkontroller. Avslutningsvis kan du också uppfylla relevanta säkerhets- och efterlevnadskrav genom att granska varje åtkomst- eller konfigurationsändring i systemet.

Bygg Datasjö-lösningar med hjälp av de här kraftfulla lösningarna

HDInsight

Tillhandahåll Hadoop, Spark, R Server, HBase och Storm-kluster i molnet

Data Lake Analytics

Distribuerad analystjänst som förenklar stordata

Azure Data Lake Storage

Skalbar och säker Data Lake-funktion för analyser med höga prestanda

Apache Hadoop® och associerade öppen källkod-projektnamn är varumärken som tillhör Apache Software Foundation.

Kan vi hjälpa dig?