Trace Id is missing
Gå til hovedinnhold

Data Lake

En ubegrenset datasjø legger til rette for intelligent handling.

  • Lagre og analyser filer i petabyte-størrelsen og billioner av objekter
  • Enkel feilsøking og optimalisering av stordataprogrammene
  • Start på sekunder, skaler umiddelbart, betal per jobb
  • Du kan enkelt utvikle parallelle programmer massivt
  • Sikkerhet, revisjon og støtte i foretaksklassen
  • Utviklet på YARN, utformet for skyen

Azure Data Lake inkluderer alle de nødvendige funksjonene som gjør det enkelt for utviklere, dataforskere og analytikere å lagre data i alle størrelser, former og hastigheter. Det lar dem også utføre alle typer behandling og analyse på tvers av plattformer og språk. Slik blir det mindre komplisert å inkludere og lagre alle data, og du kommer raskere i gang med satsvis strømming og interaktiv analyse. Azure Data Lake fungerer med eksisterende IT-investeringer for identitet, administrasjon og sikkerhet, for forenklet databehandling og -styring. Det kan også integreres sømløst med driftslagre og datalagre. Slik kan du utvide nåværende dataprogrammer. Vi har utnyttet erfaringen vi har fått gjennom å jobbe med virksomhetskunder og ved å kjøre noen av de mest omfattende behandlingene og analysene i verden for Microsoft-bedrifter som Office 365, Xbox Live, Azure, Windows, Bing og Skype. Azure Data Lake løser mange av utfordringene knyttet til produktivitet og skalerbarhet som hindrer deg i å utnytte dataressursene til fulle. Tjenesten er klar til å dekke de nåværende og fremtidige forretningsbehovene dine.

Azure Data Lake inkluderer alle de nødvendige funksjonene som gjør det enkelt for utviklere, dataforskere og analytikere å lagre data i alle størrelser, former og hastigheter. Det lar dem også utføre alle typer behandling og analyse på tvers av plattformer og språk. Slik blir det mindre komplisert å inkludere og lagre alle data, og du kommer raskere i gang med satsvis strømming og interaktiv analyse. Azure Data Lake fungerer med eksisterende IT-investeringer for identitet, administrasjon og sikkerhet, for forenklet databehandling og -styring. Det kan også integreres sømløst med driftslagre og datalagre. Slik kan du utvide nåværende dataprogrammer. Vi har utnyttet erfaringen vi har fått gjennom å jobbe med virksomhetskunder og ved å kjøre noen av de mest omfattende behandlingene og analysene i verden for Microsoft-bedrifter som Office 365, Xbox Live, Azure, Windows, Bing og Skype. Azure Data Lake løser mange av utfordringene knyttet til produktivitet og skalerbarhet som hindrer deg i å utnytte dataressursene til fulle. Tjenesten er klar til å dekke de nåværende og fremtidige forretningsbehovene dine.

datasjødiagram

Data Lake Analytics – en ubegrenset analysejobbtjeneste som styrker intelligent handling

Den første skybaserte analysetjenesten der du enkelt kan utvikle og kjøre parallelle datatransformasjoner og bearbeidingsprogrammer massivt i U-SQL, R, Python og .Net over petabyte med data. Uten infrastruktur du må administrere, kan du behandle dataene på etterspørsel, skalere umiddelbart og bare betale per jobb. Mer informasjon

Omslaget til boken «Designing Distributed Systems»

HDInsight – Apache Spark- og Hadoop®-skytjenester for bedrifter

HDInsight er det eneste fulladministrerte Hadoop-skytilbudet som gir optimaliserte analyseklynger med åpen kilde for Spark, Hive, MapReduce, HBase, Storm, Kafka og R-Server, og som støttes av en 99,9 % serviceavtale. Hver av disse stordatateknologiene og ISV-programmene distribueres enkelt som administrerte klynger, med sikkerhet og overvåking i foretaksklassen. Mer informasjon

Data Lake Store – en ubegrenset datasjø som gir kraft til stordataanalyse

Den første skybaserte datasjøen for virksomheter som er sikker, massivt skalerbar og utviklet for den åpne HDFS-standarden. Når det ikke er grenser for størrelsen på dataene og muligheten til å kjøre parallelle analyser massivt, kan du nå frigjøre verdier fra alle ustrukturerte, halvstrukturerte og strukturerte data. Mer informasjon

Utvikle, feilsøk og optimaliser stordataprogrammene dine på enkelt vis

Det kan være vanskelig å finne de rette verktøyene til å utforme og finjustere store dataspørringer. Data Lake gjør det enkelt med dyp integrering med Visual Studio, Eclipse og IntelliJ. Slik kan du bruke velkjente verktøy til å kjøre, feilsøke og finjustere koden din. Visualiseringer av U-SQL-, Apache Spark-, Apache Hive- og Apache Storm-jobber lar deg se hvordan koden kjører i stor skala. Du kan også identifisere ytelsesflaskehalser og kostnadsoptimaliseringer. Slik blir det enklere å finjustere spørringene dine. Kjøringsmiljøet vårt analyserer aktivt programmene dine mens de kjører, og tilbyr anbefalinger for å forbedre ytelsen og redusere kostnadene. Datateknikere, DBA-er og dataarkitekter kan bruke eksisterende kompetanse, for eksempel på SQL, Apache Hadoop, Apache Spark, R, Python, Java eller .NET. Slik kan de bli produktive fra første dag.

Integreres sømløst med eksisterende IT-investeringer

En av de største utfordringene med stordata er integreringen med eksisterende IT-investeringer. Data Lake er også en viktig del av Cortana Intelligence. Det betyr at det fungerer med Azure Synapse Analytics, Power BI og Data Factory. Dermed er det en komplett plattform for stordata i skyen og avansert analyse. Du får hjelp med alt fra klargjøring av data til interaktiv analyse av datasett i stor skala. Med Data Lake Analytics får du mulighet til å handle på alle data med optimalisert datavirtualisering av relasjonskilder, for eksempel Azure SQL Server på virtuelle maskiner, Azure SQL Database og Azure Synapse Analytics. Spørringer blir automatisk optimalisert ved å flytte behandlingen nært kildedataene, uten databevegelser. Det optimaliserer dermed ytelsen og minimerer ventetiden. Siden Data Lake hører til i Azure, kan du koble deg til alle data som er generert av programmer eller tatt inn av enheter i Tingenes Internett-scenarier (IoT).

Lagre og analyser filer i petabyte-størrelsen og billioner av objekter

Data Lake ble utviklet fra grunnen av for skalering og ytelse i skyen. Med Azure Data Lake Store kan organisasjonen din analysere alle data på ett sted, uten kunstige begrensninger. Data Lake Store kan lagre billioner av filer, og én enkelt fil kan være større enn en petabyte. Dette er 200 ganger større enn andre skylagre. Dette betyr at du slipper å skrive kode på nytt når du øker eller reduserer størrelsen på dataene som er lagret, eller mengden på databehandling som blir opprettet. Dermed kan du konsentrere deg om forretningslogikken. Du slipper å tenke på hvordan du skal behandle og lagre store datasett. Med Data Lake slipper du også kompleksiteten som ofte forbindes med stordata i skyen. Du får dekket nåværende og fremtidige forretningsbehov.

Rimelig og kostnadseffektivt

Data Lake er en kostnadseffektiv løsning for kjøring av arbeidsbelastninger for stordata. Du kan velge mellom klynger ved behov eller en modell der du betaler per jobb når data behandles. Uansett hvilket alternativ du velger, trenger du ikke maskinvare, lisenser eller tjenestespesifikke støtteavtaler. Systemet skalerer seg opp eller ned etter forretningsbehovene dine. Det betyr at du aldri betaler for mer enn du trenger. Du kan også skalere lagring og databehandling hver for seg. Det gir mer økonomisk fleksibilitet enn tradisjonelle løsninger for stordata. Det er ofte nødvendig å leie inn spesialiserte operasjonsteam for å kjøre infrastrukturer med stordata. Data Lake reduserer behovet for dette til et minimum. Data Lake minimerer kostnadene og optimaliserer avkastningen for datainvestering. En nylig studie viste at HDInsight leverte 63 % lavere totale eierkostnader enn ved å distribuere Hadoop lokalt i fem år.

Sikkerhet, revisjon og støtte i foretaksklassen

Microsoft administrerer og støtter Data Lake fullt ut med hjelp fra en serviceavtale og kundestøtte i foretaksklassen. Med døgnåpen kundestøtte kan du kontakte oss for å håndtere alle utfordringer du støter på i hele løsningen din for stordata. Teamet vårt overvåker distribusjonen din, slik at du slipper å gjøre det, og vi kan garantere at den vil kjøre uavbrutt. Data Lake beskytter dataressursene dine og utvider den lokale sikkerheten og styringskontrollene til skyen på en enkel måte. Data blir alltid kryptert: ved hjelp av SSL i bevegelse, og inaktive ved hjelp av tjeneste- eller brukeradministrerte HSM-støttede nøkler i Azure Key Vault. Funksjoner som enkel pålogging (SSO), flerfaktorautentisering og sømløs administrasjon av millioner av identiteter er innebygd via Azure Active Directory. Du kan godkjenne brukere og grupper med følsomme POSIX-baserte ACL-er for alle data i Store. Det legger til rette for rollebaserte tilgangskontroller. Dessuten kan du overholde krav til sikkerhet og forskriftssamsvar ved å revidere hver tilgang til eller konfigurasjonsendring i systemet.

Utvikle Data Lake-løsninger med disse effektive løsningene

HDInsight

Klargjør Hadoop-, Spark-, R Server-, HBase- og Storm-klynger i skyen.

Data Lake Analytics

Distribuert analysetjeneste som gjør stordata enklere.

Azure Data Lake Storage

Skalerbar, sikker datasjø for analyse med høy ytelse.

Apache Hadoop® og tilhørende prosjektnavn for åpen kilde er varemerker som tilhører Apache Software Foundation.