Questions? Feedback? powered by Olark live chat software
Spring over navigation

Hadoop

Hvad er Hadoop?

Apache Hadoop er åben kilde-software til lagring og analyse af store mængder af strukturerede og ustrukturerede data – terabyte eller mere af alt lige fra mails og sensorlæsninger til serverlogge og Twitter-feeds og GPS-signaler til stort set alt, du kan komme i tanke om. Hadoop kan behandle store, ustrukturerede datasæt og give indsigt og svar – og hjælpe med få styr på rodet.

Hadoop i korte træk

Hadoop blev skabt i 2005 af Mike Cafarella og Doug Cutting (som opkaldte tjenesten efter sin søns legetøjselefant) og var oprindeligt ment som et webrelateret værktøj til søgning efter data. I dag er det et open-source communityskabt projekt tilhørende Apache Software Foundation, der bruges i alle former for organisationer og brancher. Microsoft er aktiv bidragyder til communityets udvikling.

Microsoft
Microsoft har logført mere end 6.000 teknikertimer i løbet af det sidste år, hvor teknikerne har leveret kode og skabt fornyelse i fællesskab med open source-community'et på tværs af en lang række Hadoop-projekter. Derudover har vi medarbejdere, der udvikler kode til Hadoop, og Microsofts medarbejder Chris Douglas er formand for Apache-arbejdsgruppen for Hadoop.

–David Campbell, Microsoft Fellow og CTO

Bygget til store data og almindelige servere

En af grunden til, at Hadoop er blevet så populært er simpel økonomi. Behandling af store datasæt krævede engang supercomputere og anden dyr specialhardware. Hadoop muliggør pålidelig, skalerbar og distribueret computerbehandling på standardservere – og giver dig mulighed for at håndtere mange petabyte data eller flere på et mindre budget. Hadoop er også udviklet til at kunne skaleres fra en enkelt server til tusindvis af maskiner og til at registrere og håndtere fejl på programlaget for at levere større pålidelighed.

Virginia Tech
Forskere på Virginia Tech bruger Hadoop til at efterprøve petabyte af DNA-data i forbindelse med nye behandlingsformer for og medicin mod kræft.

Indsigt fra alle slags data

Det vurderes, at op til 80 % af de data, som organisationer behandler i dag, ikke er den slags data, der modtages i pæne, lige kolonner og rækker. De er i stedet en rodet blanding af mails, feeds på sociale medier, satellitbilleder, GPS-signaler, serverlogge og andre ustrukturerede filer uden sammenhæng. Hadoop kan håndtere stort set alle filer eller formater – den anden store fordel – så organisationer kan stille spørgsmål, de aldrig troede muligt.

Barcelona
Ved hjælp af Microsoft Azure, HDInsight og SQL Server 2012 kan vi indsamle, analysere og generere nær-realtids-BI med store data, der er hentet via feeds på sociale medier, GPS-signaler og data fra offentlige systemer

–Luis Sanz Marco, Barcelona

Se, hvordan byen Barcelona bruger Hadoop på Microsoft Azure

Hvorfor Hadoop i skyen?

Du kan implementere Hadoop i et traditionelt lokalt datacenter. Nogle firmaer – herunder Microsoft – tilbyder også Hadoop som en cloudbaseret tjeneste. Et oplagt spørgsmål er: Hvorfor bruge Hadoop i clouden? Her er grunden til, at stadig flere organisationer vælger denne mulighed.

I skyen sparer du tid og penge

Åben kilde betyder ikke gratis. Når du implementerer Hadoop lokalt, skal du stadig have servere og dygtige Hadoop-eksperter, der konfigurerer, optimerer og vedligeholder det hele. Med en cloudtjeneste kan du oprette en Hadoop-klynge på få minutter uden startomkostninger.

Virginia Tech
Se, hvordan Virginia Tech bruger Microsofts sky i stedet for at bruge millioner af dollar på at skabe deres eget supercomputercenter.

Skyen er fleksibel og kan hurtigt skaleres

I Microsoft Azure-clouden betaler du kun for den beregning og det lager, du bruger, når du bruger det. Start en Hadoop-klynge, analyser dine data, og luk den ned, så du ikke betaler for mere.

NHS
Vi fik hurtigt gang i Azure HDInsight-klyngen og behandlede data for seks år på bare et par timer. Så lukkede vi den ned... Det var meget billigere at behandle dataene i skyen.

–Paul Henderson, National Health Service (U.K.)

Skyen gør dig fleksibel

Opret en Hadoop-klynge på få minutter – og tilføj noder efter behov. Med clouden får organisationer med det samme værdi for pengene.

Chr Hansen
Det var ganske enkelt meget hurtigere at gøre det i skyen med Microsoft Azure. Vi kunne implementere løsninger og gå i gang med at arbejde med data på mindre end en uge.

–Morten Meldgaard, Chr. Hansen

Mød HDInsight: Hadoop i Azure-clouden

Microsoft Azure HDInsight er en 100 % Apache Hadoop-baseret tjeneste i Azure-clouden. Tjenesten tilbyder alle fordelene i Hadoop og muligheden for integration med Excel, dine Hadoop-klynger i det lokale miljø og Microsoft-økosystemet af forretningssoftware og -tjenester.

Se en introduktion til HDInsight