Hoppa över navigering

Vad är ett informationslager?

Lär dig vad ett informationslager är, fördelarna med att använda ett, metodtips att tänka på under designfasen och vilka verktyg som ska införlivas när det äntligen är dags att skapa.

Vad är ett informationslager?

Först ska vi definiera vad ett informationslager är och varför du kanske vill använda ett för din organisation.

En informationslager är en centraliserad lagringsplats som lagrar strukturerade data (databastabeller, Excel-blad) och halvstrukturerade data (XML-filer, webbsidor) för rapportering och analys. Data flödar in från en mängd olika källor, till exempel kassasystem, affärsprogram och relationsdatabaser, och de rensas vanligtvis och standardiseras innan de når lagret. Eftersom ett informationslager kan lagra stora mängder information ger det användare enkel åtkomst till en mängd historiska data, som kan användas för datautvinning, datavisualisering och andra former av business intelligence rapportering.

Fördelar med informationslager

Tillförlitliga data, särskilt när de aggregeras över tid, hjälper användarna att fatta smartare och mer välgrundade beslut om hur de kör organisationen och informationslager är det som gör det möjligt. Fördelarna med informationslagerhantering i företag är många, men några av de mest effektfulla fördelarna är:

  • Konsolidera data från flera källor till en enda sanningskälla
  • Lagra och analysera långsiktiga historiska data som sträcker sig över månader och år
  • Rensa och transformera data så att de är korrekta, konsekventa och standardiserade i struktur och form
  • Minska frågetiderna vid insamling av data och bearbetningsanalyser, vilket förbättrar övergripande prestanda i alla system
  • Läsa in data effektivt utan att behöva hantera kostnaderna för distribution eller infrastruktur
  • Skydda data så att de är privata, skyddade och säkra
  • Förbereda data för analys via datautvinning, visualiseringsverktyg och andra former av avancerad analys

Informationslager jämfört med datasjö

Det är tydligt att informationslager är viktiga för alla organisationers analysåtgärder. Men vad är skillnaden mellan ett informationslager och andra typer av datalagringsplatser, till exempel en datasjö? Och när ska den ena användas över den andra?

Som lagringsplatser lagrar och bearbetar både informationslager och datasjöar data. Men även om de kan verka erbjuda samma funktioner har de var och en sina egna användningsfall. Det är därför organisationer ofta införlivar båda systemen för att skapa en komplett lösning från slutpunkt till slutpunkt som kan hantera en mängd olika syften.

Ett informationslager är relationellt till sin natur. Det innebär att strukturen eller schemat för data bestäms av fördefinierade affärs- och produktkrav som är granskade, överensstämmelsede och optimerade för SQL-frågeåtgärder. Därför används informationslager bäst för att lagra data som har behandlats med ett specifikt syfte i åtanke, till exempel datautvinning för BI-analys eller för att köpa ett affärsanvändningsfall som redan har identifierats.

Precis som informationslager innehåller datasjöar strukturerade och halvstrukturerade data. Men de kan också ta emot rådata och obearbetade data från en mängd olika icke-relationella källor, inklusive mobilappar, IoT-enheter, sociala medier eller streaming. Det beror på att strukturen eller schemat i en datasjö inte har definierats förrän data har lästs. På grund av sin flexibla och skalbara natur används datasjöar ofta för att utföra intelligenta former av dataanalys, till exempel maskininlärning.

Inte tillgänglig Datasjö Informationslager
Typ Strukturerad, halvstrukturerad, ostrukturerad
Relationell, icke-relationell
Strukturerad
Relationell
Schema Schema vid läsning Schema vid skrivning
Format Rå, ofiltrerad Bearbetad, kontrollerad
Källor Stordata, IoT, sociala medier, strömmande data Program, företag, transaktionsdata, batchrapportering
Skalbarhet Lätt att skala till en låg kostnad Svårt och dyrt att skala
Användare Dataforskare, dataingenjörer Data Warehouse-experter, affärsanalytiker
Användningsfall Maskininlärning, förutsägelseanalys, realtidsanalys Kärnrapporter, BI

Arkitektur och design för informationslager

Nu när du vet varför och när du bör använda ett informationslager ska vi gå in på hur det fungerar genom att titta på informationslagerdesignen. Ett informationslager är mer än bara en enda silo som körs på egen hand. I stället är det ett mycket strukturerat, noggrant strukturerat system som består av flera nivåer som interagerar med dina data och varandra på olika sätt. Dessa nivåer omfattar vanligtvis:

Den nedre nivån

Data matas in från flera källor och rensas och transformeras sedan så att andra program kan använda dem i en process som kallas extrahering, transformering och inläsning (ETL). Den nedre nivån är också där data lagras och optimeras, vilket leder till snabbare frågetider och bättre prestanda överlag.

Mellannivå

Här hittar du analysmotorn, även kallad OLAP-servern (Online Analytical Processing). OLAP-servrar kommer åt stora mängder data från informationslagret i hög hastighet, vilket leder till blixtsnabba resultat.

Översta nivån

Den översta nivån är där klientdelsgränssnittet visuellt visar bearbetade data, som analytiker kan komma åt och använda för alla deras rapporterings- och självbetjänings-BI-behov.

Så här skapar du ett informationslager

När du utformar och skapar ett informationslager är det viktigt att ta hänsyn till organisationens mål, både långsiktiga och ad hoc,samt dina datas natur. Hur många datakällor integrerar du? Planerar du att automatisera dina arbetsflöden? Hur kommer du att utforska och analysera dina data? Din utbyggning varierar beroende på hur komplexa dina behov är, men ett typiskt informationslager för företagsdatabaser kan bestå av följande komponenter:

  1. Datakällor som extrahera driftsdata från point-of-sale-system, affärsprogram och andra relationsdatabaser
  2. Ett tagingsområde där data rensas och transformeras för lagret eller den centraliserade lagringsplatsen
  3. Ett lager eller centraliserad lagringsplats som lagrar bearbetade driftdata, metadata, sammanfattningsdata, och rådata för enkel användaråtkomst
  4. Tillägget av data marts, som tar data från den centraliserade lagringsplatsen och hanterar dem i delmängder till valda grupper av användare
  5. A sandbox, vilka dataexperter kan använda för att testa nya former av datautforskning i en skyddad miljö
  6. En mängd olika datalagerverktyg, ramverk och API:er för integrering, lagring, prestanda och analys

Verktyg, programvara och resurser för informationslager

I dagens datacentrerade värld har många stora programvaruföretag ett till synes oändligt utbud av informationslagerprogramvara, var och en med sitt eget specifika användningsfall. Det kan verka skrämmande, men för att kunna skapa en sammanhängande lösning med höga prestanda bör du investera i rätt verktyg och tekniker. Varje organisations behov är olika, men här är några viktiga informationslagerprodukter att titta på:

Informationslager för moln- och hybridmoln

En enhetlig, molnbaserad datalagerlösning, till exempel Azure Synapse Analytics, ger organisationer möjlighet att skala, beräkna och lagra snabbare och lägre kostnader.

Verktyg för dataintegrering

Med ETL-pipelines kan användare skapa, schemalägga och samordna sina arbetsflöden så att källdata integreras, rensas och standardiseras automatiskt.

Objektlagring

En objektlagringslösning kan innehålla stora mängder strukturerade, halvstrukturerade och ostrukturerade data, vilket gör den perfekt för mellanlagring av källdata innan den läses in i lagret.

Lagerverktyg

En distribuerad lagringslösning innehåller stora mängder data i relationstabeller med kolumnbaserad lagring. Detta sänker kostnaderna avsevärt, förbättrar frågeprestanda och ger snabbare insikter.

Prestandaverktyg

För att förbättra prestandan för dina program kanske du vill införliva Apache Spark, ett ramverk för parallell bearbetning med öppen källkod som stöder minnesintern bearbetning.

Resurs- och arbetsbelastningshantering

En resurshanterare allokerar beräkningskraft till dina arbetsbelastningar så att du kan läsa in, analysera, hantera och exportera data i enlighet med detta.

Datamodellering

Datamodellering kombinerar flera datakällor till en enda semantisk modell, vilket ger en strukturerad och effektiv vy av dina data.

Business Intelligence-verktyg

Affärsanalysverktyg hjälper till att leverera insikter till användare i form av instrumentpaneler, rapporter och andra visualiseringsverktyg.

Säkerhets- och sekretessfunktioner

Säkerhets- och efterlevnadsfunktioner som datakryptering, användarautentisering och åtkomstövervakning säkerställer att dina data förblir skyddade.

Vad hände med Azure SQL Data Warehouse?

Funktionerna som är associerade med Azure SQL Data Warehouse är nu en funktion i Azure Synapse Analytics som kallas dedikerad SQL-pool. Befintliga Azure SQL Data Warehouse kunder kan fortsätta att köra sina befintliga Azure SQL Data Warehouse arbetsbelastningar med hjälp av den dedikerade SQL-poolfunktionen i Azure Synapse Analytics utan att gå igenom några ändringar. Kunder kan också börja hantera sina befintliga informationslagerdata med Azure Synapse Analytics för att dra nytta av avancerade analysfunktioner som serverlös datasjöutforskning och integrerade SQL- och Apache Spark-motorer™ .

Vanliga frågor och svar

  • Ett informationslager är en centraliserad lagringsplats som innehåller strukturerade data (databastabeller, Excel-blad) och halvstrukturerade data (XML-filer, webbsidor) för rapportering, analys och andra former av business intelligence.

    Läs mer om informationslager

  • Det finns många fördelar med att använda ett informationslager. Ett informationslager konsoliderar till exempel flera datakällor till en enda sanningskälla, som organisationer sedan kan använda för att fatta mer välgrundade beslut kring företag och drift.

    Utforska ytterligare fördelar

  • Informationslager lagrar strukturerade och halvstrukturerade data som kan användas för källdatautvinning, datavisualisering och andra specifika BI-användningsfall. Datasjöar lagrar olika typer av rådata, som dataexperter sedan kan använda för att skapa olika projekt.
  • Ett informationslager består vanligtvis av flera nivåer: den nedre nivån, där data samlas in och lagras; mellannivån, där data analyseras; och den översta nivån, där data visas för användare att komma åt och parsa genom.

    Discover-informationslagerarkitekturer

  • När du utformar och skapar informationslagerinfrastruktur är det viktigt att tänka på hur dina data är och hur du vill transformera dem. Några vanliga element i en typisk utbyggning är datakällor, ett mellanlagringsområde, själva lagret, data marts, sandbox-miljöer och olika integreringsverktyg.

    Få tips om hur du skapar ett informationslager

  • Många stora programvaruföretag har nu en mängd olika informationslagerprodukter.

    Utforska datalagerverktyg, programvara och resurser

  • De här funktionerna är nu en funktion i Azure Synapse Analytics så kallad dedikerad SQL-pool. Befintliga Azure SQL Data Warehouse kunder kan fortsätta köra sina arbetsbelastningar här utan att gå igenom några ändringar.

    Läs mer om Azure SQL Data Warehouse

Kom igång med ett kostnadsfritt Azure-konto

Få populära analystjänster kostnadsfritt i 12 månader, mer än 25 tjänster alltid kostnadsfria  och $200 kredit att använda under dina första 30 dagar.

Kontakta en Azure-säljspecialist

Få råd om hur du kommer igång med analyser i Azure. Ställ frågor, lär dig mer om priser och metodtips och få hjälp med att utforma en lösning som uppfyller dina behov.

Kan vi hjälpa dig?