Azure Databricks Delta er nå i forhåndsversjon
Publiseringsdato: 24 september, 2018
Delta-funksjonen er nå tilgjengelig i forhåndsversjon uten ekstrakostnader i premium-SKU-en til Azure Databricks. Med Delta får kunder bedre datapålitelighet, forbedret ytelse for jobbene og spørringene og mulighet til å forenkle datasamlebåndene. Med den enorme veksten i datavolumer som analyseres, bruken av forskjellige datatyper og behovet for analyse i sanntid, har datasamlebånd blitt veldig kompliserte. De fleste kunder utvikler datasamlebånd i flere trinn som krever toleranse på hvert trinn for å behandle problemer som uregelmessigheter i skjema og motstridende skriveoperasjoner. Denne kompleksiteten av løsninger fører til ytelsesproblemer i stor skala. Med Delta i Azure Databricks, kan kunder forenkle datasamlebåndene betraktelig. Delta er et transaksjonslagringsnivå i Azure Databricks. Samhandle med den ved å lese og skrive data til en Delta-tabell, som er en optimalisert versjon av en Spark-tabell. Den lagrer data i Parquet-format og legger til metadata som gir ekstra funksjonalitet over en Spark-tabell. Den gir bedre pålitelighet og høyere ytelse på Spark-jobber og -spørringen i Azure Databricks. Delta forenkler også datasamlebånd ved å tillate at både bunke- og strømmejobber bruker samme tabell samtidig som den gir datakonsistens, dette gir brukere mulighet til å forenkle kompileringen av høytytende analyseløsninger i stor skala. Begynn å benytte deg av fordelene ved Delta på Azure Databricks med minimale kodeendringer. Den fungerer med alle eksisterende API-er i Spark som kunder bruker for Spark-tabeller. For å komme i gang med Delta på Azure Databricks, kan du gå til Databricks Delta-hurtigstartsveiledning og lese mer om Azure Databricks Delta og dens egenskaper i Delta-dokumentasjonen. |