Gegevensbronnen registreren in Azure Data Catalog

Belangrijk

Azure Data Catalog wordt op 15 mei 2024 buiten gebruik gesteld.

Er kunnen geen nieuwe Azure Data Catalog-accounts meer worden gemaakt.

Voor functies van de gegevenscatalogus gebruikt u de Microsoft Purview-service , die geïntegreerde gegevensbeheer biedt voor uw hele gegevensdomein.

Als u Azure Data Catalog al gebruikt, moet u een migratieplan maken voor uw organisatie om uiterlijk 15 mei 2024 over te stappen naar Microsoft Purview .

Inleiding

Azure Data Catalog is een volledig beheerde cloudservice die fungeert als een systeem voor registratie en detectie voor zakelijke gegevensbronnen. Met andere woorden, Data Catalog helpt mensen om gegevensbronnen te ontdekken, te begrijpen en te gebruiken, en organisaties krijgen meer waarde uit hun bestaande gegevens. De eerste stap voor het detecteren van een gegevensbron via Data Catalog is het registreren van die gegevensbron.

Gegevensbronnen registreren

Registratie is het proces van het extraheren van metagegevens uit de gegevensbron en het kopiëren van die gegevens naar de Data Catalog-service. De gegevens blijven waar ze zich momenteel bevinden, onder het beheer van de groep beheerders en het beleid van het huidige systeem.

Voer de volgende stappen uit om een gegevensbron te registreren:

  1. Start in de Azure Data Catalog-portal het hulpprogramma voor gegevensbronregistratie van Data Catalog.
  2. Meld u aan met uw werk- of schoolaccount met dezelfde Microsoft Entra-referenties die u gebruikt om u aan te melden bij de portal.
  3. Selecteer de gegevensbron die u wilt registreren.

Nadat u de gegevensbron hebt geregistreerd, houdt de catalogus de locatie bij en indexeert de metagegevens. Gebruikers kunnen de gegevensbron doorzoeken, doorzoeken en ontdekken en vervolgens de locatie gebruiken om er verbinding mee te maken met behulp van de toepassing of het hulpprogramma van hun keuze.

Ondersteunde gegevensbronnen

Zie Data Catalog DSR voor een lijst met momenteel ondersteunde gegevensbronnen.

Structurele metagegevens

Wanneer u een gegevensbron registreert, extraheert het registratiehulpprogramma informatie over de structuur van de objecten die u selecteert. Deze informatie wordt structurele metagegevens genoemd.

Voor alle objecten bevat deze structurele metagegevens de locatie van het object, zodat gebruikers die de gegevens detecteren, die informatie kunnen gebruiken om verbinding te maken met het object in de clienthulpprogramma's van hun keuze. Andere structurele metagegevens omvatten objectnaam en -type, en kenmerk-/kolomnaam en gegevenstype.

Beschrijvende metagegevens

Naast de belangrijkste structurele metagegevens die zijn geëxtraheerd uit de gegevensbron, extraheert het hulpprogramma voor gegevensbronregistratie beschrijvende metagegevens. Voor SQL Server Analysis Services en SQL Server Reporting Services worden deze metagegevens opgehaald uit de beschrijvingseigenschappen die door deze services worden weergegeven. Voor SQL Server worden de waarden die worden opgegeven met behulp van de uitgebreide eigenschap ms_description geëxtraheerd. Voor Oracle Database haalt het hulpprogramma voor registratie van de gegevensbron de kolom COMMENTS uit de ALL_TAB_COMMENTS weergave.

Naast de beschrijvende metagegevens die zijn geëxtraheerd uit de gegevensbron, kunnen gebruikers beschrijvende metagegevens invoeren met behulp van het hulpprogramma voor registratie van gegevensbronnen. Gebruikers kunnen tags toevoegen en ze kunnen experts identificeren voor de objecten die worden geregistreerd. Al deze beschrijvende metagegevens worden samen met de structurele metagegevens gekopieerd naar de Data Catalog-service.

Voorbeelden opnemen

Standaard worden alleen metagegevens uit gegevensbronnen geëxtraheerd en gekopieerd naar de Data Catalog-service, maar het begrijpen van een gegevensbron wordt vaak eenvoudiger gemaakt wanneer u een voorbeeld van de gegevens kunt bekijken die deze bevat.

U kunt een voorbeeld van een momentopname opnemen van de gegevens in elke tabel en weergave die is geregistreerd, met behulp van het hulpprogramma voor gegevensbronregistratie van Data Catalog. Als u ervoor kiest om previews op te nemen tijdens de registratie, bevat het registratieprogramma maximaal 20 records uit elke tabel en weergave. Deze momentopname wordt vervolgens gekopieerd naar de catalogus, samen met de structurele en beschrijvende metagegevens.

Notitie

Brede tabellen met een groot aantal kolommen kunnen minder dan 20 records bevatten in de preview-versie.

Gegevensprofielen opnemen

Net zoals previews kunnen waardevolle context bieden voor gebruikers die zoeken naar gegevensbronnen in Data Catalog, met inbegrip van een gegevensprofiel, kan het gemakkelijker zijn om gedetecteerde gegevensbronnen te begrijpen.

Met behulp van het hulpprogramma voor gegevensbronregistratie van Data Catalog kunt u een gegevensprofiel opnemen voor elke tabel en weergave die is geregistreerd. Als u ervoor kiest om een gegevensprofiel op te nemen tijdens de registratie, bevat het registratiehulpprogramma statistische gegevens over de gegevens in elke tabel en weergave, waaronder:

  • Het aantal rijen en de grootte van de gegevens in het object.
  • De datum voor de meest recente update van de gegevens en het objectschema.
  • Het aantal null-records en afzonderlijke waarden voor kolommen.
  • De minimum-, maximum-, gemiddelde- en standaarddeviatiewaarden voor kolommen.

Deze statistieken worden vervolgens gekopieerd naar de catalogus, samen met de structurele en beschrijvende metagegevens.

Notitie

Tekst- en datumkolommen bevatten geen gemiddelde of standaarddeviatiestatistieken in hun gegevensprofiel.

Registraties bijwerken

Als u een gegevensbron registreert, kan deze worden gedetecteerd in Data Catalog wanneer u de metagegevens en optionele preview gebruikt die tijdens de registratie zijn geëxtraheerd. Als de gegevensbron moet worden bijgewerkt in de catalogus (bijvoorbeeld als het schema van een object is gewijzigd, moeten tabellen die oorspronkelijk zijn uitgesloten, worden opgenomen of wilt u de gegevens bijwerken die zijn opgenomen in de previews), kan het hulpprogramma voor gegevensbronregistratie opnieuw worden uitgevoerd.

Als u een al geregistreerde gegevensbron opnieuw registreert, wordt een samenvoegbewerking 'upsert' uitgevoerd: bestaande objecten worden bijgewerkt en er worden nieuwe objecten gemaakt. Alle metagegevens van gebruikers via de Data Catalog-portal worden bewaard.

Samenvatting

Omdat er structurele en beschrijvende metagegevens van een gegevensbron naar de catalogusservice worden gekopieerd, maakt het registreren van de gegevensbron in Data Catalog de gegevens gemakkelijker te detecteren en te begrijpen. Nadat u de gegevensbron hebt geregistreerd, kunt u deze aantekeningen maken, beheren en detecteren met behulp van de Data Catalog-portal.