Wat is Azure Data Catalog?

Belangrijk

Azure Data Catalog wordt op 15 mei 2024 buiten gebruik gesteld.

Er kunnen geen nieuwe Azure Data Catalog-accounts meer worden gemaakt.

Voor functies van de gegevenscatalogus gebruikt u de Microsoft Purview-service , die geïntegreerde gegevensbeheer biedt voor uw hele gegevensdomein.

Als u Azure Data Catalog al gebruikt, moet u een migratieplan maken voor uw organisatie om uiterlijk 15 mei 2024 over te stappen naar Microsoft Purview .

Azure Data Catalog is een volledig beheerde cloudservice waarmee gebruikers de gegevensbronnen kunnen detecteren die ze nodig hebben en inzicht kunnen hebben in de gegevensbronnen die ze vinden. Tegelijkertijd helpt Data Catalog organisaties meer waarde te halen uit hun bestaande investeringen.

Met Data Catalog kan elke gebruiker (analist, data scientist of ontwikkelaar) gegevensbronnen detecteren, begrijpen en gebruiken in hun gegevenslandschap. Data Catalog bevat een crowdsourcingmodel met metagegevens en aantekeningen, zodat iedereen kan bijdragen aan het detecteren en gebruiken van gegevens. Het is één centrale plek voor alle gebruikers van een organisatie om hun kennis bij te dragen en een community en cultuur van gegevens te bouwen.

Problemen met detectie voor gegevensgebruikers

Detectie van zakelijke gegevensbronnen is traditioneel een organisch proces op basis van specifieke kennis. Voor bedrijven die de meeste waarde uit hun informatieassets willen halen, biedt deze aanpak veel uitdagingen:

  • Gebruikers weten mogelijk niet dat een gegevensbron bestaat, tenzij ze ermee in aanraking komen als onderdeel van een ander proces. Er is geen centrale locatie waar gegevensbronnen worden geregistreerd.
  • Tenzij gebruikers de locatie van een gegevensbron kennen, kunnen ze geen verbinding maken met de gegevens met behulp van een clienttoepassing. Vanwege dataverbruik moeten gebruikers de verbindingsreeks of het pad kennen.
  • Tenzij gebruikers de locatie van de documentatie van een gegevensbron kennen, kunnen ze het beoogde gebruik van de gegevens niet begrijpen. Gegevensbronnen en documentatie kunnen zich op verschillende plaatsen bevinden en worden gebruikt via verschillende ervaringen.
  • Als gebruikers vragen over een gegevensasset hebben, moeten ze de expert die of het team dat verantwoordelijk is voor de gegevens zien te vinden en ze offline benaderen. Er is geen expliciete relatie tussen gegevens en de deskundigen met een diep inzicht in het beoogde gebruik ervan.
  • Tenzij gebruikers het proces voor het aanvragen van toegang tot de gegevensbron begrijpen, helpt het detecteren van de gegevensbron en de bijbehorende documentatie hen nog steeds niet om toegang te krijgen tot de gegevens.

Problemen met detectie voor gegevensproducenten

Terwijl gegevensgebruikers voor deze eerder vermelde uitdagingen staan, hebben gebruikers die verantwoordelijk zijn voor het maken en onderhouden van gegevensassets hun eigen uitdagingen:

  • Het annoteren van gegevensbronnen met beschrijvende metagegevens is vaak verspilde moeite. Clienttoepassingen negeren doorgaans beschrijvingen die zijn opgeslagen in de gegevensbron.
  • Het maken van documentatie voor gegevensbronnen is vaak verspilde moeite. Op het gesynchroniseerd houden van de documentatie met de gegevensbronnen, rust een grote en continue verantwoordelijkheid. Gebruikers hebben mogelijk geen vertrouwen in documentatie die wordt beschouwd als verouderd.
  • Het maken en onderhouden van documentatie voor gegevensbronnen is complex en tijdrovend. Dit geldt des te meer voor het beschikbaar maken van die documentatie voor iedereen die gebruikmaakt van de gegevensbron.
  • Het is van groot belang om toegang tot gegevensbronnen te beperken en ervoor te zorgen dat gegevensgebruikers weten hoe ze om toegang kunnen vragen.

Gezamenlijk vormen deze uitdagingen een aanzienlijke belemmering voor bedrijven die gebruik van en kennis over zakelijke gegevens willen aansporen en promoten.

Azure Data Catalog kan helpen

Data Catalog is ontworpen om deze problemen te verhelpen en ervoor te zorgen dat ondernemingen het meeste uit hun bestaande gegevensassets kunnen halen. Data Catalog helpt door te zorgen dat gegevensbronnen gemakkelijk kunnen worden gedetecteerd en begrijpelijk zijn voor de gebruikers die met de gegevens omgaan.

Data Catalog levert een cloudservice waarin een gegevensbron kan worden geregistreerd. De gegevens blijven op de bestaande locatie, maar een kopie van de metagegevens wordt toegevoegd aan Data Catalog, samen met een verwijzing naar de locatie van de gegevensbron. Deze metagegevens worden ook geïndexeerd zodat elke gegevensbron gemakkelijk kan worden gedetecteerd via zoekopdrachten, en begrijpelijk is voor gebruikers die de gegevensbron detecteren.

Als een gegevensbron is geregistreerd, kunnen de metagegevens worden uitgebreid. De metagegevens kunnen worden toegevoegd door de gebruiker die ze heeft geregistreerd of door andere gebruikers in de onderneming. Elke gebruiker kan aantekeningen toevoegen aan een gegevensbron door beschrijvingen, tags of andere metagegevens in te voeren, zoals documentatie en processen voor het aanvragen van toegang tot gegevensbronnen. Deze beschrijvende metagegevens vormen een aanvulling op de structurele metagegevens (zoals kolomnamen en gegevenstypen) die zijn geregistreerd vanuit de gegevensbron.

Het primaire doel van het registreren van de bronnen is het detecteren en begrijpen van gegevensbronnen en het gebruik ervan. Zakelijke gebruikers hebben mogelijk gegevens nodig voor bedrijfsinformatie, ontwikkeling van toepassingen, data science of een andere taak waarbij de juiste gegevens vereist zijn. Ze kunnen de detectiefunctie van Data Catalog gebruiken om te snel zoeken naar gegevens die ze nodig hebben, de gegevens te beoordelen op geschiktheid en de gegevens gebruiken door het openen van de gegevensbron in een hulpprogramma naar keuze.

Tegelijkertijd kunnen gebruikers bijdragen aan de catalogus door tags, documentatie en aantekeningen te maken voor gegevensbronnen die al zijn geregistreerd. Ze kunnen ook nieuwe gegevensbronnen registreren, die vervolgens kunnen worden gevonden, begrepen en gebruikt door de community van catalogusgebruikers.

Mogelijkheden van Data Catalog

Meer informatie over Data Catalog

Zie voor meer informatie over de mogelijkheden van Data Catalog:

Volgende stappen