Data Citizens wie technische und geschäftliche Benutzer*innen benötigen Angaben zur Datenherkunft für die Analyse von Grundursachen, die Auswirkungsanalyse, die Nachverfolgung der Datenqualität und andere Datengovernanceszenarios. In der aktuellen Datenlandschaft, in der sich Daten fließend zwischen Standorten (lokal und in der Cloud) und Datenplattformen und Anwendungen bewegen, gewinnt die Datenherkunft zunehmend an Bedeutung. Deshalb führen wir die Vorschauversion der dynamischen Extraktion der Datenherkunft ein.
Konventionelle Systeme ordnen die Datenherkunft mithilfe der Analyse von Datentransformationsskripts zu. Dieser Vorgang wird auch als „statische Codeanalyse“ bezeichnet. In einfachen Fällen funktioniert das gut. Wenn ein SQL-Skript verwendet wird, um die Zieltabelle Customer_Sales zu erstellen, indem die Tabellen „Customer“ und „Sales“ verknüpft werden, kann die Datenherkunft mithilfe einer statischen Codeanalyse zugeordnet werden. In vielen realen Anwendungsfällen sind die Datenverarbeitungsworkloads jedoch kompliziert. Die Skripts könnten mit einer gespeicherten Prozedur umschlossen sein, die parametrisiert ist und dynamischen SQL-Code verwendet. Eine Entscheidungsstruktur mit einer if-then-else-Anweisung könnte vorhanden sein, die verschiedene Skripts zur Laufzeit ausführt. Es könnten aber auch Commitfehler zur Laufzeit bei Datentransaktionen vorliegen.
In all diesen Beispielen ist eine dynamische Analyse erforderlich, um die Datenherkunft effektiv nachverfolgen zu können. Noch wichtiger ist, dass bei der statischen Analyse der Datenherkunft keine Daten und Prozesse mit Laufzeitmetadaten in Verbindung gebracht werden, wodurch Kundenanwendungen erheblich eingeschränkt werden. Aus der Codierung in der dynamischen Datenherkunft geht beispielsweise hervor, wer eine gespeicherte Prozedur wann und über welche Anwendung bzw. welchen Server ausgeführt hat. Dadurch können Kunden den Datenschutz steuern, Vorschriften einhalten, die Time-to-Insight verbessern und ihre Daten und Prozesse insgesamt besser nachvollziehen.
Dynamische Datenherkunft aus Azure SQL-Datenbank
Heute geben wir die Vorschauversion der dynamischen Extraktion der Datenherkunft aus Azure SQL-Datenbank in Azure Purview bekannt. Azure SQL-Datenbank ist eines der am häufigsten verwendeten relationalen Datenbanksysteme in Unternehmen. Gespeicherte Prozeduren werden häufig verwendet, um Datentransformationen und Aggregationen in SQL-Tabellen für Downstreamanwendungen durchzuführen. Dieses Release ermöglicht es Ihnen, Azure Purview Data Map zusätzlich mit dynamischen Metadaten zur Datenherkunft anzureichern, zum Beispiel mit dem Ausführungsstatus, der Anzahl betroffener Zeilen, dem ausführenden Client der gespeicherten Prozedur, Benutzerinformationen und weiteren betrieblichen Details zur Ausführung gespeicherter SQL-Prozeduren in Azure SQL-Datenbank.
Eingeschränkte Metadaten zur Datenherkunft aus der statischen Codeanalyse*
Für die Implementierung greift Azure Purview Data Map auf das Instrumentierungsframework der SQL-Engine zu und extrahiert Laufzeitprotokolle, um die dynamische Datenherkunft zu aggregieren. Die Laufzeitprotokolle enthalten auch Abfragen, die in der SQL-Engine zur Datenbearbeitung ausgeführt wurden. Mit Azure Purview kann die Datenherkunft zugeordnet werden. Darüber hinaus können ausführlichere Informationen zur Herkunft gesammelt werden. Die Azure Purview-Scanner werden mehrmals täglich ausgeführt, um die Aktualität der Angaben zur dynamischen Datenherkunft aus Azure SQL aufrechtzuerhalten.
Weitere Informationen zur dynamischen Datenherkunft mit Azure Purview aus Azure SQL-Datenbank erhalten Sie im folgenden Video:
Einstieg in Azure Purview
Die native Integration mit Azure SQL-Datenbank für die Extraktion der dynamischen Datenherkunft ist bisher einzigartig. Azure Purview nimmt dabei die führende Rolle ein. Führen Sie zum Einstieg die nachfolgenden Schritte aus.
- Erstellen Sie schnell und einfach ein Azure Purview-Konto, um die allgemein verfügbaren Features auszuprobieren.
- In der Schnellstartdokumentation erfahren Sie, wie Sie eine Azure SQL-Datenbank-Instanz mit einem Azure Purview-Konto verknüpfen, um die dynamische Datenherkunft zu erfassen.