Trace Id is missing
Ana içeriğe atla
Azure
Dizüstü bilgisayarda sunum üzerinden yüz yüze tartışan dört kişi

Veri ambarı nedir?

Veri ambarının ne olduğunu, bir veri ambarını kullanmanın avantajlarını, tasarım aşamasında dikkate alınacak en iyi deneyimleri ve derleme zamanı geldiğinde hangi araçların dahil edileceğini öğrenin.

Veri ambarı nedir?

İlk olarak, bir veri ambarının ne olduğunu ve kurumunuz için neden bir veri ambarı kullanmak isteyebileceğinizi tanımlayalım.

Veri ambarı, raporlama ve analiz amacıyla yapılandırılmış verileri (veritabanı tabloları, Excel sayfaları) ve yarı yapılandırılmış verileri (XML dosyaları, web sayfaları) depolayan merkezi bir depodur. Veriler satış noktası sistemleri, iş uygulamaları ve ilişkisel veritabanlarıilişkisel veritabanlarıgibi çeşitli kaynaklardan gelir ve genellikle ambara isabet edene kadar temizlenir ve standart hale getirilir. Bir veri ambarı büyük miktarlarda bilgi depoladığından, kullanıcılara veri madenciliği, veri görselleştirme ve diğer iş zekası raporlama biçimleri için kullanılabilecek türde zengin geçmiş verilere kolay erişim sağlar.

Bir tablodaki rapor verilerini kontrol eden iki kişi

Veri ambarının avantajları

Güvenilir veriler, özellikle zaman içinde toplandığında kullanıcıların kurumlarını ve veri ambarlarını çalıştırma yöntemi hakkında daha akıllı ve daha bilinçli kararlar almasına yardımcı olur. Kurumsal veri ambarının avantajları sayısızdır, ancak en etkili avantajlardan bazıları şunlardır:

Veri ambarı ve veri gölü karşılaştırması

Veri ambarları, tüm kurumların analiz işlemleri için çok önemlidir. Peki veri ambarı ile veri gölü gibi diğer veri deposu türleri arasındaki farklar nedir? Hangisi ne zaman tercih edilmelidir?

Veri ambarları ve veri gölleri depo olarak verileri depolar ve işler. Yine de, aynı işlevselliği sunuyor gibi görünseler de her biri kendi kullanım örneklerine sahiptir. Bu nedenle kurumlar her iki sistemi de yaygın bir şekilde birleştirerek çok çeşitli amaçlara yönelik eksiksiz ve uçtan uca bir çözüm oluşturur.

Veri ambarı, doğası gereği ilişkiseldir. Bu da verilerin yapısının veya şemasının SQL sorgu işlemleri için seçki olarak sunulan, uyumlu ve iyileştirilmiş önceden tanımlanmış iş ve ürün gereksinimlerine göre belirlendiği anlamına gelir. Sonuç olarak, veri ambarlarının en ideal kullanımı iş zekası analizi için veri madenciliği veya önceden tanımlanmış bir iş kullanım örneğinin kaynağını belirleme gibi belirli bir amaca yönelik değerlendirilen verilerin depolamasına yöneliktir.

Veri ambarları gibi veri gölleri de yapılandırılmış ve yarı yapılandırılmış verileri barındırır. Yine de mobil uygulamalar, IoT cihazları, sosyal medya veya akış dahil olmak üzere ilişkisel olmayan çeşitli kaynaklardan ham ve işlenmemiş verileri alma özelliğine de sahiptir. Bunun nedeni, bir veri gölündeki yapı veya şemanın veriler okunana kadar tanımlanmamasıdır. Esnek ve ölçeklenebilir doğasının bir sonucu olarak veri gölleri, genellikle makine öğrenmesi gibi akıllı veri analizi biçimlerini gerçekleştirmek için kullanılır.

kurum genelinde destek planı
Veri Gölü Veri ambarı
Tür

Yapılandırılmamış, yarı yapılandırılmış ve yapılandırılmamış
İlişkisel, ilişkisel olmayan

Yapılandırılmış
İlişkisel

Şema

Şema okumada

Şema yazmada

Biçim

Ham, filtrelenmemiş

İşlendi, incelendi

Kaynaklar

Büyük veri, IoT, sosyal medya, akış verileri

Uygulama, iş, işlem verileri, toplu raporlama

Ölçeklenebilirlik

Düşük maliyetle kolayca ölçeklendirin

Ölçeklendirmesi zor ve pahalı

Kullanıcılar

Veri bilimcileri, veri mühendisleri

Veri ambarı uzmanları, iş analistleri

Kullanım örnekleri

Machine Learning, tahmine dayalı analiz, gerçek zamanlı analiz

Temel raporlama, BI

Sandalyede oturan ve masada çalışan bir kişi

Veri ambarı mimarisi ve tasarımı

Veri ambarının neden ve ne zaman kullanmanız gerektiğini bildiğinize göre şimdi veri ambarı tasarımına bakarak nasıl çalıştığını inceleyelim. Veri ambarı, kendi kendine çalışan tek bir silodan fazlasıdır. Bunun yerine, farklı yollarla verilerinizle ve birbiriyle etkileşim kuran birden çok katmandan oluşan, yüksek oranda yapılandırılmış ve dikkatli bir şekilde tasarlanmış bir sistemdir. Genellikle bu katmanlar şunları içerir:

Alt katman

Veriler birden çok kaynaktan alınır, sonra ayıkla, dönüştür ve yükle (ETL) adlı bir işlemde diğer uygulamaların kullanması için temizlenir ve dönüştürülür. Alt katman aynı zamanda verilerin depolandığı ve iyileştirildiği yerdir ve bu da sorgu sürelerinin hızlanmasına ve genel olarak daha iyi performansa erişilmesini sağlar.

Orta katman

Çevrimiçi analitik işlem (OLAP) sunucusu olarak da bilinen analiz altyapısını burada görürsünüz. OLAP sunucuları, veri ambarından büyük hacimli verilere yüksek hızda erişerek ışık hızında sonuçların alınmasını sağlar.

Üst katman

Üst katman, ön uç arabiriminin işlenen verileri görsel olarak sunduğu ve analistlerin tüm raporlama ve self servis BI ihtiyaçları için erişebileceği ve kullanabileceği katmandır.

Veri ambarı nasıl oluşturulur?

Veri ambarı tasarlayıp oluştururken, kurumunuzun hem uzun vadeli hem de geçici hedeflerini ve verilerinin doğasını göz önünde bulundurmanız önemlidir. Kaç veri kaynağı ile tümleştirme yapıyorsunuz? İş akışlarınızı otomatikleştirmeyi planlıyor musunuz? Verilerinizi nasıl keşfedip çözümleyeceksiniz? Derlemeniz gereksinimlerinizin karmaşıklığına bağlı olarak değişir, ancak tipik bir kurumsal veritabanı ambarı aşağıdaki bileşenlerden oluşur:

  1. Satış noktası sistemlerinden operasyonel verileri çıkartan veri kaynakları , iş uygulamaları ve diğer ilişkisel veritabanları
  2. Verilerin ambar veya merkezi depo için temizlendiğini ve dönüştürüldüğü hazırlama alanıdır 
  3. kolay kullanıcı erişimi için işlenmiş operasyonel verileri, meta verileri, özet verileri ve ham verileri depolayan bir ambar veya merkezi depo
  4. Merkezi depodan verileri alıp seçili kullanıcı gruplarına bu verileri alt kümeler halinde sunan veri reyonlarınıneklenmesi
  5. Veri bilimcilerinin korumalı bir ortamda yeni veri keşfi formlarını test etmek için kullanabileceği bir korumalı alan
  6. Tümleştirme, depolama, performans ve analiz için çok çeşitli veri ambarı araçları, çerçeveler ve API’ler
Dizüstü bilgisayarda grafikleri ve iki monitörde veri raporlarını analiz eden bir kişi
Açık grafikleri gösteren bir dizüstü bilgisayar ekranı

Veri ambarı araçları, yazılımları ve kaynakları

Günümüzün veri merkezli dünyasında birçok büyük yazılım şirketi, her biri kendi özel kullanım örneğine sahip olan sonsuz bir veri ambarı yazılımı yelpazesine sahiptir. Göz korkutucu görünebilir, ancak birlikte çalışan, yüksek performanslı bir çözüm oluşturmak için doğru araçlara ve teknolojilere yatırım yapılması gerekir. Her kurumun ihtiyaçları farklıdır, ancak incelenmesi gereken bazı temel veri ambarı ürünlerinden bazıları şu şekildedir:

Bulut ve hibrit bulut veri ambarı

 Azure Synapse Analyticsgibi birleşik, bulut tabanlı bir veri ambarı çözümü, kurumlara daha hızlı ve daha düşük maliyetle ölçeklendirme, işlem ve depolama olanağı sağlar.

Veri tümleştirme araçları

ETL işlem hatları, kullanıcıların iş akışlarını oluşturmasına, zamanlamasına ve düzenlemelerine olanak sağlar; böylelikle kaynak veriler otomatik olarak tümleştirilir, temizlenir ve standart hale getirilir.

Nesne depolama

Bir nesne depolama çözümü, büyük miktarlarda yapılandırılmış, yarı yapılandırılmış ve yapılandırılmamış verileri barındırır ve bu da onu kaynak verilerin ambara yüklenmeden önce hazırlanmasını için mükemmel bir çözüm haline getirir.

Ambar araçları

Dağıtılmış depolama çözümü, sütunlu depolamaya sahip ilişkisel tablolarda büyük veri kümelerini içerir. Bu, maliyetleri büyük ölçüde düşürebilir, sorgu performansını artırır ve içgörü elde etme süresini hızlandırır.

Performans araçları

Performansı arttırmak için bellek içi işlemeyi destekleyen açık kaynaklı bir paralel işleme altyapısı olan Apache Spark’ı kullanabilirsiniz.

Kaynak ve iş yükü yönetimi

Bir kaynak yöneticisi, verileri uygun şekilde yükleyebilmeniz, analiz edebilmeniz, yönetmeniz ve dışarı aktarabilmeniz için iş yüklerinize bilgi işlem gücü tahsis eder.

Veri modelleme

Veri modelleme, birden çok veri kaynaklarını tek bir anlamsal modelde birleştirerek verilerinizin yapılandırılmış ve kolaylaştırılmış bir görünümünü sağlar.

İş zekası araçları

İş analizi araçları, kullanıcılara panolar, raporlar ve diğer görselleştirme araçları biçiminde içgörüler sunmanıza yardımcı olur.

Güvenlik ve gizlilik özellikleri

Veri şifreleme, kullanıcı kimlik doğrulaması ve erişim izleme gibi güvenlik ve uyumluluk özellikleri, verilerinizin daima korunmasını sağlar.

Bir konuyu tartışan iki kişi ve bunlardan sağdaki kişi elinde dizüstü bilgisayar tutuyor

Azure SQL Veri Ambarı’na ne oldu?

Azure SQL Data Warehouse özellikleri artık ayrılmış SQL havuzu olarak adlandırılan Azure Synapse Analytics ’e aittir. Mevcut Azure SQL Data Warehouse müşterileri, herhangi bir değişiklik yapmadan Azure SQL Data Warehouse SQL havuzu özelliğini kullanarak mevcut Azure Synapse Analytics iş yüklerini çalıştırmaya devam eder. Müşteriler ayrıca sunucusuz veri gölü keşfi ve bütünleşik SQL ve Apache Spark™ altyapıları gibi gelişmiş analiz özelliklerinden yararlanmak için Azure Synapse Analytics ile mevcut ambar verilerini yönetmeye başlayabilir.

Sık sorulan sorular

  • Veri ambarı, raporlama, analiz ve diğer iş zekası biçimleri amacıyla yapılandırılmış (veritabanı tabloları, Excel sayfaları) ve yarı yapılandırılmış verileri (XML dosyaları, web sayfaları) tutan merkezi bir depodur.

  • Veri ambarı kullanmanın birçok avantajı vardır. Örneğin, bir veri ambarı birden çok veri kaynağını tek bir gerçeklik kaynağında birleştirilir ve kurumlar daha sonra iş ve operasyonlar hakkında daha bilinçli kararlar almak için bunları kullanabilir.

  • Veri ambarları, kaynak veri madenciliği, veri görselleştirme ve diğer belirli BI kullanım örnekleri için kullanılabilecek yapılandırılmış ve yarı yapılandırılmış verileri depolar. Veri gölleri, veri bilimcilerinin çeşitli projelerin kaynağını oluşturmak için kullanabileceği çeşitli ham veri türlerini depolar.

  • Bir veri ambarı genellikle birden çok katmandan oluşur: verilerin toplandığı ve depolandığı alt katman; verilerin analiz edildiği orta katman; ve kullanıcıların erişmesi ve ayrıştırması için verilerin görüntülendiği üst katman.

  • Veri ambarı altyapısı tasarlayıp oluştururken verilerinizin doğasını ve nasıl dönüştürmek istediğinizi göz önünde bulundurmanız önemlidir. Tipik bir derlemenin bazı ortak öğeleri arasında veri kaynakları, hazırlama alanı, ambarın kendisi, veri reyonları, korumalı alan ve çeşitli tümleştirme araçları yer alır.

  • Birçok büyük yazılım şirketi artık çok çeşitli veri ambarı ürünlerine sahiptir.

  • Bu özellikler artık ayrılmış SQL havuzu olarak adlandırılan Azure Synapse Analytics’in özellikleridir. Mevcut Azure SQL Data Warehouse müşterileri herhangi bir değişiklik yapmadan iş yüklerini çalıştırmaya devam edebilir.

Ücretsiz Hesap

Azure Bulut Bilişim hizmetlerini 30 güne kadar ücretsiz deneyin.

Kullandığın kadar öde

Kullandıkça öde fiyatlandırmasıyla kullanmaya başlayın. Önceden taahhütte bulunmadan istediğiniz zaman iptal edin.