Azure HDInsight'ta Apache HBase nedir?

Apache HBase, Apache Hadoop üzerinde oluşturulan ve Google BigTable'dan sonra modellenen açık kaynaklı bir NoSQL veritabanıdır. HBase, şemasız bir veritabanındaki büyük miktarda veri için rastgele erişim ve güçlü tutarlılık sağlar. Veritabanı sütun ailelerine göre düzenlenir.

Kullanıcı açısından bakıldığında, HBase bir veritabanına benzer. Veriler tablonun satır ve sütunlarında depolanır ve satır içindeki veriler sütun ailesine göre gruplandırılır. HBase şemasız bir veritabanıdır. Sütunlar ve veri türleri kullanılmadan önce tanımlanabilir. Açık kaynak kodu, binlerce düğümdeki petabaytlarca verileri işlemek için doğrusal olarak ölçeklendirir. Hadoop ortamındaki dağıtılmış uygulamalar tarafından sağlanan veri yedekliliğini, toplu işlemeyi ve diğer özellikleri kullanabilir.

Apache HBase, Azure HDInsight'ta nasıl uygulanır?

HDInsight HBase, Azure ortamına tümleştirilmiş yönetilen bir küme olarak sunulur. Kümeler, verileri doğrudan Azure Depolama'da depolayarak düşük gecikme süresi ve performans ve maliyet seçeneklerinde daha fazla esneklik sağlayacak şekilde yapılandırılır. Bu özellik, müşterilerin büyük veri kümeleriyle çalışan etkileşimli web siteleri oluşturmasını sağlar. Milyonlarca uç noktadan algılayıcı ve telemetri verilerini depolayan hizmetler oluşturmak için. Bu verileri Hadoop işleriyle analiz etmek. HBase ve Hadoop, Azure'da büyük veri projesi için iyi başlangıç noktalarıdır. Hizmetler gerçek zamanlı uygulamaların büyük veri kümeleriyle çalışmasını sağlayabilir.

HDInsight uygulaması, tabloların otomatik parçalanması için HBase'in genişleme mimarisini kullanır. Okuma ve yazma işlemleri ve otomatik yük devretme için güçlü tutarlılık. Performans, okumalar için bellek içi önbelleğe alma ve yazmalar için yüksek verimlilikli akış tarafından geliştirilmiştir. HBase kümesi sanal ağda oluşturulabilir. Ayrıntılar için bkz. Azure Sanal Ağ'da HDInsight kümeleri oluşturma.

Veriler HDInsight HBase’de nasıl yönetilir?

Veriler HBase kabuğunda create, get, put ve scan komutları kullanılarak HBase tarafından yönetilebilir. Veriler put kullanılarak veritabanına yazılır ve get kullanarak okunur. scan komutu, bir tablodaki birden çok satırdaki verileri almak için kullanılır. Veriler, HBase REST API’sinin üstünde bir istemci kitaplığı sağlayan HBase C# API’si kullanılarak da yönetilebilir. HBase veritabanı Apache Hive kullanılarak da sorgulanabilir. Bu programlama modellerine giriş için bkz. HDInsight'ta Apache Hadoop ile Apache HBase kullanmaya başlama. Veritabanını barındıran düğümlerde veri işlemeye olanak tanıyan ortak işlemciler de kullanılabilir.

Not

Thrift, HDInsight’ta HBase tarafından desteklenmez.

Apache HBase için kullanım örnekleri

BigTable'ın (ve uzantıya göre HBase) web aramasından oluşturulduğu kurallı kullanım örneği. Arama motorları terimleri bunları içeren web siteleriyle eşleştiren dizinler oluşturur. Ancak HBase için uygun olan diğer birçok kullanım örneği vardır; bunların birkaçı bu bölümde listelenmektedir.

Senaryo Açıklama
Anahtar değeri deposu HBase bir anahtar-değer deposu olarak kullanılabilir ve ileti sistemlerini yönetmek için uygundur. Facebook, mesajlaşma sistemi için HBase kullanır ve İnternet iletişimlerini depolamak ve yönetmek için idealdir. WebTable web sayfalarından çıkarılan tabloları aramak ve yönetmek için HBase kullanır.
Algılayıcı verileri HBase çeşitli kaynaklardan artımlı olarak toplanan verileri yakalamak için yararlıdır. Bu veriler sosyal analiz ve zaman serilerini içerir. Ayrıca, etkileşimli panoları eğilimler ve sayaçlarla güncel tutma ve denetim günlüğü sistemlerini yönetme. Örnek olarak Bloomberg traders terminali ve Open Time Series Database (OpenTSDB) verilebilir. OpenTSDB, sunucu sistemlerinin durumu hakkında toplanan ölçümleri depolar ve bu ölçümlere erişim sağlar.
Gerçek zamanlı sorgu Apache Phoenix, Apache HBase için bir SQL sorgu altyapısıdır. JDBC sürücüsü olarak erişilir ve SQL kullanarak HBase tablolarının sorgulanıp yönetilmesini sağlar.
Bir platform olarak HBase Uygulamalar, bir veri deposu olarak kullanarak HBase’in üstünde çalışabilir. Örnek olarak Phoenix, OpenTSDB, Kijive Titan verilebilir. Uygulamalar HBase ile de tümleştirebilir. Örnekler şunlardır: Apache Hive, Apache Pig, Solr, Apache Flume, Apache Impala, Apache Spark Ganglia, ve Apache Drill.

Sonraki adımlar