Power Query kullanarak Excel'i Apache Hadoop'a Bağlan

Microsoft büyük veri çözümünün önemli özelliklerinden biri, Microsoft iş zekası (BI) bileşenlerinin Azure HDInsight'taki Apache Hadoop kümeleriyle tümleştirilmesidir. Birincil örnek, Excel için Microsoft Power Query eklentisini kullanarak Hadoop kümenizle ilişkili verileri içeren Azure Depolama hesabına Excel'i bağlama özelliğidir. Bu makalede, HDInsight ile yönetilen hadoop kümesiyle ilişkili verileri sorgulamak için Power Query'yi ayarlama ve kullanma adımları gösterilmektedir.

Önkoşullar

  • HDInsight üzerinde bir Apache Hadoop kümesi. Bkz . Linux'ta HDInsight'ı kullanmaya başlama.
  • Windows 10, 7, Windows Server 2008 R2 veya sonraki bir işletim sistemi çalıştıran bir iş istasyonu.
  • Kurumsal için Microsoft 365 uygulamaları, Office 2016, Office 2013 Professional Plus, Tek Başına Excel 2013 veya Office 2010 Professional Plus.

Microsoft Power Query'yi yükleme

Power Query, çıktısı alınmış veya HDInsight kümesinde çalışan hadoop işi tarafından oluşturulmuş verileri içeri aktarabilir.

Excel 2016'da Power Query, Al ve Dönüştür bölümünün altındaki Veri şeridiyle tümleştirilmiş durumdadır. Eski Excel sürümleri için, Microsoft İndirme Merkezi'nden Excel için Microsoft Power Query'yi indirin ve yükleyin.

HDInsight verilerini Excel'e aktarma

Excel için Power Query eklentisi, HDInsight kümenizdeki verileri Excel'e aktarmayı kolaylaştırır. Burada PowerPivot ve Power Map gibi BI araçları verileri incelemek, analiz etmek ve sunmak için kullanılabilir.

  1. Excel'i başlatın.

  2. Yeni boş bir çalışma kitabı oluşturun.

  3. Excel sürümüne göre aşağıdaki adımları gerçekleştirin:

    • Excel 2016

      • Azure HDInsight'tan (HDFS) Azure'dan>Veri>>Al'ı seçin.>

        HDI.PowerQuery.SelectHdiSource.2016.

    • Excel 2013/2010

      • Azure'dan Microsoft Azure>HDInsight'tan Power Query'yi>seçin.

        HDI.PowerQuery.SelectHdiSource.

        Not: Power Query menüsünü görmüyorsanız, Dosya>Seçenekleri>Eklentileri'ne gidin ve sayfanın altındaki açılan Yönet kutusundan COM Eklentileri'ni seçin. Git... düğmesini seçin ve Excel için Power Query eklentisi kutusunun işaretli olduğunu doğrulayın.

        Not: Power Query, Diğer Kaynaklardan'ı seçerek HDFS'den veri içeri aktarmanıza da olanak tanır.

  4. Azure HDInsight (HDFS) iletişim kutusundaki Hesap adı veya URL metin kutusuna kümenizle ilişkili Azure Blob depolama hesabının adını girin. Ardından Tamam'ı seçin. Bu hesap, varsayılan depolama hesabı veya bağlı depolama hesabı olabilir. Biçim şöyledir: https://StorageAccountName.blob.core.windows.net/.

  5. Hesap Anahtarı için Blob depolama hesabının anahtarını girin ve Bağlan'ı seçin. (Hesap bilgilerini yalnızca bu mağazaya ilk kez erişişiniz için girmeniz gerekir.)

  6. Sorgu Düzenleyicisi sol tarafındaki Gezgin bölmesinde kümenizle ilişkilendirilmiş Blob depolama kapsayıcısı adına çift tıklayın. Varsayılan olarak, kapsayıcı adı küme adıyla aynı addır.

  7. Ad sütununda HiveSampleData.txtbulun (klasör yolu .. /hive/warehouse/hivesampletable/) ve ardından HiveSampleData.txt solunda İkili'yi seçin. HiveSampleData.txt tüm kümeyle birlikte gelir. İsteğe bağlı olarak, kendi dosyanızı kullanabilirsiniz.

    HDI Excel power query import data.

  8. İsterseniz, sütun adlarını yeniden adlandırabilirsiniz. Hazır olduğunuzda Kapat ve Yükle'yi seçin. Veriler çalışma kitabınıza yüklendi:

    HDI Excel power query imported table.

Sonraki adımlar

Bu makalede, HDInsight'tan Excel'e veri almak için Power Query'yi kullanmayı öğrendiniz. Benzer şekilde, HDInsight'tan Azure SQL Veritabanı'a veri alabilirsiniz. HdInsight'a veri yüklemek de mümkündür. Daha fazla bilgi için aşağıdaki makalelere bakın: