Installare applicazioni Apache Hadoop di terze parti in Azure HDInsight

Informazioni su come installare applicazioni Apache Hadoop di terze parti in Azure HDInsight. Per istruzioni sull'installazione di un'applicazione personalizzata, vedere l'articolo su come installare applicazioni HDInsight personalizzate.

Un'applicazione HDInsight è un'applicazione che gli utenti possono installare in un cluster HDInsight. Queste applicazioni possono essere sviluppate da Microsoft, da fornitori di software indipendenti (ISV) o dall'utente.

L'elenco seguente mostra le applicazioni pubblicate:

Applicazione Tipi di cluster Descrizione
AtScale Intelligence Platform Hadoop AtScale consente di trasformare il cluster HDInsight in un server OLAP con scalabilità orizzontale, consentendo di eseguire query su miliardi di righe di dati in modo interattivo usando gli strumenti di business intelligence già noti, di proprietà e apprezzati, da Microsoft Excel, Power BI, Tableau Software a QlikView.
Datameer Hadoop Datameer è una piattaforma scalabile self-service che consente di preparare, esplorare e controllare i dati per accelerare l'analisi convertendo i dati complessi a più origini in informazioni pronte per l'azienda, con conseguente generazione più veloce e più intelligente di informazioni dettagliate su scala aziendale.
Dataiku DSS on HDInsight Hadoop, Spark Dataiku DSS è una piattaforma data science aziendale che consente a data scientist e analisti di dati di collaborare per progettare ed eseguire nuovi prodotti e servizi dati in modo più efficiente, trasformando i dati non elaborati in stime a impatto elevato.
WANdisco Fusion HDI App Hadoop, Spark, HBase, Kafka Mantenere la coerenza dei dati in un ambiente distribuito è una grande sfida per le operazioni sui dati. WANdisco Fusion, una piattaforma software di livello aziendale, risolve questo problema abilitando la coerenza dei dati non strutturati in qualsiasi ambiente.
H2O SparklingWater for HDInsight Spark H2O Sparkling Water supporta gli algoritmi distribuiti seguenti: GLM, Naïve Bayes, Distributed Random Forest, Gradient Boosting Machine, Deep Neural Networks, Deep Learning, K-means, PCA, Generalized Low Rank Models, Anomaly Detection, Autoencoders.
Striim for Real-Time Data Integration to HDInsight Hadoop, HBase, Spark, Kafka Striim (si pronuncia come è scritto) è una piattaforma di intelligence e di integrazione dei dati di streaming end-to-end, che consente l'inserimento continuo, l'elaborazione e l'analisi di flussi di dati di vario genere.
Jumbune Enterprise-Accelerating BigData Analytics Hadoop, Spark A un livello elevato, Jumbune assiste le aziende 1. Accelerando le prestazioni del carico di lavoro Hive, Java, Scala basato sul motore Tez, MapReduce e Spark. 2. Monitorando in modo proattivo il cluster Hadoop, 3. Determinando la gestione della qualità dei dati nei file system distribuiti.
Kyligence Enterprise Hadoop, HBase, Spark Basato su Apache Kylin, Kyligence Enterprise abilita LA BI in Big Data. Come motore OLAP aziendale in Hadoop, Kyligence Enterprise consente agli analisti aziendali di progettare BI in Hadoop con metodologie data warehouse e BI standard del settore.
StreamSets Data Collector for HDInsight Cloud Hadoop, HBase, Spark, Kafka StreamSets Data Collector è un motore leggero e potente che trasmette i dati in tempo reale. Usare l'agente di raccolta dati per instradare ed elaborare i dati nei flussi di dati. Viene fornito con una licenza di valutazione di 30 giorni.
Trifacta Wrangler Enterprise Hadoop, Spark, HBase Trifacta Wrangler Enterprise per HDInsight supporta il data wrangling a livello aziendale per qualsiasi scala di dati. Il costo dell'esecuzione di Trifacta su Azure è costituito da una combinazione di costi di sottoscrizione Trifacta oltre ai costi dell'infrastruttura di Azure per le macchine virtuali.
Unifi Data Platform Hadoop, HBase, Spark Unifi Data Platform è una suite integrata senza problemi di strumenti di dati self-service progettati per consentire all'utente aziendale di affrontare le sfide dei dati che determinano ricavi incrementali, ridurre i costi o la complessità operativa.

Nelle istruzioni illustrate in questo articolo si usa il portale di Azure. È anche possibile esportare il modello di Azure Resource Manager dal portale oppure ottenere una copia del modello di Resource Manager dai fornitori e usare l'interfaccia della riga di comando classica di Azure e Azure PowerShell per distribuire il modello. Vedere Creare cluster Apache Hadoop in HDInsight mediante modelli di Resource Manager.

Prerequisiti

Per installare applicazioni HDInsight in un cluster HDInsight esistente, è necessario un cluster HDInsight. Per crearne uno, vedere Creare cluster. È anche possibile installare applicazioni HDInsight quando si crea un cluster HDInsight.

Installare applicazioni in cluster esistenti

La procedura seguente illustra come installare applicazioni HDInsight in un cluster HDInsight esistente.

Installare un'applicazione HDInsight

  1. Accedere al portale di Azure.

  2. Dal menu a sinistra passare a Tutti i servizi>Analytics>Cluster HDInsight.

  3. Selezionare un cluster HDInsight dall'elenco. Se non ci sono cluster disponibili, è necessario crearne uno. Vedere Creare cluster.

  4. Nella categoria Impostazioni selezionare Applicazioni. È possibile visualizzare un elenco delle applicazioni installate nella finestra principale.

    HDInsight applications portal menu.

  5. Selezionare +Aggiungi dal menu. Verrà visualizzato un elenco delle applicazioni disponibili. Se +Aggiungi è disattivato, significa che non sono disponibili applicazioni per questa versione del cluster HDInsight.

    HDInsight applications available applications.

  6. Selezionare una delle applicazioni disponibili e quindi seguire le istruzioni per accettare le note legali.

È possibile vedere lo stato di installazione dell'applicazione dalle notifiche del portale selezionando l'icona a forma di campana nella parte superiore del portale. Dopo l'installazione dell'applicazione, questa verrà visualizzata nel pannello App installate.

Installare applicazioni durante la creazione del cluster

È possibile installare applicazioni HDInsight quando si crea un cluster. Durante il processo, le applicazioni HDInsight vengono installate dopo la creazione del cluster e mentre è nello stato in corso di esecuzione. Per installare le applicazioni durante la creazione del cluster usando il portale di Azure, nella scheda Configurazione + prezzi selezionare +Aggiungi applicazione.

Azure portal cluster configuration applications.

Elencare le app HDInsight installate e le proprietà

Il portale include un elenco delle applicazioni HDInsight installate per un cluster e le proprietà di ognuna.

Elencare le applicazioni HDInsight e visualizzare le proprietà

  1. Accedere al portale di Azure.

  2. Dal menu a sinistra passare a Tutti i servizi>Analytics>Cluster HDInsight.

  3. Selezionare un cluster HDInsight dall'elenco.

  4. Nella categoria Impostazioni selezionare Applicazioni. È possibile visualizzare un elenco delle applicazioni installate nella finestra principale.

    HDInsight applications installed apps.

  5. Selezionare una delle applicazioni installate per visualizzare la proprietà. Elenchi delle proprietà:

    Proprietà Descrizione
    Nome dell'app Nome applicazione.
    Status Stato dell'applicazione.
    Pagina Web URL dell'applicazione Web distribuita nel nodo perimetrale. Le credenziali sono le stesse usate per le credenziali utente HTTP configurate per il cluster.
    Endpoint SSH È possibile usare SSH per connettersi al nodo perimetrale. Le credenziali SSH sono le stesse usate per le credenziali utente SSH configurate per il cluster. Per altre informazioni, vedere Usare SSH con HDInsight.
    Descrizione Descrizione dell'applicazione.
  6. Per eliminare un'applicazione, fare clic con il pulsante destro del mouse sull'applicazione e quindi scegliere Elimina dal menu di scelta rapida.

Connettersi al nodo perimetrale

È possibile connettersi al nodo perimetrale tramite HTTP e SSH. Le informazioni sull'endpoint sono disponibili nel portale. Per altre informazioni, vedere Usare SSH con HDInsight.

Le credenziali dell'endpoint HTTP sono le credenziali utente HTTP configurate per il cluster HDInsight. Le credenziali dell'endpoint SSH sono le credenziali SSH configurate per il cluster HDInsight.

Risoluzione dei problemi

Vedere Risolvere i problemi di installazione.

Passaggi successivi