¿Cómo puedo comprobar que he detenido correctamente un clúster de HDInsight y que no se me cobrará?

Para detener un clúster de HDInsight, debe eliminarlo. De forma predeterminada, todos los datos en los que opera un clúster de HDInsight residen en Azure Blob Storage, por lo que no se verán afectados por esto. Si desea conservar sus metadatos de Hive (tablas o esquemas) debe aprovisionar un clúster con un almacén de metadatos externo. Puede encontrar más detalles en esta documentación.

Preguntas y respuestas relacionadas

  • Cada suscripción tiene un límite predeterminado respecto al número de nodos de datos de HDInsight que pueden crearse. Si necesita crear un clúster de HDInsight de mayor tamaño o varios clústeres de HDInsight que, en conjunto, superan el máximo de la suscripción actual, puede solicitar un incremento de los límites de facturación de la suscripción. Abra una incidencia de soporte técnico en la que se especifique Facturación para el tipo de soporte. Dependiendo del número máximo de nodos por suscripción que solicite, puede que se le pida información adicional que nos permita optimizar sus implementaciones.

  • El número de nodos de datos variará en función de sus necesidades. Gracias a la elasticidad que ofrece Azure Cloud Services, puede probar diversos tamaños de clúster para determinar la combinación de costo y rendimiento que le resulte óptima y pagar únicamente por lo que utilice en un momento dado. Los clústeres también se pueden escalar bajo demanda para ampliar y reducir con la finalidad de cumplir los requisitos de su carga de trabajo.

  • Para calcular el coste de clústeres de varios tamaños, pruebe la Calculadora de Azure.

  • Cobramos el número de minutos durante los que se ejecuta el clúster, redondeado al minuto más próximo, no a la hora.

  • HDInsight implementa un número de nodos diferente para cada tipo de clúster. Dentro de un tipo de clúster dado, hay roles diferentes para los distintos nodos. Esto permite a los clientes dimensionar esos nodos en un rol determinado adecuado para los detalles de su carga de trabajo. Por ejemplo, un clúster de Hadoop puede tener sus propios nodos aprovisionados con una gran cantidad de memoria si el tipo de análisis que se va a realizar consume mucha memoria. Los clústeres de Hadoop para HDInsight se implementan con dos roles:

    • Nodo principal (2 nodos)
    • Nodo de datos (al menos 1 nodo) Los clústeres de HBase para HDInsight se implementan con tres roles:
    • Servidores principales (2 nodos)
    • Servidores de región (al menos 1 nodo)
    • Nodos maestros o Zookeeper (3 nodos) Los clústeres de Storm para HDInsight se implementan con tres roles:
    • Nodos Nimbus (2 nodos)
    • Servidores de supervisor (al menos 1 nodo)
    • Nodo Zookeeper (3 nodos) Los clústeres Spark para HDInsight se implementan con tres roles:
    • Nodo principal (2 nodos)
    • Nodo de trabajo (al menos 1 nodo)
    • Nodos Zookeeper (3 nodos) (gratis para nodos Zookeeper A1) El uso de R Server implica un nodo perimetral además de la arquitectura de implementación del clúster.
  • If you run a cluster for 100 hours in US East with two D13 v2 head nodes, three D12 v2 data nodes, and three D11 v2 zookeepers, the billing would be the following in the two scenarios:

    • On a Standard HDInsight cluster—100 hours x (2 x $-/hour + 3 x $-/hour + 3 x $-/hour) = $-
    • On a Standard HDInsight cluster with Enterprise Security Package—100 hours x (2 x $-/hour + 3 x $-/hour + 3 x $-/hour) + 100 hours x (2 x 8 + 3 x 4 + 3 x 2) x $-/core-hour = $-