As tarefas do Apache Spark ganham melhoria da velocidade até nove vezes com a Cache de E/S do HDInsight
Data de publicação: 31 outubro, 2018
A Cache de E/S do Azure HDInsight já está disponível em pré-visualização nos clusters mais recentes do Apache Spark no Azure HDInsight. Uma vez ativada, melhora o desempenho das tarefas do Apache Spark de forma totalmente transparente, sem quaisquer alterações das tarefas necessárias e pode proporcionar melhoria até nove vezes no tempo de execução de consultas. Isto proporciona uma excelente relação custo-desempenho de implementações do Apache Spark com base na cloud. A Cache de E/S do HDInsight é uma nova funcionalidade de colocação em cache transparente de dados, baseada no RubiX, que utiliza os avanços recentes em tecnologia SSD para tornar desnecessária a gestão de memória explícita e permite a utilização otimizada dos recursos para melhorar o desempenho.