Data Lake

Soluzione Data Lake senza limiti per azioni intelligenti

Azure Data Lake include tutte le funzionalità necessarie a sviluppatori, data scientist e analisti per archiviare facilmente dati di tutte le dimensioni, forme e velocità e svolgere qualsiasi tipo di elaborazione e analisi con più piattaforme e linguaggi. Il servizio elimina la complessità correlata all'inserimento e all'archiviazione di tutti i dati, semplificando la preparazione e l'esecuzione con analisi in batch, di streaming e interattive. Azure Data Lake si integra con l'investimento IT esistente per identità, gestione e sicurezza, per gestione e governance dei dati semplificate. Il servizio si integra in modo uniforme anche con gli archivi operativi e i data warehouse, per permetterti di estendere le applicazioni dati correnti. Abbiamo realizzato questo servizio basandoci sull'esperienza acquisita dalla collaborazione con clienti aziendali e dall'esecuzione di alcuni tra i carichi di lavoro di elaborazione e analisi su più vasta scala nel mondo per soluzioni Microsoft come Office 365, Xbox Live, Azure, Windows, Bing e Skype. Azure Data Lake affronta con successo molte delle sfide poste da produttività e scalabilità che normalmente ti impediscono di ottimizzare il valore delle risorse dati, grazie a un servizio pronto a soddisfare le tue esigenze aziendali attuali e future.

Breve video per una panoramica

Data Lake Analytics: un servizio di analisi senza limiti per azioni intelligenti

Il primo servizio di analisi cloud che ti permette di sviluppare ed eseguire facilmente programmi di elaborazione e trasformazione dei dati con architettura altamente parallela in U-SQL, R, Python e .NET su petabyte di dati. Nessuna infrastruttura da gestire, elaborazione dei dati on demand, scalabilità immediata e pagamento in base ai processi. Altre informazioni

HDInsight: servizio Hadoop® e Apache Spark cloud per l'azienda

HDInsight è l'unica soluzione Hadoop cloud completamente gestita che fornisce cluster di analisi open source ottimizzati per Spark, Hive, Map Reduce, HBase, Storm, Kafka ed R Server con un contratto di servizio che garantisce la disponibilità al 99,9%. Ognuna di queste tecnologie di Big Data e applicazioni ISV consente una semplice distribuzione come cluster gestito, con funzionalità di sicurezza e monitoraggio di livello aziendale. Altre informazioni

Data Lake Store: un archivio senza limiti per l'analisi di Big Data

La prima soluzione Data Lake cloud per le aziende sicura, con scalabilità estremamente elevata e basata sullo standard aperto HDFS. Grazie all'assenza di limiti per le dimensioni dei dati e alla possibilità di eseguire analisi altamente parallele, puoi sfruttare al meglio il valore di tutti i tuoi dati non strutturati, semistrutturati e strutturati. Altre informazioni

Sviluppo, debug e ottimizzazione di programmi di Big Data con facilità

La scelta degli strumenti più adatti per progettare e ottimizzare le query sui Big Data può rappresentare una sfida complessa. Data Lake semplifica queste attività attraverso una profonda integrazione con Visual Studio, Eclipse e IntelliJ, permettendoti di usare strumenti familiari per esecuzione, debug e ottimizzazione del codice. Le visualizzazioni dei processi U-SQL, Apache Spark, Apache Hive e Apache Storm ti permettono di verificare l'esecuzione del codice su vasta scala e di identificare i colli di bottiglia in termini di prestazioni e l'efficienza dei costi, semplificando l'ottimizzazione delle query. Il nostro ambiente di esecuzione analizza attivamente i tuoi programmi quando vengono eseguiti e ti offre consigli per migliorare le prestazioni e ridurre i costi. Sviluppatori di dati, amministratori di database e progettisti di architetture dei dati possono sfruttare le competenze esistenti, ad esempio in SQL, Apache Hadoop, Apache Spark, R, Python, Java e .NET, per essere produttivi sin dal primo giorno.

Facile integrazione con gli investimenti IT esistenti

Una delle sfide principali dei Big Data è l'integrazione con gli investimenti IT esistenti. Data Lake è un componente chiave di Cortana Intelligence e si integra quindi con Azure SQL Data Warehouse, Power BI e Data Factory per offrirti una piattaforma cloud completa di analisi avanzata e Big Data che ti supporta in ogni attività, dalla preparazione dei dati allo svolgimento di analisi interattive su set di dati su larga scala. Data Lake Analytics ti permette di usare tutti i dati in modo costruttivo, con virtualizzazione ottimizzata dei dati delle origini relazionali come Azure SQL Server nelle macchine virtuali, database SQL di Azure e Azure SQL Data Warehouse. Le query vengono ottimizzate automaticamente spostando l'elaborazione vicino ai dati di origine senza spostare i dati, per ottenere i massimi livelli di prestazioni con una latenza minima. Infine, poiché Data Lake è in Azure, puoi connetterti a ogni tipo di dati generati dalle applicazioni o presenti nei dispositivi in scenari Internet of Things (IoT).

Archiviazione e analisi di file con dimensioni di petabyte e trilioni di oggetti

Data Lake è stato progettato da zero per garantire scalabilità e prestazioni di livello cloud. Con Azure Data Lake Store l'organizzazione può analizzare tutti i dati da un'unica posizione senza vincoli artificiali. Data Lake Store consente di archiviare trilioni di file con dimensioni dei singoli file che possono superare un petabyte, ovvero 200 volte maggiori rispetto a quanto possibile negli altri archivi cloud. Di conseguenza, se aumenti o riduci le dimensioni dei dati archiviati o la quantità di calcolo usata, non devi riscrivere il codice. In questo modo, puoi concentrarti solo sulla logica di business e non sul modo in cui elaborare e archiviare set di dati di grandi dimensioni. Data Lake elimina anche la complessità normalmente associata ai Big Data nel cloud, per essere in grado di soddisfare le tue esigenze aziendali attuali e future.

Conveniente ed economico

Data Lake è una soluzione a costi ridotti per l'esecuzione di carichi di lavoro di Big Data. Puoi scegliere tra cluster on demand o un modello di pagamento per processo quando vengono elaborati i dati. In entrambi i casi non sono necessari hardware, licenze o contratti di supporto specifici del servizio. Poiché il sistema è in grado di ridimensionarsi in base alle tue esigenze aziendali, non paghi mai in eccesso rispetto a quanto ti serve. Il servizio ti permette anche di ridimensionare in modo indipendente l'archiviazione e il calcolo, per una flessibilità più conveniente rispetto alle soluzioni per Big Data tradizionali. Infine, il servizio riduce al minimo la necessità di impiegare un team operativo specializzato, normalmente associato all'esecuzione di un'infrastruttura per Big Data. Data Lake abbatte i costi ottimizzando il ritorno sugli investimenti nei dati. Da uno studio recente è emerso che HDInsight ha un costo totale di proprietà del 63% inferiore rispetto alla distribuzione di Hadoop in locale in un arco di cinque anni.

Sicurezza, controllo e supporto di livello aziendale

Data Lake è completamente gestito e supportato da Microsoft, con servizio di supporto e contratto di servizio di livello aziendale. L'assistenza clienti 24 ore su 24, 7 giorni su 7 ti permette di contattarci per gestire qualsiasi problematica riguardo all'intera soluzione per Big Data. Il nostro team monitora la distribuzione al posto tuo, garantendone un'esecuzione ininterrotta. Data Lake protegge gli asset di dati ed estende facilmente nel cloud i controlli di governance e sicurezza locali. I dati sono sempre crittografati, con SSL quando sono in transito e, quando sono inattivi, con chiavi basate sul modulo di protezione hardware gestite dall'utente o dal servizio in Azure Key Vault. Funzionalità come Single Sign-On (SSO), Multi-Factor Authentication e facile gestione di milioni di identità sono integrate tramite Azure Active Directory. Puoi autorizzare utenti e gruppi con ACL basati su POSIX con granularità fine per tutti i dati nell'archivio abilitando il controllo degli accessi in base al ruolo. Infine, puoi soddisfare le esigenze di sicurezza e conformità alle normative controllando ogni accesso o modifica alla configurazione nel sistema.

Crea soluzioni Data Lake usando questi potenti servizi

Apache Hadoop® e i nomi di progetti open source associati sono marchi registrati di Apache Software Foundation.