Trace Id is missing
Lompat ke konten utama

Data Lake

Data lake tanpa batas untuk mendukung tindakan cerdas.

  • Menyimpan dan menganalisis file berukuran petabyte dan triliunan objek
  • Melakukan debug dan mengoptimalkan program big data Anda dengan mudah
  • Mulai dalam hitungan detik, skalakan secara langsung, bayar per pekerjaan
  • Kembangkan program paralel secara masif dengan kesederhanaan
  • Keamanan, audit, dan dukungan tingkat perusahaan
  • Dibuat di YARN, dirancang untuk cloud

Azure Data Lake mencakup semua kemampuan yang diperlukan untuk memudahkan pengembang, ilmuwan data, dan analis untuk menyimpan data dengan berbagai ukuran, bentuk, dan kecepatan, serta melakukan semua jenis pemrosesan dan analitik di seluruh platform dan bahasa. Azure Data Lake menyederhanakan kompleksitas penyerapan dan penyimpanan semua data sekaligus mempercepat proses memulai dan menjalankan analitik batch, streaming, dan interaktif. Azure Data Lake dapat digunakan dengan investasi TI yang ada untuk identitas, manajemen, dan keamanan untuk menghasilkan manajemen dan tata kelola data yang disederhanakan. Azure Data Lake juga terintegrasi secara lancar dengan penyimpanan operasional dan gudang data sehingga Anda dapat memperluas aplikasi data saat ini. Kami mendapatkan pengalaman bekerja bersama pelanggan perusahaan dan menjalankan beberapa pemrosesan skala dan analitik terbesar di dunia untuk bisnis Microsoft seperti Office 365, Xbox Live, Azure, Windows, Bing, dan Skype. Azure Data Lake memecahkan banyak tantangan produktivitas dan skalabilitas yang dapat menghambat dalam memaksimalkan nilai aset data dengan layanan yang siap memenuhi kebutuhan bisnis Anda saat ini dan di masa mendatang.

Azure Data Lake mencakup semua kemampuan yang diperlukan untuk memudahkan pengembang, ilmuwan data, dan analis untuk menyimpan data dengan berbagai ukuran, bentuk, dan kecepatan, serta melakukan semua jenis pemrosesan dan analitik di seluruh platform dan bahasa. Azure Data Lake menyederhanakan kompleksitas penyerapan dan penyimpanan semua data sekaligus mempercepat proses memulai dan menjalankan analitik batch, streaming, dan interaktif. Azure Data Lake dapat digunakan dengan investasi TI yang ada untuk identitas, manajemen, dan keamanan untuk menghasilkan manajemen dan tata kelola data yang disederhanakan. Azure Data Lake juga terintegrasi secara lancar dengan penyimpanan operasional dan gudang data sehingga Anda dapat memperluas aplikasi data saat ini. Kami mendapatkan pengalaman bekerja bersama pelanggan perusahaan dan menjalankan beberapa pemrosesan skala dan analitik terbesar di dunia untuk bisnis Microsoft seperti Office 365, Xbox Live, Azure, Windows, Bing, dan Skype. Azure Data Lake memecahkan banyak tantangan produktivitas dan skalabilitas yang dapat menghambat dalam memaksimalkan nilai aset data dengan layanan yang siap memenuhi kebutuhan bisnis Anda saat ini dan di masa mendatang.

diagram data lake

Data Lake Analytics—layanan pekerjaan analitik tanpa batas untuk mendukung tindakan cerdas

Layanan analitik cloud pertama tempat Anda dapat dengan mudah mengembangkan dan menjalankan transformasi data paralel secara masif serta memproses program di U-SQL, R, Python, dan .Net yang berukuran hingga petabyte data. Proses data sesuai permintaan, sesuaikan dengan cepat, dan cukup bayar untuk setiap pekerjaan tanpa perlu mengelola infrastruktur. Pelajari selengkapnya

Sampul buku Designing Distributed Systems

HDInsight—layanan cloud Apache Spark dan Hadoop® untuk perusahaan

HDInsight adalah satu-satunya penawaran Cloud Hadoop yang dikelola sepenuhnya dan menyediakan kluster analitik sumber terbuka yang dioptimalkan untuk Spark, Hive, Map Reduce, HBase, Storm, Kafka, dan R-Server yang didukung oleh SLA 99,9%. Setiap teknologi Big Data serta aplikasi ISV ini dapat disebarkan dengan mudah sebagai kluster terkelola, dengan keamanan dan pemantauan tingkat perusahaan. Pelajari selengkapnya

Data Lake Store—data lake tanpa batas yang mendukung analitik big data

Data lake cloud pertama untuk perusahaan yang aman, dapat di skalakan secara masif, dan dibangun dengan standar HDFS terbuka. Dengan ukuran data tak terbatas dan kemampuan untuk menjalankan analitik paralel secara masif, kini Anda dapat memaksimalkan nilai dari semua data tak terstruktur, semiterstruktur, dan terstruktur. Pelajari selengkapnya

Kembangkan, lakukan debug, dan optimalkan program big data dengan mudah

Menemukan alat yang tepat untuk merancang dan menyempurnakan kueri big data Anda mungkin sulit dilakukan. Data Lake memudahkan hal ini melalui integrasi mendalam dengan Visual Studio, Eclipse, dan IntelliJ sehingga Anda dapat menggunakan alat yang tak asing lagi untuk menjalankan, melakukan debug, dan menyesuaikan kode. Visualisasi pekerjaan U-SQL, Apache Spark, Apache Hive, dan Apache Storm memungkinkan Anda melihat bagaimana kode berjalan sesuai kebutuhan dan mengidentifikasi hambatan kinerja dan pengoptimalan biaya, sehingga lebih mudah untuk menyesuaikan kueri Anda. Lingkungan eksekusi kami secara aktif melakukan analisis saat program Anda berjalan dan menawarkan rekomendasi untuk meningkatkan kinerja dan mengurangi biaya. Teknisi data, DBA, dan arsitek data dapat menggunakan keterampilan yang ada, seperti SQL, Apache Hadoop, Apache Spark, R, Python, Java, dan .NET, untuk memaksimalkan produktivitas sejak hari pertama.

Terintegrasi secara lancar dengan investasi TI yang sudah ada

Salah satu tantangan utama dari big data adalah integrasi dengan investasi TI yang sudah ada. Data Lake adalah bagian utama dari Cortana Intelligence sehingga dapat digunakan dengan Azure Synapse Analytics, Power BI, dan Data Factory untuk big data cloud lengkap dan platform analitik tingkat lanjut yang membantu Anda melakukan banyak hal, mulai dari mempersiapkan data hingga melakukan analitik interaktif pada himpunan data berskala besar. Data Lake Analytics memberi Anda kemampuan untuk melakukan tindakan pada semua data Anda dengan virtualisasi data yang dioptimalkan dari sumber relasional seperti Azure SQL Server pada mesin virtual, Azure SQL Database, dan Azure Synapse Analytics. Kueri dioptimalkan secara otomatis dengan memindahkan pemrosesan mendekati data sumber, tanpa pergerakan data, sehingga memaksimalkan performa dan meminimalkan latensi. Terakhir, karena Data Lake berada di Azure, Anda dapat menyambungkannya ke data apa pun yang dihasilkan oleh aplikasi atau diserap oleh perangkat dalam skenario Internet of Things (IoT).

Menyimpan dan menganalisis file berukuran petabyte dan triliunan objek

Data Lake dirancang dari segala sisi untuk skala dan performa cloud. Organisasi Anda dapat menganalisis semua data di satu tempat tanpa batasan palsu dengan Azure Data Lake Store. Data Lake Store dapat menyimpan triliunan file, yang mana satu file dapat berukuran lebih dari satu petabyte. Ini berarti 200x lebih besar dari penyimpanan cloud lainnya. Artinya, Anda tidak perlu menulis ulang kode saat menambah atau mengurangi ukuran data yang disimpan atau jumlah komputasi yang dijalankan. Hal ini membuat Anda tidak perlu mengkhawatirkan pemrosesan dan penyimpanan himpunan big data dan cukup fokus pada logika bisnis Anda. Data Lake juga menyederhanakan kompleksitas yang biasanya terkait dengan big data di cloud guna memastikan bahwa data tersebut dapat memenuhi kebutuhan bisnis Anda saat ini dan di masa mendatang.

Terjangkau dan hemat biaya

Data Lake adalah solusi hemat biaya untuk menjalankan beban kerja big data. Anda dapat memilih antara kluster sesuai permintaan atau model bayar per pekerjaan saat data diproses. Kedua pilihan ini tidak memerlukan perjanjian dukungan khusus layanan, lisensi, atau perangkat keras. Sistem menaikkan atau menurunkan skala sesuai kebutuhan bisnis Anda. Ini berarti bahwa Anda tidak perlu membayar lebih dari yang diperlukan. Hal ini juga memungkinkan Anda menskalakan penyimpanan dan komputasi secara independen sehingga memberikan fleksibilitas ekonomi yang lebih besar dibandingkan solusi big data biasa. Terakhir, aplikasi ini meminimalkan kebutuhan untuk merekrut tim operasi khusus yang biasanya terkait dengan menjalankan infrastruktur big data. Data Lake meminimalkan biaya sekaligus memaksimalkan pengembalian investasi data Anda. Studi terbaru menunjukkan HDInsight memberikan TCO 63% lebih rendah dibandingkan menyebarkan Hadoop secara lokal selama lebih dari lima tahun.

Keamanan, audit, dan dukungan tingkat perusahaan

Data Lake dikelola penuh dan didukung oleh Microsoft, didukung oleh SLA dan dukungan tingkat perusahaan. Dengan dukungan pelanggan setiap saat, Anda dapat menghubungi kami untuk mengatasi setiap tantangan yang dihadapi terkait seluruh solusi big data Anda. Tim kami akan memantau penyebaran dan menjamin bahwa penyebaran akan berjalan terus-menerus sehingga Anda tidak perlu melakukannya sendiri. Data Lake melindungi aset data Anda dan memperluas kontrol keamanan dan tata kelola lokal ke cloud dengan mudah. Data akan selalu dienkripsi; bergerak menggunakan SSL, dan menggunakan layanan atau kunci yang didukung HSM yang dikelola pengguna di Azure Key Vault saat tidak aktif. Kemampuan seperti akses menyeluruh (SSO), autentikasi multifaktor, dan manajemen tanpa hambatan untuk jutaan identitas disertakan melalui Azure Active Directory. Anda dapat mengotorisasi pengguna dan grup dengan ACL berbasis POSIX yang mendetail untuk semua data di Store yang mengaktifkan kontrol akses berbasis peran. Terakhir, Anda dapat memenuhi kebutuhan kepatuhan keamanan dan peraturan dengan mengaudit setiap akses atau perubahan konfigurasi ke sistem.

Bangun solusi Data Lake menggunakan solusi yang canggih ini

HDInsight

Provisikan kluster Hadoop, Spark, R Server, HBase, dan Storm cloud.

Data Lake Analytics

Layanan analitik terdistribusi yang memudahkan big data.

Azure Data Lake Storage

Data lake yang dapat diskalakan dan aman guna menghasilkan analitik dengan performa tinggi.

Apache Hadoop® dan nama proyek sumber terbuka terkait adalah merek dagang dari Apache Software Foundation.