Lewati Navigasi

Data Lake

Data lake tanpa batas untuk mendukung tindakan cerdas

  • Simpan dan analisis file ukuran petabyte dan triliunan objek
  • Kembangkan program paralel secara besar-besaran dengan kesederhanaan
  • Debug dan optimalkan program big data Anda dengan mudah
  • Keamanan, pengauditan, dan dukungan tingkat perusahaan
  • Dimulai dalam hitungan detik, diskalakan secara instan, bayar per pekerjaan
  • Dibangun di atas YARN, dirancang untuk cloud
Azure Data Lake mencakup semua kemampuan yang diperlukan untuk memudahkan pengembang, ilmuwan data, dan analis untuk menyimpan data dari berbagai ukuran, bentuk, dan kecepatan, serta melakukan semua jenis pemrosesan dan analitik di seluruh platform dan bahasa. Ini menghapus kerumitan penyerapan dan penyimpanan semua data Anda sekaligus mempercepat memulai dan menjalankan analis batch, streaming, dan analitik. Azure Data Lake bekerja dengan investasi TI yang sudah ada terkait identitas, manajemen, dan keamanan untuk manajemen dan tata kelola data yang disederhanakan. Ia juga terintegrasi tanpa hambatan dengan penyimpanan operasional dan gudang data sehingga Anda dapat memperluas aplikasi data saat ini. Kami memanfaatkan pengalaman bekerja dengan pelanggan perusahaan dan menjalankan beberapa pemrosesan dan analitik terbesar di dunia untuk bisnis Microsoft seperti Office 365, Xbox Live, Azure, Windows, Bing, dan Skype. Azure Data Lake menyelesaikan berbagai tantangan produktivitas dan skalabilitas yang menghambat Anda memaksimalkan nilai aset data dengan layanan yang siap memenuhi kebutuhan bisnis Anda saat ini dan di masa mendatang.

Data Lake Analytics—layanan pekerjaan analitik tanpa batas untuk mendukung tindakan cerdas

Layanan analitik cloud pertama tempat Anda dapat dengan mudah mengembangkan dan menjalankan transformasi data paralel secara masif serta memproses program di U-SQL, R, Python, dan .Net melalui petabyte data. Tanpa harus mengelola infrastruktur, memproses data sesuai permintaan, menskalakan secara instan, dan hanya membayar per pekerjaan. Info selengkapnya

HDInsight—Apache Spark cloud dan layanan Hadoop® untuk perusahaan

HDInsight adalah satu-satunya penawaran Cloud Hadoop terkelola sepenuhnya yang memberikan kluster analitik sumber terbuka yang dioptimalkan untuk Spark, Hive, Map Reduce, HBase, Storm, Kafka, dan R-Server yang didukung oleh SLA 99,9%. Masing-masing teknologi Big Data ini serta aplikasi ISV dapat disebarkan dengan mudah sebagai kluster terkelola, dengan keamanan dan pemantauan tingkat perusahaan. Pelajari selengkapnya

Data Lake Store—data lake tak terbatas yang mendukung analitik big data

Data lake cloud pertama untuk perusahaan yang aman, dapat diskalakan secara besar-besaran, dan dibuat sesuai dengan standar HDFS terbuka. Tanpa batasan ukuran data dan kemampuan untuk menjalankan analitik paralel secara besar-besaran, kini Anda dapat membuka kunci nilai dari semua data Anda yang tidak terstruktur, semi-terstruktur, dan terstruktur. Pelajari selengkapnya

Mengembangkan, men-debug dan mengoptimalkan program data besar Anda dengan mudah

Menemukan alat yang tepat untuk mendesain dan menyesuaikan kueri data besar Anda mungkin sulit dilakukan. Data Lake memudahkannya melalui integrasi mendalam dengan Visual Studio, Eclipse, dan IntelliJ sehingga Anda dapat menggunakan alat yang familier untuk menjalankan, men-debug, dan menyesuaikan kode Anda. Visualisasi pekerjaan U-SQL, Apache Spark, Apache Hive, dan Apache Storm memungkinkan Anda melihat bagaimana kode Anda berjalan dalam skala besar dan mengidentifikasi hambatan performa dan pengoptimalan biaya sehingga lebih mudah untuk menyesuaikan kueri Anda. Lingkungan eksekusi kami secara aktif menganalisis program Anda saat berjalan dan menawarkan rekomendasi untuk meningkatkan performa dan mengurangi biaya. Teknisi data, DBA, dan arsitek data dapat menggunakan keterampilan yang ada, seperti SQL, Apache Hadoop, Apache Spark, R, Python, Java, dan .NET, agar menjadi produktif sejak hari pertama.

Terintegrasi tanpa hambatan dengan investasi TI Anda yang sudah ada

Salah satu tantangan utama big data adalah integrasi dengan investasi TI yang sudah ada. Data Lake adalah bagian utama dari Kecerdasan Cortana, yang berarti bahwa ia bekerja bersama Azure Synapse Analytics, Power BI, dan Data Factory untuk big data cloud lengkap dan platform analitik tingkat lanjut yang membantu Anda dengan segala sesuatunya mulai dari persiapan data hingga melakukan analitik interaktif pada himpunan data skala besar. Data Lake Analytics memberi Anda kekuatan untuk bertindak pada semua data Anda dengan virtualisasi data yang dioptimalkan dari sumber relasi seperti Azure SQL Server pada mesin virtual, Azure SQL Database, dan Azure Synapse Analytics. Kueri dioptimalkan secara otomatis dengan memindahkan pemrosesan mendekati data sumber, tanpa pergerakan data, sehingga memaksimalkan kinerja dan meminimalkan latensi. Terakhir, karena Data Lake berada di Azure, Anda dapat terhubung ke data apa pun yang dihasilkan oleh aplikasi atau diserap oleh perangkat dalam skenario Internet of Things (IoT).

Simpan dan analisis file berukuran petabyte dan triliunan objek

Data Lake dirancang dari dasar untuk skala dan performa cloud. Dengan Azure Data Lake Store, organisasi Anda dapat menganalisis semua datanya di satu tempat tanpa batasan buatan. Data Lake Store Anda dapat menyimpan triliunan file yang ukuran satu file-nya dapat lebih besar dari satu petabyte, yaitu 200x lebih besar dari penyimpanan cloud lainnya. Dengan kata lain, Anda tidak perlu menulis ulang kode saat meningkatkan atau mengurangi ukuran data yang disimpan atau jumlah komputasi yang disatukan. Dengan begitu, Anda dapat fokus pada logika bisnis saja dan bukan pada cara memproses dan menyimpan himpunan data yang besar. Data Lake juga menghilangkan kerumitan yang biasanya terkait dengan data besar di cloud, yang memastikannya dapat memenuhi kebutuhan bisnis Anda saat ini dan di masa mendatang.

Terjangkau dan hemat biaya

Data Lake adalah solusi hemat biaya untuk menjalankan beban kerja data besar. Anda dapat memilih antara kluster sesuai permintaan atau model bayar per pekerjaan saat data diproses. Dalam kedua kasus, tidak diperlukan perjanjian perangkat keras, lisensi, atau dukungan khusus layanan. Sistem menskalakan ke atas atau ke bawah sesuai dengan kebutuhan bisnis Anda, yang berarti Anda tidak pernah membayar lebih dari yang dibutuhkan. Ia juga memungkinkan Anda menskalakan penyimpanan dan komputasi secara independen sehingga memungkinkan fleksibilitas yang lebih ekonomis daripada solusi data besar tradisional. Terakhir, Data Lake meminimalkan kebutuhan untuk mempekerjakan tim operasi khusus yang biasanya terkait dengan menjalankan infrastruktur data besar. Data Lake meminimalkan biaya sekaligus memaksimalkan imbal hasil investasi data Anda. Studi terbaru menunjukkan HDInsight memberikan TCO 63% lebih rendah daripada menyebarkan Hadoop di lokal selama lebih dari lima tahun.

Keamanan, audit, dan dukungan tingkat perusahaan

Data Lake dikelola sepenuhnya dan didukung oleh Microsoft, didukung oleh SLA dan dukungan tingkat perusahaan. Dengan dukungan pelanggan setiap saat, Anda dapat menghubungi kami untuk mengatasi setiap tantangan yang dihadapi dengan seluruh solusi data besar Anda. Tim kami memantau penempatan Anda sehingga Anda tidak perlu melakukannya sendiri, yang menjamin bahwa penempatan akan berjalan terus-menerus. Data Lake melindungi aset data dan memperluas kontrol keamanan dan tata kelola lokal Anda ke cloud dengan mudah. Data selalu dienkripsi; bergerak menggunakan SSL, dan saat istirahat menggunakan layanan atau kunci yang didukung HSM yang dikelola pengguna di Azure Key Vault. Kemampuan seperti akses menyeluruh (SSO), autentikasi multifaktor, dan pengelolaan tanpa hambatan jutaan identitas disertakan melalui Azure Active Directory. Anda dapat mengotorisasi pengguna dan grup dengan ACL berbasis POSIX yang mendetail untuk semua data di Store yang mengaktifkan kontrol akses berbasis peran. Terakhir, Anda dapat memenuhi kebutuhan kepatuhan keamanan dan peraturan dengan mengaudit setiap akses atau perubahan konfigurasi ke sistem.

Buat solusi Data Lake menggunakan solusi canggih ini

HDInsight

Menyediakan kluster cloud Hadoop, Spark, R Server, HBase, dan Storm

Data Lake Analytics

Layanan analitik terdistribusi yang memudahkan data besar

Azure Data Lake Storage

Data lake yang scalable dan aman untuk analitik dengan performa tinggi

Apache Hadoop® dan nama proyek sumber terbuka terkait adalah merek dagang milik Apache Software Foundation.