Azure Data Lake のパブリックプレビューをリリース

10月 28, 2015 に投稿済み

Product Marketing, Hadoop/Big Data and Data Warehousing

世界中の SQL Server と BI のプロが集う SQL PASS Summit 2015 の開催に先駆けて、マイクロソフトは Azure Data Lake AnalyticsAzure Data Lake Store のパブリック プレビューの提供を開始することを発表しました

以前開催された Strata カンファレンスで、新しい分析サービスの導入と既存の Azure HDInsight ソリューションを Azure Data Lake に追加するという展望をお伝えしたとおり、マイクロソフトは、ビッグデータテクノロジをよりシンプルなものにして、可能な限り多くの人々が利用できるようにすることを目指しています。

今回、皆様が Azure Data Lake を活用してさらなる生産性向上を実現できるように、Azure Data Lake をさまざまな視点から解説する全 6 回のブログ シリーズの連載を開始することにしました。1 回目となるこの記事では、上記で触れた 2 つのサービスについてご紹介します。Azure でのビッグ データ処理の詳細については Channel 9 で説明していますので、そちらも併せてご覧ください。

Azure Data Lake Analytics とは?

Azure Data Lake Analytics はコードを動的にスケーリングする分散型のビッグ データ分析サービスで、これを活用することでお客様は分散型インフラストラクチャを気にすることなく、ビジネス ロジックに集中することができます。このサービスは Apache YARN を基盤とするクラウドに最適化された設計となっていて、必要な処理速度に応じてダイヤルを設定するだけでどのようなスケールのジョブにもすぐに対応できます。また、従量課金のサービスであるためコスト効率が高いほか、Azure Active Directory がサポートされていることから簡単にアクセス許可やロールを管理したりオンプレミスの ID システムと統合したりすることができます。

clip_image001

現在、多くの開発者やデータ科学者が既存のテクノロジやツールを使用してビッグデータの活用に取り組んでいます。Azure Data Lake Analytics では U-SQL 言語を使用できるため、ご自身の強力なコードと SQL のメリットを統合することができます。U-SQL 言語は、マイクロソフト内部で使用しているビッグデータ システムで利用されているものと同一の分散型ランタイムで構築されています。SQL および .NET の開発者の方々は、あらゆるデータの処理や分析に現在のスキルを活用できます。

clip_image002

Azure Data Lake Tools for Visual Studio では、U-SQL の最新のオーサリング機能、デバッグ機能、高度なパフォーマンス分析機能がサポートされているため、膨大な数のノードでジョブを実行する場合に最適化して生産性を向上させることができます。U-SQL コードを視覚化すると、そのスケールでコードがどのように実行されているかを確認し、パフォーマンス上のボトルネックやコストの最適化について把握したうえで、クエリの調整を簡単に行うことができます。

clip_image003

Azure Data Lake Store とは?

は、サイズや種類を問わずさまざまなデータを簡単に取得し、あらゆるスケールのデータをアプリケーションを変更することなく高速で処理することが可能な単一のリポジトリです。データを安全に共有して共同作業を行ったり、HDFS アプリケーションやその他のツールを利用して処理や分析を実行することができます。

clip_image004

詳細情報

ドキュメントと使用方法