Ignite 2018 – Azure Data により AI をビジネスにとってリアルな存在に

2018年9月24日 に投稿済み

Corporate Vice President, Azure Data

本日、オーランドで行われた Microsoft Ignite で、クラウド、データ、人工知能 (AI) の融合がかつてない変化をもたらし、あらゆる業界で急速に革新の基盤となりつつあることを紹介しました。強力な AI アプリケーションの原動力はデータであり、AI を最大限に活用するには最新のデータ資産が必要です。データの可能性を解放することは、AI を活用して新しい分析情報を発見し、新しいビジネス チャンスを作ろうとする組織にとって必要不可欠なこととなっています。

本日、Microsoft は、組織がビジネスを変えるデータと AI ソリューションを構築することを可能にする、多くの刺激的な発表を行いました。20 年以上にわたって、組織はリレーショナル データのあらゆる側面を管理するために SQL Server に頼ってきました。昨年の Ignite では、SQL Server 2017 の一般提供を発表しました。これによって、愛用されてきた SQL Server エンジンが Linux でも利用できるようになりました。これは最初の 6 か月間だけで 560 万件のダウンロードを突破し、すぐにこれまでで最も人気のある SQL Server のバージョンとなりました。本日、SQL Server 2019 プレビューの発表により、その勢いはさらに加速するでしょう。SQL Server 2019 を使うと、組織はリレーショナル データ非リレーショナル データを単一の統合されたソリューションでシームレスに管理できます。また、Apache SparkTM や Hadoop 分散ファイル システム (HDFS) のサポートなどのビッグ データ機能が組み込まれています。さらに、SQL Server Machine Learning Services と Spark Machine Learning (ML) を使用することで、組織は、データの種類に関係なくデータ資産全体から AI 駆動の分析情報を得ることができます。

また、Azure SQL Data Warehouse、Azure Cosmos DB、Mongo DB、Oracle、Teradata などのデータ ソースへの追加コネクタを使用して PolyBase も強化しました。こうして、組織がデータ サイロを解消できるようさらに支援します。この新しいレベルのデータ仮想化により、組織は、ソースに関係なく同じセキュリティ ポリシーとアクセス制御ポリシーを適用して、すべてのデータに対して T-SQL クエリを実行できるようになりました。SQL Server 2019 は、オンプレミスでも、Azure Stack でも、クラウドでも、Kubernetes で実行できます。Azure Data Studio の SQL Server 2019 用ツールのプレビューによって、組織はビッグ データ クラスターを管理できるだけでなく、新しい分析ノートブック エクスペリエンスと PolyBase ウィザードを活用して、他のデータベース管理システムの格納データにすばやく、そして簡単にアクセスできるようになりました。ジョンズ ホプキンズ大学などの顧客が、この製品の上で厳しい要件のビッグ データ ワークロードを既に実行して、分析や AI を自由に利用しているのを見るのは興奮を誘われることです。

「当初から Sloan Digital Sky Survey データベースは SQL Server 上で実行されており、SQL Server は大規模な宇宙論的シミュレーションからのオブジェクト カタログも格納します。私たちは、SQL Server 2019 のビッグ データ クラスターの将来性に期待しています。これにより、すべてのビッグ データ セットを含められるようにデータベースを強化できます。SQL Server 2019 は分散可能であるため、現在のデータベース ソリューションの限界をはるかに超えて、最大 10 PB 以上のデータセットを使用した、新しいタイプのシミュレーションや次世代の天文調査まで取り組みを拡大することができます。」

Dr.ジョンズ ホプキンズ大学、Institute for Data Intensive Engineering and Science(データ集約工学研究所)、Gerard Lemson 博士

詳細については、SQL Server 2019 発表のブログをご覧ください。

Microsoft は、Azure を組織のデータの最適な宛先にする、多くのエキサイティングな発表も行いました。SQL ワークロードに対し、Azure SQL Database Managed Instance は、クラウドへの簡単な移行パスと素晴らしい価値を提供します。本日一般提供された Azure SQL Database Managed Instance を使用することで、組織はコード変更なしで SQL Server ワークロードを Azure に移行できます。VNET のネイティブ サポートを備え、SQL Server の完全な機能セットに対応しています。Azure ハイブリッド特典SQL Database の予約容量などのオファーのおかげで、Azure に移行する組織は、他のクラウド オファリングと比較して最大 80% 節約することができます。また、組織はフル マネージドの Azure Database Migration Service を使用して、SQL Server から SQL Database Managed Instance に大規模に移行することができるようになりました。Azure SQL Database Managed Instance に対する強い需要と、それが既に組織にもたらしている価値を見ることは刺激になります。

「当社では、TimeXtender ソリューションを Azure SQL Database Managed Instance の運用環境に数週間ほどでデプロイすることができました。すぐに 49% のコスト削減と 25 - 30% のパフォーマンス改善を実現しました。また、機械学習を通じてデータに人工知能を適用できるとのことなので、今後の可能性の点でも非常に期待が持てます。」

コマツ オーストラリア、ビジネス テクノロジおよびシステム担当 GM、John Steele 氏。

また、Azure SQL Database Managed Instance はアナリストたちの注目も集めています。Forrester が最近、SQL データベースを Managed Instance に移行した一部の顧客にインタビューしたところ、平均して 6 か月未満の移行投資回収期間DBA の生産性の 40% 向上が見られたことがわかりました。

また、本日、Azure SQL Database Hyperscale のプレビューも発表されました。これは、ワークロードのニーズにオンデマンドで適応する、非常にスケーラブルなサービス レベルです。Azure SQL Database Hyperscale を使用すると、組織は 1 つのデータベースを最大 100 TB まで拡張でき、アプリケーションの拡張の可能性を大幅に拡大できます。こうした革新によって、Azure SQL Database はクラウドで最良のリレーショナル データベースになります。

Azure のオープンネスへの取り組みをさらに証明するものとして、オープン ソース データベースについての多くのエキサイティングな発表も行われました。Azure Database for MariaDB がプレビューになり、フル マネージドでオープン ソースの、サービスとしての MariaDB データベースが Azure プラットフォームにもたらされました。Azure 上の MariaDB は、組み込みの高可用性、動的なスケーリング、柔軟な価格設定、ワールドクラスのセキュリティとインフラストラクチャを開発者に提供します。潜在的な脅威が発生したときに組織が適切に検出、対処することを可能にする、MySQL と PostgreSQL 向けの Azure データベース サービスの Advanced Threat Protection のプレビューについても発表されました。Azure Database for PostgreSQL では、Intelligent Performance オファリングの一環として、Query Store、Query Performance Insight、Performance Recommendations のプレビューがサポートされるようになりました。これらの機能を組み合わせてデータベースを調べることで、組織はワークロードをより深く理解したり、ボトルネックを特定したり、クエリ パフォーマンスの変化を検出したりすることができます。Microsoft のオープン ソース データベース オファリングの詳細については、発表ブログをご覧ください。 

Azure Cosmos DB は、NoSQL ワークロード向けの、Microsoft のグローバル分散型マルチモデル データベース サービスです。Azure Cosmos DB は、ターンキーのグローバル配布、柔軟なスケーリング、10 ミリ秒未満の待機時間、5 つの明確な一貫性モデル、高可用性の保証を提供します。Azure Cosmos DB では、すべてのデータのインデックスが自動的に作成されるため、開発者がスキーマやインデックスの管理に対処する必要はありません。また、マルチモデル サービスでもあり、ドキュメント、キー値、グラフ、列ファミリのデータ モデルをネイティブにサポートしています。

本日、Azure Cosmos DB の世界規模でのマルチマスターの一般提供について発表いたします。これに伴い、マルチマスター レプリケーションにより、前例のない書き込みスケーラビリティと可用性が実現します。Azure Cosmos DB のマルチマスター レプリケーションを使用すると、すべてのリージョンが (読み取り可能であることに加えて) 書き込み可能になり、10 ミリ秒未満の書き込み待機時間と、全世界における 99.999% の書き込み可用性を実現できます。詳細については、最新の SLA ページをご覧ください。

Azure Cosmos DB Cassandra API の一般提供開始についても発表いたします。Azure Cosmos DB は、Apache Cassandra とのワイヤ プロトコル レベルの互換性を提供し、実質的にコードを変更することなく既存のアプリケーションとお気に入りのオープン ソース ソフトウェア (OSS) ツールを使い続けられるようにします。さらに、フル マネージドで、Cassandra アプリをベンダー ロックなしで柔軟に実行できるようにします。市場での Azure Cosmos DB の驚異的な勢いと、お客様がどのようにそれを取り入れて事業を推進しているかを見るのは興奮を誘われます。

「Cosmos DB は、グローバルな評価システムのためのワールドワイドな高性能プラットフォームを提供してくれました。ボタンを 1 回クリックするだけで、世界中の地域に迅速に展開し、お客様やパートナー様に非常に短い時間で対応できます。Cosmos DB Cassandra API により弊社のサービスの移行中のエンジニアリング上の主要な手間が削減され、最低限の変更だけで統合できました。Cassandra API のサポート開始に伴い、当社の最大のサービスを移行する予定です。”

Symantec 社のテクニカル ディレクター/アーキテクトの Michael Shavell 氏

Azure Cosmos DB は、業界トップレベルのパフォーマンスだけでなく、優れた価値も提供します。既存の NoSQL アプリケーションを Azure Cosmos DB に移行する組織は、OSS NoSQL データベースの Enterprise バージョンと比較して最大 6 倍の節約ができます。本日、Azure Cosmos DB 予約容量が一般提供されたことを発表いたします。これにより、組織は Azure Cosmos DB の表示価格から最大 65% 節約できます。さらに、データベースをわずか 10,000 RU/s でプロビジョニングでき (エントリ ポイントが 5 倍下がる)、組織のニーズに合わせて段階的に拡張できることが発表されました。また、人気の Cosmos DB for Free のお試しのトライアル期間を 1 か月に延長することも発表いたします。機能や価値を全体的に考えて、Azure Cosmos DB はあらゆる NoSQL ワークロードの最良の宛先です。

詳細については、Azure Cosmos DB 発表のブログをご覧ください。

分析と AI に関して言えば、組織がビジネスに対する重要な分析情報を迅速に得る上で、Azure は最も魅力的な一連のサービスを提供しています。Azure Data Factory を使用すると、組織は AWS S3、AWS Redshift、Google Big Query、Oracle、Teradata、Netezza、SAP HANA などの 70 以上のデータ ソースから数 TB 規模のデータを Azure に苦もなく取り込んで、より詳細な分析ができます。Azure Databricks には、データ準備や機械学習 (およびディープ ラーニング) のモデル開発とトレーニングのための、高速かつ簡単で共同作業が可能な Apache Spark ベースの分析プラットフォームが備わっています。また、最高の OSS 分析フレームワークと Azure エコシステムとの緊密な統合を提供します。Azure SQL Data Warehouse は、エンタープライズ クラスの完全に統合されたデータ ウェアハウスであり、コンピューティングとストレージの独立したスケーリングを提供する種類としては最初のものです。これらの 3 つのサービスを統合することで、「最新のデータ ウェアハウス」と「ビッグ データでの機械学習」のパターンが形成され、素晴らしい価値が組織に提供されます。

「当社の最新のデータ ウェアハウスによって、データセンターに不足していた敏捷性が改善します。業務の複雑さにはあまり重点を置かず、ビジネス ロジックに重点を置くことで、敏捷性を高め、ビジネスの価値を迅速に獲得しています。」

Anheuser-Busch InBev のグローバル ディレクター、Chetan Kundavaram 氏

本日、Azure SQL Data Warehouse が、より小さなサービス レベル (DW500c) でより多くのお客様からご利用いただけるようになることが発表されました。今回のリリースに伴い、組織は強力なクラウド データ ウェアハウスを 1 時間あたりたった $6.049 で始めることができます。このパフォーマンス重視のレベルは、Azure Government を含む 26 の Azure グローバル リージョンで利用可能です。Azure SQL Data Warehouse では Azure Databricks との統合がさらに強化されており、組織はストリーミング データを簡単にストリーミング、トレーニング、公開してリアルタイムの分析ソリューションを構築できるようになりました。詳細については、Azure SQL Data Warehouse 発表のブログをご覧ください。

また、Azure Databricks Delta のプレビューも新しくなりました。Azure Databricks Delta を使用すると、組織はデータの信頼性を高め、パフォーマンスを向上させ、データ パイプラインを簡潔にできます。Azure Databricks によって大規模で高性能な分析ソリューションを構築することが、組織にとってかつてないほど簡単になりました。新しいメタデータ、Spark テーブルでのインデックス作成やキャッシュ機能により、組織は Azure Databricks の Spark ジョブやクエリの信頼性とパフォーマンスを向上させることができます。Azure Databricks Delta およびその他のエキサイティングな発表の詳細については、Azure Databricks 発表のブログをご覧ください。

また、オープン ソース分析のサポートに対する継続的な取り組みの一環として、HDInsight が Hadoop 3.0 をサポートするようになり、Azure はこの機能を提供する最初のクラウド プロバイダーになることも本日発表しました。HDInsight はまた、Enterprise セキュリティ パッケージの一般提供によってセキュリティも強化します。これにより、組織は HDInsight クラスターをドメインに参加させ、Kerberos でユーザーを認証し、Apache Ranger を使用してアクセスを承認および監査することができます。再生、自動データ スキュー検出、その他の革新的な機能拡張を使用すると、大規模なジョブのデバッグや診断が簡単に行えることが開発者の方々にもおわかりいただけるでしょう。詳細については、HDInsight 発表のブログをご覧ください。

本日、Azure Data Explorer のプレビューについても発表されました。これは、データ探索用に最適化されたきわめて高速なサービスです。このサービスは、組織がペタバイト規模の構造化データと非構造化データからすばやく分析情報を検出するのに役立ちます。Azure Data Explorerを使ってストリーミング データを照会することで、パフォーマンスの分析、傾向と異常の特定、問題の診断につながる分析情報を瞬時に引き出すことができます。また、データ エンジニアがデータ分析の初期段階でデータを探索し、そのデータの内容をより深く理解する目的で使うこともできます。Azure Data Explorer は、数分前から数週間前、数か月前までのデータを瞬時に可視化して分析できるようにすることで、最新のデータ ウェアハウスを強化します。詳細については、Azure Data Explorer 発表のブログをご覧ください。

最後に、本当に変革的な顧客ソリューションの例の説明で締めくくりたいと思います。世界的な石油ガス企業である Shell は、データと AI を活用してビジネスをデジタル変革している途中です。この変革の 1 つの驚くべき例として、小売店舗の安全性と有効性を改善するために、どのようにデータの力を使っているかが挙げられます。Shell は Azure Databricks を使用することで、数千時間もの有線テレビ (CCTV) 映像を分析して、ほぼリアルタイムで潜在的な安全上の問題を特定するためのアルゴリズムをトレーニングすることができます。

「私たちは、エッジとクラウドの両方で機能する一連の機械学習モデルを開発しました。エッジで関心のあるイベントをリアルタイムで特定し、それらを厳密な処理のためにクラウドに渡すことができます。また、クラウドを使用してほぼリアルタイムでアラートを出すことができます。Azure クラウドは、こうした変革を後押しし、Azure Databricks のような最高の "サービスとしてのプラットフォーム" オファリングをまとめ、それらを TensorFlow や Kafka のようなオープン ソース テクノロジと組み合わせます。」

Shell のデータ サイエンス担当ゼネラル マネージャー、Daniel Jeavons 氏

皆様や組織にご利用いただけるたくさんのエキサイティングな技術があるため、データを最新化し、そこから生成できる分析情報を最大化してビジネスを変革するには、今が最良です。皆様のデータにはもっと可能性があります。皆様がどのような成果を挙げられるか楽しみにしています。