ナビゲーションをスキップする

Azure HDInsight Spark クラスターを使用したローン償却予測

償却されるローンは、通常、債務者によるローンの支払いが大幅に遅れている場合に、債権者 (通常、貸出機関) が回収できない可能性が高いと宣言した額のローンです。高額の償却が貸出機関の年度末財政に悪影響を与えるため、貸出機関は頻繁に注意深く償却リスクを監視して、ローンの償却を回避します。Azure R Server for HDInsight を使用すれば、貸出機関は機械学習の予測分析を利用して、ローンが償却される可能性を予測し、HDFS や Hive テーブルに保存される分析結果のレポートを実行できます。

説明

注: このソリューションが既にデプロイされている場合は、ここをクリックしてそのデプロイを表示してください。

予測プロビジョニング時間: 25 分

このソリューションでは、Microsoft R Server を使用して HDInsight Spark クラスターを作成します。このクラスターには、2 つのヘッド ノード、2 つのワーカー ノード、1 つのエッジ ノードが含まれ、合計で 32 個のコアがあります。この HDInsight Spark クラスターの概算のコストは、1 時間あたり $8.29 です。課金は、クラスターが作成されると開始し、クラスターが削除されると終了します。課金は分単位で発生するため、使用しなくなったクラスターは随時削除することをお勧めします。終了したら、[デプロイ] ページでソリューション全体を削除してください。

概要

貸出機関がローン償却の予測データを利用できることによるメリットはいくつもあります。ローンの償却は、大幅に滞納されているローンに対し銀行が手元にある予測データを使用して行う最後の手段です。ローン担当者は金利を低くしたり、返済期間を延長したりするなど個別の状況に応じたインセンティブを提案し、顧客がローンの支払いを続けられるようにして、ローンの償却を回避します。このようなタイプの予測データを取得するには、多くの場合、信用組合や銀行は顧客の過去の支払い履歴や実行済みの簡単な統計回帰分析に基づいてデータを手動で作成します。この方法ではデータ コンパイル エラーになる可能性が高く、統計的に妥当ではありません。

このソリューション テンプレートは、エンド ツー エンドでローン データに予測分析を実行し、償却可能性に関するスコアリングを作成するソリューションを示します。Power BI レポートには、クレジット ローンの分析と傾向や、償却可能性の予測も示されます。

ビジネスの視点

ローン償却の予測では、シミュレートされたローン履歴データを使用して、近い将来 (次の 3 か月) のローン償却の可能性を予測します。スコアが高いほど、将来ローンが償却される可能性が高くなります。

この分析データを使用して、支店ロケーションごとのローン償却の傾向と分析もローン マネージャーに示されます。ローン マネージャーは償却リスクの高いローンの特徴を見て、その特定地域でのローン提供のビジネス プランを立案できます。

HDInsight Spark クラスターの Microsoft R Server では、R Server と Apache Spark の力を組み合わせて活用し、ビッグ データに対応した分散型かつスケーラブルな機械学習機能を提供しています。このソリューションでは、ローン償却予測の機械学習モデルの開発方法 (データ処理、機能エンジニアリング、トレーニング モデル、評価モデルなど)、Web サービスとしての機械学習モデルの (エッジ ノードでの) デプロイ方法、Azure HDInsight Spark クラスターの Microsoft R Server を使用したリモートでの Web サービスの使用方法を示します。最終的な予測は、Power BI で視覚化できる Hive テーブルに保存されます。

Power BI では、ローンの支払いおよび償却予測のサマリーも視覚的に示されます (ここではシミュレーション データで示されます)。右側にある [今すぐ試す] ボタンをクリックすると、このダッシュボードを試すことができます。

データ サイエンティストの視点

このソリューション テンプレートでは、ローン償却リスクを予測するために、シミュレートされたローン履歴データを使用して予測分析を開発する方法について、そのプロセス全体を説明します。このデータには、ローン保持者の人口統計データ、ローンの額、契約上のローンの期間、ローンの支払い履歴などの情報が含まれます。このソリューション テンプレートには、データ処理、機能エンジニアリング、データをトレーニングするさまざまなアルゴリズムなどを実行する R スクリプトのセットも含まれており、最終的に最も高性能なモデルを選択してデータをスコアリングし、各ローンの確率スコアを作成します。このソリューションには、機械学習モデルを Web サービスとして (エッジ ノード上で) デプロイするためのスクリプトも含まれており、Azure HDInsight Spark クラスターの Microsoft R Server を使用してリモートで Web サービスを使用します。

このソリューションをテストするデータ サイエンティストは、Azure HDInsight Spark クラスターの Edge Node 上で実行される RStudio Server のブラウザ ベース Open Source Edition で提供される R コードを使用できます。コンピューティング コンテキストを設定することにより、ユーザーはコンピューティングを実行する場所を決めることができ、エッジ ノード上でローカルに実行したり、Spark クラスター内のノードに配信したりすることができます。また、公開されている Github リポジトリですべての R コードを見つけることができます。ぜひお楽しみください。

免責事項

©2017 Microsoft Corporation.All rights reserved.本情報は "現状のまま" 提供され、通知なく変更されることがあります。Microsoft はここで提供される情報に関し、明示または暗示にかかわらず、いかなる保証も行わないものとします。ソリューションの生成にはサード パーティのデータが使用されています。お客様には他者の権利を尊重する責任があり、それには、類似のデータセットを作成するための関連ライセンスの購入や、そうした関連ライセンスへの準拠が含まれます。

関連ソリューションのアーキテクチャ

SQL Server でのローン償却予測

このソリューションは、R Services が組み込まれた SQL Server 2016 で、銀行ローンを次の 3 か月以内に償却する必要があるかどうかを予測する Machine Learning モデルを構築し、デプロイする方法を示します。

SQL Server による融資信用リスク

R Services 搭載の SQL Server 2016 を使用すると、貸出機関は予測分析を使って、債務不履行に陥る可能性の高い借り手に提供する融資の数を減らし、融資ポートフォリオの収益性を上げることができます。