Předpověď odepisování půjček s využitím clusterů Azure HDInsight Spark

Odepsaná půjčka je taková, u které věřitel (obvykle instituce poskytující úvěr) uzná, že není pravděpodobné splacení dlužné částky. K tomu obvykle dochází při nesplácení splátek dlužníkem. Vzhledem k tomu, že má vysoká míra odpisů negativní dopad na účetní závěrku instituce poskytující úvěr na konci roku, instituce poskytující úvěry často velmi pečlivě monitorují riziko odepsání, aby odepisování půjček zabránily. Díky Azure HDInsight R Serveru můžou instituce poskytující úvěry využívat prediktivní analýzy strojového učení k předpovědi pravděpodobnosti odepsání půjček a vypracování zprávy na základě výsledků analýzy uložených v HDFS a tabulkách Hive.

Popis

Poznámka: Pokud jste toto řešení už nasadili, můžete ho zobrazit kliknutím sem.

Odhadovaný čas zřízení: 25 minut

Toto řešení vytvoří cluster HDInsight Spark s Microsoft R Serverem. Tento cluster bude obsahovat 2 hlavní uzly, 2 pracovní uzly, 1 hraniční uzel a celkem 32 jader. Přibližné náklady na tento cluster HDInsight Spark jsou $8.29/hod. Účtovat se začne při vytvoření clusteru a skončí se při jeho odstranění. Účtuje se poměrnou částí po minutách, takže byste cluster měli odstranit vždy, když už se nepoužívá. Jakmile budete hotovi, na stránce Deployments (Nasazení) odstraňte celé řešení.

Přehled

Tady jsou některé z výhod, které institucím poskytujícím úvěry zajišťují údaje o predikci odepisování půjček. Odepsání půjčky jako nedobytné pohledávky je to poslední, co banka u vysoce problematické půjčky může udělat. Pokud ale úvěrový specialista má k dispozici data předpovědí, může zákazníkům předložit individuální pobídky, jako je třeba nižší úrok nebo delší doba splácení. Pomůže jim tak zajistit splácení půjčky a zabrání jejímu odpisu jako nedobytné. K získání tohoto typu predikcí úvěrové společnosti nebo banky obvykle ručně zpracovávají data založená na historii minulých plateb a provádějí jednoduché statistické regresní analýzy. Tato metoda je velmi náchylná k chybám při sestavování dat a není statisticky spolehlivá.

Tato šablona ukazuje komplexní řešení pro spouštění prediktivních analýz nad údaji o půjčkách s cílem vyhodnotit pravděpodobnost odepisování pohledávek jako nedobytných. Sestava PowerBI vás také provede analýzou a trendy půjček a úvěrů a predikcí pravděpodobnosti odepisování pohledávek jako nedobytných.

Z obchodního pohledu

Tato predikce odepsání půjček využívá simulovaná data historie půjček k predikci pravděpodobnosti, že se půjčka v bezprostřední budoucnosti (následující tři měsíce) odepíše. Čím vyšší je toto skóre, tím pravděpodobnější je odepsání této půjčky v budoucnu.

Prostřednictvím analytických dat mají správci úvěrů k dispozici také trendy a analýzy odepsaných půjček podle umístění poboček. Charakteristiky půjček s vysokým rizikem odepsání pomohou správcům úvěrů při vytváření obchodního plánu pro nabídku půjček v konkrétní geografické oblasti.

Microsoft R Server v clusterech HDInsight Spark využívá kombinovaný výkon R Serveru a Apache Sparku a poskytuje tak možnosti distribuovaného a škálovatelného strojového učení pro velké objemy dat. Toto řešení ukazuje postup vývoje modelů strojového učení pro predikci odepsání půjčky (včetně zpracování dat, vytváření funkcí, trénování a vyhodnocování modelů), nasazení modelů jako webové služby (na hraničním uzlu) a vzdálené používání této webové služby s využitím Microsoft R Serveru v clusterech Azure HDInsight Spark. Konečné předpovědi se ukládají do tabulky Hive, kterou je možné vizualizovat v Power BI.

Power BI také prezentuje vizuální souhrny předpovědí splácení a odepsání půjčky (tady se zobrazují se simulovanými daty). Tento řídicí panel si můžete vyzkoušet kliknutím na tlačítko Try it Now (Vyzkoušet) na pravé straně.

Z pohledu odborníka přes data

Tato šablona řešení vás provede kompletním procesem vývoje prediktivní analýzy s využitím sady simulovaných dat historie půjček k předpovědi rizika odepsání. Data obsahují informace jako demografické údaje držitele, výše půjčky, smluvní doba trvání půjčky a historie splácení půjčky. Šablona řešení zahrnuje také sadu skriptů R, které provádějí zpracování dat, vytváření funkcí, několik různých algoritmů pro trénování dat a konečně výběr nejvýkonnějšího modelu pro vyhodnocení dat a vygenerování skóre pravděpodobnosti pro jednotlivé půjčky. Toto řešení zahrnuje také skripty pro nasazení modelu jako webové služby (na hraničním uzlu) a vzdálené používání této webové služby s využitím Microsoft R Serveru v clusterech Azure HDInsight Spark.

Odborníci přes data, kteří testují toto řešení, můžou pracovat s poskytnutým kódem R v open source edici RStudio Serveru v prohlížeči, který běží na hraničním uzlu clusteru Azure HDInsight Spark. Prostřednictvím nastavení výpočetního kontextu se uživatel může rozhodnout, kde se budou provádět výpočty: místně na hraničním uzlu nebo distribuovaně napříč uzly v clusteru Spark. Veškerý kód R najdete také ve veřejném úložišti GitHub. Bavte se.

Právní omezení

© 2017 Microsoft Corporation. Všechna práva vyhrazena. Tyto informace se poskytují „tak, jak jsou“ a mohou se bez předchozího upozornění změnit. Společnost Microsoft neposkytuje s ohledem na uvedené informace žádné záruky, ať už výslovné, nebo implikované. K vytvoření řešení byla použita data třetích stran. Zodpovídáte za respektování práv ostatních, včetně pořízení náležitých licencí pro vytváření podobných datových sad a jejich dodržování.

Související architektury řešení

Predikce odepisování půjček s využitím SQL Serveru

Toto řešení ukazuje, jak sestavit a nasadit model strojového učení s využitím SQL Serveru 2016 a R Services pro predikci, jestli bude bankovní půjčku nutné v následujících 3 měsících odepsat jako nedobytnou pohledávku.

Úvěrové riziko u půjček s využitím SQL Serveru

Pomocí SQL Serveru 2016 s R Services může poskytovatel půjček využít prediktivní analýzu k omezení počtu půjček, které nabízí vypůjčovatelům s nejvyšší pravděpodobností neplacení, a zvýšení ziskovosti úvěrového portfolia.