Hitelleértékelés-előrejelzés Azure HDInsight Spark-fürtökkel

A leértékelt hitel olyan hitel, amelyről egy hitelező (általában egy hitelintézet) megállapította, hogy az adósság egy része nagy valószínűséggel nem lesz behajtható. Ez többnyire akkor fordul elő, ha az adós súlyos késedelembe esik a törlesztés során. Mivel a leértékelt hitelek magas aránya negatív hatással van a hitelintézet év végi pénzügyi eredményére, a hitelintézetek gyakran nagy gonddal figyelik a hitelek leértékelődési kockázatát a hitelleértékelés megelőzése érdekében. Az Azure HDInsight R Server használatával a hitelintézetek gépi tanuláson alapuló prediktív elemzési szolgáltatásokkal jelezhetik előre a hitelek leértékelésének valószínűségét, az elemzés HDFS-ben és hive-táblákban tárolt eredményéből pedig jelentést készíthetnek.

Leírás

Megjegyzés: ha már üzembe helyezte ezt a megoldást, az üzemelő példányt ide kattintva érheti el.

Üzembe helyezés becsült ideje: 25 perc

Ez a megoldás létrehoz egy Microsoft R Servert futtató HDInisght Spark-fürtöt, amely 2 főcsomópontot, 2 feldolgozócsomópontot, egy határcsomópontot és összesen 32 processzormagot tartalmaz. A HDInsight Spark-fürt hozzávetőleges költsége $8.29/óra. A díjakat az adott fürt létrehozásától a törléséig tartó időszakra számítjuk fel. Az elszámolás percalapú, ezért a fürtöt mindig törölje, ha az már nincs használatban. Ha befejezte a munkát, a Példányok lapon törölheti a teljes megoldást.

Áttekintés

A hitelleértékelés-előrejelzési adatok használata számos előnyt kínál a pénzintézetek számára. A súlyos késedelembe esett hitelek esetében a leértékelés a bank utolsó mentsvára. Az előrejelzés adatai alapján a hitelügyintéző azonban olyan személyre szabott ösztönzőket (például alacsonyabb kamatot vagy hosszabb törlesztési időt) kínálhat az ügyfeleknek, amelyeknek köszönhetően folytathatják a törlesztést. Így megakadályozható a hitel leértékelése. Az ilyen típusú előrejelzési adatokat a hitelszövetkezetek és a bankok gyakran manuálisan, az ügyfelek fizetési előzményei alapján állítják össze, és ezt követően egyszerű statisztikai regressziós elemzést végeznek rajtuk. Ez a módszer azonban rendkívül érzékeny az adatgyűjtési hibákra, és statisztikailag sem teljesen hibátlan.

Ebben a megoldássablonban egy átfogó szolgáltatást mutatunk be, amelynek segítségével prediktív elemzések futtathatók a hiteladatokon, és elvégezhető a leértékelés valószínűségének pontozása. A hitelek elemzésének, a kapcsolódó trendeknek és a leértékelési valószínűségre vonatkozó előrejelzéseknek a bemutatására egy Power BI-jelentés szolgál.

Üzleti szempontok

Ez a hitelleértékelés-előrejelző szimulált hitelelőzmény-adatok alapján segít megbecsülni, hogy mekkora annak a valószínűsége, hogy a közeljövőben (a következő három hónapban) hitelleértékelés fog bekövetkezni. Minél nagyobb a pontszám, annál valószínűbb, hogy a hitelt a közeljövőben le fogják értékelni.

A hitelkezelő az elemzési adatok mellett a leértékelt hitelek bankfiókokra lebontott trendjeit is megtekintheti. A nagy leértékelési kockázatú hitelek jellemzőinek megismerése révén a hitelkezelő tudatosabban dolgozhatja ki az adott földrajzi területre vonatkozó üzleti terveket.

A HDInsight Spark-fürtökön futó Microsoft R Server az R Server és az Apache Spark hatékonyságát ötvözve kínál elosztott és skálázható gépi tanulási funkciókat big data-jellegű adatok elemzéséhez. Ez a megoldás a hitelleértékelések előrejelzésére szolgáló gépi tanulási (például adatfeldolgozási, funkciófejlesztési, betanítási és kiértékelési) modellek létrehozását, a modellek webszolgáltatásként (a határcsomóponton) való üzembe helyezését és a webszolgáltatás Azure HDInsight Spark-fürtökön futó Microsoft R Serverrel történő távoli használatát szemlélteti. A végső előrejelzéseket a rendszer egy Hive-táblába menti, mely vizualizálható a Power BI-ban.

A Power BI vizuális összegzéseket készít a törlesztés és a leértékelés előrejelzéséről is (ez itt szimulált adatokkal látható). Ha szeretné kipróbálni az irányítópultot, kattintson a jobb oldalon található „Kipróbálás” gombra.

Adatszakértői szempontok

Ez a szolgáltatássablon végigvezeti az előrejelzési analitika fejlesztésének teljes folyamatán, és szimulált hitelelőzmény-adatokkal szemlélteti, hogyan jelezhető előre a hitelleértékelés. Az adatok tartalmazzák a hiteltulajdonosok demográfiai adatait, a hitel összegét, a hitel szerződés szerinti futamidejét és a törlesztési előzményeket. A megoldássablon emellett olyan R-parancsprogramokat is tartalmaz, amelyek adatfeldolgozást és funkciófejlesztést végeznek, betanítják az adatokat különböző algoritmusok segítségével, és végül kiválasztják azt a modellt, amely a legjobb adatpontozó teljesítményt nyújtja az egyes hitelek valószínűségi pontszámának létrehozásához. Végül, a megoldás tartalmaz parancsprogramokat a modell (határcsomóponton futó) webszolgáltatásként való üzembe helyezéséhez, illetve a webszolgáltatás Azure HDInsight Spark-fürtökön futó Microsoft R Serverrel való távoli használatához.

A megoldást tesztelő adatszakértők az R-kódot az Azure HDInsight Spark-fürt határcsomópontján futó RStudio Server böngészőalapú nyílt forráskódú kiadásában tekinthetik meg. A számítási környezet beállításával a felhasználó eldöntheti, hogy a számítási műveletek helyileg, a határcsomóponton, vagy a Spark-fürt csomópontjain elosztva legyenek-e végrehajtva. A teljes R-kód megtalálható a Github nyilvános kódtárában is. Jó kísérletezgetést!

Jogi nyilatkozat

© 2017 Microsoft Corporation. Minden jog fenntartva. Ezt az információt jelen formájában nyújtjuk, és előzetes értesítés nélkül változhat. Az itt szereplő információkra a Microsoft nem vállal sem kifejezett, sem vélelmezett garanciát. A megoldás harmadik féltől származó adatok felhasználásával lett létrehozva. Ön felelős mások jogainak tiszteletben tartásáért, beleértve a hasonló adatkészletek létrehozásának céljából történő beszerzéseket és a vonatkozó licenceknek való megfelelőséget is.

Kapcsolódó megoldásarchitektúrák

Loan ChargeOff Prediction with SQL Server

Ez a megoldás bemutatja, hogy hogyan lehet létrehozni és üzembe helyezni a gépi tanulási modellt az SQL Server 2016 with R Services segítségével. Ez a modell képes jelezni, ha egy bankhitel esetében a következő 3 hónapban leértékelés várható.

Loan Credit Risk with SQL Server

Az SQL Server 2016 with R Services segítségével a hitelintézet prediktív elemzéseket végezhet, amelyekkel kiszűrheti a nagy valószínűséggel fizetésképtelenné váló hiteligénylőket, és így növelheti a hitelportfólió nyereségességét.