Navigatie overslaan

Voorspelling van oninbaarheid van leningen met Azure HDInsight Spark Clusters

Een oninbare lening is een lening die door een crediteur (meestal een leningverstrekker) wordt beschouwd als een schuld die waarschijnlijk niet kan worden geïnd, meestal wanneer de schuldenaar enorm achterloopt met zijn aflossingen. Aangezien een hoge oninbaarheid een negatieve impact heeft op de jaarcijfers van leningverstrekkers, houden leningverstrekkers het risico op oninbaarheid van leningen vaak goed in de gaten om te voorkomen dat leningen oninbaar worden. Met Azure HDInsight R Server kan een leningverstrekker optimaal gebruikmaken van voorspellende analyses door machine learning om de waarschijnlijkheid dat leningen oninbaar worden te voorspellen en een rapport uit te voeren op de analytische resultaten die zijn opgeslagen in HDFS en Hive-tabellen.

Beschrijving

Opmerking: als u deze oplossing al hebt geïmplementeerd, klikt u hier om de implementatie te bekijken.

Geschatte inrichtingstijd: 25 minuten

Deze oplossing maakt een HDInsight Spark-cluster met Microsoft R Server. Dit cluster bevat twee hoofdknooppunten, twee werkknooppunten en één edge-knooppunt met in totaal 32 kerngeheugens. De geschatte kosten voor dit HDInsight Spark-cluster zijn $8.29/uur. De facturering begint zodra een cluster is gemaakt en stopt als een cluster wordt verwijderd. De facturering wordt pro-rato per minuut berekend, dus u moet altijd uw cluster verwijderen wanneer het niet meer wordt gebruikt. Gebruik de pagina Implementaties om de complete oplossing te verwijderen wanneer u klaar bent.

Overzicht

Het verschaffen van voorspellingsgegevens over oninbare leningen biedt leningverstrekkers meerdere voordelen. Een lening oninbaar maken is het laatste redmiddel dat een bank zal inzetten bij een ernstig achterstallige lening. Met een overzicht van de voorspellingsgegevens kan de functionaris die over leningen gaat gepersonaliseerde stimulansen aanbieden, zoals een lager rentetarief of langere terugbetalingsperioden, zodat klanten aan hun betalingen voor de lening kunnen blijven voldoen. Hiermee wordt dus voorkomen dat de lening oninbaar wordt. Om dit soort voorspellingsgegevens te verkrijgen, stellen kredietinstellingen of banken gegevens vaak handmatig samen op basis van de betaalgeschiedenis van klanten en voeren ze een simpele statistische regressieanalyse uit. Bij deze, niet erg statistisch waterdichte, methode kunnen er gemakkelijk fouten voorkomen bij het samenstellen van de gegevens.

Deze oplossingssjabloon toont een end-to-endoplossing voor het uitvoeren van voorspellende analyse van leninggegevens en voor het genereren van een beoordeling van de kans op oninbaar worden. Aan de hand van een Power BI-rapport loopt u stapsgewijs door de analyse en trend van kredietleningen en de voorspelling van de kans op oninbaar worden.

Vanuit het perspectief van een bedrijf

Voor de voorspelling van het oninbaar worden van deze lening worden gesimuleerde leninggeschiedenisgegevens gebruikt om te voorspellen hoe groot de kans is dat de lening in de directe toekomst (de komende drie maanden) oninbaar wordt. Hoe hoger de score, hoe hoger de kans dat de lening in de toekomst oninbaar wordt.

Aan de hand van de analysegegevens krijgt de leningmanager ook meteen een overzicht van de trends en analyses van de oninbare leningen per filiaal. Eigenschappen van de leningen met een hoog risico dat ze oninbaar worden, helpen leningmanagers bedrijfsplannen op te stellen voor het aanbieden van leningen in die specifieke geografische locatie.

Microsoft R Server in HDInsight Spark-clusters levert gedistribueerde en schaalbare machine learning-mogelijkheden voor big data door optimaal gebruik te maken van de gecombineerde kracht van R Server en Apache Spark. Deze oplossing demonstreert hoe machine learning-modellen kunnen worden ontwikkeld om oninbaarheid van leningen te voorspellen (inclusief gegevensverwerking, feature-engineering, modellen trainen en evalueren), de modellen te implementeren als een webservice (op het edge-knooppunt) en de webservice op afstand te gebruiken met Microsoft R Server op Azure HDInsight Spark-clusters. De uiteindelijke voorspelling wordt opgeslagen in een Hive-tabel die kan worden gevisualiseerd in Power BI.

Power BI geeft bovendien visuele samenvattingen van de aflossingen en voorspellingen van oninbaarheid (wordt hier getoond met gesimuleerde gegevens). U kunt dit dashboard nu uitproberen door te klikken op de knop Nu uitproberen rechts.

Vanuit het perspectief van de datawetenschapper

Deze oplossingssjabloon behandelt het complete proces van hoe u voorspellende analytische gegevens ontwikkelt aan de hand van een set gesimuleerde geschiedenisgegevens over leningen om het risico op het oninbaar worden van leningen te voorspellen. Deze gegevens bevatten informatie als demografische gegevens over de leninghouder, het bedrag van de lening, de contractuele duur van de lening en geschiedenis van de aflossingen. De oplossingssjabloon bevat ook enkele aantal R-scripts die gegevensverwerking, feature-engineering en diverse verschillende algoritmes uitvoeren om de gegevens te trainen en ten slotte het best presterende model te selecteren om de gegevens te scoren om een waarschijnlijkheidsscore voor elke lening te krijgen. De oplossing bevat ook scripts om het model te implementeren als een webservice (op het edge-knooppunt) en de webservice op afstand te gebruiken met Microsoft R Server op Azure HDInsight Spark-clusters.

Gegevenswetenschappers die deze oplossing testen, kunnen werken met de bijgeleverde R-code van de op browser gebaseerde Open Source Edition van RStudio Server die uitvoert op het Edge-knooppunt van het Azure HDInsight Spark-cluster. Door de rekencontext in te stellen, kan de gebruiker beslissen waar de berekening wordt uitgevoerd: lokaal op het edge-knooppunt, of gedistribueerd op de knooppunten in het Spark-cluster. Alle R-code is ook te vinden in de openbare Github-opslagplaats. Veel plezier.

Vrijwaring

© 2017 Microsoft Corporation. Alle rechten voorbehouden. Deze informatie wordt als zodanig geleverd en kan zonder kennisgeving worden gewijzigd. Microsoft biedt geen garanties, expliciet of impliciet, met betrekking tot de hier verstrekte informatie. Gegevens van derden zijn gebruikt om de oplossing te genereren. U bent verantwoordelijk voor het respecteren van de rechten van anderen, inclusief het aanschaffen en naleven van relevante licenties om vergelijkbare gegevenssets te maken.

Gerelateerde architecturen voor oplossingen

Voorspelling van oninbaar worden van lening met SQL Server

In deze oplossing wordt getoond hoe u een machine learning-model bouwt en implementeert met SQL Server 2016 met R Services, om te voorspellen of er binnen drie maanden een banklening moet worden gemarkeerd als oninbaar

Leningkredietrisico met SQL Server

Met SQL Server 2016 met R Services kan een leninginstantie gebruikmaken van voorspellende analyses om het aantal leningen dat zij doorgaans standaard aan dergelijke leners verstrekken te verminderen, waardoor de winstgevendheid van hun leningenportfolio wordt verbeterd.