Hopp over navigasjon

Prognose av ettergitte lån med Azure HDInsight Spark-klynger

Et ettergitt lån er et lån som en kreditor (vanligvis en låneinstitusjon) har erklært sannsynligvis ikke kommer til å bli tilbakebetalt i sin helhet, vanligvis når lånetakeren er svært tilbakebetalingsudyktig. Da et stort antall ettergitte lån har negativ virkning på låneinstitusjonens årsresultater, vil låneinstitusjoner ofte overvåke risikoen for ettergivelse av lån veldig nøye for å unngå dette. Ved å bruke HDInsight R Server, kan en låneinstitusjon benytte prediktiv analyse med maskinlæring for å forutse sannsynligheten for at lån blir ettergitt og kjøre en rapport over analyseresultatene som lagres i HDFS og strukturtabeller.

Beskrivelse

Merk: Hvis du allerede har distribuert denne løsningen, kan du klikke her for å vise distribusjonen.

Estimert klargjøringstid: 25 minutter

Denne løsningen vil opprette en HDInsight Spark-klynge med Microsoft R Server. Denne klyngen vil inneholde to hovednoder, to arbeidsnoder og én kantnode med totalt 32 kjerner. Den omtrentlige kostnaden for denne HDInsight Spark-klyngen er $8.29/time. Faktureringen starter så snart en klynge er opprettet, og stopper når klyngen slettes. Fakturering er fordelt per minutt, så du bør alltid slette klyngen når den ikke lenger er i bruk. Bruk distribusjoner-siden for å slette hele løsningen når du er ferdig.

Oversikt

Her har du flere fordeler som kreditorer får fra prognosedata for ettergitte lån. Ettergivelse av et lån er en banks siste utvei for et ubetalt lån, med tilgjengelige prognosedata kan kreditoren tilby tilpassede insentiver som lavere rente eller lengre tilbakebetalingstid for å hjelpe kunder med å fortsette med tilbakebetalingen av lån og derved unngå ettergivelse. For å få denne typen prognosedata vil kreditorer og banker ofte manuelt samle inn dataene basert på kundens tidligere betalingshistorikk og utføre en enkel statistisk regresjonsanalyse. Denne metoden er veldig utsatt for datainnsamlingsfeil og er ikke statistisk stabil.

Denne løsningsmalen demonstrerer en løsning som gjør slutt på manuell prediktiv analyse av lånedata og produserer en score basert på sannsynlighet for ettergivelse av lån. En PowerBI-rapport vil også gjennomgå analysen og trendene til kredittlån og prognosen for sannsynlighet for ettergivelse av lån.

Forretningsperspektiv

Denne prognosen for sannsynligheten for ettergivelse av lån bruker simulerte historiske lånedata for å forutse hvor sannsynlig det er for at et lån blir ettergitt nær fremtid (de neste tre månedene). Desto høyere scoren er, desto større sannsynlighet er det for at lånet blir ettergitt i fremtiden.

Med analysedataene blir kreditoren også presentert med trendene og analysene for ettergitte lån etter bransjelokasjoner. Karakteristikkene til lån som har høy risiko for å bli ettergitt hjelper kreditorer med å sette opp en forretningsplan for lånetilbud i det spesifikke geografiske området.

Microsoft R Server på HDInsight Spark-klynger tilbyr distribuerte og skalerbare maskinlæringsegenskaper for store data ved å kombinere kraften til R Server og Apache Spark. Denne løsningen demonstrerer hvordan du utvikler maskinlæremodeller for å forutse ettergivelse av lån (inkludert databehandling, funksjonsutvikling, opplæring og evaluering av modeller), distribuer modellene som en nettjeneste (på kantnoden) og bruk nettjenesten eksternt med Microsoft R Server på Azure HDInsight Spark-klynger. De endelige prognosene lagres i en Hive-tabell som kan visualiseres i PowerBI.

PowerBI presenterer også visuelle sammendrag over prognoser for betaling og ettergivelse av lån (vist her med simulerte data). Du kan prøve dette dashbordet ved å klikke på knappen «Prøv nå» til høyre.

Perspektivet til dataforskere

Denne løsningsmalen gjennomgår den fullstendige prosessen for å utvikle prognoseanalyse ved hjelp av et sett av simulerte utlånshistorikkdata for å estimere risikoen for ettergivelse av lån. Dataene inneholder informasjon som demografikkdata til lånetakeren, lånebeløp, kontraktmessig varighet på lånet og historikk for tilbakebetaling av lån. Løsningsmalen inkluderer også et sett med R-skript som utfører databehandling, funksjonsutvikling og flere forskjellige algoritmer for datalæring, og til slutt velge den beste ytende modeller for å score dataen og produsere en sannsynlighetsscore for hvert lån. Løsningen inkluderer også skript for distribusjon av modellen som en nettjeneste (på kantnode) og bruk av nettjenesten eksternt med Microsoft R Server på Azure HDInsight Spark-klynger.

Dataforskere som tester denne løsningen kan jobbe med den medleverte R-koden fra den nettleserbaserte åpen kilde-utgaven av RStudio Server som kjøper på kantnoden til Azure HDInsight Spark-klyngen. Ved å angi databehandlingskontekst kan brukeren avgjøre hvor databehandlingen vil bli utført: lokalt på kantnoden eller distribuert på tvers av nodene i Spark-klyngen. All R-koden kan også finnes i det offentlige GitHub-arkivet. Lykke til!

Ansvarsfraskrivelse

©2017 Microsoft Corporation. Med enerett. Denne informasjonen gis «som den er» og kan endres uten varsel. Microsoft gir ingen garantier, uttrykkelig eller underforstått, i forbindelse med informasjonen som oppgis her. Tredjepartsdata ble benyttet for å generere løsningen. Du er ansvarlig for å respektere andres rettigheter, inkludert anskaffelse og overhold av relevante lisenser for å opprette lignende datasett.

Relaterte løsningsarkitekturer

Prognose for ettergivelse av lån med SQL Server

Denne løsningen demonstrerer hvordan du bygger og distribuerer en maskinlæringsmodell med SQL Server 2016 for å forutsi om et banklån blir ettergitt i løpet av de neste 3 månedene

Lånekredittrisiko med SQL Server

Ved bruk av SQL Server 2016 med R Services, kan en låneinstitusjon benytte prediktiv analyse for å redusere antallet lån som de tilbyr til de lånetakere som mest sannsynligvis vil misligholde og derved øke lønnsomheten på låneporteføljen.