Omitir navegación

Predicción de préstamos incobrables con clústeres de Azure HDInsight Spark

Un préstamo incobrable es aquel para el que un acreedor (normalmente, una institución crediticia) declara que es probable que no se recupere el importe de la deuda, generalmente en casos de morosidad grave. Puesto que una tasa alta de préstamos incobrables tiene consecuencias negativas en las finanzas del ejercicio fiscal de las instituciones crediticias, a menudo estas instituciones supervisan detenidamente el riesgo de que los préstamos resulten incobrables para evitarlo. Con Azure HDInsight R Server, una institución crediticia puede aprovechar análisis predictivo con aprendizaje automático para predecir la probabilidad de que los préstamos resulten incobrables y elaborar un informe sobre el resultado del análisis que se almacena en tablas de Hive y HDFS.

Descripción

Nota: Si ya ha implementado esta solución, haga clic aquí para ver la implementación.

Tiempo de aprovisionamiento estimado: 25 minutos

Esta solución crea un clúster de HDInsight Spark con Microsoft R Server. Este clúster contiene 2 nodos principales, 2 nodos de trabajo y 1 nodo perimetral con un total de 32 núcleos. El costo aproximado de este clúster de HDInsight Spark es $8.29/hora. La facturación comienza cuando se crea el clúster y se detiene cuando este se elimina. Se prorratea por minutos, por lo que siempre debe eliminar el clúster cuando ya no se utilice. Use la página Implementaciones para eliminar toda la solución cuando haya terminado.

Información general

Las instituciones crediticias obtienen numerosas ventajas al disponer de datos de predicción de préstamos que pueden resultar incobrables. Declarar un préstamo como incobrable es el último recurso al que recurrirá un banco ante un préstamo moroso importante. Con los datos de predicción en mano, el gestor de préstamos puede ofrecer incentivos personalizados, como una reducción del tipo de interés o una ampliación del período de pago, para ayudar a los clientes a continuar pagando sus préstamos y, por tanto, evitar que se declaren como incobrables. Para obtener este tipo de predicción, a menudo las instituciones financieras elaboran los datos manualmente en función del historial de pago de los clientes y llevan a cabo un sencillo análisis de regresión estadística. Este método está muy expuesto a errores en la compilación de los datos y, por tanto, no es estadísticamente confiable.

Esta plantilla muestra una solución integral para llevar a cabo un análisis predictivo de datos de préstamos y puntuar la probabilidad de que resulten incobrables. Un informe de PowerBI muestra también el análisis y la tendencia de los préstamos, así como la predicción de probabilidad de que resulten incobrables.

Perspectiva empresarial

Esta predicción de préstamos incobrables utiliza datos históricos de préstamos para predecir la probabilidad de que los préstamos resulten incobrables en el futuro inmediato (los tres próximos meses). Cuanto más alta es la puntuación, mayor es la probabilidad de que el préstamo resulte incobrable.

Junto a los datos de análisis, el gestor de préstamos obtiene las tendencias y el análisis de los préstamos incobrables por sucursales. Las características de los préstamos con un alto riesgo de resultar incobrables ayudan a los gestores de préstamos a hacer planes de negocio para la oferta de préstamos en esa área geográfica concreta.

Microsoft R Server en clústeres de Spark en HDInsight proporciona funcionalidad de aprendizaje automático distribuida y escalable para macrodatos, aprovechando el potencial combinado de R Server y Apache Spark. Esta solución muestra cómo desarrollar modelos de aprendizaje automático para predecir préstamos incobrables (incluidos el procesamiento de datos, el diseño de características, el entrenamiento y la evaluación de modelos), implementar los modelos como un servicio web (en el nodo perimetral) y consumir el servicio web en modo remoto con Microsoft R Server en clústeres de Azure HDInsight Spark. Las predicciones finales se guardan en una tabla de Hive que se puede visualizar en Power BI.

Power BI ofrece también resúmenes visuales de los pagos de préstamos y de las predicciones de préstamos incobrables (aquí se muestran con datos simulados). Para probar este panel, haga clic en el botón “Probarlo ahora” de la derecha.

Perspectiva de científico de datos

Esta plantilla de solución muestra el proceso completo de desarrollo y análisis usando un conjunto de datos históricos de préstamos simulados para predecir el riesgo de que los préstamos resulten incobrables. Los datos contienen información como los detalles demográficos del titular del préstamo, el importe y la duración contractual del préstamo y el historial de pagos de préstamos. La plantilla de solución incluye también un conjunto de scripts de R para el procesamiento de datos, el diseño de características y diferentes algoritmos para entrenar los datos y, finalmente, seleccionar el modelo con el mejor rendimiento para puntuar los datos con el fin de generar una puntuación de probabilidad para cada préstamo. La solución incluye también scripts para implementar el modelo como servicio web (en el nodo perimetral) y consumir dicho servicio en modo remoto con Microsoft R Server en clústeres de Azure HDInsight Spark.

Los científicos de datos que prueben esta solución pueden trabajar con el código de R proporcionado desde la edición de código abierto de RStudio Server basada en explorador que se ejecuta en el nodo perimetral del clúster de Azure HDInsight Spark. Al establecer el contexto de proceso, el usuario puede decidir dónde se llevará a cabo: de forma local en el nodo perimetral o de forma distribuida en los nodos del clúster de Spark. Todo el código de R se puede encontrar también en el repositorio público de Github. ¡Diviértase!

Declinación de responsabilidades

©2017 Microsoft Corporation. Todos los derechos reservados. Esta información se proporciona "tal cual" y puede cambiar sin previo aviso. Microsoft no ofrece ninguna garantía, ni expresa ni implícita, respecto a la información que aquí se proporciona. Para generar la solución, se utilizaron datos de terceros. Usted es responsable de respetar los derechos de otros, incluida la adquisición y el cumplimiento de las licencias correspondientes para crear conjuntos de datos similares.

Arquitecturas de soluciones relacionadas

Predicción de préstamos incobrables con SQL Server

Esta solución muestra cómo crear e implementar un modelo de aprendizaje automático con SQL Server 2016 con R Services para predecir si será necesario declarar como incobrable un préstamo bancario en los próximos 3 meses.

Riesgo de crédito con SQL Server

El uso de SQL Server 2016 con R Services permite a una institución crediticia utilizar análisis predictivo para reducir el número de préstamos que ofrece a prestatarios con una alta probabilidad de impago, lo que le permite aumentar la rentabilidad de su cartera crediticia.