Gezintiyi Atla

Azure HDInsight Spark Kümeleri ile Kredi Zarar Kaydı Tahmini

Zarar olarak kaydedilen krediler, genellikle borçlunun kredi ödemelerinde büyük gecikmeler yaşanmasından dolayı borç veren (genellikle bir kredi kuruluşu) tarafın borç tutarını tahsil edemediğini bildirdiği kredilerdir. Zarar olarak kaydetme oranının yüksek olmasının kredi kuruluşlarının yıl sonu finansal durumuna olan olumsuz etkisi göz önünde bulundurulduğunda, kredi kuruluşları kredilerin zarar olarak kaydedilmesini engellemek için bu riski çok yakından izler. Bir kredi kuruluşu, kredilerin zarar olarak kaydedilme olasılığını tahmin etmek için Azure HDInsight R Server kullanarak tahmine dayalı makine öğrenimi analizinden yararlanabilir ve HDFS ile hive tablolarında depolanan analiz sonucu üzerine bir rapor çalıştırabilir.

Açıklama

Not: Bu çözümü zaten dağıttıysanız dağıtımınızı görüntülemek için buraya tıklayın.

Tahmini Sağlama Süresi: 25 Dakika

Bu çözümde, Microsoft R Server içeren bir HDInsight Spark kümesi oluşturulur. 2 baş düğüm, 2 çalışan düğümü ve 1 uç düğümden oluşan bu küme toplamda 32 çekirdek içerir. Bu HDInsight Spark kümesinin maliyeti yaklaşık $8.29/saattir. Faturalandırma, küme oluşturulduğunda başlar ve küme silindiğinde sona erer. Fatura dakikalara eşit olarak dağıtıldığından, kullanılmayan kümelerinizi mutlaka silmelisiniz. İşiniz bittiğinde, Dağıtımlar sayfasını kullanarak çözümü tamamen silin.

Genel Bakış

Burada borç veren kurumların kredi zarar kaydı tahmin verileriyle donatılmasına yönelik birden çok avantaj sunulmuştur. Bir krediyi zarar olarak kaydetmek, bankanın ödemesi çok gecikmiş bir kredi için başvuracağı son çaredir. Müşterilerin kredi ödemelerini sürdürmeleri ve böylelikle kredinin zarar olarak kaydedilmesinin önlenmesi için bir kredi yetkilisi, eldeki tahmin verileriyle, düşük faiz oranları ya da daha uzun geri ödeme süresi gibi teşvik edici teklifler sunabilir. Bu türden tahmin verilerini elde etmek için, kredi sendikaları veya bankalar, müşterilerin ödeme geçmişleri ve gerçekleştirilmiş basit istatistiksel gerileme analizini temel alan verileri bazen kendileri oluşturur. Bu yöntemin, veri derleme hatasına olan eğilimi yüksektir ve istatistiksel olarak doğru bir tercih değildir.

Bu çözüm şablonda, kredi verileri üzerine tahmine dayalı analizleri çalıştırmak ve zarar kaydı olasılığına puanlama yapmak için uçtan uca çözüm gösterilir. Bir PowerBI raporunda ayrıca kredi borçlarının ve zarar kaydı olasılığı tahmininin analizleri ve eğilimi anlatılır.

İş Perspektifi

Bu kredi zarar kaydı tahmini, sanal kredi geçmişi verilerini kullanarak, yakın gelecekte (gelecek üç ay içinde) kredi zararının olasılığını tahmin eder. Puan ne kadar yüksek olursa, gelecekte kredinin zarar kaydının yapılma olasılığı o kadar yüksek olur.

Analiz verileriyle, kredi yöneticisine şube konumları tarafından sağlanan zarar kaydı kredilerinin eğilimleri ve analizleri sunulur. Zarar etme riski yüksek olan kredilerin özellikleri, kredi yöneticilerinin o belirli coğrafi bölgede kredi tekliflerine yönelik iş planı oluşturmalarında yardımcı olur.

HDInsight Spark kümelerinde Microsoft R Server, R Server ile Apache Spark’ın birleşik gücünden yararlanarak büyük veriler için dağıtılmış ve ölçeklenebilir makine öğrenimi özellikleri sağlar. Bu çözümde, kredi zarar tahmini için makine öğrenimi modelleri geliştirme (veri işleme, özellik mühendisliği, eğitim ve değerlendirme modelleri dahil), modelleri uç düğümde bir web hizmeti olarak dağıtma ve web hizmetini Azure HDInsight Spark kümelerinde Microsoft R Server ile uzaktan kullanma işlemlerinin nasıl yapıldığı gösterilmiştir. Son tahminler Power BI’da görselleştirilebilen bir Hive tablosuna kaydedilir.

Power BI ayrıca kredi ödemelerinin ve zarar tahminlerinin görsel özetlerini sunar (sanal verilerle birlikte burada gösterilmiştir). Sağdaki “Şimdi Deneyin” düğmesine tıklayarak bu panoyu deneyebilirsiniz.

Veri Uzmanı Perspektifi

Bu çözüm şablonunda, kredi zarar riskinin tahmin edilmesi için simülasyonla elde edilmiş bir kredi geçmiş verileri kümesi kullanarak tahmin analizi geliştirme süreci baştan sona açıklanmıştır. Verilere kredi borçlusu nüfus verileri, kredi tutarı, kredi sözleşme dönemi ve kredi ödeme geçmişi gibi bilgiler dahil edilmiştir. Çözüm şablonu ayrıca veri işleme, özellik mühendisliği ve diğer çeşitli algoritmaları gerçekleştirerek verileri eğiten ve son olarak her bir kredi için olasılık puanı oluşturmak amacıyla en yüksek performanslı modeli seçen bir R betikleri kümesi de içerir. Çözüme, modeli bir web hizmeti (uç düğümde) olarak dağıtma ve web hizmetini Azure HDInsight Spark kümelerinde Microsoft R Server ile uzaktan kullanmaya yönelik betikler de dahil edilmiştir.

Bu çözümü test eden veri uzmanları, Azure HDInsight Spark kümesinin Uç Düğümünde çalışan, tarayıcı tabanlı Açık Kaynak RStudio Server Sürümü’nden sağlanan R koduyla çalışabilir. Kullanıcı işlem bağlamını ayarlayarak işlemlerin nerede gerçekleştirileceğine karar verebilir: uç düğümde yerel olarak veya Spark kümesinde düğümlere dağıtılmış olarak. Tüm R kodu genel Github deposunda da bulunabilir. İyi eğlenceler!

Bildirim

© 2017 Microsoft Corporation. Tüm hakları saklıdır. Buradaki bilgiler “olduğu gibi” sağlanmıştır ve bildirim yapılmaksızın değiştirilebilir. Microsoft, işbu bilgilerle ilgili açık veya zımni herhangi bir garanti vermez. Çözüm oluşturulurken üçüncü taraf verileri kullanılmıştır. Benzer veri kümeleri oluşturmak için ilgili lisansları edinmek ve bunlara uymak dahil olmak üzere başkalarının haklarına saygılı olma sorumluluğu sizindir.

İlgili çözüm mimarileri

SQL Server ile Kredi Zarar Kaydı Tahmini

Bu çözüm, bir banka kredisinin gelecek üç ay içinde zarar olarak kaydedilip edilmeyeceğini tahmin etmek için SQL Server 2016 ile R Services kullanarak makine öğrenme modeli oluşturup dağıtmayı gösterir

SQL Server ile Kredi Verme Riski

Borç veren bir kurum, SQL Server 2016 ile R Services kullanarak, borçlarını ödememe olasılığı yüksek olan borç alanlara teklif ettikleri kredilerin tutarını azaltmak için tahmine dayalı analizlerden faydalanabilir. Böylece kredi portföylerinin karlılığını artırabilirler.