Please use this identifier to cite or link to this item: https://repositorio.insper.edu.br/handle/11224/2573
Type: Dissertação
Title: Aplicação de técnicas de machine learning em modelos de escore de crédito
Authors: Lukosiunas, Andreza
Examination board: Ayres, Fábio José
Madalozzo, Regina
Alencar, Airlane Pereira
Advisor: Artes, Rinaldo
Publication Date: 2018
Original Abstract: Visando o aumento do lucro e redução da perda, instituições financeiras credoras esforçam-se em melhorar o acerto ao prever as chances de potenciais devedores ficarem inadimplentes. Com o aumento da capacidade do processamento computacional, técnicas de aprendizado de máquinas estão se popularizando em diversos meios. Diante desses dois cenários, este trabalho propõe a comparação das técnicas regressão logística, random forests, xgboost e multilayer perceptron aplicadas a uma base de escore de crédito disponibilizada pela Serasa Experian contendo o público de pequenas e médias empresas. Foram implementados testes de hipóteses utilizando o teste DeLong para comparar as áreas sob a curva roc dos modelos apresentados. A principal contribuição deste trabalho foi mostrar que houve superioridade da técnica random forests quando comparada às outras apresentadas neste trabalho ao diferenciar bons ou maus pagadores.
Keywords in original language : Escore de crédito; aprendizado de máquina; regressão logística; random forests; gradient boosting; xgboost; multilayer perceptron; redes neurais artificiais; acordo de Basileia.
Abstract: Aiming at increasing profit and reducing loss, creditor financial institutions strive to improve the accuracy by predicting the chances of potential borrowers becoming defaulters. With increasing computational processing capacity, machine learning techniques are becoming very popular in a variety of environments. In the face of these two scenarios, this work proposes the comparison of logistic regression, random forests, xgboost and multilayer perceptron applied to a credit score dataset provided by Serasa Experian containing the public of small and medium enterprises. Hypothesis tests were used with DeLong test to compare the areas under the roc curve of the presented models. The main contribution of this work was to show that there was superiority of the random forests technique when compared to the others presented in this work to differentiate good or bad payers.
Language: Português
Appears in Collections:Mestrado Profissional em Economia

Files in This Item:
File Description SizeFormat 
Dissertacao- Andreza Lukosiunas.pdf1.08 MBAdobe PDFThumbnail
View/Open

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.