Aplicação de técnicas de machine learning em modelos de escore de crédito
dc.contributor.advisor | RINALDO ARTES | |
dc.contributor.author | Lukosiunas, Andreza | |
dc.coverage.spatial | São Paulo, SP | pt_BR |
dc.creator | Lukosiunas, Andreza | |
dc.date.accessioned | 2021-09-13T03:20:39Z | |
dc.date.accessioned | 2020-07-16T18:41:25Z | |
dc.date.available | 2021-09-13T03:20:39Z | |
dc.date.available | 2018 | |
dc.date.available | 2020-07-16T18:41:25Z | |
dc.date.issued | 2018 | |
dc.date.submitted | 2018 | |
dc.description.abstract | Visando o aumento do lucro e redução da perda, instituições financeiras credoras esforçam-se em melhorar o acerto ao prever as chances de potenciais devedores ficarem inadimplentes. Com o aumento da capacidade do processamento computacional, técnicas de aprendizado de máquinas estão se popularizando em diversos meios. Diante desses dois cenários, este trabalho propõe a comparação das técnicas regressão logística, random forests, xgboost e multilayer perceptron aplicadas a uma base de escore de crédito disponibilizada pela Serasa Experian contendo o público de pequenas e médias empresas. Foram implementados testes de hipóteses utilizando o teste DeLong para comparar as áreas sob a curva roc dos modelos apresentados. A principal contribuição deste trabalho foi mostrar que houve superioridade da técnica random forests quando comparada às outras apresentadas neste trabalho ao diferenciar bons ou maus pagadores. | pt_BR |
dc.description.other | Aiming at increasing profit and reducing loss, creditor financial institutions strive to improve the accuracy by predicting the chances of potential borrowers becoming defaulters. With increasing computational processing capacity, machine learning techniques are becoming very popular in a variety of environments. In the face of these two scenarios, this work proposes the comparison of logistic regression, random forests, xgboost and multilayer perceptron applied to a credit score dataset provided by Serasa Experian containing the public of small and medium enterprises. Hypothesis tests were used with DeLong test to compare the areas under the roc curve of the presented models. The main contribution of this work was to show that there was superiority of the random forests technique when compared to the others presented in this work to differentiate good or bad payers. | pt_BR |
dc.format.extent | 68 p. | pt_BR |
dc.identifier.uri | https://repositorio.insper.edu.br/handle/11224/2573 | |
dc.language.iso | Português | pt_BR |
dc.rights.uri | TODOS OS DOCUMENTOS DESSA COLEÇÃO PODEM SER ACESSADOS, MANTENDO-SE OS DIREITOS DOS AUTORES PELA CITAÇÃO DA ORIGEM | pt_BR |
dc.subject | Escore de crédito; aprendizado de máquina; regressão logística; random forests; gradient boosting; xgboost; multilayer perceptron; redes neurais artificiais; acordo de Basileia. | pt_BR |
dc.title | Aplicação de técnicas de machine learning em modelos de escore de crédito | pt_BR |
dc.type | master thesis | |
dspace.entity.type | Publication | |
local.contributor.boardmember | Ayres, Fábio José | |
local.contributor.boardmember | Madalozzo, Regina | |
local.contributor.boardmember | Alencar, Airlane Pereira | |
local.type | Dissertação | pt_BR |
relation.isAdvisorOfPublication | 8b791c94-f3e5-4e04-af26-594195a8f576 | |
relation.isAdvisorOfPublication.latestForDiscovery | 8b791c94-f3e5-4e04-af26-594195a8f576 |