Aplicação de técnicas de machine learning em modelos de escore de crédito

dc.contributor.advisorRINALDO ARTES
dc.contributor.authorLukosiunas, Andreza
dc.coverage.spatialSão Paulo, SPpt_BR
dc.creatorLukosiunas, Andreza
dc.date.accessioned2021-09-13T03:20:39Z
dc.date.accessioned2020-07-16T18:41:25Z
dc.date.available2021-09-13T03:20:39Z
dc.date.available2018
dc.date.available2020-07-16T18:41:25Z
dc.date.issued2018
dc.date.submitted2018
dc.description.abstractVisando o aumento do lucro e redução da perda, instituições financeiras credoras esforçam-se em melhorar o acerto ao prever as chances de potenciais devedores ficarem inadimplentes. Com o aumento da capacidade do processamento computacional, técnicas de aprendizado de máquinas estão se popularizando em diversos meios. Diante desses dois cenários, este trabalho propõe a comparação das técnicas regressão logística, random forests, xgboost e multilayer perceptron aplicadas a uma base de escore de crédito disponibilizada pela Serasa Experian contendo o público de pequenas e médias empresas. Foram implementados testes de hipóteses utilizando o teste DeLong para comparar as áreas sob a curva roc dos modelos apresentados. A principal contribuição deste trabalho foi mostrar que houve superioridade da técnica random forests quando comparada às outras apresentadas neste trabalho ao diferenciar bons ou maus pagadores.pt_BR
dc.description.otherAiming at increasing profit and reducing loss, creditor financial institutions strive to improve the accuracy by predicting the chances of potential borrowers becoming defaulters. With increasing computational processing capacity, machine learning techniques are becoming very popular in a variety of environments. In the face of these two scenarios, this work proposes the comparison of logistic regression, random forests, xgboost and multilayer perceptron applied to a credit score dataset provided by Serasa Experian containing the public of small and medium enterprises. Hypothesis tests were used with DeLong test to compare the areas under the roc curve of the presented models. The main contribution of this work was to show that there was superiority of the random forests technique when compared to the others presented in this work to differentiate good or bad payers.pt_BR
dc.format.extent68 p.pt_BR
dc.identifier.urihttps://www.repositorio.insper.edu.br/handle/11224/2573
dc.language.isoPortuguêspt_BR
dc.rights.uriTODOS OS DOCUMENTOS DESSA COLEÇÃO PODEM SER ACESSADOS, MANTENDO-SE OS DIREITOS DOS AUTORES PELA CITAÇÃO DA ORIGEMpt_BR
dc.subjectEscore de crédito; aprendizado de máquina; regressão logística; random forests; gradient boosting; xgboost; multilayer perceptron; redes neurais artificiais; acordo de Basileia.pt_BR
dc.titleAplicação de técnicas de machine learning em modelos de escore de créditopt_BR
dc.typemaster thesis
dspace.entity.typePublication
local.contributor.boardmemberAyres, Fábio José
local.contributor.boardmemberMadalozzo, Regina
local.contributor.boardmemberAlencar, Airlane Pereira
local.typeDissertaçãopt_BR
relation.isAdvisorOfPublication8b791c94-f3e5-4e04-af26-594195a8f576
relation.isAdvisorOfPublication.latestForDiscovery8b791c94-f3e5-4e04-af26-594195a8f576
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Dissertacao- Andreza Lukosiunas.pdf
Tamanho:
1.05 MB
Formato:
Adobe Portable Document Format
Licença do Pacote
Agora exibindo 1 - 1 de 1
N/D
Nome:
license.txt
Tamanho:
1.71 KB
Formato:
Plain Text
Descrição: