Mestrado Profissional em Economia

URI permanente para esta coleçãohttps://repositorio.insper.edu.br/handle/11224/3240

Navegar

Resultados da Pesquisa

Agora exibindo 1 - 2 de 2
  • Imagem de Miniatura
    Dissertação
    Aplicação de árvores de regressão aditivas bayesianas no desenvolvimento de modelos de escore de crédito no Brasil
    (2016) Brito Filho, Daniel Alves De
    A análise de crédito é uma atividade fundamental para as instituições financeiras. Os modelos de escore de crédito tornaram-se uma ferramenta importante, devido à necessidade de padronização e agilidade nas análises de crédito, existindo situações em que a aprovação ou recusa do crédito é totalmente automatizada. Segundo Thomas (2009), a técnica mais utilizada na construção de modelos de escore de crédito é a regressão logística. Por outro lado, outras técnicas, reunidas sob o termo aprendizado de máquina, têm sido aplicadas em modelos de classificação. Como podemos observar em Kruppa et al. (2013) e Lessmann et al. (2015), esses modelos têm apresentado resultados superiores aos modelos de regressão logística. Este trabalho propõe uma comparação entre o modelo de regressão logística e os modelos de aprendizado de máquina BART e Random Forests. Para o desenvolvimento dos modelos foi utilizada uma base de dados fornecida pela empresa Serasa Experian contendo informações do bureau de crédito referente a clientes de operações de crédito direto ao consumidor no varejo. Para a avaliação da performance dos modelos foram utilizadas a estatística de Kolmogorov-Smirnov e o coeficiente de Gini. Também foi gerado um intervalo de confiança para a métrica área sob a curva (AUC) para testar a hipótese dos modelos possuírem a mesma performance. Como principal resultado, a análise realizada confirma a superioridade do modelo BART sobre o modelo de regressão logística no banco de dados analisado. Além disso, os resultados sugerem que o modelo Random Forests é superior ao modelo de regressão logística somente quando ajustado na amostra balanceada analisada, dado que a performance da regressão logística melhorou quanto ajustado na base de desenvolvimento desbalanceada. Os melhores modelos BART ajustados, tanto na amostra balanceada quanto na amostra desbalanceada, foram superiores ao modelo Random Forests, nos dados analisados. Porém, o modelo BART padrão e Random Forests apresentaram performance similar e não podemos afirmar que um modelo foi superior ao outro.
  • Imagem de Miniatura
    Dissertação
    Aplicação de algoritmos de aprendizado de máquina no desenvolvimento de modelos de escore de crédito
    (2015) Silverio, Murilo
    RESUMO Os modelos de escore de crédito tornaram-se uma ferramenta importante para as instituições financeiras devido à necessidade de padronização e agilidade nas análises de crédito. De acordo com Thomas (2009) a regressão logística tem sido a técnica mais utilizada na construção desses modelos. Entretanto, nos últimos quinze anos, modelos baseados em algoritmos de aprendizado de máquina têm surgido e apresentado resultados superiores aos de modelos de regressão logística, como podemos observar em Kruppa et al. (2013) e Lessmann et al. (2015). Este trabalho propõe uma comparação entre modelos de regressão logística e modelos criados utilizando as técnicas de aprendizado de máquina Random Forests e Logistic Model Trees. Para o desenvolvimento do modelo foi utilizada uma base de dados fornecida por uma instituição financeira, referente a uma operação de crédito direto ao consumidor. A estatística de Kolmogorov-Smirnov e o Coeficiente de Gini foram utilizados para determinar a performance de cada modelo. Como principal resultado, este trabalho confirma a superioridade do modelo de Random Forests sobre o modelo de regressão logística, o mesmo não acontecendo com o modelo de Logistic Model Trees.