Iniciação Científica e Tecnológica

URI permanente desta comunidadehttps://repositorio.insper.edu.br/handle/11224/3250

Navegar

Resultados da Pesquisa

Agora exibindo 1 - 2 de 2
  • Imagem de Miniatura
    Relatório de Iniciação Científica
    Extração, Estruturação e Interpretação Automatizada de Notícias: Um Modelo Baseado em Aprendizado Profundo, Reconhecimento Ótico de Caracteres e Alocação Latente de Dirichlet
    (2025) Oehling, Klaus Colletti
    Este relatório de iniciação científica desenvolve um método automatizado para extração, estruturação e interpretação de notícias veiculadas no jornal impresso O Estado de S. Paulo, no período de 2001 a 2023. A pesquisa integra o estudo macroeconômico de expectativas fiscais apresentado em Fiscal Shocks or Fiscal News? Evidence from Daily Fiscal Expectations (Bandeira; Bonomo; Carvalho; Mendes, 2025). A metodologia adotada consistiu, inicialmente, na construção de um conjunto de dados anotado por meio da ferramenta Label Studio, na qual foram criadas caixas delimitadoras com regiões correspondentes a títulos, textos, tipos, notas, autores, subtítulos e outros nas capas e páginas da seção de economia do periódico. Esse corpus serviu de base para treinar um modelo de aprendizado profundo com a biblioteca LayoutParser, permitindo a detecção automática das estruturas jornalísticas. Mais adiante, foi implementado um algoritmo autoral para agrupar coerentemente caixas delimitadoras da mesma notícia e aplicar o Reconhecimento Ótico de Caracteres (OCR) ao conteúdo extraído. Por fim, utilizou-se a modelagem de tópicos via Alocação Latente de Dirichlet (LDA) para identificar e classificar notícias fiscais. A série temporal resultante demonstra forte alinhamento com eventos fiscais relevantes das últimas décadas.
  • Imagem de Miniatura
    Relatório de Iniciação Científica
    Eventos Fiscais e Notícias Fiscais: uma assistência de pesquisa
    (2024) Mugnol, Júlio César Ballen