Doc Explorer Linguistic & Layout: Explorando Ferramentas de Inteligência Artificial para Extração de Informações de Documentos Semi Estruturados
dc.contributor.advisor | Fornaciali, Michel | |
dc.contributor.author | Oliveira, Erik Leonardo Soares de | |
dc.contributor.author | Barranco, Marcelo Rabello | |
dc.contributor.author | Silva, Marcos Vinícius da | |
dc.contributor.author | Souza, Thomas Chiari Ciocchetti de | |
dc.date.accessioned | 2025-04-09T18:35:13Z | |
dc.date.issued | 2024 | |
dc.description | Projeto realizado para a empresa Dell Technologies - Mentor: Pedro Henrique Pereira | |
dc.description.abstract | O formato PDF (Portable Document Format) é amplamente utilizado devido ao baixo consumo de memória e à facilidade de visualização das informações. No entanto, sua estrutura não padronizada traz desafios significativos para a extração automática de dados estruturados, especialmente em contextos corporativos, como o da Dell, onde o volume de documentos é alto e a diversidade de formatos é ampla. Este projeto, desenvolvido como parte de um Capstone, visa identificar e analisar tecnologias atuais de extração de dados aplicadas a PDFs semi-estruturados, propondo uma metodologia que integre um fluxo completo de processamento de dados para lidar com diferentes estruturas e elementos. O objetivo é extrair informações essenciais, através de texto, tabelas e imagens, de forma automatizada e confiável, e aplicar inteligência artificial generativa para facilitar a consulta e geração de informações relevantes desses documentos. | pt |
dc.format | Digital | |
dc.format.extent | 63 p. | |
dc.identifier.uri | https://repositorio.insper.edu.br/handle/11224/7562 | |
dc.language.iso | Português | |
dc.subject | Extração de Dados de Documentos | pt |
dc.subject | Extração de Dados de PDF | pt |
dc.subject | Geração de Insights com IA Generativa | pt |
dc.subject | Retrieval Augmented Generation | en |
dc.title | Doc Explorer Linguistic & Layout: Explorando Ferramentas de Inteligência Artificial para Extração de Informações de Documentos Semi Estruturados | |
dc.type | bachelor thesis | |
dspace.entity.type | Publication | |
local.contributor.boardmember | Fornaciali, Michel | |
local.contributor.boardmember | Santana, Andre Luiz Maciel | |
local.contributor.boardmember | ALEX CAMILLI BOTTENE | |
local.subject.cnpq | ENGENHARIAS | |
local.subject.cnpq | CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO | |
local.type | Trabalho de Conclusão de Curso | |
relation.isBoardMemberOfPublication | 2e10100c-7365-41dc-a424-aa548af2faea | |
relation.isBoardMemberOfPublication.latestForDiscovery | 2e10100c-7365-41dc-a424-aa548af2faea |