Doc Explorer Linguistic & Layout: Explorando Ferramentas de Inteligência Artificial para Extração de Informações de Documentos Semi Estruturados

dc.contributor.advisorFornaciali, Michel
dc.contributor.authorOliveira, Erik Leonardo Soares de
dc.contributor.authorBarranco, Marcelo Rabello
dc.contributor.authorSilva, Marcos Vinícius da
dc.contributor.authorSouza, Thomas Chiari Ciocchetti de
dc.date.accessioned2025-04-09T18:35:13Z
dc.date.issued2024
dc.descriptionProjeto realizado para a empresa Dell Technologies - Mentor: Pedro Henrique Pereira
dc.description.abstractO formato PDF (Portable Document Format) é amplamente utilizado devido ao baixo consumo de memória e à facilidade de visualização das informações. No entanto, sua estrutura não padronizada traz desafios significativos para a extração automática de dados estruturados, especialmente em contextos corporativos, como o da Dell, onde o volume de documentos é alto e a diversidade de formatos é ampla. Este projeto, desenvolvido como parte de um Capstone, visa identificar e analisar tecnologias atuais de extração de dados aplicadas a PDFs semi-estruturados, propondo uma metodologia que integre um fluxo completo de processamento de dados para lidar com diferentes estruturas e elementos. O objetivo é extrair informações essenciais, através de texto, tabelas e imagens, de forma automatizada e confiável, e aplicar inteligência artificial generativa para facilitar a consulta e geração de informações relevantes desses documentos.pt
dc.formatDigital
dc.format.extent63 p.
dc.identifier.urihttps://repositorio.insper.edu.br/handle/11224/7562
dc.language.isoPortuguês
dc.subjectExtração de Dados de Documentospt
dc.subjectExtração de Dados de PDFpt
dc.subjectGeração de Insights com IA Generativapt
dc.subjectRetrieval Augmented Generationen
dc.titleDoc Explorer Linguistic & Layout: Explorando Ferramentas de Inteligência Artificial para Extração de Informações de Documentos Semi Estruturados
dc.typebachelor thesis
dspace.entity.typePublication
local.contributor.boardmemberFornaciali, Michel
local.contributor.boardmemberSantana, Andre Luiz Maciel
local.contributor.boardmemberALEX CAMILLI BOTTENE
local.subject.cnpqENGENHARIAS
local.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
local.typeTrabalho de Conclusão de Curso
relation.isBoardMemberOfPublication2e10100c-7365-41dc-a424-aa548af2faea
relation.isBoardMemberOfPublication.latestForDiscovery2e10100c-7365-41dc-a424-aa548af2faea

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
N/D
Nome:
Relatorio Final_Dell Technologies_Doc explorer Linguistic.pdf
Tamanho:
6.07 MB
Formato:
Adobe Portable Document Format

Licença do pacote

Agora exibindo 1 - 1 de 1
N/D
Nome:
license.txt
Tamanho:
236 B
Formato:
Item-specific license agreed upon to submission
Descrição: