Please use this identifier to cite or link to this item: https://repositorio.insper.edu.br/handle/11224/3712
Full metadata record
DC FieldValueLanguage
dc.rights.licenseTODOS OS DOCUMENTOS DESTA COLEÇÃO PODEM SER ACESSADOS, MANTENDO-SE OS DIREITOS DOS AUTORES PELA CITAÇÃO DA ORIGEMpt_BR
dc.date.accessioned2022-07-03T01:25:47Z-
dc.date.available2022-07-03T01:25:47Z-
dc.date.issued2021-
dc.identifier.urihttps://repositorio.insper.edu.br/handle/11224/3712-
dc.description.abstractEste projeto tem como objetivo o desenvolvimento de uma ferramenta modularizada de extração dos documentos do Diário Oficial do estado de São Paulo e identificação de licitações. Essa ferramenta é a base para um desenvolvimento de um produto capaz de categorizar e resumir informações de grande quantidade de documentos, sendo também um produto customizável às necessidades específicas da DELL. De acordo com o cliente, a aplicação precisa de módulos de coleta de dados (scraper), identificação de textos dos documentos, separação de seções de documentos, identificador de licitações e mecanismo de busca entre licitações, sendo todos esses módulos adaptáveis à demanda. Para isso, foi necessário estudar tecnologias como: scrapper, tratamento de imagens, reconhecimento óptico de caracteres, modelos de classificação, mecanismos de buscas e utilização de um banco de dados não relacional. Dado que a principal demanda do cliente é o tratamento dos textos do diário oficial e identificação de licitações, todos os módulos da ferramenta apresentaram-se eficazes no que diz respeito ao tempo esperado e da saída obtida, incluindo a extração de textos de arquivos pdf e classificação com random forest.pt_BR
dc.format.extent29 p.pt_BR
dc.format.mediumDigitalpt_BR
dc.language.isoPortuguêspt_BR
dc.subjectclassificação de textopt_BR
dc.subjectreconhecimento óptico de caracterespt_BR
dc.subjectprocessamento de imagempt_BR
dc.titleExtração e classificação de licitações do Diário Oficial do Estado de SPpt_BR
dc.typeTrabalho de Conclusão de Cursopt_BR
dc.description.otherNão informadopt_BR
dc.subject.cnpqEngenhariaspt_BR
dc.contributor.defensecommitteeVidal, Maciel Calebept_BR
dc.contributor.defensecommitteeAyres, Fabio Josept_BR
dc.description.qualificationlevelGraduaçãopt_BR
dc.subject.keywordsoptical character recognitionpt_BR
dc.subject.keywordstext classificationpt_BR
dc.subject.keywordsimage processingpt_BR
dc.subject.keywordsScikit Learnpt_BR
dc.subject.keywordsPyTesseract.pt_BR
dc.description.notesProjeto realizado para empresa Dell - Mentor na Empresa: Diego Gallopt_BR
dc.contributor.autorSatyro, Vitor-
dc.contributor.autorLiu, Vitor-
dc.contributor.autorDelchiaro, Lucca-
dc.contributor.autorSchoueri, Guilherme-
dc.contributor.orientadorMontagner, Igor dos Santos-
dc.coverage.paisBrasilpt_BR
dc.coverage.cidadeSão Paulopt_BR
Appears in Collections:Graduações em Engenharias

Files in This Item:
File Description SizeFormat 
DELL_Relatorio_Final_PFE.pdfRelatório Final PFE - Dell2.34 MBAdobe PDFThumbnail
View/Open

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.