Solução Full-Stack de machine learning para Visão Computacional em Ambientes Industriais: Classificação, Versionamento e Treinamento Local de Modelos

dc.contributor.advisorCARLOS MAGNO DE OLIVEIRA VALENTE
dc.contributor.authorMachado, Diego Baptista Daurea
dc.contributor.authorCelestino, Douglas Pablo Braçal
dc.contributor.authorSilva, Gustavo Mendes da
dc.contributor.authorRizzo, Pedro Ivo de
dc.date.accessioned2025-11-28T12:05:07Z
dc.date.issued2025
dc.descriptionProjeto realizado para a empresa ABB / Mentor: Tiago Prata, MSc (R&D Engineer, Software Engineer and Talent Ambassador at ABB)
dc.description.abstractEste projeto dedica-se a estabelecer uma solução full-stack de machine learning para algoritmos de visão computacional, com versionamento, reclassificação e retreinamento de modelos, operando integralmente via Intranet para facilitar seu uso em plantas industriais. Tal abordagem visa atender qualquer processo, permitindo ao usuário realizar o upload de mídias, escolher as Labels que deseja classificar e anotar manualmente bounding boxes para rotulagem supervisionada e depois treinamento e retreinamento de modelos de visão computacional com as mídias rotuladas. Para isso, empregou-se Python e o modelo de detecção de objetos YOLO, associadas a um fluxo de versionamento (DVC/Git) que permite realimentar o modelo conforme surgem correções manuais de classificação. O frontend foi desenvolvido utilizando Next.js e Node.js, proporcionando uma interface interativa e eficiente para interação com os modelos. Além disso, toda a arquitetura foi dockerizada utilizando Docker, garantindo portabilidade, escalabilidade e facilidade de implantação em ambientes industriais. O resultado é um sistema robusto que permite evolução dos modelos e datasets sem depender de soluções em nuvem, garantindo escalabilidade e adequação às necessidades industriais locais.pt
dc.description.abstractThis project aims to establish a full-stack machine learning solution for computer vision algorithms, with versioning, reclassification, and model retraining capabilities, operating entirely over an Intranet to facilitate its use in industrial mining plants. This approach is designed to support any process, allowing users to upload media, select the labels they want to classify, and manually annotate bounding boxes for supervised labeling and then train or retrain computer vision models. The system leverages Python and the YOLO object detection model, combined with a versioning flow (DVC/Git) that enables retraining as manual classification corrections are implemented. The frontend was developed using Next.js and Node.js, providing an interactive and efficient interface for interacting with the models. Furthermore, the entire architecture is containerized using Docker, ensuring portability, scalability, and ease of deployment in industrial environments. The result is a robust system that allows the evolution of models and datasets without relying on cloud-based solutions, providing scalability and alignment with local industrial needs.en
dc.formatDigital
dc.format.extent80 p.
dc.identifier.urihttps://repositorio.insper.edu.br/handle/11224/8124
dc.language.isoPortuguês
dc.subjectClassificação de Imagenspt
dc.subjectVisão Computacionalpt
dc.subjectVersionamento de Modelospt
dc.subjectArquitetura de softwarept
dc.subjectArquitetura full-stackpt
dc.subjectImage Classificationen
dc.subjectMining, Computer Visionen
dc.subjectModel Versioningen
dc.subjectSoftware Architectureen
dc.subjectFull-Stack architectureen
dc.titleSolução Full-Stack de machine learning para Visão Computacional em Ambientes Industriais: Classificação, Versionamento e Treinamento Local de Modelos
dc.typebachelor thesis
dspace.entity.typePublication
local.contributor.boardmemberCARLOS MAGNO DE OLIVEIRA VALENTE
local.contributor.boardmemberDurão, Luiz Fernando Cardoso dos Santos
local.contributor.boardmemberMACIEL CALEBE VIDAL
local.contributor.coadvisorMARCELO HASHIMOTO
local.subject.cnpqENGENHARIAS
local.subject.cnpqOUTROS::ENGENHARIA MECATRONICA
local.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
local.typeTrabalho de Conclusão de Curso
relation.isAdvisorOfPublication8a98da68-52ea-4145-9c8d-773249f6cd25
relation.isAdvisorOfPublication.latestForDiscovery8a98da68-52ea-4145-9c8d-773249f6cd25
relation.isBoardMemberOfPublication8a98da68-52ea-4145-9c8d-773249f6cd25
relation.isBoardMemberOfPublication3c34d0f1-1f7d-4405-a994-3484d365cebf
relation.isBoardMemberOfPublication.latestForDiscovery8a98da68-52ea-4145-9c8d-773249f6cd25
relation.isCoAdvisorOfPublication48cdd4c6-a757-4ce4-bf0b-ce6e77ea71a7
relation.isCoAdvisorOfPublication.latestForDiscovery48cdd4c6-a757-4ce4-bf0b-ce6e77ea71a7

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Imagem de Miniatura
Nome:
CAPSTONE_RELATRIO_FINAL_ABB_DESENVOLVIMENTO_DE_ALGORITMOS_DE_ANLISE_DE_VDEO_2025.1.pdf
Tamanho:
2.8 MB
Formato:
Adobe Portable Document Format

Licença do pacote

Agora exibindo 1 - 1 de 1
N/D
Nome:
license.txt
Tamanho:
236 B
Formato:
Item-specific license agreed upon to submission
Descrição: