Contagem de multidões através de redes neurais convolucionais

dc.contributor.advisorSilva, Raul Ikeda Gomes da
dc.contributor.authorSantos, Eiki Luis Yamashiro Batista dos
dc.coverage.cidadeSão Paulopt_BR
dc.coverage.paisBrasilpt_BR
dc.creatorSantos, Eiki Luis Yamashiro Batista dos
dc.date.accessioned2022-07-13T12:41:41Z
dc.date.available2022-07-13T12:41:41Z
dc.date.issued2021
dc.description.abstractA Contagem de Multidões através de Visão Computacional é uma tarefa desafiadora, visto que fatores como a oclusão devido à diferentes alturas das pessoas, ambientes não presentes no conjunto de treinamento e diferentes densidades de multidão presentes na mesma imagem, prejudicam significativamente o desempenho da maioria dos métodos de contagem. Uma possível solução para se diferenciar objetos presentes no ambiente, é se aproveitando da segregação de planos, separando o background do foreground, entretanto é necessário um conhecimento prévio do ambiente, o que afeta o desempenho em ambientes não presentes no conjunto de treinamento. Outra abordagem é através de Redes Neurais Convolucionais ou CNN (Convolutional Neural Network) que, segundo Géron[4] (2017), emergiram do estudo do córtex visual do cérebro e tem sido usadas no reconhecimento de imagens desde 1980, portanto as CNNs são inspiradas no processamento de dados visuais dos neurônios nos humanos, especializadas na análise de imagens, que podem atingir desempenho sobre-humano em algumas tarefas visuais. Assim, é proposta uma rede neural de três colunas, onde cada coluna se especializa em analisar uma determinada faixa de densidade. Um classificador é treinado para rotular um recorte da imagem com base na densidade da multidão e encaminhá-lo para a coluna mais apropriada. Um banco de dados com 1198 imagens anotadas e divididas em conjunto de teste e conjunto de treinamento é utilizado para medir a precisão da contagem, além de comparar o desempenho da CNN de várias colunas com outros métodos computacionais de contagem.pt_BR
dc.description.otherCrowd Counting with Computer Vision is a hard task, factors such as occlusion due to different heights of people, environments not present in the training set and different densities in the crowd image, significantly impair the performance of most counting methods. A possible approach is using a real-time foreground-background segmentation. However, prior knowledge of the environment is required, which affects performance in unfamiliar environments. Another approach is through Convolutional Neural Networks or CNN, according to Gerón[4], they emerged from the study of the visual cortex of the brain and have been used in image recognition since 1980. in this way, CNNs are inspired by the processing of visual data from neurons in humans, specializing in image analysis, which can achieve superhuman performance in some visual tasks. A Convolutional Neural Network Architecture is proposed with three different columns. The columns have differents characteristics, that allows each column specializing in certain density range. A Switch is trained to classify a input patch of the image based on the density in this patch, and forward this to the most appropriate column. A database with 1198 annotated images is used to mesure the precision of the crowd count.pt_BR
dc.format.extent15 p.pt_BR
dc.format.mediumDigitalpt_BR
dc.identifier.urihttps://repositorio.insper.edu.br/handle/11224/3740
dc.language.isoPortuguêspt_BR
dc.rights.licenseTODOS OS DOCUMENTOS DESTA COLEÇÃO PODEM SER ACESSADOS, MANTENDO-SE OS DIREITOS DOS AUTORES PELA CITAÇÃO DA ORIGEMpt_BR
dc.subjectRedes Neurais Convolucionaispt_BR
dc.subjectcontagem de multidãopt_BR
dc.subjectVisão Computacionalpt_BR
dc.subject.keywordsConvolutional Neural Networkspt_BR
dc.subject.keywordsCrowd Countingpt_BR
dc.subject.keywordsComputer Visionpt_BR
dc.subject.keywordsBackground Segmentationpt_BR
dc.titleContagem de multidões através de redes neurais convolucionaispt_BR
dc.typereport
dspace.entity.typePublication
local.subject.cnpqEngenhariaspt_BR
local.typeRelatório de Iniciação Científicapt_BR

Arquivos

Pacote original

Agora exibindo 1 - 2 de 2
Imagem de Miniatura
Nome:
Eiki Luis Yamashiro Batista do Santos - Trabalho.pdf
Tamanho:
647.91 KB
Formato:
Adobe Portable Document Format
Descrição:
Eiki Luis Yamashiro Batista do Santos - Trabalho
N/D
Nome:
Eiki Luis Yamashiro Batista do Santos - Termo de autorização.pdf
Tamanho:
212.19 KB
Formato:
Adobe Portable Document Format
Descrição:
Eiki Luis Yamashiro Batista do Santos - Termo de autorização

Licença do pacote

Agora exibindo 1 - 1 de 1
N/D
Nome:
license.txt
Tamanho:
282 B
Formato:
Item-specific license agreed upon to submission
Descrição: