Contagem de multidões através de redes neurais convolucionais

Santos, Eiki Luis Yamashiro Batista dos

Contagem de multidões através de redes neurais convolucionais

dc.contributor.advisor	Silva, Raul Ikeda Gomes da
dc.contributor.author	Santos, Eiki Luis Yamashiro Batista dos
dc.coverage.cidade	São Paulo	pt_BR
dc.coverage.pais	Brasil	pt_BR
dc.creator	Santos, Eiki Luis Yamashiro Batista dos
dc.date.accessioned	2022-07-13T12:41:41Z
dc.date.available	2022-07-13T12:41:41Z
dc.date.issued	2021
dc.description.abstract	A Contagem de Multidões através de Visão Computacional é uma tarefa desafiadora, visto que fatores como a oclusão devido à diferentes alturas das pessoas, ambientes não presentes no conjunto de treinamento e diferentes densidades de multidão presentes na mesma imagem, prejudicam significativamente o desempenho da maioria dos métodos de contagem. Uma possível solução para se diferenciar objetos presentes no ambiente, é se aproveitando da segregação de planos, separando o background do foreground, entretanto é necessário um conhecimento prévio do ambiente, o que afeta o desempenho em ambientes não presentes no conjunto de treinamento. Outra abordagem é através de Redes Neurais Convolucionais ou CNN (Convolutional Neural Network) que, segundo Géron[4] (2017), emergiram do estudo do córtex visual do cérebro e tem sido usadas no reconhecimento de imagens desde 1980, portanto as CNNs são inspiradas no processamento de dados visuais dos neurônios nos humanos, especializadas na análise de imagens, que podem atingir desempenho sobre-humano em algumas tarefas visuais. Assim, é proposta uma rede neural de três colunas, onde cada coluna se especializa em analisar uma determinada faixa de densidade. Um classificador é treinado para rotular um recorte da imagem com base na densidade da multidão e encaminhá-lo para a coluna mais apropriada. Um banco de dados com 1198 imagens anotadas e divididas em conjunto de teste e conjunto de treinamento é utilizado para medir a precisão da contagem, além de comparar o desempenho da CNN de várias colunas com outros métodos computacionais de contagem.	pt_BR
dc.description.other	Crowd Counting with Computer Vision is a hard task, factors such as occlusion due to different heights of people, environments not present in the training set and different densities in the crowd image, significantly impair the performance of most counting methods. A possible approach is using a real-time foreground-background segmentation. However, prior knowledge of the environment is required, which affects performance in unfamiliar environments. Another approach is through Convolutional Neural Networks or CNN, according to Gerón[4], they emerged from the study of the visual cortex of the brain and have been used in image recognition since 1980. in this way, CNNs are inspired by the processing of visual data from neurons in humans, specializing in image analysis, which can achieve superhuman performance in some visual tasks. A Convolutional Neural Network Architecture is proposed with three different columns. The columns have differents characteristics, that allows each column specializing in certain density range. A Switch is trained to classify a input patch of the image based on the density in this patch, and forward this to the most appropriate column. A database with 1198 annotated images is used to mesure the precision of the crowd count.	pt_BR
dc.format.extent	15 p.	pt_BR
dc.format.medium	Digital	pt_BR
dc.identifier.uri	https://repositorio.insper.edu.br/handle/11224/3740
dc.language.iso	Português	pt_BR
dc.rights.license	TODOS OS DOCUMENTOS DESTA COLEÇÃO PODEM SER ACESSADOS, MANTENDO-SE OS DIREITOS DOS AUTORES PELA CITAÇÃO DA ORIGEM	pt_BR
dc.subject	Redes Neurais Convolucionais	pt_BR
dc.subject	contagem de multidão	pt_BR
dc.subject	Visão Computacional	pt_BR
dc.subject.keywords	Convolutional Neural Networks	pt_BR
dc.subject.keywords	Crowd Counting	pt_BR
dc.subject.keywords	Computer Vision	pt_BR
dc.subject.keywords	Background Segmentation	pt_BR
dc.title	Contagem de multidões através de redes neurais convolucionais	pt_BR
dc.type	report
dspace.entity.type	Publication
local.subject.cnpq	Engenharias	pt_BR
local.type	Relatório de Iniciação Científica	pt_BR

Arquivos

Pacote original

Agora exibindo 1 - 2 de 2

Nome:: Eiki Luis Yamashiro Batista do Santos - Trabalho.pdf
Tamanho:: 647.91 KB
Formato:: Adobe Portable Document Format
Descrição:: Eiki Luis Yamashiro Batista do Santos - Trabalho

Baixar

Nome:: Eiki Luis Yamashiro Batista do Santos - Termo de autorização.pdf
Tamanho:: 212.19 KB
Formato:: Adobe Portable Document Format
Descrição:: Eiki Luis Yamashiro Batista do Santos - Termo de autorização

Baixar

Licença do pacote

Agora exibindo 1 - 1 de 1

Nome:: license.txt
Tamanho:: 282 B
Formato:: Item-specific license agreed upon to submission
Descrição:

Baixar

Coleções

Relatório de Iniciação Científica