Contagem de multidões através de redes neurais convolucionais
dc.contributor.advisor | Silva, Raul Ikeda Gomes da | |
dc.contributor.author | Santos, Eiki Luis Yamashiro Batista dos | |
dc.coverage.cidade | São Paulo | pt_BR |
dc.coverage.pais | Brasil | pt_BR |
dc.creator | Santos, Eiki Luis Yamashiro Batista dos | |
dc.date.accessioned | 2022-07-13T12:41:41Z | |
dc.date.available | 2022-07-13T12:41:41Z | |
dc.date.issued | 2021 | |
dc.description.abstract | A Contagem de Multidões através de Visão Computacional é uma tarefa desafiadora, visto que fatores como a oclusão devido à diferentes alturas das pessoas, ambientes não presentes no conjunto de treinamento e diferentes densidades de multidão presentes na mesma imagem, prejudicam significativamente o desempenho da maioria dos métodos de contagem. Uma possível solução para se diferenciar objetos presentes no ambiente, é se aproveitando da segregação de planos, separando o background do foreground, entretanto é necessário um conhecimento prévio do ambiente, o que afeta o desempenho em ambientes não presentes no conjunto de treinamento. Outra abordagem é através de Redes Neurais Convolucionais ou CNN (Convolutional Neural Network) que, segundo Géron[4] (2017), emergiram do estudo do córtex visual do cérebro e tem sido usadas no reconhecimento de imagens desde 1980, portanto as CNNs são inspiradas no processamento de dados visuais dos neurônios nos humanos, especializadas na análise de imagens, que podem atingir desempenho sobre-humano em algumas tarefas visuais. Assim, é proposta uma rede neural de três colunas, onde cada coluna se especializa em analisar uma determinada faixa de densidade. Um classificador é treinado para rotular um recorte da imagem com base na densidade da multidão e encaminhá-lo para a coluna mais apropriada. Um banco de dados com 1198 imagens anotadas e divididas em conjunto de teste e conjunto de treinamento é utilizado para medir a precisão da contagem, além de comparar o desempenho da CNN de várias colunas com outros métodos computacionais de contagem. | pt_BR |
dc.description.other | Crowd Counting with Computer Vision is a hard task, factors such as occlusion due to different heights of people, environments not present in the training set and different densities in the crowd image, significantly impair the performance of most counting methods. A possible approach is using a real-time foreground-background segmentation. However, prior knowledge of the environment is required, which affects performance in unfamiliar environments. Another approach is through Convolutional Neural Networks or CNN, according to Gerón[4], they emerged from the study of the visual cortex of the brain and have been used in image recognition since 1980. in this way, CNNs are inspired by the processing of visual data from neurons in humans, specializing in image analysis, which can achieve superhuman performance in some visual tasks. A Convolutional Neural Network Architecture is proposed with three different columns. The columns have differents characteristics, that allows each column specializing in certain density range. A Switch is trained to classify a input patch of the image based on the density in this patch, and forward this to the most appropriate column. A database with 1198 annotated images is used to mesure the precision of the crowd count. | pt_BR |
dc.format.extent | 15 p. | pt_BR |
dc.format.medium | Digital | pt_BR |
dc.identifier.uri | https://repositorio.insper.edu.br/handle/11224/3740 | |
dc.language.iso | Português | pt_BR |
dc.rights.license | TODOS OS DOCUMENTOS DESTA COLEÇÃO PODEM SER ACESSADOS, MANTENDO-SE OS DIREITOS DOS AUTORES PELA CITAÇÃO DA ORIGEM | pt_BR |
dc.subject | Redes Neurais Convolucionais | pt_BR |
dc.subject | contagem de multidão | pt_BR |
dc.subject | Visão Computacional | pt_BR |
dc.subject.keywords | Convolutional Neural Networks | pt_BR |
dc.subject.keywords | Crowd Counting | pt_BR |
dc.subject.keywords | Computer Vision | pt_BR |
dc.subject.keywords | Background Segmentation | pt_BR |
dc.title | Contagem de multidões através de redes neurais convolucionais | pt_BR |
dc.type | report | |
dspace.entity.type | Publication | |
local.subject.cnpq | Engenharias | pt_BR |
local.type | Relatório de Iniciação Científica | pt_BR |
Arquivos
Pacote original
1 - 2 de 2
- Nome:
- Eiki Luis Yamashiro Batista do Santos - Trabalho.pdf
- Tamanho:
- 647.91 KB
- Formato:
- Adobe Portable Document Format
- Descrição:
- Eiki Luis Yamashiro Batista do Santos - Trabalho
N/D
- Nome:
- Eiki Luis Yamashiro Batista do Santos - Termo de autorização.pdf
- Tamanho:
- 212.19 KB
- Formato:
- Adobe Portable Document Format
- Descrição:
- Eiki Luis Yamashiro Batista do Santos - Termo de autorização
Licença do pacote
1 - 1 de 1
N/D
- Nome:
- license.txt
- Tamanho:
- 282 B
- Formato:
- Item-specific license agreed upon to submission
- Descrição: