TODOS OS DOCUMENTOS DESTA COLEÇÃO PODEM SER ACESSADOS, MANTENDO-SE OS DIREITOS DOS AUTORES PELA CITAÇÃO DA ORIGEMSilva, Raul Ikeda Gomes daSantos, Eiki Luis Yamashiro Batista dos2022-07-132022-07-132021https://repositorio.insper.edu.br/handle/11224/3740A Contagem de Multidões através de Visão Computacional é uma tarefa desafiadora, visto que fatores como a oclusão devido à diferentes alturas das pessoas, ambientes não presentes no conjunto de treinamento e diferentes densidades de multidão presentes na mesma imagem, prejudicam significativamente o desempenho da maioria dos métodos de contagem. Uma possível solução para se diferenciar objetos presentes no ambiente, é se aproveitando da segregação de planos, separando o background do foreground, entretanto é necessário um conhecimento prévio do ambiente, o que afeta o desempenho em ambientes não presentes no conjunto de treinamento. Outra abordagem é através de Redes Neurais Convolucionais ou CNN (Convolutional Neural Network) que, segundo Géron[4] (2017), emergiram do estudo do córtex visual do cérebro e tem sido usadas no reconhecimento de imagens desde 1980, portanto as CNNs são inspiradas no processamento de dados visuais dos neurônios nos humanos, especializadas na análise de imagens, que podem atingir desempenho sobre-humano em algumas tarefas visuais. Assim, é proposta uma rede neural de três colunas, onde cada coluna se especializa em analisar uma determinada faixa de densidade. Um classificador é treinado para rotular um recorte da imagem com base na densidade da multidão e encaminhá-lo para a coluna mais apropriada. Um banco de dados com 1198 imagens anotadas e divididas em conjunto de teste e conjunto de treinamento é utilizado para medir a precisão da contagem, além de comparar o desempenho da CNN de várias colunas com outros métodos computacionais de contagem.15 p.DigitalPortuguêsRedes Neurais Convolucionaiscontagem de multidãoVisão ComputacionalContagem de multidões através de redes neurais convolucionaisreportConvolutional Neural NetworksCrowd CountingComputer VisionBackground Segmentation