Desenvolvimento de Navegação Autônoma para VANT Utilizando Técnicas de Aprendizado por Reforço

Gera, Henrique Turco; Freitas, Leonardo Sterman; Quinze, Luigi Orlandi; Souza, Victoria Leal Garcia de

Desenvolvimento de Navegação Autônoma para VANT Utilizando Técnicas de Aprendizado por Reforço

dc.contributor.advisor	FABRÍCIO JAILSON BARTH
dc.contributor.author	Gera, Henrique Turco
dc.contributor.author	Freitas, Leonardo Sterman
dc.contributor.author	Quinze, Luigi Orlandi
dc.contributor.author	Souza, Victoria Leal Garcia de
dc.date.accessioned	2026-04-17T17:47:39Z
dc.date.issued	2025
dc.description	Projeto desenvolvido para a empresa Akaer. Mentor: Paulo Roberto Rugani Barcellos
dc.description.abstract	Este projeto visa desenvolver, em simulação, um sistema de navegação para um VANT (Veículo Aéreo Não Tripulado) de asa fixa utilizando aprendizado por reforço. (Reinforcement Learning). O ambiente de treinamento foi implementado diretamente sobre a modelagem mecânica do VANT (Aerosonde), no referencial NED (North-East-Down), garantindo que a dinâmica (atuadores, restrições e equações de movimento) utilizada pelo VANT reflita seu comportamento físico. O veículo emprega Proximal Policy Optimization (PPO), adequado a espaços de ação contínuos (complexos) e estáveis para controle fino, aprendendo a minimizar distância ao alvo (waypoint), alinhar direção e respeitar os limites operacionais. Em paralelo, a modelagem mecânica foi consolidada (MATLAB) para validação e análise, enquanto o ambiente em Python (compatível com a biblioteca Gymnasium) integra o mesmo conjunto de equações ao loop de interação do aprendizado por reforço. Essa integração do modelo mecânico com o ambiente de Reinforcement Learning assegura consistência entre simulação física e aprendizado, favorecendo a transferência de resultados e a avaliação comparativa de algoritmos.	pt
dc.description.abstract	This project aims to develop, in simulation, a navigation system for a fixed-wing UAV (Unmanned Aerial Vehicle) using Reinforcement Learning (RL). The training environment was implemented directly on the UAV’s mechanical model (Aerosonde) in the NED (North–East–Down) reference frame, ensuring that the dynamics (actuators, constraints, and equations of motion) reflect the vehicle’s real physical behavior. The vehicle employs the Proximal Policy Optimization (PPO) algorithm, which is well suited for continuous (complex) and stable action spaces, learning to minimize the distance to the target (waypoint), align its direction, and respect operational limits. In parallel, the mechanical model was developed and validated using MATLAB while the Python environment (compatible with the Gymnasium library) integrates the same set of equations into the RL interaction loop. This integration between the mechanical model and the Reinforcement Learning environment ensures consistency between physical simulation and learning, supporting both result transferability and comparative algorithm evaluation.	en
dc.format	Digital
dc.format.extent	77 p.
dc.identifier.uri	https://repositorio.insper.edu.br/handle/11224/8321
dc.language.iso	Português
dc.subject	VANT	pt
dc.subject	aprendizado por reforço	pt
dc.subject	simulação	pt
dc.subject	UAV	en
dc.subject	reinforcement learning	en
dc.subject	simulation	en
dc.title	Desenvolvimento de Navegação Autônoma para VANT Utilizando Técnicas de Aprendizado por Reforço
dc.type	bachelor thesis
dspace.entity.type	Publication
local.contributor.boardmember	FABRÍCIO JAILSON BARTH
local.contributor.boardmember	TIAGO FERNANDES TAVARES
local.contributor.coadvisor	Paiva, Antônio S. de Menezes
local.subject.cnpq	CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
local.subject.cnpq	OUTROS::ENGENHARIA MECATRONICA
local.type	Trabalho de Conclusão de Curso
relation.isAdvisorOfPublication	23da5ea9-5ae9-4cff-8368-5e035e5b89a5
relation.isAdvisorOfPublication.latestForDiscovery	23da5ea9-5ae9-4cff-8368-5e035e5b89a5
relation.isBoardMemberOfPublication	23da5ea9-5ae9-4cff-8368-5e035e5b89a5
relation.isBoardMemberOfPublication	b94cce1d-a49e-40dc-becd-051f9254fab8
relation.isBoardMemberOfPublication.latestForDiscovery	23da5ea9-5ae9-4cff-8368-5e035e5b89a5

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1

Nome:: Relatrio_Final_pub.pdf
Tamanho:: 2.73 MB
Formato:: Adobe Portable Document Format

Baixar

Licença do pacote

Agora exibindo 1 - 1 de 1

Nome:: license.txt
Tamanho:: 236 B
Formato:: Item-specific license agreed upon to submission
Descrição:

Baixar

Coleções

Graduações em Engenharias e Ciência da Computação