Modelagem financeira de alta frequência com Big Data e Machine Learning

dc.contributor.advisorMACIEL CALEBE VIDAL
dc.contributor.authorDias, Felipe Maluli de Carvalho
dc.contributor.authorMartins, Guilherme dos Santos
dc.contributor.authorPereira, Marlon Silva
dc.date.accessioned2025-04-09T15:27:06Z
dc.date.issued2024
dc.descriptionProjeto realizado para a empresa DAO Capital - Mentor na empresa: Matteo Iannoni
dc.description.abstractO objetivo deste projeto é desenvolver uma arquitetura robusta e escalável que atenda às necessidades específicas do fluxo de dados de cotação intradiária de ativos, para sustentar modelagem de alta frequência nas estratégias de compra e venda de ações de uma gestora de investimentos, e então desenvolver um modelo de compra e venda de ações que utilize esses dados. Para alcançar esses objetivos, o projeto propõe uma infraestrutura composta por processos de extração, limpeza, e armazenamento de dados, com ênfase na eficiência do tratamento de grandes volumes de informações. A infraestrutura proposta é baseada em uma pipeline de dados construída em Python, que inclui etapas de extração e carregamento (EL). Para o armazenamento dos dados, foi utilizado de início o banco de dados PostgreSQL, que foi substituído pelo QuestDB, uma escolha motivada pela sua otimização voltada a grandes volumes de dados de série temporal. A arquitetura, desenvolvida com uma aplicação de extração e limpeza em Python e integrada a um banco de dados QuestDB, mostrou-se eficaz para lidar com o volume de dados esperado através de testes de estresse realizados usando protótipos iniciais do sistema e simulando a fonte de dados, destacando-se pela sua capacidade de fácil integração com outras ferramentas. Além disso, o projeto contempla o estudo e a aplicação de diferentes sinais financeiros, utilizando técnicas e métricas quantitativas, além de modelos de Machine Learning, com o objetivo de avaliar as melhores variáveis para o desenvolvimento de um modelo de Factor Investing para os dados intradiários.pt
dc.description.abstractThe objective of this project is to develop a robust and scalable architecture that meets the specific needs of intraday asset price data flow to support high-frequency modeling in the trading strategies of an investment management firm. Additionally, the project aims to develop a trading model that utilizes this data. To achieve these objectives, the project proposes an infrastructure composed of processes for data extraction, cleaning, and storage, with an emphasis on efficiently handling large volumes of information. The proposed infrastructure is based on a data pipeline built in Python, including extraction and loading (EL) stages. Initially, PostgreSQL was used for data storage, but it was later replaced by QuestDB due to its optimization for large volumes of time-series data. The architecture, developed with a Pythonbased extraction and cleaning application integrated with a QuestDB database, proved effective in handling the expected data volume. This was confirmed through stress tests conducted with initial prototypes of the system by simulating the data source, highlighting its ease of integration with other tools. Additionally, the project includes the study and application of various financial signals using quantitative techniques and metrics, as well as Machine Learning models, with the goal of identifying the best variables for developing a Factor Investing model tailored to intraday data.en
dc.formatDigital
dc.format.extent72 p.
dc.identifier.urihttps://repositorio.insper.edu.br/handle/11224/7557
dc.language.isoPortuguês
dc.subjectArquitetura escalável e robustapt
dc.subjectfluxo de dados de alta frequênciapt
dc.subjectPipeline de dados em Pythonpt
dc.subjectExtração e carregamento de dados (EL)pt
dc.subjectBanco de dados QuestDBpt
dc.subjectSinais financeirospt
dc.subjectFactor Investingen
dc.subjectScalable and robust architectureen
dc.subjectHigh-frequency data flowen
dc.subjectPython data pipelineen
dc.subjectData extraction and loading (EL)en
dc.subjectQuestDB databaseen
dc.subjectFinancial signalsen
dc.titleModelagem financeira de alta frequência com Big Data e Machine Learning
dc.title.alternativeHigh-frequency financial modeling with Big Data and Machine Learningen
dc.typebachelor thesis
dspace.entity.typePublication
local.contributor.boardmemberMACIEL CALEBE VIDAL
local.contributor.boardmemberFABIO JOSE AYRES
local.contributor.boardmemberFABRÍCIO JAILSON BARTH
local.subject.cnpqENGENHARIAS
local.subject.cnpqCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
local.typeTrabalho de Conclusão de Curso
relation.isAdvisorOfPublication3c34d0f1-1f7d-4405-a994-3484d365cebf
relation.isAdvisorOfPublication.latestForDiscovery3c34d0f1-1f7d-4405-a994-3484d365cebf
relation.isBoardMemberOfPublication3c34d0f1-1f7d-4405-a994-3484d365cebf
relation.isBoardMemberOfPublication37971022-7c69-4e93-9186-4c9431a1f95c
relation.isBoardMemberOfPublication23da5ea9-5ae9-4cff-8368-5e035e5b89a5
relation.isBoardMemberOfPublication.latestForDiscovery3c34d0f1-1f7d-4405-a994-3484d365cebf

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
N/D
Nome:
Relatorio Final_DAO Capital_Modelagem financeira.pdf
Tamanho:
3.05 MB
Formato:
Adobe Portable Document Format

Licença do pacote

Agora exibindo 1 - 1 de 1
N/D
Nome:
license.txt
Tamanho:
236 B
Formato:
Item-specific license agreed upon to submission
Descrição: