Please use this identifier to cite or link to this item: https://repositorio.insper.edu.br/handle/11224/5406
Type: Relatório de Iniciação Científica
Title: Construção de modelo de geração de música com Deep Learning
Author: Eller, Vinicius Grando
Advisor: Ayres, Fábio José
Publication Date: 2022
Original Abstract: Um desafio que compositores enfrentam em suas carreiras, é o processo criativo para iniciar uma obra. Por meio de aprendizado profundo, este projeto tem como objetivo construir um modelo que seja capaz de gerar músicas, a partir de uma base de dados composta por um ritmo específico, possibilitando uma solução para o problema dos compositores. Com este propósito, o trabalho apresenta o necessário sobre teoria musical, para o fácil entendimento dos possíveis formatos de armazenamento e representação de arquivos digitais de áudio, o que resulta no uso do formato MIDI e sua conversão para a representação piano roll, que é facilmente vetorizada. O estudo tem sua fundação em duas bases de dados de estilos diferentes, uma composta por músicas do videogame gameboy, enquanto a outra base de dados é integralmente de músicas clássicas de um único compositor, Johann Sebastian Bach. Como existem diversos modelos que podem gerar música e o objetivo não é realizar um resumo, a análise será feita utilizando apenas duas classes diferentes de autoencoders: stacked e variational, além de desenvolver um modelo baseado em redes convolucionais. O encerramento do estudo comprova que é possível gerar musicais que respeitam a teoria musical, também sendo agradáveis ao ouvido humano. Sendo assim, a tecnologia pode ser futuramente utilizada para inovar o ramo musical, por meio da criação de novas obras ou pela quebra de momentos de dificuldade no processo criativo de um compositor.
Keywords in original language : autoencoder
Aprendizado Profundo
MIDI
geração de música
piano roll
Abstract: A challenge that some composers deal with in their careers is the creative process to start a melody. Through Deep Learning, this project aims to build a model that can generate music, from a database composed by a specific rhythm, enabling a possible solution to the problem of composers. For that purpose, the study article presents the fundamental about music theory, to understand the possible ways to represent and save digital audio files, causing the use of MIDI files and its conversion to piano roll representation, easily vectorized. The study has its foundations in two databases of different music styles, one composed of music from the video game Gameboy, while the other database is restricted only to a single classical music composer, Johann Sebastian Bach. Since there are several models capable of generate music and this is study is not a resume, the analysis will be done using only two classes of autoencoders networks: stacked and variational, in addition, a convolutional neural network model will be developed as well. The conclusion proves that it is possible to generate songs with logic musical theory background, also being nice to listen. Therefore, in the future the technology can be used to innovate the musical field, through the creation of new compositions or by helping composers in difficult moments of the creativity process.
Keywords (english terms): autoencoders
Deep Learning
MIDI
music generation
piano roll
Language: Português
CNPq Area: Ciências Sociais Aplicadas
Copyright: TODOS OS DOCUMENTOS DESTA COLEÇÃO PODEM SER ACESSADOS, MANTENDO-SE OS DIREITOS DOS AUTORES PELA CITAÇÃO DA ORIGEM.
Appears in Collections:Relatório de Iniciação Científica

Files in This Item:
File Description SizeFormat 
Vinicius Grando Eller - Trabalho.pdfVinicius Grando Eller - Trabalho1.25 MBAdobe PDFThumbnail
View/Open
Vinicius Grando Eller - Termo de autorização.pdfVinicius Grando Eller - Termo de autorização694.67 kBAdobe PDFView/Open

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.