Please use this identifier to cite or link to this item:
https://repositorio.insper.edu.br/handle/11224/5406
Type: | Relatório de Iniciação Científica |
Title: | Construção de modelo de geração de música com Deep Learning |
Author: | Eller, Vinicius Grando |
Advisor: | Ayres, Fábio José |
Publication Date: | 2022 |
Original Abstract: | Um desafio que compositores enfrentam em suas carreiras, é o processo criativo para iniciar uma obra. Por meio de aprendizado profundo, este projeto tem como objetivo construir um modelo que seja capaz de gerar músicas, a partir de uma base de dados composta por um ritmo específico, possibilitando uma solução para o problema dos compositores. Com este propósito, o trabalho apresenta o necessário sobre teoria musical, para o fácil entendimento dos possíveis formatos de armazenamento e representação de arquivos digitais de áudio, o que resulta no uso do formato MIDI e sua conversão para a representação piano roll, que é facilmente vetorizada. O estudo tem sua fundação em duas bases de dados de estilos diferentes, uma composta por músicas do videogame gameboy, enquanto a outra base de dados é integralmente de músicas clássicas de um único compositor, Johann Sebastian Bach. Como existem diversos modelos que podem gerar música e o objetivo não é realizar um resumo, a análise será feita utilizando apenas duas classes diferentes de autoencoders: stacked e variational, além de desenvolver um modelo baseado em redes convolucionais. O encerramento do estudo comprova que é possível gerar musicais que respeitam a teoria musical, também sendo agradáveis ao ouvido humano. Sendo assim, a tecnologia pode ser futuramente utilizada para inovar o ramo musical, por meio da criação de novas obras ou pela quebra de momentos de dificuldade no processo criativo de um compositor. |
Keywords in original language : | autoencoder Aprendizado Profundo MIDI geração de música piano roll |
Abstract: | A challenge that some composers deal with in their careers is the creative process to start a melody. Through Deep Learning, this project aims to build a model that can generate music, from a database composed by a specific rhythm, enabling a possible solution to the problem of composers. For that purpose, the study article presents the fundamental about music theory, to understand the possible ways to represent and save digital audio files, causing the use of MIDI files and its conversion to piano roll representation, easily vectorized. The study has its foundations in two databases of different music styles, one composed of music from the video game Gameboy, while the other database is restricted only to a single classical music composer, Johann Sebastian Bach. Since there are several models capable of generate music and this is study is not a resume, the analysis will be done using only two classes of autoencoders networks: stacked and variational, in addition, a convolutional neural network model will be developed as well. The conclusion proves that it is possible to generate songs with logic musical theory background, also being nice to listen. Therefore, in the future the technology can be used to innovate the musical field, through the creation of new compositions or by helping composers in difficult moments of the creativity process. |
Keywords (english terms): | autoencoders Deep Learning MIDI music generation piano roll |
Language: | Português |
CNPq Area: | Ciências Sociais Aplicadas |
Copyright: | TODOS OS DOCUMENTOS DESTA COLEÇÃO PODEM SER ACESSADOS, MANTENDO-SE OS DIREITOS DOS AUTORES PELA CITAÇÃO DA ORIGEM. |
Appears in Collections: | Relatório de Iniciação Científica |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Vinicius Grando Eller - Trabalho.pdf | Vinicius Grando Eller - Trabalho | 1.25 MB | Adobe PDF | ![]() View/Open |
Vinicius Grando Eller - Termo de autorização.pdf | Vinicius Grando Eller - Termo de autorização | 694.67 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.