Análise da Música Brasileira – Parte 4

Chegamos à última parte da análise da música brasileira. Este estudo mediu a complexidade das composições sob duas vertentes: os acordes e as letras das músicas. Formar essas duas visões foi possível graças a utilização de uma base de dados de mais de 40 mil cifras e 100 mil letras, extraídas dos sites  cifras.com.br e letras.com.br, respectivamente. Para aferir a complexidade das composições foram utilizados os seguintes indicadores:

  • Indicadores dos acordes: quantidade de acordes distintos, percentual de acordes distintos, tamanho dos acordes e raridade dos acordes.
  • Indicadores das letras: quantidade de palavras distintas, percentual de palavras distintas e raridade das palavras.

Esses indicadores expõem situações muito interessantes. Por exemplo, a música brasileira com maior quantidade de palavras distintas é Declaração de Gerra, de Mv Bill (632 termos únicos). Pensou que seria Faroeste Caboclo? Com 393 palavras distintas, ela apareceria apenas em 36º lugar num ranking utilizando essa medida. Já a música com maior quantidade de acordes distintos é a gospel Coroai o Rei, da Igreja Cristã Maranata (que utiliza 70 acordes diferentes).

Outras músicas se destacam pela simplicidade da letra. Um exemplo é Vamos Todos Balançar, do Chiclete com Banana. Tirando as palavras repetidas, eis sua letra:

Vamos todos balançar!

O abadá.

(Chiclete com Banana. Vamos Todos Balançar)

Outro primor da economia poética é a música Alaíde, da banda Garota Safada:

Ôh Alaíde, Ôh Alaíde, Ôh Alaíde, Ôh Alaíde,

Cadê você?

Alaíde não tá não, quem tá é Olga. Chama Olga!

Ôh Olga, Ôh Olga, Ôh Olga, Ôh Olga, Ôh Olga, Ôh Olga…

(Alaíde. Garota Safada)

No extremo oposto, há artistas que são mestres do vocabulário rebuscado. O indicador de raridade de palavras mostra alguns casos em que determinada palavra foi utilizada uma única vez em toda a produção musical brasileira! Um dos artistas que mais utilizaram termos inéditos foi Zé Ramalho. Um exemplo é a música “Pra Chegar Mais Perto de Deus“:

Nascimentos, universos
Distância, tempo e o meio
Radioastronomia, radiogaláxias
Espaço e música
Matemática, cosmologia e física
Íons, prótons e inércias
Relatividades gravitacionais
Temperatura e luz
Expandindo-se nos ares, os quasars
Outros corpos pulsam, piscam, são os pulsars
Supernovas, gigantes buracos negros
A anti-matéria, curvaturas do espaço
E um ninho de planetas
Onde num deles há vida ?????

(Zé Ramalho. Pra chegar mais perto de Deus)

E agora, um ranking geral de artistas

As partes anteriores do estudo analisaram isoladamente as letras e os acordes das músicas. Agora, vamos analisar tudo junto. Na verdade, utilizaremos os indicadores agrupados para cada artista para criar um índice de complexidade da obra, e aí ranqueá-los. Para isso utilizaremos a seguinte equação:

Índice de Complexidade da Obra =

(i1) Índice de Quantidade de Músicas +

(i2) Índice de Quantidade de Palavras Distintas +

(i3) Índice de Percentual de Palavras Distintas +

(i4) Índice de Raridade das Palavras +

(i5) Índice de Quantidade de Acordes Distintos +

(i6) Índice de Percentual de Acordes Distintos +

(i7) Índice de Tamanho dos Acordes +

(i8) Índice de Raridade dos Acordes

Cada componente da equação foi colocado numa escala de 0 a 1, onde o artista com maior valor fica com 1 e o com menor valor fica com 0, mantida a proporção dos valores intermediários[1]. Assim, é possível obter um índice final que está numa escala de 0 a 8.

Eis os 10 maiores artistas brasileiros, segundo o Índice de Complexidade da Obra:

X_ranking

Nenhuma surpresa aqui. São artistas que presam por composições complexas. Observe que quando o artista recebe o índice 1 em algum indicador significa que ele é o melhor naquele atributo. Chico Buarque é o artista com maior número de acordes distintos utilizados na sua obra. Lenine é o artista que utiliza acordes mais raros.

O ranking inverso, dos 10 artistas com obras menos complexas, é este:

Y_ranking_inverso

Veja a tabela com o ranking completo aqui.

A simplificação da música brasileira ao longo do tempo.[2]

Veja os gráficos abaixo, com o quantitativo de acordes distintos, o tamanho dos acordes e o indicador de raridade dos acordes, agrupados por ano, entre 1950 e 2017[3]:

01_qtde_acordes_tempo

02_tamanho_acordes_tempo

03_raridade_acordes_tempo

Claramente vemos uma mudança de padrão, com a constante simplificação das músicas produzidas. Por pura especulação vejo 3 razões para isso. 1) A absorção pela música brasileira do Rock and Roll, primeiramente com a Jovem Guarda na década de 60 (perceba que o primeiro tropeço da curva se dá justamente nessa década); 2) A popularização do Rap/Hip Hop (ritmos com harmonias simples, naturalmente) a partir de 1980; e 3) A guerra Faustão x Gugu na década de 90.

Por que Faustão e Gugu são responsáveis pela queda na complexidade das composições brasileiras?

Não faz tanto tempo assim. O brasileiro típico ia domingo pela manhã à igreja e à tarde ficava com a família assitindo à Banheira do Gugu ou às Vídeo-Cassetadas do Faustão. Tudo normal. O problema foi quando a guerra pela audiência se tornou tão acirrada que os apresentadores apelaram para a repetição desenfreada de apresentações de bandas cujas composições e vestimentas eram, digamos, minimalistas.

Tais grupos musicais recém-formados não tinham tanto material assim para mostrar, então deu-se início às linhas de produção de hits. Há relatos de que Faustão mantinha o compositor Michael Sullivan em cativeiro, obrigando-o a compor novos sucessos para o É o Tchan toda semana. Surgem assim sucessos forçados como É o Tchan na Selva, no Havaí, no Japão

A produção de músicas de prateleira foi o golpe final na complexidade das composições nacionais, e é responsável por boa parte do que se escuta de Sertanejo, Forró Universitário, Axé e Funk atualmente.

Pense nisso: a mediana do quantitativo de acordes distintos entre 2011 e 2016 foi 6, apenas dois acordes a mais que Jingle Bell.

Sugestões? Críticas?

Veja as outras partes do estudo: PARTE 1PARTE 2PARTE 3 – PARTE 4

 

[1] Essa transformação é feita utilizando a seguinte fórmula: xi = (xi – min(x)) / (max(x) – min(x)).

[2] Agradecimento total a Fernando Sola Pereira, por ter criado este código. A questão é a seguinte: se você digitar, por exemplo, raimundos mulher de fases ano no google, ele retorna 1999, que é exatamente o ano de lançamento da música. Para realizar a análise temporal, seria perfeito. O problema é que o Google tem proteções contra robôs. Fernando “contornou” esse problema utilizando o Selenium para simular proxys diferentes. O Google nem sempre tem a informação do ano da música, por isso utilizei um código complementar que baixa essa informação do site letras.mus.br. No total conseguimos 70% das informações do ano de lançamento.

[3] Só detalhei aqui a evolução no tempo de indicadores relativos aos acordes. Isso porque não há uma tendência clara de mudança nos atributos das letras. Agradecimentos ao Rap/Hip Hop.

 

56 comentários sobre “Análise da Música Brasileira – Parte 4

  1. Uma dúvida: se uma música sobe o tom duas vezes, então ela tende a ter mais acordes distintos (mesmo que a progressão, os intervalos sejam iguais), certo? Isso não teria que ser levado em conta também em trabalhos futuros. Além disso, a metodologia distingue C de C2, por exemplo? No exemplo da música com mais acordes distintos, estes dois detalhes parecem ser o principal motivo de ela estar em primeiro lugar.

    Outra sugestão: o exemplo de palavras únicas pode levar a supervalorizar neologismos (que podem ser interessantes ou não) e palavras até sem sentido (bará-bará-bará) e dá para dar um tapa nesses casos, né?

    No mais, ótimo trabalho!

    Curtido por 1 pessoa

    1. Valeu pelo feedback! Realmente, considerei as mudanças de tom, contando os acordes como distintos. Acho mais justo, já que modulações enriquecem a harmonia. Também diferenciei C e C2. O caso dos neologismo é evitado porque antes de contabilizar os termos distintos faço uma checagem num dicionário de português (por outro lado, acabo desprezando os termos em inglês ou outro idioma).

      Curtir

      1. Acho que a estratégia foi a mais adequada dentro das possibilidades. Concordo que a modulação “conte ponto”, pois são relativamente raras. Não vejo problemas em desprezar termos em inglês (representam uma parcela inexpressiva, são “desnecessários” e não são mesmo compreendidos por grande parte da população).

        Curtir

  2. Incrível o trabalho, Leonardo. Parabéns. Uma sugestão pra pensar nas interpretações: pode ser que as músicas que temos dos anos 60 e 70 na base sejam apenas as “de bom gosto” ou mais sofisticadas. Em outras palavras, pode ser que o pop pobre de antigamente tenha existido, mas não tenha entrado para a posteridade. Já o pop pobre produzido no alcance da geração que populou os sites que você usou pode estar representado com mais precisão.

    Curtido por 1 pessoa

  3. Algumas coisas não ficaram muito claras pra mim (não sei se porque pulei alguma parte sem querer):
    Qual o parâmetro usado pra determinar o tamanho dos acordes?
    E no caso destes últimos gráficos, o resultado pra cada ano é a média de todas as músicas analisadas daquele ano?

    Curtir

    1. O parâmetro eh o número de caracteres. Antes foi feita uma padronização. Por exemplo, C° e Cdim eh a mesma coisa, então padronizei antes para q ficassem com o mesmo tamanho. Nós últimos gráficos cada ano está representado pela mediana do indicador medido para cada musica.

      Curtir

  4. Sensacional o trabalho Leonardo! Parabéns.

    Gostaria de fazer algumas sugestões:
    1. Acho que você deveria escrever um livro sobre isso.
    2. Que tal uma versão em PDF dos 4 posts para download?
    3. Seria legal se houvesse uma versão (a título de comparação) com músicas internacionais.
    4. Seria interessante cruzar esses dados com outros dados, por exemplo, número de execuções em rádios (ou spotify para facilitar). Talvez haja uma correlação (eu suspeito que exista).

    E tirar algumas dúvidas (desculpe se perguntar algo que estava no testo, mas acabei não lendo):
    1. As músicas clássicas e instrumentais não foram consideradas por motivos óbvios. Dá pra fazer algo semelhante para elas?
    2. Existem alguns erros em algumas letras nos sites utilizados. Você acha que isso é estatisticamente relevante? Seria interessante a adoção de uma margem de erro?

    Um grande abraço e novamente parabéns.

    Curtido por 1 pessoa

    1. É difícil fazer algo com músicas instrumentais, a menos que haja algum repositório pesquisável delas. Erros nas letras tendem a não impactar muito, a não ser que, por exemplo, estejam concentrados em determinado artista ou gênero.

      Valeu pelo feedback. Abs

      Curtir

  5. Comentei no post 1 agora a pouco, mas so li os outros três depois. Muito bom! Muita coisa interessante. Lenine é mesmo um dos compositores atuais mais excepcionais que eu conheço, e isso é porque aparentemente as questoes de ritmo ficaram de fora desse mapa. 😉
    Você devia tentar escrever um artigo pro SBCM ou ISMIR.

    Curtido por 1 pessoa

  6. Cara,
    Simplesmente sensacional!
    Parabéns pela iniciativa, pela disposição em minerar todas essas informações, pelo desprendimento em disponibilizar “tudo” (até códigos!), pela paixão e interesse na “qualidade” (mesmo que você chame de complexidade) da nossa música… Com uma técnica minuciosa e embasamento científico/estatístico, você conseguiu traduzir em números o efeito da “bundalização” da música nacional. Claro e preciso.
    Muito obrigado mesmo!

    Curtido por 1 pessoa

  7. Ufa!, Obrigado!!!
    Agora tenho algo de valor científico a apresentar prá minha mulher quando ela disser que sou saudosista quando digo que depois dos anos 90 não apareceu mais ninguém…

    Curtido por 1 pessoa

  8. Parabéns! Gosto muito de música e de rankings, logo, li o estudo inteiro com muito interesse. Curioso é gerar interpretações com base nos dados, dando aos fatos, comprovações. Como se comentou aqui, percebemos o impacto do iê-iê-iê na simplificação da música, mas que de certa forma ajudou o nascimento da MPB dos Festivais. Como sugerido, dá um livro.

    Curtido por 1 pessoa

  9. A despeito de não ter lido plenamente todo o texto, parabéns pelo excelente trabalho!

    Uma pena os resultados específicos terem o desvio pelo fato da presença/ausência de todo o acervo brasileiro, mas ainda assim os resultados finais (e sua conclusão!) são percebidas, não apenas por seu estudo, mas diariamente. Infelizmente!

    Um abraço.

    Curtido por 1 pessoa

  10. Muitíssimo interessante, parabéns pelo trabalho!

    Sua analise deixa bem evidente o panorama “lógico-matemático” dos usos de acordes, palavras e graus de complexidade, o que já garanta um grande entendimento do mercado fonográfico brasileiro sem mesmo ter se esforçar para enxergar elementos subjetivos.

    Ademais, também acredito que uma identificação mais completa dos compositores destas canções seria crucial para o entendimento pleno da situação musical. Seria possível listar e conhecer – além dos óbvios compositores de hits – quem são os artistas escrevendo suas próprias canções, o que acredito ser muito relevante pois mesmo tendo em mente o sucesso comercial, um artista desenvolve sua canção de modo estritamente único (Michael Jackson só pra citar, um dos maiores astros pop de todos os tempos, compôs “Billie Jean”, hit que liderou as paradas).

    Afinal de contas, nenhuma música se escreveu sozinha, alguém em algum momento precisou parar, pensar(em muitos casos nem tanto) e anotar tudo. Se vai utilizar de formulas prontas e frases de efeito, ou transpirar uma estória completa e única, aí já é outro caso.

    No mais, essa análise certamente proporciona uma ótima base para a compreensão da produção no mercado fonográfico!

    Um abraço

    Curtido por 1 pessoa

  11. A análise é muito boa,mas eu acho que a Simone não devia ser citada ao lado dos compositores,e as palavras distintas e raras não conferem qualidade literária a um texto.Eu posso fazer uma letra usando gírias regionais e ser uma merda.Abraços.

    Curtido por 1 pessoa

  12. Excelente! Daria um belo trabalho científico sobre a música brasileira. Como sugestão você poderia estender a sua pesquisa à músicas internacionais como as que tocam em nossas rádios, comparar os artistas e verificar se a tendência da redução da complexidade musical ao longo do tempo também ocorre.

    Curtido por 1 pessoa

  13. Eu diria que vc não conhece Minas Gerais. Não vi nada sobre a musica mineira. À exceção de João Bosco, que não pode ser considerado 100% mineiro visto sua formação externa ao Estado, o Clube da Esquina com Milton Brant, Lô Borges Venturini e outros tantos, não aparecem nem para serem amaldiçoados.
    Me perdoe, mas está incompleto seu estudo. Senti falta dos Paralamas tambem…

    Curtido por 1 pessoa

Deixe um comentário