Uma análise de sentimentos dos tweets da Dilma Rousseff

14 Aug 2016 por Fernando Meireles


Num post anterior, fiz uma análise dos tweets da Presidenta Dilma Rousseff. Neste aqui, aproveitei os dados já coletados para fazer algo diferente, que já estava querendo fazer há tempos: uma análise de sentimentos. Basicamente, esta técnica serve para avaliar um determinado texto, dando a ele uma nota numa escala que vai de negativo a positivo, triste a feliz, etc. No caso, vou fazer isto utilizando a API do cognitive services da Microsoft, que possui um algoritimo próprio para classificar os textos numa escala que vai de 0, mais negativo, a 1, mais positivo (assim como outros métodos, ele classifica cada palavra num texto e, então, computa um score para a frase ou trecho; para uma análise sobre a potencialidade do método, ver aqui).

Analisando os sentimentos dos tweets da Dilma

Como mostro naquele post anterior, podemos concluir três coisas em relação aos tweets da @dilmabr publicados desde 2015: (1) ela passou a tuítar mais após o seu afastamento (mas já tuitou mais no passado); (2) seus tweets passaram a receber mais retweets e favoritadas após o afastamento; e, (3), os tweets que mencionam o termo “golpe” são mais influentes do que a média deste outro grupo (tweets pós-afastamento sem o termo “golpe”).

Com uma análise de sentimentos destes tweets, podemos descobrir outras coisas: como o tom das postagens da Presidenta variaram ao longo do tempo? Seus tweets mais recentes possuem conteúdo mais negativo (críticas, mostras de ressentimento, etc.) ou mais positivos (expressões de felicidade, elogios, etc.)? Para responder estas perguntas, apliquei o algoritimo do cognitive services em cada um dos tweets 1859 da Dilma e salvei seus scores (aqui há um bom tutorial sobre como usar o serviço da Microsoft no R, com o pacote mscstexta4r). Feito isto, podemos plotar os resultados (cada ponto cinza indica um tweet, o eixo y indica o score do tweet naquela escala que vai de 0, mais negativo, a 1, mais positivo e, enfim, a linha azul é uma curva loess):

Duas coisas chamam a atenção logo de cara. A primeira delas é o fato de que, após o seu afastamento (maio de 2016, linha tracejada), o sentimento geral dos tweets da Dilma tornam-se mais negativos, como mostra o declínio da linha azul (o que até faz sentido). Exemplos disto:

## Tweet =  Fico triste de não assistir à festa "ao vivo e a cores".
Mas estarei acompanhando, torcendo pelo Brasil.  / Score =  0

## Tweet =  O golpe consiste em 2 coisas: estancar a sangria, impedir
q as investigações da #LavaJato chegasse até eles. O meu gov não
interromperia.  / Score =  0.2127647

O que contrasta com alguns tweets anteriores:

## Tweet =  Viva a mulher brasileira! Viva o povo brasileiro.
Viva o Brasil! #DilmaDaMulher  / Score =  1

## Tweet =  (...) valeu a pena lutar pela liberdade,
valeu a pena lutar pela democracia! Este País está + forte
do q nunca.  / Score =  1

Durante todo o restante do período, os tweets da Presidenta oscilavam pouco em seus tons, ficando, na média, um pouco acima de 0.5 na escala de sentimentos. A caída repentina após o afastamento, portanto, indica que o tom geral dos tweets da Presidenta mudaram (embora não dê pra saber, apenas visualmente, se a média destes tweets é significativamente diferente dos demais).

Já a segunda coisa que merece destaque é a retomada do tom positivos nos últimos tweets Como dá pra ver, após a queda, a linha azul volta a subir bastante (superando, inclusive, períodos anteriores). Mas o que ela tem dito? Coisas como estas:

## Tweet =  As mulheres têm se destacado nesses Jogos,
o que nos enche de orgulho e alegria. #Rio2016  /
Score =  0.9818006

## Tweet =  Obrigada, @BernieSanders! Dilma agradece
solidariedade do senador democrata norte-americano:
https://t.co/jtPVdAouaA  / Score =  1

## Tweet =  O Brasil está orgulhoso, @RafaelaSilvaa.
Estamos emocionados com sua conquista. Você é o máximo!
Parabéns! #Rio2016  / Score =  1

Como se pode ver, o tom triste e combativo dos tweets mais negativos contrasta com estes, que são dedicados a agradecer pessoas e exaltar conquistas.


« Golpe ou impeachment? Uma análise dos tweets da Dilma Rousseff
electionsBR: um pacote no R para baixar e limpar dados eleitorais do TSE »