Golpe ou impeachment? Uma análise dos tweets da Dilma Rousseff

12 Aug 2016 por Fernando Meireles


Desde o ínicio do impeachment da agora Presidente afastada, Dilma Rousseff (PT), acadêmicos e articulistas discutem se este processo se encaixa na categoria de golpe de estado. Críticos do governo e membros da oposição defendem que, conceitualmente, golpe de estado envolveria deposição à força da ou do presidente (i.e., por golpe militar), o que não é o caso aqui. Por outro lado, esta definição está longe de ser consensual: outras definições são consistentes com a ausência de participação militar. No caso da queda do então Presidente do Paraguai, Fernando Lugo, o mesmo foi frequentemente alegado, embora, também ali, seja difícil explicar como que um processo tão rápido possa ter seguido dentro da normalidade democrática.

Outra questão neste debate, entretanto, não é muito analisada: rotular o processo de impedimento da Presidenta Dilma como golpe é uma boa estratégia? Para analisar isto, resolvi aproveitar o pacote twitteR, no R, para fazer uma análise de todos os tweets dela desde outubro de 2014 para responder esta pergunta. Como o twitter é reconhecidamente uma ferramenta importante de comunicação (a Dilma, além disso, tem quase 5 milhões de seguidores), este é um bom exercício para investigar o retorno desta estratégia.

Os dados que usei, com todos os tweets da Presidenta, podem ser baixados neste link. Com eles, é possível replicar o código que usei abaixo para fazer a análise (também é necessário ter instalado alguns pacotes, como o ggplot2, pra gerar gráficos, e o dplyr, pra manipular os dados).

A Presidenta Dilma ficou mais ativa no Twitter nos últimos meses?

Depois de sua posse em 2010, Dilma Rousseff acabou abandonando o Twitter, rede social onde foi bastante ativa durante as eleições. Entre indas e vindas, logo após ter sido afastada da Presidência, entretanto, o perfil dilmabr voltou a ser usado com mais frequência. E, segundo a revista Época, seu novo uso para a ferramente tem sido divulgar sua defesa no processo de impeachment.

A primeira coisa que resolvi investigar foi justamente isto: se a Presidenta teria ficado mais ativa no Twitter após o seu afastamento. Para começar, primeiro carrego os pacotes e os dados necessários no R.

library(lubridate) # Para manipular datas
library(ggplot2) # Para gerar graficos
library(tidyr) # Para manipular os dados
library(dplyr) # Para manipular os dados
library(tm) # Para fazer text mining nos tweets

load("dilma_tw.Rda")

A base tem 16 variáveis e 1859 observações (significando que, desde 2010, o perfil @dilmabr tuítou 1859 vezes). A questão que precisamos analisar, agora, é verificar a frequência com que a Presidenta tem tuítado. Agregando seus tweets por mês, podemos visualizar isto:

dilma_tw$data_mes <- floor_date(dilma_tw$created, "month")

dilma_tw %>%
  count(data_mes) %>%
  ggplot(aes(x = data_mes, y = n)) + geom_line() + 
  geom_vline(xintercept = 
  as.numeric(as.POSIXct("2016-05-01")), linetype = 2) + 
  theme_bw() + 
  labs(title = "Atividade da Dilma no Twitter",
  x = "Ano-Mês", y = "Número de tweets")

O gráfico mostra que a pró-atividade da Presidenta no twitter é ambígua. É verdade que ela passou a tuítar mais nos últimos dois meses (a linha pontilhada indica o mês de maio de 2016), mas em outros períodos ela utilizava a ferramente muito mais, especialmente nos meses anteriores às eleições de 2014. Mesmo assim, pode ser que, mesmo não tuitando com tanta frequência, seus tweets mais recentes estejam atingindo um público maior (recebendo mais retweets ou sendo mais favoritados pelos usuários, o que indicaria que eles estariam tendo maior engajamento com os seus conteúdos). Podemos ver isso agregando as retuítadas e os favoritos também por mês:

dilma_tw %>%
  group_by(data_mes) %>%
    summarise(Reteets = sum(retweetCount), Favoritos = sum(favoriteCount)) %>%
      gather(key = Ação, value = N, Reteets:Favoritos) %>%
      ggplot(aes(x = data_mes, y = N / 1000, color = Ação)) +
      geom_line() + geom_vline(xintercept = as.numeric(as.POSIXct("2016-05-01")),
      linetype = 2) + 
      theme_bw() + labs(title = "RTs e Favs dos tweets da Dilma",
      x ="Ano-Mês", y = "RTs e Fav (em milhares)")

O padrão parece seguir o anterior: a Presidenta vem tendo maior influência no twitter após seu afastamento, mas já teve mais que isso no passado. O problema é que estas simples medidas escondem uma informação importante: mesmo tuitando menos, pode ser que seus tweets atuais sejam relativamente mais influentes. Suponhamos, por exemplo, que todo tweet da @dilmabr tenha sempre 100 retweets; caso ela tuíte muito num mês, este gerará mais retweets no agregado. Como essa influência depende do número de tweets (quem tuíta mais pode receber mais retweets e favoritos), portanto, uma medida melhor de influência pode ser obtida calculando a média de retweets e favoritos por tweet num mês, i.e. retweets / total de tweets e favoritos / total de tweets. É possível ver este gráfico abaixo:

dilma_tw %>%
  group_by(data_mes) %>%
  summarise(Retweets_por_tuite = sum(retweetCount) / n(),
  Favoritos_por_tuite = sum(favoriteCount) / n()) %>%
  gather(key = Ação, value = N, Retweets_por_tuite:Favoritos_por_tuite) %>%
  ggplot(aes(x = data_mes, y = N, color = Ação)) + geom_line() +
  geom_vline(xintercept = as.numeric(as.POSIXct("2016-05-01")),
  linetype = 2) + 
  theme_bw() + 
  labs(title = "RTs e Favs por tweet da Dilma", x = "Ano-Mês",
  y = "RTs e Fav por tweet")

Agora é que as coisas mudam de figura: mesmo tendo tuítado relativamente menos do que em outras épocas, os tweets mais recentes da Presidenta são mais influentes, isto é, eles obtêm mais retweets e favoritos (apenas com base neste gráfico, também suspeito que poucas pessoas têm interesse em retuítar e favoritar tweets de campanha, como aqueles divulgando agenda de eventos e comícios, o que pode explicar porque a atividade nos períodos eleitorais não produz um impacto por tweet tão grande; também deve ser considerado que o número de seguidores da Presidente não se manteve constante no período).

Quais termos mais aparecem nos tweets da Presidenta Dilma?

Se os últimos tweets da Dilma têm sido os seus mais influentes, no que eles são diferentes dos anteriores? Eles falam sobre assuntos distintos? Para analisar isto, criei uma matriz com a frequência de palavras usadas nos tweets para, então, visualizar os resultados. Começo com os tweets pré-afastamento:

pre_afast <- dilma_tw %>%
  filter(data_mes < as.POSIXct("2016-04-01 UTC")) %>%
  select(text) %>%
  VectorSource() %>%
  Corpus() %>%
  TermDocumentMatrix(control = list(
    removePunctuation = T,
    stopwords = c(stopwords("portuguese"),
    "vcs",
    "aqui",
    "ser",
    "hoje",
    "sobre",
    "agora",
    "todos",
    "ter",
    "vamos",
    "anos"),
    removeNumbers = T, tolower = T)
  ) %>%
  as.matrix() %>%
  as.data.frame()

pre_afast <- data.frame(termos = rownames(pre_afast),
freq = rowSums(pre_afast), periodo = "Pré afastamento")

 pre_afast %>%
  arrange(desc(freq)) %>%
  slice(1:15) %>%
  mutate(termos = factor(termos,
  levels = termos[order(freq, decreasing = T)])) %>%
  ggplot(aes(x = termos, y = freq)) +
  geom_bar(stat = "identity") + theme_bw() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1)) + 
  labs(title = "Termos mais usados nos tweets da Dilma\n(Pré-afastamento)",
  x = "Termo", y = "Frequência")

Neste período pré-afastamento, os termos que mais aparecem nos tweets da Presidenta se referem principalmente às eleições, ela mesma e ao país. Quando analisamos o segundo período, alguns termos novos aparecem:

Apesar da frequência de termos ser menor (o período também é menor), fica evidente que alguns ganham maior espaço: especialmente os termos “provisório”, “impeachment”, “processo”, “democracia” e “golpe”. Estes são, especificamente, os tweets usados como estratégia de defesa da Presidente, como seguinte exemplo mostra.

Portanto, vimos não só que os tuítes da Dilma se tornaram mais influentes após o seu afastamento, mas também que o conteúdo destes é um pouco diferente dos anteriores: eles mencionam mais o processo de impeachment e, além disso, contêm mais o termo “golpe”.

Usar os termos “golpe” e “impeachment” dá resultado?

Mas os tweets que usam o termo “golpe” recebem mais retweets e favoritadas? Em caso positivo, podemos dizer que, ao menos no âmbito do twitter, o uso do conceito traz benefícios. Podemos fazer um exercício simples para verificar isto, que consiste em calcular a média de retweets e favoritos nos tweets com a palavra “golpe” e nos que não a contêm.

## 
## =================================
## golpe          Retweets Favoritos
## ---------------------------------
## C/ termo golpe  734.4    1326.8  
## S/ termo golpe  435.8     817.4  
## ---------------------------------

O resultado dá uma ideia da influência do termo “golpe”: tweets com este termo recebem, em média, cerca de 299 retweets a mais, além de cerca de 509 favoritadas a mais. Este não é a forma mais rigorosa de fazer isto (o grupo dos tweets sem o termo “golpe” pode tratar de assuntos menos relevantes, ter sido publicado em períodos diferentes, etc.), mas este simples exercício mostra que o uso do termo tem relação com a influência de um tweet da Presidenta (também deve ser levado em conta que isto não explica toda a influência dos seus tweets mais recentes). E quanto ao termo impeachment? O resultado muda:

## 
## =======================================
## golpe                Retweets Favoritos
## ---------------------------------------
## C/ termo impeachment  464.3     937.7  
## S/ termo impeachment  449.9     836.8  
## ---------------------------------------

Praticamente não existe diferença entre tweets que usam ou não o termo “impeachment”. Podemos ainda comparar os dois, “golpe” e “impeachment”:

## 
## =======================================
## golpe                Retweets Favoritos
## ---------------------------------------
## C/ termo golpe        734.4    1326.8  
## C/ termo impeachment  436.4     893.7  
## ---------------------------------------

Tweets com o termo “golpe”, novamente, ganham disparado em influência. Fazendo uma estimativa simples de que cada retweet alcance 100 novos usuários, podemos dizer que cada tweet com o termo atinge cerca de 30.000 usuários a mais. Provavelmente este número é maior, e ele ainda deve ser somado ao número de seguidores da Presidente que já viram os tweets em suas timelines. Outra coisa que deve ser considera é que estes retweets são feitos por usuários que provavelmente têm maior inclinação pela Presidenta, o que significa que estes já são mais propensos a se engajar com publicações que mencionam o termo “golpe”. Em todo caso, como os números mostram, o uso deste termo está associado com um maior número de retweets e favoritos, sugerindo que, ao menos no twitter, classificar o processo de impeachment como golpe parece ser a melhor estratégia.


« Como importar qualquer arquivo no R
Uma análise de sentimentos dos tweets da Dilma Rousseff »