Usando R
Uma introdução para pesquisadores em Humanidades Digitais
Prefácio
Este é um manuscrito em desenvolvimento. A versão em website deste livro pode ser encontrada em: www.fmeireles.com/livro
Para ver a proposta geral do livro (book prospect), clique aqui.
Introdução
A pesquisa quantitativa nas Ciências Sociais cresceu imensamente nas últimas décadas. Com o aumento da disponibilidade de dados e de novos softwares, muitas pessoas passaram a ter acesso a um arsenal de ferramentas para testar hipóteses que antes sequer eram imagináveis. Com o mínimo de treinamento, um simples notebook pode ser usado para carregar e manipular bases de dados com centenas de milhões de entradas, como aquelas encontradas em microdados censitários.
Se você está lendo este livro, é provável que tenha interesse em aprender a fazer justamente este tipo de análise. É o que esse livro oferece: uma porta de entrada à pesquisa quantitativa utilizando R – uma das linguagens de programação mais populares para análise de dados, tanto na academia quanto fora dela.
Nossa abordagem é prática e direta. Acreditamos que a melhor maneira de aprender a fazer pesquisa quantitativa é por meio da prática. Por isso, em vez de nos aprofundarmos em conceitos abstratos de programação, preferimos usar exemplos aplicados, demonstrando como usar o R para resolver problemas concretos de pesquisa. Este livro, em outras palavras, é um guia de uso. Ao longo dele, você aprenderá a usar R para:
Realizar tarefas básicas: criar objetos, utilizar funções e instalar pacotes.
Importar dados, desde planilhas do Excel até bases de dados complexas e/ou imensas.
Realizar as principais operações de manipulação de dados.
Criar gráficos informativos e totalmente customizáveis.
Realizar análises estatísticas, o que inclui calcular estatísticas descritivas, estimar modelos de regressão e testar hipóteses.
Apresentar resultados de forma replicável em diferentes formatos.
Antes de prosseguir, no entanto, vamos preparar o terreno: o R é um ambiente de programação, o que significa que não abriremos um banco de dados utilizando um menu de tarefas, nem calcularemos estatísticas clicando em um botão. Em vez disso, precisaremos programar, isto é, escrever código de forma ordenada para que o computador o execute sequencialmente. Aprender a programar, especialmente no início, pode ser um pouco difícil, mas acho que não precisamos reforçar o quanto todo o esforço envolvido valerá à pena.
Nossa filosofia
O mote do livro: ensinar a usar R para resolver problemas aplicados de pesquisa social e de análise de dados, e não necessariamente para aprender lógica de programação. No fundo, acreditamos que ir o mais rapidamente possível para a prática é a melhor forma de entender o potencial do R. É por essa razão que não cobrimos de forma aprofundada tópicos considerados essenciais em livros introdutórios de programação, como estruturas de repetição e condicionais e princípios de programação orientada a objetos.
Além da opção geral por um livro prático, procuramos seguir alguns princípios menores na escrita desse livro. São eles:
Priorizamos código fácil de ler, mesmo que ele seja um pouco mais extenso;
Preferimos usar ferramentas simples e versáteis para resolver problemas, e não necessariamente as mais eficientes e especializadas;
Organizamos tarefas de análise de dados em módulos independentes, como importação de dados e manipulação, de forma que cada parte possa ser reutilizada em outros projetos;
Partimos do pressuposto de que, sempre que possível, análises devem ser replicáveis – qualquer pessoa familiarizada com o R deve ser capaz de reproduzir nossos códigos.
Para quem este livro é indicado?
Recomendamos este livro sobretudo para cientistas sociais, economistas e pessoas de áreas próximas que estão dando seus primeiros passos no mundo da metodologia quantitativa e da análise de dados. Nossa ideia é que ele seja um atalho para o aprendizado de R e que, a partir dele, a leitura de livros e manuais mais avançados, como os Wickham, Çetinkaya-Rundel, e Grolemund (2023) ou o de Aquino (2014), seja mais fácil e proveitosa.
Vamos enfatizar: este não é um livro de programação, pelo menos não em sentido estrito. Antes, ele é um guia introdutório para o uso aplicado do R em pesquisa social quantitativa. Respondendo à pergunta do sub-título, este livro é indicado principalmente para quem quer aprender rapidamente a usar o R para resolver problemas reais de pesquisa.
Como usar o livro
Pensamos este livro como um complemento para um curso de R de curta duração, com cinco aulas. Dessa forma, cada capítulo corresponde a um dia de trabalho: antes dos encontros, alunas e alunos idealmente lerão um capítulo para cobrir o conteúdo exposto em aula e, no turno oposto, praticam o que foi visto com os exercícios disponíveis ao final do mesmo capítulo.
Os capítulos do livro podem ser lidos ou consultados de forma independente, mas seguem um percurso planejado: começamos com o básico sobre como instalar e usar o R e o RStudio e concluímos com modelos de regressão linear simples e multivariados. Por conta disso, para estudo individual sugerimos que cada capítulo seja lido seguindo a sequência em que são apresentados.