Tutorial 2 – Importação de dados
- Neste tutorial, não é necessário instalar o pacote
readr– ele já está disponível e carregado no ambiente do navegador.
Introdução
Neste rápido tutorial, praticaremos a importação de dados em R. Particularmente, focaremos em CSVs – formato no qual armazenamos tabelas usando texto – e aprenderemos a importá-los usando a função read_delim() do pacote readr, que é parte do tidyverse.
Formatos de dados
Dados podem estar em diferentes formatos: CSV (texto separado por vírgulas), Excel (.xlsx), entre outros. O formato mais comum é o CSV – que nada mais é do que um arquivo de texto com um tipo de formatação específica. Exemplo:
nome,idade,partido
Ana,35,PT
Bruno,42,PSOL
Carla,28,PL
Outro exemplo, dessa vez com tabulações:
nome idade partido
Ana 35 PT
Bruno 42 PSOL
Carla 28 PL
Para este tutorial, vamos carregar um destes arquivos da página de estatísticas do Instituto de Segurança Pública do Rio de Janeiro.1 O arquivo é um CSV separado por ponto e vírgula (;) e tem dados sobre letalidade no estado do Rio.
Depois de importar uma base, sempre confira 3 coisas: primeiras linhas, número de linhas e nomes das colunas. Para isso, usamos algumas funções como as seguintes:
Exercício: descubra se existe uma coluna chamada ano.
É possível usar a função glimpse() do dplyr para fazer tudo isso de uma vez só.
Explorando dados
Após importar, use funções de inspeção rápida:
| Função | O que faz |
|---|---|
head() |
Primeiras linhas |
str() |
Estrutura dos dados |
summary() |
Resumo estatístico |
nrow() |
Número de linhas |
ncol() |
Número de colunas |
names() |
Nomes das colunas |
Exercício: explore letalidade com summary(), nrow(), ncol() e names().
Resultado esperado: 150 linhas e 5 colunas.
Exportando dados
No navegador, salvar arquivo local pode não funcionar como no RStudio local.
Use esta sintaxe para exportar:
write.csv(objeto, "meus_dados.csv", row.names = FALSE)
Notas de rodapé
A definição de letalidade violenta é, segundo o site do ISP, “Homicídio doloso + Lesão corporal seguida de morte + Latrocínio + Morte por intervenção de agente do Estado”.↩︎