Tutorial 2 – Importação de dados

ImportantePacotes
  • Neste tutorial, não é necessário instalar o pacote readr – ele já está disponível e carregado no ambiente do navegador.

Introdução

Neste rápido tutorial, praticaremos a importação de dados em R. Particularmente, focaremos em CSVs – formato no qual armazenamos tabelas usando texto – e aprenderemos a importá-los usando a função read_delim() do pacote readr, que é parte do tidyverse.

Formatos de dados

Dados podem estar em diferentes formatos: CSV (texto separado por vírgulas), Excel (.xlsx), entre outros. O formato mais comum é o CSV – que nada mais é do que um arquivo de texto com um tipo de formatação específica. Exemplo:

nome,idade,partido
Ana,35,PT
Bruno,42,PSOL
Carla,28,PL

Outro exemplo, dessa vez com tabulações:

nome    idade   partido
Ana 35  PT
Bruno   42  PSOL
Carla   28  PL

Para este tutorial, vamos carregar um destes arquivos da página de estatísticas do Instituto de Segurança Pública do Rio de Janeiro.1 O arquivo é um CSV separado por ponto e vírgula (;) e tem dados sobre letalidade no estado do Rio.

Depois de importar uma base, sempre confira 3 coisas: primeiras linhas, número de linhas e nomes das colunas. Para isso, usamos algumas funções como as seguintes:

Exercício: descubra se existe uma coluna chamada ano.

DicaDica prática

É possível usar a função glimpse() do dplyr para fazer tudo isso de uma vez só.

Explorando dados

Após importar, use funções de inspeção rápida:

Função O que faz
head() Primeiras linhas
str() Estrutura dos dados
summary() Resumo estatístico
nrow() Número de linhas
ncol() Número de colunas
names() Nomes das colunas

Exercício: explore letalidade com summary(), nrow(), ncol() e names().

Resultado esperado: 150 linhas e 5 colunas.

Exportando dados

No navegador, salvar arquivo local pode não funcionar como no RStudio local.

CuidadoNo RStudio (local)

Use esta sintaxe para exportar:

write.csv(objeto, "meus_dados.csv", row.names = FALSE)

Notas de rodapé

  1. A definição de letalidade violenta é, segundo o site do ISP, “Homicídio doloso + Lesão corporal seguida de morte + Latrocínio + Morte por intervenção de agente do Estado”.↩︎