Ciência Política na era do Big Data: automação na coleta de dados digitais

Abstract

Nosso objetivo neste artigo é introduzir uma forma simples de automatizar a coleta de dados na internet para fins acadêmicos. Argumentamos que esta solução trás três principais vantagens em relação à coleta manual: (1) ela reduz drasticamente o tempo gasto na coleta; (2) ela elimina totalmente erros de imputação e de digitação; e, (3), ela aumenta a transparência das pesquisas que a utilizam. Como exemplo, coletamos mais de 25 mil proposições legislativas do site da Assembleia Legislativa de Minas Gerais e oferecemos um passo-a-passo para reproduzir este procedimento no ambiente de programação R. Concluímos discutindo as vantagens desta solução para a Ciência Política, especialmente nesta época em que cada vez mais dados estão disponíveis na internet.

Publication
In Política Hoje.