class: center, middle, inverse, title-slide .title[ # 1. Apresentação ] .subtitle[ ## Pesquisa de survey ] .author[ ### Fernando Meireles ] .date[ ###
Survey | 1.2025
<br>
] --- Pesquisas eleitorais presidenciais nos EUA consistentemente subestimaram o apoio a Trump <img src="slides_files/figure-html/unnamed-chunk-1-1.svg" style="display: block; margin: auto;" /> --- Pesquisas eleitorais presidenciais nos EUA consistentemente subestimaram o apoio a Trump <img src="slides_files/figure-html/unnamed-chunk-2-1.svg" style="display: block; margin: auto;" /> --- E no Brasil? <img src="slides_files/figure-html/unnamed-chunk-3-1.svg" style="display: block; margin: auto;" /> --- Ao que tudo indica, idem <img src="slides_files/figure-html/unnamed-chunk-4-1.svg" style="display: block; margin: auto;" /> --- background-color: #FFFFFF .pull-left[ <img src="imgs/auxilio1.png" width="370px" style="display: block; margin: auto;" /> .font80[
[El País](https://brasil.elpais.com/brasil/2020-09-24/bolsonaro-bate-40-de-aprovacao-seu-recorde-em-taxa-puxada-por-quem-ganha-ate-um-salario-minimo.html) ] ] .pull-right[ <br>
Em abril de 2020, o governo Bolsonaro começa a pagar um .texto[Auxílio Emergencial] mensal durante a pandemia ] --- .pull-left2[ <br>
O debate: o .texto[Auxílio] teve ou não impacto na popularidade do governo? - Como saber? ] .pull-right2[ .center[ <img src="imgs/auxilio2.png" width="470px" style="display: block; margin: auto;" /> ] .font80[
[Poder360](https://www.poder360.com.br/governo/cai-para-38-aprovacao-do-governo-entre-quem-recebeu-auxilio-emergencial/) ] ] --- background-color: #FFFFFF .pull-left[ <img src="imgs/responsavel.png" width="370px" style="display: block; margin: auto;" /> .font80[
[Exame](https://exame.com/brasil/para-65-bolsonaro-e-principal-responsavel-por-auxilio-emergencial/) ] ] .pull-right[ <br>
Parte da população viu Bolsonaro como responsável pelo .texto[Auxílio] ] --- .pull-left[ <img src="imgs/auxilio3.png" width="370px" style="display: block; margin: auto;" /> .font80[
[DW](https://www.dw.com/pt-br/aux%C3%ADlio-emergencial-n%C3%A3o-%C3%A9-suficiente-para-ganhar-elei%C3%A7%C3%A3o/a-54594738) ] ] .pull-right[ <br>
*Surveys* não indicavam que o .texto[Auxílio] teria efeito direto sobre beneficiários e, no entanto, a margem de Bolsonaro foi muito maior - O que aconteceu? ] --- .texto[Problemas] .pull-left[ - Escassez de dados oficiais atualizados da população - Erros de cobertura (Censo de 2010, PNADc, etc.) - Controle de aplicação (fraudes, etc.) - *Wording* (i.e., como perguntar sobre ideologia?) ] .pull-right[ - *Mode effects* (cobertura e usos de telefone e internet) - Abordagem e *repondent fatigue* - *Social desirability bias* e *Nonresponse bias* - Margens de erro subestimadas (e.g., *design effects*) ] --- Considere outros problemas:
Como determinar o tamanho da população de rua do país? --
Como medir a desigualdade de renda na população? --- background-color: #FFFFFF <img src="imgs/rua.png" width="720px" style="display: block; margin: auto;" /> .font80[
[Censo da população em situação de Rua](https://censorua-pcrj.hub.arcgis.com/pages/metodologia) ] --- A pergunta correta não seria: > em meio a tantos problemas, por que ainda usar *surveys*? --- .texto[A mensagem deste curso] *Surveys* são tentativas sempre imperfeitas de mensurar alvos móveis, não observáveis diretamente --
Não obstante, *surveys* são, uma das nossas melhores tentativas de colocar números em fenômenos complexos, opiniões e atitudes --- class: inverse, mline, middle, center background-color: #282A36 # Usos --- Uma definição geral: .alert[*Survey* é um grande e multidisciplinar grupo de técnicas de pesquisa que envolve .texto[coletar dados individuais por meio da aplicação de questionários]] .column-right[ Exemplos: .font90[ - Apuração de votos em um plenário - Pesquisa com pessoas em um shopping - Entrevistas com políticos - *Spam* de questionário de satisfação (e-bit e similares) ] ] --- .texto[*Highlights*] -
[Survey Research Center](https://www.src.isr.umich.edu/) -
[Pew Research Center](https://www.pewresearch.org/) -
[Roper Center](https://ropercenter.cornell.edu/) -
[Instituto Brasileiro de Geografia e Estatística](https://www.ibge.gov.br/) --- .texto[Grandes *surveys*] -
[American National Election Studies](https://electionstudies.org/) -
[World Values Survey](https://www.worldvaluessurvey.org/) -
[Latinobarómetro](https://www.latinobarometro.org/lat.jsp) -
[European Social Survey](https://www.europeansocialsurvey.org/) -
[Comparative Study of Electoral Systems](https://www.cses.org/) ---
A teoria e a tecnologia na área de *surveys* evoluíram continuamente .pull-left[ - [Mixed-mode](https://academic.oup.com/jssam/article/12/3/507/7690907) e *web surveys* - [MrP](https://library.virginia.edu/data/articles/getting-started-multilevel-regression-and-poststratification) ] .pull-right[ - [Aprendizado de máquina](https://www.journals.uchicago.edu/doi/abs/10.1086/714777) - [Detecção de fraudes](https://academic.oup.com/jssam/article/12/1/14/6967120?searchresult=1) ] ---
O número de pesquisas eleitorais cresceu no Brasil; em 2024, foram `14793` pesquisas <img src="slides_files/figure-html/unnamed-chunk-10-1.svg" style="display: block; margin: auto;" /> ---
E estas cada vez mais usam diferentes modos de coleta <img src="slides_files/figure-html/unnamed-chunk-11-1.svg" style="display: block; margin: auto;" /> --- class: inverse, mline, middle, center background-color: #282A36 # Curso --- .texto[Roteiro do curso]
Na primeira parte do curso, veremos o básico sobre *surveys* e teoria estatística envolvidas
Em uma segunda parte, trabalharemos com inferência e pós-ajustes
No final, discutiremos alguns tópicos --- .texto[Amostragem] Duas formas: .pull-left[ .texto2[Probabilística], na qual a seleção de unidades da população é aleatória e a probabilidade de inclusão de cada unidade na amostra é conhecida de antemão ] .pull-right[ .texto2[Não-probabilística], na qual a seleção de unidades não é totalmente aleatória e a prob. de seleção é desconhecida ] --- Tudo pode dar errado em *surveys* (essa é a regra) e, portanto, precisamos saber o que fazer
A segunda parte do curso é voltada principalmente para a inferência e pós-ajustes quando temos justificativas teóricas para entender os diferentes erros que podemos encontrar em uma pesquisa qualquer --- .texto[Pesquisas no Brasil] Por aqui, temos problemas específicos e, também, uma tradição de *area-sampling* combinada com quotas como modo canônico .pull-left[
Em geral, usam-se amostras .texto2[não-probabilísticas] por .texto2[conglomerados], com sorteio em duas ou três etapas e com seleção de respondentes intencional ] .pull-right[
Maiores problemas: cobertura, *nonresponse* e *mode effects* ] --- .texto[Política de avaliação]
4 tarefas aplicadas ao longo do curso, com intervalos entre elas (*80* pontos)
Apresentação resumida de um texto para leitura recomendada (*10* pontos)
Participação em aula (*10* pontos) -- <br> .center[ .alert[
Não haverá trabalho final] ] --- .texto[Uso de LLMs] .pull-left[ .texto2[Encorajado] ✅ - Usar *ChatGPT* para tirar dúvidas - Usar *ChatGPT* para corrigir código - Usar *ChatGPT* para revisar gramática, português e inglês ] .pull-right[ .texto2[Desencorajado] ❌ - Usar *ChatGPT* para gerar código - Usar *ChatGPT* para redigir textos - Usar *ChatGPT* para criar teorias ou explicações ] --- Estes e outros detalhes do conteúdo programático estão na .texto[ementa] atualizada do curso, disponível [aqui](https://fmeireles.com/survey/ementa) --- .texto[Política geral sobre *slides*] .alert[
*Slides* são são um recurso e não substituem leituras obrigatórias e recomendadas] .font90[ .pull-left[
Resumir e parafrasear envolvem maior processamento cognitivo que abordagens não-generativas (transcrição literal, tirar fotos ou guardar *slides*) ] .pull-right[
Tomar notas em aula melhora desempenho acadêmico (ver [esta](https://www.sciencedirect.com/science/article/pii/S0361476X21000849), [esta](https://link.springer.com/article/10.1007/s11251-018-9458-0) e [esta](https://link.springer.com/article/10.1007/s10648-024-09914-w) meta-análises) ] ] --- class: inverse, mline, middle, center background-color: #282A36 # Começando --- .texto[Tarefa pós-aula] Para começar a se familiarizar com *surveys* e seus produtos mais imediatos (i.e., bancos de dados codificados), você deverá:
Criar uma conta em [Cesop](https://www.cesop.unicamp.br/por/banco_de_dados), o repositório de pesquisas de opinião mantido pela Unicamp (pode levar dias)
Analisar as pesquisas disponíveis e escolher uma que lhe interesse
Assim que possível, baixar o banco de dados e o seu questionário e começe a explorá-lo usando `R` --- .texto[Template] Usaremos um *template* em [quarto](https://quarto.org) para realizar tarefas alternando código, texto e referências bibliográficas.
[fmeireles.com/survey/template](https://fmeireles.com/survey/template.html) --- .texto[Tarefa em aula] (na verdade, um *quizz* pra documentar progresso ao longo do curso) .left-column[ Em 1880, Karl Marx criou um instrumento para investigar as condições da classe trabalhadora francesa ] .right-column[ .font80[ > *The following hundred questions are the most important. In replies the number of the corresponding question should be given. It is not essential to reply to every question, but our recommendation is that replies should be as detailed and comprehensive as possible. The name of the working man or woman who is replying will not be published without special permission but the name and address should be given so that if necessary we can send communication.* ] ] --- .texto[Quizz 1] .font90[ - Questão 2 do instrumento do Marx > *Does the shop in which you work belong to a capitalist or to a limited company? State the names of the capitalist owners or directors of the company.* ] -- <br> .texto2[Pergunta]: esta redação tem algum problema? --- .texto[Quizz 2] .font90[ - Questões 3 e 4 do instrumento > *State the number of persons employed. / State their age and sex.* ] -- <br> .texto2[Pergunta]: pela redação das questões, qual é a população que Marx está investigando? --- .texto[Quizz final] .texto2[Pergunta]: imagine que Marx tenha obtido uma taxa de resposta de 30% na sua pesquisa (imagine também que ele conhecia a população-alvo e tinha como acessá-la). Qual é o problema de se usar os resultados do *survey* para inferir sobre a classe trabalhadora francesa?