A mágica das pesquisas eleitorais

 

 a   

É comum escutarmos frases do tipo: “não confio nessas pesquisas eleitorais; afinal, não conheço ninguém que já tenha participado de uma pesquisa dessas.”

Vamos tentar explicar, sem muita matemática, a ciência por trás dessas pesquisas de intenção de voto. Esperamos que ao final deste texto você esteja convencido de que a frase destacada acima não faz sentido.

Comecemos com uma situação hipotética bastante corriqueira. Estamos cozinhando um molho para servir no jantar e queremos saber se a quantidade de sal está boa. Imediatamente, provamos uma colherada e fazemos um diagnóstico. Soa familiar? Quando fazemos isso, estamos inconscientemente usando o mesmo princípio que os institutos de pesquisa. Pegamos uma amostra (colherada), e chegamos a alguma conclusão a respeito da população (totalidade do molho). Note que o tamanho da colherada que usamos para avaliar o molho não depende do tamanho da panela!

Imagine, agora, que o shopping perto de sua casa está com uma promoção. Você foi um dos sorteados e poderá participar do desafio descrito a seguir, concorrendo a um carro zerinho. O dono do shopping colocou uma caixa gigante bem no centro da praça de alimentação. Dentro dessa caixa estão 1 milhão de bolas nas cores preta ou branca. Seu desafio é chutar a proporção correta de bolas pretas dentre o total de bolas da caixa. Antes de fazer o seu chute, você poderá retirar algumas bolas da caixa e portanto saberá a proporção de bolas pretas dentre o total de bolas retiradas. Nesse caso, o que você faria? Lembre-se de que sua única informação disponível são as bolas retiradas. A caixa não é transparente e você não pode olhar dentro dela.

[Nota: De agora em diante chamaremos as bolas retiradas de: amostra.]

Uma resposta natural seria dizer que a proporção de bolas pretas na caixa (população) é a mesma que você observou na amostra. Ou seja, se são retiradas 10 bolas das quais 6 são pretas, o chute é que 60% das bolas dentro da caixa são pretas.

Vamos supor que o dono do shopping saiba que a proporção de bolas pretas dentro da caixa é de 50%. A grande pergunta é a seguinte. Usando a técnica de chute descrita anteriormente, qual a probabilidade de você chutar o valor correto?

Agora é fácil traçar um paralelo. Uma pesquisa eleitoral nada mais é do que retirar um pequeno número de bolas e tentar descobrir qual a proporção de bolas pretas dentro da caixa. Em outras palavras, a caixa representa o Brasil. Cada bola é um eleitor e cada cor diferente representa o voto num determinado candidato.

Voltando ao nosso desafio do shopping, se você tem o direito de retirar apenas 10 bolas da caixa, me parece improvável que exatamente 5 bolas sejam pretas e as outras 5 sejam brancas. Nesse caso improvável, você chutaria que 50% das bolas da caixa são pretas e acertaria. Entretanto, qual das opções abaixo você acharia mais provável?

a- Tirar 5 bolas pretas e 5 bolas brancas.

b- Tirar 10 bolas pretas

Se a resposta não lhe parece óbvia, simplifique e imagine que foram retiradas apenas 4 bolas. Note que existem diversas sequencias onde 50% das bolas são pretas. Por exemplo:

  • Preta,Preta,branca,branca
  • Preta,branca,preta,branca
  • Branca,branca,preta,preta

Por outro lado, só existe uma sequencia onde todas são pretas.

A mensagem aqui é a seguinte: numa pesquisa eleitoral é improvável que o pesquisador dê azar e só entreviste eleitores do PT o que faria chutar que 100% da população vota no partido dos trabalhadores. Por outro lado, é possível que isso ocorra, afinal o número de eleitores do PT é bem maior que a sua amostra.

A grande sacada vem agora. À medida que aumentamos o tamanho da amostra, a chance de errarmos o chute se torna cada vez menor. Em outras palavras, quanto mais bolas você retirar da caixa, maior a chance de seu chute estar próximo ao valor verdadeiro (50%, nesse exemplo).

Como o objetivo é ser o mais simples possível vou omitir as contas matemáticas. Vamos focar em gráficos:

b

Note como numa amostra com 1000 bolas, o mais provável é que algo próximo a 500 bolas sejam pretas. Na verdade, existe 80% de chance do total de bolas pretas retiradas estar entre 480 e 520. A intuição é a citada anteriormente, existem várias sequências de retirada onde 500 bolas são pretas (dentre um total de 1000 bolas retiradas), mas existem poucas sequências onde 998 bolas são pretas dentre um total de 1000 (retiradas).

Para o caso em que a proporção de bolas negras é diferente de 50% existe um outro efeito que se agrega ao citado acima. Se a proporção for de, por exemplo, 70% , retirar bolas pretas se torna mais provável do que retirar bolas brancas. Como o objetivo é não colocar contas aqui, direi apenas que esse efeito trabalha ao nosso favor, fazendo que os resultados mais prováveis do meu processo de amostragem sejam aqueles próximos a proporção verdadeira. Ou seja, se retirarmos 1000 bolas da caixa, os resultados mais prováveis são aqueles em que existe algo no entorno de 700 bolas negras.

c

Para fechar com chave de ouro: você consegue dizer o que acontece se triplicarmos a quantidade de bolas dentro da caixa? Ou seja, atualmente as pesquisas eleitorais são feitas com 3 mil pessoas para representar 140 milhões de eleitores. E se tivéssemos o triplo de eleitores? Precisaríamos entrevistar mais pessoas? Aliás, quantas bolas eu falei que existiam dentro da caixa mesmo? Se você não se lembra do número é porque ele só foi citado uma vez, no começo desse texto: depois, não foi usado para mais nada. Isso mesmo, não foi usado para nada, nem para as contas omitidas. Portanto, o tamanho da população não afetará nossa técnica de chute. Uma intuição melhor do porquê disso ficará para outro post pois serei obrigado a incluir um pouco de matemática.

Portanto, quando o William Bonner diz que a Dilma está com 32% das intenções de voto e que a margem de erro é de 2 pontos percentuais, com intervalo de confiança de 95%, o que ele quer dizer? Agora você já está pronto para interpretar essa informação. Lembra quando eu falei que, para aquele exemplo específico, existia 80% de chance do total de bolas pretas retiradas estar entre 480 e 520? Naquele caso estávamos fazendo o caminho inverso de uma pesquisa eleitoral. Ou seja, usei a informação que apenas o dono do shopping possuía (os tais 50%) para calcular a probabilidade da minha amostra gerar um chute entre 48% e 52%. No mundo real não sabemos a quantidade de bolas pretas dentro da caixa, o que torna as coisas um pouquinho mais complicadas. Embora pareça “razoável” interpretar a frase de Bonner como: existe 95% de chance da intenção de votos de Dilma estar entre 30 e 34 por cento, a interpretação mais precisa é a de que, se fizermos 100 pesquisas eleitorais, esperamos que o valor verdadeiro esteja a menos de 2 pontos percentuais de distância do valor que chutamos em 95 delas. Nesse caso, nosso melhor chute para o valor verdadeiro é 32%.

De uma forma ou de outra, esperamos que agora você tenha uma intuição de porque as pesquisas eleitorais podem funcionar, mesmo que você nunca tenha sido entrevistado. Isso não significa que elas não errem nunca.

Obs1: Se uma panela de molho está bem misturada, uma colherada basta para sabermos se a quantidade de sal está boa. Entretanto, numa pesquisa de intenção de votos existem concentrações regionais. Talvez a área nobre da cidade esteja mais inclinada a votar em um candidato. Ou talvez os jovens se identifiquem mais com um determinado partido. No texto acima, supusemos que a panela estava muito bem misturada, ou o que em estatística chamamos de amostra aleatória simples. Existem diversas técnicas para lidar com os dados quando o molho não está tão bem misturado, todos eles fogem ao escopo desse texto. De qualquer forma, podemos usar a mesma intuição. O segredo está em dividir a panela em partes suficientemente homogêneas e então tratarmos cada uma dessas partes como uma caixa. Se dentro de cada caixa as bolas estiverem bem misturadas, tudo bem.

Fazer uma pesquisa de votos apenas na internet não é uma boa ideia. O molho não estará bem misturado. A internet é mais acessada pelos jovens. Além disso não são todas as residências que tem acesso a rede. Nesse caso você estará provando apenas a parte mais salgada da panela. Faleremos mais sobre isso num próximo post sobre Viés de Seleção.

link: https://www.facebook.com/admRachelSheherazade/photos/a.213637028835348.1073741828.213631462169238/354303078102075/?type=1

 d

Obs2: No caso em que temos diversos candidatos concorrendo a um cargo o raciocínio é análogo; com cada caixa contendo bolas de várias cores. Como você já deve ter imaginado, cada cor representaria as intenções de voto para um candidato diferente.

  1. Quer entender melhor a matemática por trás dessa história ? http://terrytao.wordpress.com/2008/10/10/small-samples-and-the-margin-of-error/

10 comentários sobre “A mágica das pesquisas eleitorais

  1. Bom texto, gente! Bem explicativo sem perder rigor. Seria interessante fazer uma extensão desse artigo no caso em que a”panela não esteja bem misturada”, isto é, quando há estratificação da população, e precisamos de técnicas mais sofisticadas que amostragem aleatória simples. Um exemplo disso podia ser http://exame2.com.br/mobile/topicos/maconha ou aquela pesquisa do Ipea sobre violência doméstica…

    Curtir

  2. Eu acreditaria se do universo das amostras fosse proporcional a porcentagem de cada estado no eleitorado total.
    exemplo São Paulo tem 32 %.
    Minas Gerais 25%, e oa demais por percentual.
    Uma amostra de 1000 então deveria ter 320 votos de São Paulo. 250 mineiros e assim sucessivamente.
    aí ficaria mais coerente.

    Curtir

  3. João, o que descrevemos no texto acima é uma simples tentativa de ilustrar os conceitos básicos de estatística utilizados nas pesquisas eleitorais.

    O processo completo é muito mais rigoroso. Na prática, os institutos que realizam a pesquisa usam características da população brasileira retiradas do IBGE para extrair uma amostra representativa da sociedade.

    Sua ideia de coletar dividir a amostra em percentuais por estados de fato é considerada na pesquisa. Além disso várias outras características também são levadas em conta como sexo, raça, religião, etc.

    Abaixo deixo um link do IBOPE onde eles explicam brevemente a metodologia deles.

    http://www.ibope.com.br/pt-br/ibope/comofazemos/Paginas/Composicao-das-amostras.aspx

    Curtir

    • Só lembrando que os institutos particulares de pesquisa utilizam métodos de amostragem não-probabilísticos (geralmente por cotas), o que pode acarretar em problemas na hora de fazer inferência para a população. Pois a amostra perdeu sua aleatoriedade, pressuposto básico para que se possa utilizar os métodos estatísticos de inferência.

      Sobre o que o João disse acima, não é verdade essa ideia de que “se a proporção de homens é 48% e de mulheres é 52% na população, devemos ter na amostra 48% de homens e 52% de mulheres.”
      O que mais interfere nessas quantidades é a variabilidade existente dentro de cada categoria. Se por um acaso, a opinião entre as mulheres for mais homogênea e a opinião entre os homens for mais heterogênea; uma amostra contendo (por exemplo) 80% de homens e 20% de mulheres, pode ser muito mais representativa dessa população composta por 48% homens e 52% mulheres, do que se tivesse sido mantida as proporções da amostra e população iguais.

      Curtir

  4. É evidente que pode haver divergências, grandes, inclusive. Se não fosse assim, não existiria margem de erro e % de certeza. É como uma doença onde 95% se curam. Imagine o significado disso praqueles 5% que morrem. E nem por isso, a ESTATISTICA está errada.

    Curtido por 1 pessoa

  5. VC não pode comparar a pesquisa feita na rua começa com a da NET, achar voto do Aécio na NET eh igual achar Corinthiano na arena Corinthians, ou seja o local onde eh feita a amostra tem pouca chance de obter resultado diferente por ser concentração de uma das opções

    Curtir

  6. E agora, Fernandinho? Explica pq o boca de urna e pesquisas anteriores erraram consistentemente em tantos lugares. Acho que o Emir Sader ta certo, hein…

    Curtir

Deixe um comentário