O tal do FHC

lula_e_cafe_com_FHC

Vou lhe contar uma história. Maria era mãe solteira de dois filhos: Adão e Eva. Ao longo dos anos Maria teve vários maridos.Todos eles tentaram sem êxito resolver um problema que afligia essa família: Adão era viciado em drogas. Foi então que Maria conheceu um tal de Fernando Henrique. Fernando cortou gastos da família, pegou dinheiro emprestado e internou Adão numa clínica de reabilitação. Tudo parecia ótimo, mas o casal acabou se divorciando. Foi então que Maria conheceu um tal de Luís Inácio, cara legal, bastante carismático. Agora que o principal problema da família estava resolvido, passou a sobrar um pouco mais de dinheiro no fim do mês. Luís decidiu colocar Eva em um colégio melhor e aumentou a mesada dos filhos. Essa história parece familiar não? Vamos ver agora alguns dos possíveis desfechos para a mesma… Ahh, e se você acha que a ideia aqui é puxar a sardinha para algum dos lados, fique tranquilo, e continue lendo o texto.

Perceba que eu falei muito pouco sobre Fernando e Luís. Os dois podem ser heróis ou vilões.

Cenário A: Fernando era maluco. Por vezes tirou dinheiro da família pra gastar com amantes. Pegou dinheiro emprestado no cheque especial e pagava juros muito altos desnecessariamente. Adão largou as drogas não por causa da internação, mas porque amadureceu, e decidiu que não queria mais isso pra sua vida. Luís, por outro lado, era um santo, um gênio. Soube aplicar o dinheiro da família na educação de Eva e Adão, o que trouxe alto retorno para a família.

Cenário B: Fernando era um gênio das finanças. Resolveu o problema que assolava a família há anos e que nenhum outro ex-marido tinha conseguido. Tudo isso apesar do pouco dinheiro disponível. Fernando não tinha amantes e nunca roubou. Luís, por outro lado, era alcoólatra. Gastou muito mal o dinheiro da família. Sua sorte é que apareceu um vizinho chinês, pai de 33 crianças, que comprava todos os bolos que Maria conseguisse cozinhar. Dizem que esse dinheiro extra foi a única coisa boa que aconteceu durante o namoro com Luís. Em suma, Luís era um pateta, que só prosperou porque estava no lugar certo, na hora certa.

No cenário C ambos os ex-maridos são heróis; por outro lado, no cenário D ambos atrapalharam mais do que ajudaram.

O problema é que, agora, o prédio inteiro decidiu que entende EXATAMENTE o que aconteceu na família do Adão. Os vizinhos de Maria se dividem. Alguns defendem fervorosamente Fernando, outros tem certeza que Luís foi a melhor coisa que aconteceu àquela família. O pior de tudo é quando aparece uma galera pra comparar “dados objetivos”, “fatos contra fatos”.

Mesada da EVA: R$ 50,00 —-> R$ 300,00
Consumo mensal de chocolate: 0 barras —-> 4 barras

Os vizinhos costumam achar que esses dados mostram quem foi o melhor marido. Mas note que esses dados são compatíveis com qualquer um dos cenários citados. Em outras palavras, esses dados simplistas não informam nada.

Ainda não fez o link?

Take-home message: tenha muitas opiniões, defenda-as com afinco, mas NÃO tenha tanta certeza das coisas. Vai votar no PT? Procure textos falando mal do PT. Vai votar na oposição? Leia a opinião dos PTistas. Mais importante ainda, entenda a visão de cientistas políticos e economistas, pare de gastar seu tempo com o que é escrito por leigos. Desconfie das comparações simplistas.

one of the few certainties in life is that persons of certainty should certainly be avoided

Pra fechar, queria mandar um abraço pra você, garotão. Você mesmo, rapaz. Você, que não sabe o que é índice de Gini mas tem certeza absoluta que o Bolsa Família é bom/ruim. Você, que não faz menor ideia de porque o Banco Central aumenta a taxa de juros para conter a inflação, mas tem certeza que FHC salvou/destruiu o país. Queria avisar que, em breve, passarei no seu consultório pra falar que acho um absurdo você tratar os pacientes com anti-histamínico. Uma simples pesquisa no Google lhe informaria que a vitamina C é um anti histamínico natural. Logo, logo, passarei na sua obra para dizer que a mistura de concreto está errada. Eu li num blog que, quanto mais areia no concreto, mais forte a estrutura. Estou até pensando em parar de usar cimento.

Fernando Luz Barbosa

A mágica das pesquisas eleitorais

 

 a   

É comum escutarmos frases do tipo: “não confio nessas pesquisas eleitorais; afinal, não conheço ninguém que já tenha participado de uma pesquisa dessas.”

Vamos tentar explicar, sem muita matemática, a ciência por trás dessas pesquisas de intenção de voto. Esperamos que ao final deste texto você esteja convencido de que a frase destacada acima não faz sentido.

Comecemos com uma situação hipotética bastante corriqueira. Estamos cozinhando um molho para servir no jantar e queremos saber se a quantidade de sal está boa. Imediatamente, provamos uma colherada e fazemos um diagnóstico. Soa familiar? Quando fazemos isso, estamos inconscientemente usando o mesmo princípio que os institutos de pesquisa. Pegamos uma amostra (colherada), e chegamos a alguma conclusão a respeito da população (totalidade do molho). Note que o tamanho da colherada que usamos para avaliar o molho não depende do tamanho da panela!

Imagine, agora, que o shopping perto de sua casa está com uma promoção. Você foi um dos sorteados e poderá participar do desafio descrito a seguir, concorrendo a um carro zerinho. O dono do shopping colocou uma caixa gigante bem no centro da praça de alimentação. Dentro dessa caixa estão 1 milhão de bolas nas cores preta ou branca. Seu desafio é chutar a proporção correta de bolas pretas dentre o total de bolas da caixa. Antes de fazer o seu chute, você poderá retirar algumas bolas da caixa e portanto saberá a proporção de bolas pretas dentre o total de bolas retiradas. Nesse caso, o que você faria? Lembre-se de que sua única informação disponível são as bolas retiradas. A caixa não é transparente e você não pode olhar dentro dela.

[Nota: De agora em diante chamaremos as bolas retiradas de: amostra.]

Uma resposta natural seria dizer que a proporção de bolas pretas na caixa (população) é a mesma que você observou na amostra. Ou seja, se são retiradas 10 bolas das quais 6 são pretas, o chute é que 60% das bolas dentro da caixa são pretas.

Vamos supor que o dono do shopping saiba que a proporção de bolas pretas dentro da caixa é de 50%. A grande pergunta é a seguinte. Usando a técnica de chute descrita anteriormente, qual a probabilidade de você chutar o valor correto?

Agora é fácil traçar um paralelo. Uma pesquisa eleitoral nada mais é do que retirar um pequeno número de bolas e tentar descobrir qual a proporção de bolas pretas dentro da caixa. Em outras palavras, a caixa representa o Brasil. Cada bola é um eleitor e cada cor diferente representa o voto num determinado candidato.

Voltando ao nosso desafio do shopping, se você tem o direito de retirar apenas 10 bolas da caixa, me parece improvável que exatamente 5 bolas sejam pretas e as outras 5 sejam brancas. Nesse caso improvável, você chutaria que 50% das bolas da caixa são pretas e acertaria. Entretanto, qual das opções abaixo você acharia mais provável?

a- Tirar 5 bolas pretas e 5 bolas brancas.

b- Tirar 10 bolas pretas

Se a resposta não lhe parece óbvia, simplifique e imagine que foram retiradas apenas 4 bolas. Note que existem diversas sequencias onde 50% das bolas são pretas. Por exemplo:

  • Preta,Preta,branca,branca
  • Preta,branca,preta,branca
  • Branca,branca,preta,preta

Por outro lado, só existe uma sequencia onde todas são pretas.

A mensagem aqui é a seguinte: numa pesquisa eleitoral é improvável que o pesquisador dê azar e só entreviste eleitores do PT o que faria chutar que 100% da população vota no partido dos trabalhadores. Por outro lado, é possível que isso ocorra, afinal o número de eleitores do PT é bem maior que a sua amostra.

A grande sacada vem agora. À medida que aumentamos o tamanho da amostra, a chance de errarmos o chute se torna cada vez menor. Em outras palavras, quanto mais bolas você retirar da caixa, maior a chance de seu chute estar próximo ao valor verdadeiro (50%, nesse exemplo).

Como o objetivo é ser o mais simples possível vou omitir as contas matemáticas. Vamos focar em gráficos:

b

Note como numa amostra com 1000 bolas, o mais provável é que algo próximo a 500 bolas sejam pretas. Na verdade, existe 80% de chance do total de bolas pretas retiradas estar entre 480 e 520. A intuição é a citada anteriormente, existem várias sequências de retirada onde 500 bolas são pretas (dentre um total de 1000 bolas retiradas), mas existem poucas sequências onde 998 bolas são pretas dentre um total de 1000 (retiradas).

Para o caso em que a proporção de bolas negras é diferente de 50% existe um outro efeito que se agrega ao citado acima. Se a proporção for de, por exemplo, 70% , retirar bolas pretas se torna mais provável do que retirar bolas brancas. Como o objetivo é não colocar contas aqui, direi apenas que esse efeito trabalha ao nosso favor, fazendo que os resultados mais prováveis do meu processo de amostragem sejam aqueles próximos a proporção verdadeira. Ou seja, se retirarmos 1000 bolas da caixa, os resultados mais prováveis são aqueles em que existe algo no entorno de 700 bolas negras.

c

Para fechar com chave de ouro: você consegue dizer o que acontece se triplicarmos a quantidade de bolas dentro da caixa? Ou seja, atualmente as pesquisas eleitorais são feitas com 3 mil pessoas para representar 140 milhões de eleitores. E se tivéssemos o triplo de eleitores? Precisaríamos entrevistar mais pessoas? Aliás, quantas bolas eu falei que existiam dentro da caixa mesmo? Se você não se lembra do número é porque ele só foi citado uma vez, no começo desse texto: depois, não foi usado para mais nada. Isso mesmo, não foi usado para nada, nem para as contas omitidas. Portanto, o tamanho da população não afetará nossa técnica de chute. Uma intuição melhor do porquê disso ficará para outro post pois serei obrigado a incluir um pouco de matemática.

Portanto, quando o William Bonner diz que a Dilma está com 32% das intenções de voto e que a margem de erro é de 2 pontos percentuais, com intervalo de confiança de 95%, o que ele quer dizer? Agora você já está pronto para interpretar essa informação. Lembra quando eu falei que, para aquele exemplo específico, existia 80% de chance do total de bolas pretas retiradas estar entre 480 e 520? Naquele caso estávamos fazendo o caminho inverso de uma pesquisa eleitoral. Ou seja, usei a informação que apenas o dono do shopping possuía (os tais 50%) para calcular a probabilidade da minha amostra gerar um chute entre 48% e 52%. No mundo real não sabemos a quantidade de bolas pretas dentro da caixa, o que torna as coisas um pouquinho mais complicadas. Embora pareça “razoável” interpretar a frase de Bonner como: existe 95% de chance da intenção de votos de Dilma estar entre 30 e 34 por cento, a interpretação mais precisa é a de que, se fizermos 100 pesquisas eleitorais, esperamos que o valor verdadeiro esteja a menos de 2 pontos percentuais de distância do valor que chutamos em 95 delas. Nesse caso, nosso melhor chute para o valor verdadeiro é 32%.

De uma forma ou de outra, esperamos que agora você tenha uma intuição de porque as pesquisas eleitorais podem funcionar, mesmo que você nunca tenha sido entrevistado. Isso não significa que elas não errem nunca.

Obs1: Se uma panela de molho está bem misturada, uma colherada basta para sabermos se a quantidade de sal está boa. Entretanto, numa pesquisa de intenção de votos existem concentrações regionais. Talvez a área nobre da cidade esteja mais inclinada a votar em um candidato. Ou talvez os jovens se identifiquem mais com um determinado partido. No texto acima, supusemos que a panela estava muito bem misturada, ou o que em estatística chamamos de amostra aleatória simples. Existem diversas técnicas para lidar com os dados quando o molho não está tão bem misturado, todos eles fogem ao escopo desse texto. De qualquer forma, podemos usar a mesma intuição. O segredo está em dividir a panela em partes suficientemente homogêneas e então tratarmos cada uma dessas partes como uma caixa. Se dentro de cada caixa as bolas estiverem bem misturadas, tudo bem.

Fazer uma pesquisa de votos apenas na internet não é uma boa ideia. O molho não estará bem misturado. A internet é mais acessada pelos jovens. Além disso não são todas as residências que tem acesso a rede. Nesse caso você estará provando apenas a parte mais salgada da panela. Faleremos mais sobre isso num próximo post sobre Viés de Seleção.

link: https://www.facebook.com/admRachelSheherazade/photos/a.213637028835348.1073741828.213631462169238/354303078102075/?type=1

 d

Obs2: No caso em que temos diversos candidatos concorrendo a um cargo o raciocínio é análogo; com cada caixa contendo bolas de várias cores. Como você já deve ter imaginado, cada cor representaria as intenções de voto para um candidato diferente.

  1. Quer entender melhor a matemática por trás dessa história ? http://terrytao.wordpress.com/2008/10/10/small-samples-and-the-margin-of-error/