terça-feira, 14 de outubro de 2014

Há mais coisas entre as Pesquisas e as Urnas, do que sonha a nossa vã filosofia

Por Paulo Franco



Como podem, os institutos,  darem  95% de certeza em resultados tão divergentes.  Ou um ou outro está errado.  Os números do Instituto Sensus estão tão distantes e tão desfavoráveis à Dilma e favoráveis a Aécio que não resta outra coisa a pensar, a não ser em fraude eleitoral.


Os resultados das pesquisas eleitorais pelos Institutos e os meios de comunicação que os contratam tem desafiado os limites da bestialidade, rasgando todos os manuais de estatística e trepudiando a regras mínimas da ética e do respeito à democracia.

Os institutos utilizam-se de tecnicas estatísticas da teoria da amostragem que contemplam um intervalo de confiança, que caracteriza um intervalo medido por desvios padrões, que contempla uma certa probabilidade do resultado ficar nesse referido intervalo.

Os institutos trabalham com um intervalo de 95% de confiabilidade, ou seja, 95% de probabilidade do resultado estar no intervalo determinado.  Essa probabilidade de 95% compreende um intervalo de 2 desvios padrões para menos e 2 desvios padrões para mais.  Na prática significa que de cada 100 levantamentos, 95 estarão dentro desse intervalo, em qualquer ponto do intervalo.

Plotei abaixo os levantamentos feitos pelos Institutos Datafolha, Ibope e Sensus.

O INDICIO DE FRAUDE ESTÁ ESCANCARADA


Plotando num gráfico da curva padrão (normal) os resultados da pesquisa dos 3 institutos, do candidato Aécio temos as seguintes constatações. (i) os resultados do Ibope e do Datafolha foram identicos, 46%, portanto as duas curvas são concidentes e sobrepostas.  (ii) Os resultados da pesquisa divulgada pelo Instituto Sensus é totalmente descolada e distante das curvas do Ibope e do Datafolha.

No caso do Ibope e Datafolha, o intervalo de confiança de 95% é compreendido pelos valores que vão de 44% até 48%, com a média (resultado númerico apresentado) de 45%.
____________________
Postagens Relacionadas:
Há algo de podre no Reino da Dinamarca
Datafolha, me engana que eu gostoEleições Presidenciais: Perspectivas para o 2º turno
Vox Populi x Ibope: Fraude ou erro grosseiro?
Dilma Rousseff, perspicaz, desmonta o circo armado pela Globo

____________________

No caso do Sensus, o intervadode confiança de 95% é compreendido pelos valores de 57% até 61%, com a média (resultado númerico apresentado) de 59%, nestes casos com valores arredondados para facilitar a visibilidade e a compreensão. 

Como se pode notar, tanto pelos números, como pelo gráfico que as duas curvas não se tocam, não se cruzam, havendo uma distância astronômica, tecnicamente falando.  Como pode dois intervalos de números tão diferentes e distantes ter a probabilidade de 95%?  Isso é uma ofensa ao cidadão, uma agressão à teoria estatística.  Uma aberração dessa sugere instantâneamente uma alta probabilidade de ocorrência de fraude no planejamento ou na execução da pesquisa, recaindo sobre a Sensus a maior chance da ocorrência da fraude.  E, no caso de fraude, fica caracterizado o favorecimento fraudulento das intensões de votos superestimadas, o que a meu ver caracterizaria um crime eleitoral, ou no mínimo um atentado contra a democracia.

SENSUS MANTEM A DIVERGÊNCIA NO CASO DE DILMA


Da mesma forma, lotando num gráfico da curva padrão (normal) os resultados da pesquisa dos 3 institutos, da candidata Dilma,  temos constatações semelhantes, onde as distorções invertem-se, mas mantendo o prejuizo para Dilma e o favorecimento para Aécio. (i) os resultados do Ibope e do Datafolha foram identicos, 44%, portanto as duas curvas são concidentes e sobrepostas.  (ii) Os resultados da pesquisa divulgada pelo Instituto Sensus é totalmente distinta das curvas do Ibope e do Datafolha.

No caso do Ibope e Datafolha, o intervalo de confiança de 95% é compreendido pelos valores que vão de 42% até 46%, com a média (resultado númerico apresentado) de 44%.,

No caso do Sensus, o intervado de confiança de 95% é compreendido pelos valores de 38% até 42%, com a média (resultado númerico apresentado) de 40%.

Embora no caso dos resultados das intensões de votos para Dilma, as divergências sejam menores, os intervalores de confiança têm valores distintos, somente se tocando no valor máximo do intervalo da Sensus, 42% coincidir com o valor mínimo do Ibope e do Datafolha.  Da mesma forma que no caso referente ao Aécio,  são absurdas as diferenças e não há como justificar perante a sociedade que os números de uns ou de outros.

O INTERVALO DE CONFIANÇA E O ERRO AMOSTRAL


Como já é do conhecimento de todos, quando um Instituto faz uma pesquisa de intenção de votos, ele não aplica em todo o universo, nesta caso todos os eleitores do Brasil. Isso não é feito por limitações técnicas e de custo. Então ele recorre à tecnica de amostragem.
 
A amostra selecionada deve ser tão representativa do universo que permita a generalização dos resultados obtidos para todo o universo de eleitores. As limitações acarretadas pela amostra, são expressada níveis níveis de probabilidades ou de confiança.
 
A idéia neste momento não é questionar a qualidade da amostra em termos quantitativos e nem qualitativos, mas entender a formação do intervalo de confiança, e as margens de erro envolvidos nos resultados divulgados pelo Instituto.
 
O imagem acima mostra uma curva de distribuição normal padrão, onde a área abaixo da curva representa a probabilidade acumulada de ocorrer um evento qualquer. O eixo central é a média e os demais eixos verticais representam a distância em desvios padrões da media. Numa distribuição normal padronizada, a média é zero e os eixos são 1, 2, 3 desvios padrões para a direita e -1, -2...desvios padrões para a esquerda.
 
O intervalo de 4 desvios padrões em torno da média (2 para baixo e 2 para cima) concentra uma probablidade de 95,44%, portanto há uma probabilidade de 95,44% de que o resultado ocorra entre os números X-2 e X+2.
 
Por isso que ao divulgar a pesquisa o apresentador, neste caso disse: "Se a eleição fosse hoje Dilma Rousseff obteria 44% das intenções de votos, com uma margem de erro de 2 pontos para mais e 2 pontos para menos. Esses resultados têm 95% de confiabilidade".
 
Note que tem sido sempre considerado, não só neste caso, mas também por outros institutos o valor do Desvio Padrão como 1 ponto percentual. Como já disse anteriormente, não estou neste momento questionando a metodologia, e os resultados da pesquisa, mas apenas interpretando-os. Significa, então, que o instituto calculou o desvio padrão e o valor deve ser muito próximo de 1%. Convém ressaltar que este número é aproximado, pois ele varia muito em função de cada distribuição. Provavelmente é uma simplificação que não compromete os resultados, espero.
 
Se há 95% de probabilidade do resultado estar no intervalo descrito, onde estão os outros 5%? Estão nas extremidades da curva. Ou seja, 2,5% de probabilidade de ocorrer um valor menor que 42% (44% - 2%) e 2,5% de probabilidade de ocorrer um valor maior que 46% (44% + 2%).

Nenhum comentário:

Postar um comentário