quarta-feira, 13 de agosto de 2014

Datafolha, me engana que eu gosto

Por PAULO FRANCO

 

A probabilidade de ocorrer o empate entre Dilma e Aécio se as eleições fosse nessa data, dificilmente chegaria a 1%.



Em meados deste mes de julho, o Instituto Datafolha divulgou o resultados da pesquisa de intenção de votos para a presidência da república.  A divulgação foi feita com pompa e circunstância gerando uma comemoração da oposição e de toda a classe mais conservadora do país.

O Datafolha anunciava como uma bomba que Aécio Neves estaria tecnicamente empatado com a candidata da situação à reeleição, Dilma Rousseff, no segundo turno se a eleição fosse naquela data.   O entusiasmo foi tal, que os cidadãos mais contentes não se deram conta que o 2o. turno não teria a menor validade se a candidata da situação vencer no primeiro turno.  Aliás que é o que indica a mesma pesquisa.

Isso denota que a divulgação de pesquisa eleitoral tem um objetivo maior que é estimular os eleitores indecisos a votarem num determinado candidato.  Vamos votar em qualquer candidato de oposição para que o 2o. turno se concretize, pois haveria uma chance de reversão da tendencia vitoriosa de Dilma.

No caso presente, toda a força da mídia se dirigem ao candidato da oposição, já que o "aparente" empate técnico foi tão comemorado e considerado uma grande esperança, senão uma vitória. 























EMPATE TÉCNICO,  REALIDADE OU FICÇÃO?


Será que houve realmente um empate técnico entre os dois principais candidatos?  No gráfico acima, para que seja visivel a intersecção (empate) dos resultados entre os dois candidatos foram plotados tanto os resultados apurados como a margem de erro correspondentes, relativos ao intervalo de confiança de 95%, conforme estabelece os parâmetros técnicos da pesquisa.
____________________
Postagens Relacionadas:
Instituto IPSOS: Dilma tem 85% de chances de ser reeleita
IBOPE + MÍDIA: A Equação e o Mapa da Fraude
Rede Globo, O Ópio do Povo
Millôr não mentiu: A midia é realmente canalha !
____________________

É perfeitamente visivel pelo gráfico que o "famigerado" empate técnico não passa de um linha tênue que serve, na verdade, de fronteira entre os números dos dois candidados, obtidos nesse levantamento.  Ou seja, foi apurado para Dilma Rousseff 44% das intenções de votos e para Aécio Neves, 40% dos votos.  Há então uma diferença de 4% em favor da primeira.

Como há uma margem de erro de 2% para cima e para baixo, o limite inferior da margem de erro de Dilma coincide com o limite superior de Aécio.  Ou seja, o empate somente se daria se o resultado da intenção de votos de Dilma ficasse no limite mínimo ou seja 42% (44% - 2%) e simultaneamente, o resultado da intenção de votos de Aécio ficasse no límite máximo ou seja 42% (40% + 2%).

Examinando o relatório da pesquisa divulgada pelo Datafolha (anexado ao final da postagem) observei a falta de uma maior precisão nos dados, principalmente nesse caso onde o referido empate se dá numa siituaçao limítrofe entre ambos os candidados.

O relatório não divulga os dados brutos da pesquisa, mas tão somente os percentuais. E para complicar a leitura, esses percentuais são arredondados para a unidade percentual, sem nenhuma casa decimal.  Ora, porque estou levantando essa questão?  Simplesmente porque em termos de números absolutos o empate pode, na verdade, não existir.  Ou seja, pode haver uma distância razoavel em termos absolutos que não aparece no nível de um ponto percentual, em função do arredondamento adotado pelo Instituto.



Na questão do arredondamento percentual, por exemplo, se Dilma obteve 44,45% (44% arredondado) e Aécio obteve 39,53% (40% arredondado), o empate técnico não passaria de uma ficção, pois o limite inferior da margem de erro de Dilma seria 42,45% (42% arredondado), enquanto que o limite superior da margem de erro de Aécio seria de 41,53% (42% arredondado).  Não havendo portanto a tal intersecção que define o empate técnico entre as duas condidaduras. Há um intervalo de 1% que inviabilizaria o empate técnico e que não está devidamente claro para a sociedade.

É uma temeridade dizer que houve um empate ténico diante de uma fragilidade estatistica desse nível extremamente grave já que estamos falando de uma eleição presidencial.  Além de uma maior fidedignidade na informação, seria necessário informar ao eleitor, ao cidadão, em que nível de probabiblidades esse empate técnico se encontra ou qual é a chance probabilistica de ocorrer o empate.

Para entendermos qual é a significancia, a relevância desse empate técnico alardeado pela mídia e pelo Instituto Datafolha, precisamos entender, em termos teóricos e práticos o signficado do Intervalo de Confiança bem como as margens de erros.


AMOSTRA, INTERVALO DE CONFIANÇA E  ERRO




Como já é do conhecimento de todos, quando um Instituto faz uma pesquisa de intenção de votos, ele não aplica em todo o universo, nesta caso todos os eleitores do Brasil.  Isso não é feito por limitações técnicas e de custo.  Então ele recorre à tecnica de amostragem.  

A amostra selecionada deve ser tão representativa do universo que permita a generalização dos resultados obtidos para todo o universo de eleitores.  As limitações acarretadas pela amostra, são expressada níveis níveis de probabilidades ou de confiança.

A idéia neste momento não é questionar a qualidade da amostra em termos quantitativos e nem qualitativos, mas entender a formação do intervalo de confiança, e as margens de erro envolvidos nos resultados divulgados pelo Instituto. 

O imagem acima mostra uma curva de distribuição normal padrão, onde a área abaixo da curva representa a probabilidade acumulada de ocorrer um evento qualquer.  O eixo central é a média e os demais eixos verticais representam a distância em desvios padrões da media.  Numa distribuição normal padronizada, a média é zero e os eixos são 1, 2, 3 desvios padrões para a direita e -1, -2...desvios padrões para a esquerda. 

O intervalo de 4 desvios padrões em torno da média (2 para baixo e 2 para cima) concentra uma probablidade de 95,44%, portanto há uma probabilidade de 95,44% de que o resultado ocorra entre os números X-2 e X+2.  

Por isso que ao divulgar a pesquisa o apresentador, neste caso disse: "Se a eleição fosse hoje e houvesse 2º turno, Dilma Rousseff obteria 44% das intenções de votos, com uma margem de erro de 2 pontos para mais e 2 pontos para menos.  Esses resultados têm 95% de confiabilidade". 

Note que tem sido sempre considerado, não só neste caso, mas também por outros institutos o valor do Desvio Padrão como 1 ponto percentual.  Como já disse anteriormente, não estou neste momento questionando a metodologia,  e os resultados da pesquisa, mas apenas interpretando-os.  Significa, então, que o instituto calculou o desvio padrão e o valor deve ser muito próximo de 1%.   Convém ressaltar que este número é aproximado, pois ele varia muito em função de cada distribuição.  Provavelmente é uma simplificação que não compromete os resultados, espero.

Se há 95% de probabilidade do resultado estar no intervalo descrito, onde estão os outros 5%?  Estão nas extremidades da curva.  Ou seja, 2,5% de probabilidade de ocorrer um valor menor que  42% (44% - 2%) e 2,5% de probabilidade de ocorrer um valor maior que 46% (44% + 2%).


QUAL SERIA A PROBABILIDADE DE OCORRER ESSE "EMPATE TÉCNICO"?




Para entender melhor qual seria a probabilidade do empate técnico plotamos as curvas que mostram as distribuições de probabilidades dos dois candidatos, onde a primeira curva, com os números relativos a Aécio, mostrando no eixo central 40% referente ao percentual de intenção de votos apurados para ele.

Em torno dos 40%, de Aécio (curva azul), visualiza-se o intervalo de 95% de confiabilidade representado pelos 38% (40% - 2%) e pelos 42% (40% + 2%).  A outra curva (vermelha) plotada concomitantemente, referente aos valores apurados da candidata Dilma,  tem seu ponto médio nos 44%, cujo intervalo de confiabilidade de 95% está entre o limite mínimo de 42% (44% - 2%) e o limite máximo de 46% (44% + 2%).

O importante nesse gráfico éa intersecção entre as duas curvas que se dá no ponto representado pelo percentual 42.  O que isso significa?  Significa que, usando um intervalo de confiança de 95%, o limite mínimo do intevalo de Dilma, coincide com o limite máximo do intervalo de Aécio. Em outras palavras, com 95% de probabilidade, os limites apenas encostam um em outro, ou seja, é praticamente nulo, ou quase nulo.

Qual seria então a probabiilidade de ocorrer um empate se a eleição fosse hoje.  Não é dificil identificar a probabilidade dessa ocorrência, já que as as áreas compreendidas nas curvas em questão representam a distribuição de probabilidades acumulada.

Conforme visualizamos nos gráficos acima, a probabilidade de que Dilma obtenha 42% ou menos é de 2,5%, representada pela ponta inicial da cuva (vermelha) da distribuição de probabilidades de Dilma. Por outro lado a probabilidade de que Aécio obtenha 42% ou mais é de 2,5% da mesma forma, representando nesse caso pela parte final da curva (azul) de Aécio.

Como estamos falando de 2º turno, só há 2 candidatos, portanto as pessoas só podem votar num, noutro ou anular ou votar em branco.  O resultado do pleito só leva em consideração os votos válidos, ou seja, os votos em Dilma ou em Aécio, desprezando-se os demais.

O Calculo da probabilidade dessa área depende da relação ente os dois eventos.  Por exemplo, se todos os candidatos que deixarem de votar em Dilma, votassem necessáriamento em Aécio e vice-versa, a probabilidade de ocorrer o empate, com os resultados apurados nesta pesquisa seriam os 2,50%.  Mas se a transferência de votos de um candidato para outro for zero, então a probabilidade de ocorrer o empate seria algo em torno de 0,06% (2,5% x 2,5%).  Como sabemos que são dois extremos que não ocorre, o resultado está nessa faixa entre 0,06% e 2,5%, mais provavel que não chegue a 1%.

Em resumo, a probabilidade de ocorrer o empate entre Dilma e Aécio se as eleições fosse na data da pesquisas, dificilmente chega a 1%.


NÃO HAVERÁ 2º TURNO, É O QUE MOSTRA A PESQUISA


Porque tanta euforia da mídia e da oposição com o pseudo-empate técnico?  Afinal, qual é a probabilidade de ocorrência de 2º turno?



Salvo, os possíveis ganhos em operações especulaivas na Bolsa de Valores, não há razões para festejos da oposição, da grande mídia e do mercado financeiro.  Os resultados de intenções de votos, conforme ilustra o gráfico acima, não haveria 2o. turno se a eleição fosse na data da pesquisa.

Dilma obteve 36% das intenções de votos, enquanto que o somatório dos demais candidatos atingiu apenas 31%.  Considerando-se somente os votos válidos Dilma ficou com 54% e os demais com 46%, portanto a eleição seria liquidada no primeiro turno. 


RETROSPECTIVA DAS PESQUISAS NAS ÚLTIMAS ELEIÇÕES PRESIDENCIAIS.


Comparando as pesquisas realizadas no mês de julho, nos anos em que foram realizadas a últimas 3 pesquisas 2002 e 2006 com Lula e 2010 com Dilma.

Pelo gráfico abaixo, percebemos que tanto Lula  em 2002 quanto Dilma em 2010 as pesquisas já apontavam claramente a ocorrência de um 2º turno.

Por outro lado, em 2006 Lula tinha uma folga razoável para vencer em 1º turno, mas acabou não sustentando, abrindo espaço para o 2o. turno.  Nesta ocasião vale lembrar o efeito devastador do mensalão, muito bem explorado pela oposição.

Agora em 2014, Dilma tem uma folga menor, mas não pesa sobre ela e nem sobre o PT qualquer tsuname parecido com o ocorrido em 2006.  Contribuindo ainda, para diminuir a chance da ocorrência do 2º turno é o nível de denúncias que vem ocorrendo pela mídia, ao candidato da Oposição Aécio e também de seu partido, o PSDB.











 

ANEXO: RELATÓRIO DA PESQUISA


http://media.folha.uol.com.br/datafolha/2014/07/18/intencao_de_voto_para_presidente.pdf






Nenhum comentário:

Postar um comentário