It is my purpose therefore to relate a few incidents of the latter part of the reign of Augustus, and thereafter to deal with the reign of Tiberius and subsequent events without either prejudice or partiality … “sine ira et studio” – motives from which my mind is necessarily free. Tacitus. “Annals”.
A eleição se aproxima, e nada mais natural que, com o afloramento das paixões políticas, um tema recorrente volte à pauta das discussões cotidianas: a precisão das pesquisas eleitorais.
As críticas são as mais diversas, desde as populares teorias da conspiração que julgam os institutos de pesquisa como que maculados — com campanhas de favorecimento ou depreciação de determinado candidato — até argumentos mais sofisticados, advindos de questionamentos metodológicos sobre as técnicas de amostragem ou sobre a imparcialidade na escolha das perguntas das pesquisas em questão.
Nesse âmbito, conceitos estatísticos nada triviais são questionados em discussões corriqueiras que em nada ajudam na melhor compreensão dos resultados, e mesmo das limitações das pesquisas.
Um exemplo bem familiar a todos que acompanham o cenário eleitoral é o conceito de margem de erro. É comum o anúncio de dois candidatos em “empate técnico” quando os intervalos de confiança provenientes das margens de erro de suas respectivas estimativas se sobrepõem. Mas, na prática, o que significa esse empate?
A última eleição presidencial, de 2014, tem bons exemplos para abordarmos o tema. Às vésperas do segundo turno, os candidatos Aécio Neves (PSDB) e Dilma Rousseff (PT) apresentavam, segundo as principais pesquisas, percentuais de intenção de votos bem próximos. A pesquisa divulgada pelo instituto Datafolha na noite de sábado antes do segundo turno, indicava a candidata Dilma Rousseff com 52% dos votos válidos, contra 48% do candidato Aécio Neves. Como a margem de erro da pesquisa era de 2 pontos percentuais, o empate técnico entre os dois candidatos era anunciado.
Dito dessa forma, a interpretação casual indicaria que havia uma probabilidade razoável, ou ao menos considerável, de que, em verdade, Dilma estivesse atrás de Aécio. Mas se pararmos para analisar que o nível de confiança da pesquisa é de 95%, podemos interpretar, de uma forma não tão rigorosa, que a probabilidade real de Dilma ter menos de 50% dos votos naquele momento era de apenas 2,5%. Muito menor, portanto, que o termo “empate técnico” pode deixar transparecer.
Na mesma eleição, é interessante analisar os resultados das pesquisas de boca-de-urna do primeiro turno de 2014, em comparação aos resultados reais obtidos. De forma geral, uma pesquisa boca-de-urna, feita no dia da eleição, deveria ser a que melhor retrata os percentuais de intenção de votos reais de cada candidato, pois é feita de forma concomitante com a votação em si.
A pesquisa divulgada pelo Ibope naquele primeiro turno indicava Aécio Neves com 30% dos votos válidos, mas o percentual real do candidato foi de 33,55%. Novamente, considerando a margem de erro máxima de 2 pontos (na verdade essa margem é menor do que os 2 pontos divulgados, na medida que o percentual do candidato é mais baixo) e o nível de confiança de 95%, poderíamos argumentar que a probabilidade de que as intenções de voto do candidato fossem maiores que os 33,5% obtidos, de acordo com a pesquisa, era menor que 0,1%. Interessante notar, entretanto, que não só o instituto Ibope, como todos os demais grandes institutos de pesquisa capturaram com precisão a tendência de crescimento do candidato Aécio Neves nos últimos dias de campanha, que o levaram a desbancar a candidata Marina Silva (na época pelo PSB) na busca de uma vaga para disputa do 2⁰ turno com a candidata Dilma Rousseff.
Diferenças dessa magnitude, ou mesmo maiores, não são incomuns quando se analisa outras pesquisas ou mesmo outras eleições, aumentando o nível de descrença geral dos eleitores nesses levantamentos. Mas o descrédito pode vir, novamente, da má compreensão de termos estatísticos e não de erros metodológicos dos institutos em si.
A margem informada pelos institutos de pesquisa não engloba todas as possíveis fontes de propagação de erros. Considera apenas o erro proveniente da escolha de uma amostra aleatória da população. Imaginemos que todos os eleitores do Brasil pudessem ser numerados de 1 até 147 milhões (quantidade apta a votar em 2018) e que, de forma completamente randômica, conseguíssemos sortear 2.300 desses eleitores para fazer uma pesquisa. Se conseguíssemos, de fato, entrevistar esses sorteados, teríamos uma pesquisa com a margem de erro próxima dos 2 pontos percentuais tradicionalmente divulgada pelos institutos. Mas é fácil perceber que conseguir fazer isso é impraticável.
Os institutos de pesquisa procuram, então, desenhar metodologias que permitam às amostras selecionadas, ou seja, os perfis dos eleitores escolhidos para a pesquisa, se aproximarem ao máximo de uma amostra aleatória. Ao fazer isso, novos erros podem ser incorporados aos modelos, aumentando significativamente a margem da pesquisa para além dos 2 pontos percentuais que estamos acostumados a acompanhar.
As novas fontes de erro podem ser diversas, e muito difíceis de quantificar, o que explica a divulgação apenas da margem relativa à amostragem aleatória. No artigo “A (im)precisão das pesquisas eleitorais”, os autores estimaram, empiricamente, que, em média, a margem de erro das pesquisas equivaleu a 7,5 pontos percentuais nos pleitos de 2012, 2014 e 2016.
Sem tratar o resultado como verdade absoluta (já que todos os estudos têm suas limitações), mas reconhecendo sua relevância, muitos poderiam questionar se, com margem de erro tão grande, ainda existe utilidade nas pesquisas eleitorais em si.
De fato, para fazer estimativas pontuais dos percentuais de intenção de voto de cada candidato, elas realmente parecem ser imprecisas.
Mas, voltando ao exemplo anterior do primeiro turno da eleição presidencial de 2014, o que talvez faça mais sentido é analisar temporalmente os dados, em vez de apenas a fotografia revelada por um levantamento específico em determinada data. Como dito anteriormente, as pesquisas foram muito eficazes em capturar a tendência de crescimento do candidato Aécio Neves em relação à Marina Silva, embora não tenham conseguido precisar com exatidão a estimativa do percentual de votos do candidato tucano.
As discussões metodológicas em torno das pesquisas eleitorais continuarão a ter grande valor na construção das amostras. Mas enquanto não se encontram soluções viáveis para os problemas, devemos nos atentar muito mais à evolução das intenções de voto de cada candidato do que ao percentual estimado em si.