Margem de erro e pontos percentuais

Nas pesquisas de intenção de voto nas eleições, é comum ouvir falar de “margem de erro”. Por exemplo, em uma pesquisa, os candidatos Veiaco e Cacareco possuem 18% e 21% das intenções de voto, respectivamente. Se a margem de erro for de dois pontos percentuais (para mais ou para menos), eles estão “tecnicamente empatados”: o candidato Veiaco poderia ter entre 16% e 20% dos votos, enquanto que o candidato Cacareco pode ter entre 19% e 23%, ou seja, existem cenários que o candidato Cacareco teria mais votos que o candidato Veiaco.

grafico

Todas as pesquisa têm margem de erro amostral. Elas buscam obter informações sobre um dado universo (por exemplo, o eleitorado) através da análise de uma amostra (uma parcela do universo). Como a amostra é sempre menor do que o universo, os resultados obtidos podem ser generalizados para todo o universo dentro de certos limites. Esses limites, dentro dos quais o erro é admitido, constituem a margem de erro.

Intervalo de confiança

A margem de erro é habitualmente definida como alcance (ou seja, metade da largura) do intervalo de confiança para uma determinada estatística. Esse intervalo pode ser definido para qualquer nível de confiança desejado, mas geralmente é escolhido 95%. Este nível é a probabilidade que uma margem de erro tem em torno do percentual que incluiria os “verdadeiros” percentuais, ou seja, o resultado estará dentro daquele intervalo de 95 dos 100 estudos realizados hipoteticamente.

Considere que uma pesquisa eleitoral busque estimar uma proporção p (desconhecida) de elementos em uma população apresentando certa característica de interesse (no caso, a proporção de eleitores que votarão no candidato A). A proporção amostral é definido como:

\(\hat{p}=\frac{x}{n}\)

onde x é o número de elementos da amostra que apresentam a característica e n denota o tamanho da amostra coletada. Por ser uma variável aleatória, possui uma distribuição de probabilidade. Para uma amostra grande, podemos considerar a proporção amostral como tendo aproximadamente distribuição normal com média p e variância p(1-p)/n.

A margem de erro é um valor que deve ser somado ou subtraído de \(\hat{p}\) para definir um intervalo de confiança. Para definir esse valor, deve-se considerar que \(\hat{p}\) deve estar a uma distância da proproção verdadeira p menor que o valor dessa margem de erro \(\varepsilon\). A probabilidade dessa relação é conhecida como coeficiente de confiança do intervalo e é definida como:

\(\gamma=P(\varepsilon)=P(|\hat{p}-p|\lt\varepsilon)\)

Substituindo-se pela definição de \(\hat{p}\) e considerando n muito grande, é possível realizar uma manipulação algébrica até chegar em:

\(\varepsilon=z\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}\)

onde z é obtido pelo gráfico da distribuição normal.

Obs.: existe uma outra interpretação para IC que diz que, para um IC de 90% existe 90% de chance de conter o valor verdadeiro. No entanto, isto só é verdade se outras fontes de erro — como o viés de amostragem e o erro de medição — forem pequenas em comparação com a variabilidade devida à amostragem aleatória. Por essa razão, provavelmente a melhor interpretação de um intervalo de confiança, para fins práticos, é que ele quantifica a precisão da estimativa, mas não diz nada sobre a sua exactidão – veja sobre a diferença entre precisão e exatidão no post de Teoria dos erros.

Exemplo

Em uma cidade de 10 milhões de habitantes, 2 mil pessoas foram entrevistadas, das quais 400 afirmaram que irão votar no candidato Veiaco. Assim, \(\hat{p}\) = X/n = 400/2000 = 0,20. Considerando o coeficiente de confiança gama = 0,95 e observando o gráfico da distribuição normal (veja mais clicando no link) para obter o valor de z = 1,96, temos que:

\(\varepsilon=1,96\sqrt{\frac{0,20(1-0,20)}{2000}}\approx0,02\)

Subtraindo e somando essa margem de erro (o tal “para mais ou para menos”), temos que o intervalo amostra compreende os valores entre “0,20 – 0,02 = 0,18” e “0,20 + 0,02 = 0,22”. Assim, o candidato Veiaco tem intenção de voto de 20% dos eleitores, com margem de erro de 2 pontos percentuais (para mais ou para menos), ou seja, é muito provável (em um nível de confiança de 95%) que tenha entre 18% e 22% dos votos.

Diferença entre porcentagem e ponto percentual

Suponha essa cidade de 10 mil habitantes e que o candidato Veiaco tenha 20% das intenções de voto. Isso corresponde a duas mil pessoas (veja o cálculo a seguir):

20% de 10.000 = 20/100 * 10.000 = 1/5 * 10.000 = 2.000

Em uma nova pesquisa, é dito que o mesmo candidato está com 25% das intenções de voto. Então ele cresceu cinco pontos percentuais (5 p.p.), e não cinco por cento (5%).

Já ponto percentual é o nome da unidade que indica o valor absoluto da diferença entre percentagens. Veja a diferença:

– candidato cresceu 5 p.p. – 5% de 10.000 = 500

– candidato cresceu 5% – 5% de 2.000 (eleitores conquistados na primeira pesquisa) = 100

Considerando-se o primeiro caso (mais comum nas pequisas), o candidato tinha 2.000 eleitores e agora tem 2.500; no segundo caso, teria só 2.100 eleitores.

Leitura crítica de uma pesquisa eleitoral

Uma pesquisa de intenção de voto é realizada por amostragem, ou seja, não representa exatamente o que todos os eleitores realmente votariam naquele momento. Corre-se o risco, por exemplo, da pesquisa acontecer em uma região ou uma classe social com mais eleitores de um determinado candidato. Os institutos de pesquisa tentam evitar esse tipo de problema buscando a maior heterogeneidade possível, realizando a pesquisa com o maior número de pessoas possível das mais variadas regiões, classes sociais, religiões, etc. Daí a importância da margem de erros.

Além disso, a escolha de um candidato deve-se pautar pela análise de propostas, histórico de realizações públicas (boas ou más), aliados e partidos políticos da coligação e vários outros critérios racionais (nada de votar só porque ele comeu pastel na feira, porque ele “fala firme” ou porque “tem raiva” do adversário político dele). Não se deve votar em alguém só porque as pesquisas dizem que está ganhando (isso não é futebol), ou deixar de votar só porque as pesquisas apontam poucos votos para ele.

Veja alguns exemplos de manipulações de estatísticas e como interpretar melhor os números clicando no link.

Fontes

Leave a Reply

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.