Inferência bayesiana e a Porta dos Desesperados

A partir de observações, como você pode inferir/deduzir algo? A inferência frequentista baseia-se na regularidade estatística das frequências relativas e sustenta que a probabilidade de um dado acontecimento pode ser medida observando a frequência relativa do mesmo acontecimento, em uma sucessão numerosa de experiências idênticas e independentes.

Já na inferência bayesiana, a ideia é trabalhar com o grau de confiança. Por exemplo, quando alguém pergunta “Qual a chance (ou quanto você confia) de ter vida em Marte?”, não é possível realizar esse “experimento” várias vezes. Outro ponto é que as incertezas são modificadas após observações de novos dados ou resultados. Exista também a questão de se colocar informação que não está nos dados – pode ser uma outra fonte um mesmo um “chute”.

Uma de suas aplicações está nos filtros anti-spam. A probabilidade “Pr(spam|palavra)” de um email ser um spam por conter determinada palavra é igual à probabilidade “Pr(palavra|spam)” de aparecimento daquela palavra em emails que sejam marcados pelo usuário como spam, multiplicada à probabilidade geral “P(spam)” de spams por total de emails recebidos e dividida pela probabilidade geral “P(palavra)” de aparecimento daquela palavra. Amostras de mensagens consideradas spams ou não para gerar as estatísticas ficam em bancos de dados, resultado do feedback dos usuários.

A formulação acima vem do Teorema de Bayes, um corolário da lei da probabilidade total – regra fundamental que relaciona probabilidades marginais (variáveis contidas no subconjunto) e probabilidades condicionais (depende de uma dada condição). Seu cálculo pode ser representado da seguinte forma (também conhecida como “regra de Bayes”):

Pr(A|B) = Pr(B|A).Pr(A) / Pr(B)

O objetivo aqui é responder à seguinte questão: qual é a probabilidade de que o evento A tenha ocorrido, visto que o evento B acabou de ocorrer? Essa probabilidade é simbolizada por Pr(A∣B). Pr(A) e Pr(B) são as probabilidades a priori (ou marginais) de A e B, ou seja, o que já se conhece antes de implementar a condição com um novo conhecimento sobre a situação. Essa condição de novas evidências implica em novas probabilidades, conhecidas como probabilidades a posteriori (ou condicionais): Pr(A|B) e Pr(B|A), que é a probabilidade de observar B dada a ocorrência de A (indica a compatibilidade dos elementos com a hipótese/evento A dado).

Pode-se generalizar a fórmula para mais de um evento A. Considere os eventos A1, A2, … , Ak mutuamente exclusivos, cuja união é todo o espaço amostral de um experimento, e o evento B com probabilidade diferente de zero:

math formula

Assim, cada análise compõe-se de dois tipos de informações: os dados que estão sendo analisados e a informação prévia. O pesquisador é livre para escolher qualquer informação prévia que ajuda a explicar os dados que estão sendo analisados. Por exemplo, no caso de fazer uma previsão de chuva, pode-se utilizar o resultado de outra pesquisa dizendo que o modelo numérico acerta 86% dos casos como um “peso” para calcular a probabilidade de chuva.

Porta dos Desesperados (Problema de Monty Hall)

O problema de Monty Hall surgiu a partir de um concurso televisivo dos Estados Unidos chamado “Let’s Make a Deal”, exibido na década de 1970 e apresentado por Monte Halperin. No Brasil, foi adaptado para o Programa “Oradukapeta” do Sérgio Mallandro (no SBT). Neste quadro, os participantes escolhiam entre três portas, sendo que atrás de uma delas havia prêmios (brinquedos, bicicletas, etc) e nas outras havia “monstros” fantasiados. Mallandro ainda perguntava se a criança não queria trocar de porta, ou se não queria ficar com um brinquedo ao invés de abrir a porta.

  1. Na 1ª etapa, cada criança escolhe uma porta (que ainda não são abertas)
  2. Depois, a porta escolhida por uma das crianças é aberta e sai um monstro (ou seja, o prêmio não está lá)
  3. A criança que continua no jogo agora tem duas opções, sendo que uma delas está com o prêmio
  4. O apresentador oferece: quer continuar com a mesma opção ou mudar de porta?

No início, quando se escolheu uma das portas, havia 1/3 de probabilidade de ganhar o prêmio, ou seja, 33,33%. Não existia razão para essa probabilidade mudar até o apresentador ter aberto uma das portas que não era premiada. Aparentemente, a nova situação resume-se a uma probabilidade de 50% em acertar e 50% em errar a porta com o prêmio.

No entanto, esta análise intuitiva é errada, pois a porta que o apresentador abre depende da porta que escolhida inicialmente. O apresentador sabe desde o começo onde está o prêmio e assim ele nunca abrirá uma porta premiada na primeira tentativa. Se a primeira criança tiver escolhido inicialmente uma porta não-premiada (as chances disso acontecer são maiores do que acertar logo de primeira), o apresentador não tem liberdade de escolha e só pode abrir a porta não-premiada que lhe resta, obrigando-o a continuar mantendo fechada a única porta premiada.

Veja esse exemplo: a criança escolheu a porta de número 2. As outras duas portas não escolhidas tinham em conjunto 2/3 de probabilidade de ocultarem o prêmio. Ao abrir uma dessa portas e revelar que não havia o prêmio, o apresentador está dando uma informação valiosa: se o prêmio estava nas outras portas que não escolheu (1 ou 3), então agora ele só pode estar na porta que você não escolheu e não foi aberta (a porta 1). Ou seja, se a primeira criança errou ao escolher uma porta – e as chances disto são de 2/3 – então ao abrir uma das outras portas não-premiadas o apresentador está lhe dizendo onde está o prêmio.

Assim, sempre é mais vantajoso trocar. A probabilidade de ganhar o prêmio se trocar de porta é maior do que se não o fizer, pois a probabilidade em acertar a porta premiada passa de uma em três (33,33%) para duas em três (66,67%). Veja o esquema com as três situações possíveis, considerando-se que sempre a criança vai trocar de porta após ser revelado uma das portas sem prêmio:

A criança tem uma chance inicialmente igual de selecionar o prêmio, o Monstro A ou o Monstro B. A troca após revelar uma porta sem prêmio resulta em uma vitória 2/3 das vezes

A criança tem uma chance inicialmente igual (1 em 3) de selecionar o prêmio, o Monstro A ou o Monstro B. A troca após revelar uma porta sem prêmio resulta em uma vitória 2/3 das vezes

O exemplo dado aconteceu no programa do Sérgio Mallandro e o vídeo está logo abaixo. A menina de azul escolheu porta 2 e menina de rosa escolheu porta 3. A menina de rosa abriu porta 3 e não tinha prêmio. A menina de azul podia então escolher entre as portas 1 e 2 mas manteve a 2; abre e aparece um “monstro” – a porta 1 que estava com o prêmio.

Nesse outro exemplo, a menina escolhe porta 2, e o menino escolhe a 3. Depois ele muda de ideia e escolhe a 1; quando abre, tem um monstro. A menina tem como opções as portas 2 e 3, mas continua na 2; abre e ganha o prêmio.

Dentre os prêmios mais famosos que o programa dava, estavam uma bicicleta e o videogame Dynavision. Já a matemática envolvida demonstra muito bem como nosso cérebro não foi feito para lidar intuitivamente com tais tipos específicos de problemas.

Fontes e veja mais

Compartilhe o link desse texto, mas se for copiar algum trecho, cite a fonte. Valorize nosso trabalho.
Mais informações na licença de uso do site.

Um Pingback/Trackback