Teoria dos Jogos

Ramo da matemática aplicada, a teoria dos jogos ganhou fama no mundo pop após o filme norte americano “Uma mente brilhante” (2001). O filme representa a vida do matemático John Nash, ganhador do Prêmio de Ciências Econômicas em Memória de Alfred Nobel em 1994, após resolver, na década de 1950, um problema relacionado à teoria dos jogos. Nash começou a mostrar sinais de esquizofrenia em 1958, passando por internações e recuperação gradativa após 1970, depois de longo tratamento e abandono da medicação antipsicótica.

A Teoria dos Jogos (entenda jogo como um cenário) estuda situações estratégicas onde jogadores escolhem diferentes ações (competição, colaboração, etc) na tentativa de melhorar seu retorno em interações com outros jogadores, que também podem tomar decisões, de modo sequencial ou simultâneo. Escolher o melhor vagão para entrar no trem ou escolher a sala de cinema mais vazia são exemplos de situações cotidianas da aplicação da teoria, que pode ser ser usada inclusive em relações diplomáticas, políticas e econômicas entre nações.

Para saber o jogo que está sendo realizado, deve-se entender a relação custo/benefício de cada um dos adversários. Às vezes, uma perda financeira é tolerável devido a uma razão passional (só pelo prazer de ver o concorrente se dar mal, por exemplo). Esse entendimento que leva à elaboração do modelo matemático que permita prever as ações do jogo. O pressuposto para a teoria funcionar é que todos os jogadores sempre tomam ações racionais.

Na obra “A fundação”, de Isaac Asimov, foi criada a ciência chamada “psico-história”, mescla história, sociologia, e matemática estatística para prever com exatidão as ações coletivas de populações muito grandes. Ela começou a entrar em crise quando um elemento passional de grande influência, o mulo, entrou na história. Veja mais sobre A Fundação clicando no link.

Frase do mordomo Alfred, do Batman, no filme "The Dark Night" sobre o vilão Coringa (referências também ao Alex (Laranja Mecânica) e ao Tyler Durden (Clube da Luta) — Frase do mordomo Alfred, do Batman, no filme “The Dark Night” sobre o vilão Coringa (referências também ao Alex (Laranja Mecânica) e ao Tyler Durden (Clube da Luta)

As pessoas podem muitas vezes não agir de modo racional. Já os Estados são racionais, pois seguem o modelo Hobbesiano. Assim, é muito difícil prever o comportamento de uma só pessoa, mas quanto maior o número de pessoas, mais fácil fica de prever o comportamento do coletivo. As volatilidades individuais se cancelam e só o que tem em comum acaba impactando no todo. Mesmo o Estado Islâmico, que parece ser completamente passional, participa de um jogo. Nele, o EI tem muito pouco a perder, e por isso é bastante bruto em suas ações. Já os outros países tem muito a perder.

Um dos principais conceitos envolvidos é o conceito de “minmax”: deve-se minimizar o máximo prejuízo ou maximizar o ganho mínimo ao tomar decisões. Por exemplo, em um jogo onde todos querem te ver mal, como tirar uma vantagem disso? Com esse tipo de pergunta, trabalharam os matemáticos Francês Borel e John von Neumann.

O trabalho de Von Neumann culminou no livro “The Theory of Games and Economic Behavior”, lançado em 1944 com a co-autoria de Oskar Morgenstern. Ele definiu os jogos de soma zero, que são jogos finitos onde toda vez que algum dos jogadores tem um benefício, o outro automaticamente tem um prejuízo, ou seja, são mutuamente exclusivos (uma cobrança de pênalti, por exemplo). Existem jogos de soma diferente de zero, porque algumas saídas têm resultados combinados maior ou menor que zero. Um exemplo é o dilema do prisioneiro (veja mais abaixo).

John Nash criou um conceito que depois ganhou o seu nome: o equilíbrio de Nash. Ele representa uma situação em que, em um jogo envolvendo dois ou mais jogadores, nenhum jogador tem a ganhar mudando sua estratégia unilateralmente, tendendo a permanecer nesse estado/equilíbrio. Por exemplo, em um jogo de xadrez, existem milhões e milhões de possibilidades de realizar toda uma partida, mas como certas opções excluem outras, já que certas ações são favoráveis à sua vitória e outras não, reduz-se o número de probabilidades. A melhor opção mantém-se independente das opções dos outros jogadores.

Nash também elaborou um meio de transformar jogos cooperativos em não cooperativos (e vice versa). Assim, é possível descobrir qual é o equilíbrio em jogos cooperativos também. Podem ainda existir equilíbrios onde todo mundo se dá bem ou todo mundo sai perdendo. Para evitar a segunda situação, pode haver um mediador. Por exemplo, a Lei Cidade Limpa impedindo letreiros enormes com grandes custos e sem visibilidade para quem passa na rua.

Dilema do prisioneiro aplicado em uma situação cotidiana

Jogos de coalizão acontecem onde grupos se unem para brigar pelas ações favoráveis ao grupo, como em partidos políticos. Também existem os jogos de retaliação, quando o jogo se repete e tenta-se impedir que o adversário continue ganhando e você perdendo – existe uma recompensa para quem realiza a retaliação primeiro. Nesse caso, deve-se tomar cuidado para não acabar com a sinergia do grupo, ou seja, a capacidade que os jogadores tem de produzirem mais juntas do que separadas. Por isso mesmo, muitas “joint ventures” tem prazo para durar, já que em algum momento pode acontecer uma retaliação.

Existe também o “free rider”, que busca a oportunidade de pegar algum benefício, mesmo sem ter que arcar com custos no futuro – só de deixar os outros jogando, ele vai ter algum benefício com isso, reduzindo seu custo. A presença dele acaba condicionando o jogo a uma situação onde os outros se dão mal. Por exemplo, dividir a pasta de dente em uma república é mais barato do que cada um ter uma, mas o “free rider” pode abusar desse recurso em vez de usar moderadamente, causando um custo para os outros jogadores.

Dilema do prisioneiro

Dois bandidos foram levados para salas separadas para serem interrogados. Os guardas apresentam as seguintes opções:

Se você entregar o outro, mostrar provas de que foi o outro, você está livre e o seu colega pega 10 anos de prisão;
Se ficar calado, vai ficar preso 10 anos;
Se ninguém delatar ninguém, os dois pegam 1 ano de cadeia;
Se os dois delatarem, os dois pegam 10 anos de prisão.

Note que a melhor situação para os dois é quem ninguém delate ninguém. No entanto, o equilíbrio de Nash ocorre com os dois delatando, que é o pior dos casos. Como que funciona: primeiro os dois pensam em não delatar, só que quando um pensa que o outro vai ficar quieto, ele vislumbra uma situação em que ele pode ganhar ainda mais, dedurando sem ser delatado e saindo livre. No entanto, o mesmo vale para o outro preso.

Aconteceu a mesma coisa na crise de 1929 e na operação do mensalão da Polícia Federal.

Uma variação desse dilema envolve duas lanchonetes formando um duopólio, inicialmente com o mesmo número de clientes. Se uma fizer propaganda, vai ter um custo, mas vai pegar alguns clientes do concorrente e ganhar mais. No entanto, se as duas resolverem fazer propaganda, as duas vão manter seus números de clientes mas com os custos da propaganda.

Quebra de monopólio

Imagine que uma companhia aérea (Varig) detenha o monopólio de voos sobre uma região e que uma outra empresa (a Vasp) deseja iniciar uma competição vendendo passagens nesse mercado. Enquanto a Vasp está sondando, a Varig já avisa que vai retaliar se a Vasp realmente decidir entrar na disputa, baixando os preços a um nível que a Vasp não vai conseguir concorrer. Caso a Vasp não entre, ela fica com 0% de participação e a Varig continua o monopólio (100% do mercado). Caso entre na disputa, podem acontecer os seguintes cenários:

Se a Varig não retaliar, as duas ficam com aproximadamente metade do mercado cada uma;
Se a Varig retaliar, a Vasp tem que responder, e terá dois cenários:
1) a Vasp sai do mercado na hora que retaliou, assumindo o prejuízo pelo que já foi gasto, e a Varig também terá um prejuízo, já que baixou os preços das passagens;
2) a Vasp fica no mercado e as duas se dão muito mal, já que as duas estariam operando com valores muito baixos

Assim, o que acontece é que a Vasp não entra na briga e, só com a ameaça, a Varig mantém o monopólio. No entanto, a Vasp pode, ao sondar, já fazer o seguinte movimento: investir (ou pelo menos dizer isso) na compra de muitas aeronaves e contratação de pessoal para o novo mercado. Com isso, a Vasp mostra que vai entrar na briga para ficar. Se a Vasp saísse, a perda seria muito maior, e isso não faria sentido.

Nesse novo cenário, em que ambas levariam prejuízo, a Varig se vê forçada a não retaliar. Não era bem o que a Varig gostaria, mas um lucro menor é melhor do que um prejuízo certo. O grande investimento da Vasp faz a decisão de começar uma guerra comercial ficar nas mãos da Varig.

Gene egoísta

Considere dois tipos de gaivota: uma que fica o dia todo de olho no mar para pegar o peixe e outra que fica esperando a outra pescar o peixe para roubá-lo. O primeiro tipo de gaivota tem um grande gasto energético. Já o segundo tem bem menos esforço e leva vantagem, mas só se existir um número pequeno de gaivotas “aproveitadoras”. A curto prazo, surgirão mais gaivotas piratas, até que quase não vai ter mais nenhuma pescando e a sociedade entra em declínio. O ponto em que o número de gaivotas “pescadoras” for o suficiente para manterem a si mesmas e às gaivotas “aproveitadoras” é o ponto de equilíbrio de Nash.

Veja uma resenha sobre o livro Gene Egoísta, de Richard Dawkings, clicando no link.

Tragédia dos bens comuns

A tragédia dos comuns é uma situação onde indivíduos, agindo de forma independente e racional de acordo com seus próprios interesses, se comportam em contrariedade aos melhores interesses de uma comunidade, esgotando algum recurso comum. Por exemplo, em uma crise hídrica, muitas pessoas optam por perfurar poços artesianos. Em curto prazo, pode-se resolver individualmente o problema, mas quando essa solução é usada de modo cada vez mais intenso, pode gerar problemas como contaminação dos lençóis freáticos e afundamento do solo. Isso leva a uma perda coletiva a longo prazo. Uma das formas de prover o equilíbrio desse jogo é através da atuação do Estado, formando esse pensamento coletivo que o indivíduo não teria.

Muitos pontos desse post foram discutidos no SciCast sobre Teoria dos Jogos e um exemplo usando o jogo “pedra-papel-tesoura” está no Spin de notícias 260. Veja também alguns exemplos da teoria dos jogos na vida real no blog “Bípede Pensante“. O artigo de Teoria dos Jogos na Wikipedia tem vários exemplos em diferentes áreas.

2 comments

Ruben Paiva Gomes disse:
1 de dezembro de 2017 às 3:03
sci cast?
Responder
1. Vinicius Roggério da Rocha disse:
  1 de dezembro de 2017 às 5:38
  Sim, SciCast, um podcast de ciências…. vale muito a pena ouvir!
  Responder