Parabéns a todos que se desafiaram a solucionar o Giant Puzzle #5! Admiramos imensamente aqueles que se arriscam a pensar fora da caixa e a encontrar soluções criativas para problemas complexos.
Conseguiram resolver esse puzzle (em ranking, do maior ao menor valor esperado encontrado pela estratégia sugerida):
- Pietro Geronimi
- Leonardo Joau
- Igor Magalhães
- Fabiano Menezes
- Caio Graça
- Matheus Raposo
O problema
Zarathustra resolveu investigar uma oportunidade em um cassino quant que oferece variações do jogo de Blackjack. Em uma das variações disponíveis, você adiciona ao baralho 8 cartas I, com o valor de face contabilizado de maneira complexa.
A dinâmica da carta I é como uma exponenciação do complexo i e funciona da seguinte maneira:
- Caso você tenha 1 carta I na mão, ela tem valor i, complexo, e não soma ao valor total, que é real, ou seja, 0 pontos;
- Com duas cartas I o cenário muda de figura: I*I = i*i = -1, ou seja, você soma -1 pontos;
- Com três cartas, voltamos ao cenário complexo: I3 = -i , ou seja, 0 pontos;
- Finalmente, com quatro cartas: I4 = 1, ou seja, 1 ponto.
Considerando essa variação, qual o edge mínimo da casa com o jogador seguindo uma estratégia básica idêntica à do dealer, ou seja, escolhendo um valor fixo “soft” para parar de pedir novas cartas?
Extra
Sabemos que repetir a estratégia do dealer não é a melhor opção disponível.
Cite uma estratégia que aumente o valor esperado do jogador!
O ranking daqueles que solucionarem esse puzzle será baseado no valor esperado encontrado pela estratégia sugerida, sendo que aquele que submeteu a solução correta e o maior valor esperado estará no topo! Você pode reenviar sua solução caso encontre uma estratégia mais eficiente.
Obs.: Nesse jogo não é possível dobrar ou splitar e um baralho novo é utilizado a cada rodada. A estratégia do jogador não precisa parar em 17, pode ser qualquer valor. O edge da casa é a vantagem do dealer em relação ao jogador, ou seja, o lucro médio do dealer para cada real gasto pelo apostador – também podendo ser expresso em termos de porcentagem.
Regras do Blackjack
Blackjack é um dos jogos mais populares nos cassinos pelo mundo. O jogo é jogado entre um dealer contra um ou mais jogadores. Cada jogador recebe duas cartas enquanto o dealer apresenta uma carta virada para cima e outra para baixo. Cada carta vale o valor de face, sendo ‘J’=’Q’=’K’= 10 pontos e ‘A’=1 ou 11 pontos. A rodada é definida por cada jogador tomando uma das seguintes decisões:
- Hit: pedir mais uma carta;
- Stand: parar;
- Dobrar: dobrar a aposta por mais uma carta;
- Split: caso as duas primeiras cartas possuam o mesmo valor em pontos, é possível separá-las em dois jogos, onde cada uma dará início a uma nova mão. Uma aposta igual a inicial deve ser feita para a segunda mão.
O jogador ganha se a sua mão somar mais pontos que a do dealer, sem ir acima de 21 pontos (burst). No caso de empate, o jogador recebe de volta todo o valor da aposta, exceto quando o dealer tem um “Blackjack”(A e 10/J/Q/K) e o jogador não, nesse caso o jogador perde.
A estratégia do dealer é fixa: hit enquanto somar um total menor que 17 e stand para um total a partir de “soft” 17. Entenda “soft” como uma mão com um A em que ele é contabilizado como 11.
Em caso de vitória do jogador por “Blackjack” (A e 10/J/Q/K), ele recebe 2.5x a aposta, enquanto que em uma vitória simples ele recebe 2x a aposta inicial.
Solução
Da maneira que formulamos, com um stop fixo, as cartas complexas não trariam uma complexidade além do caso clássico com a adição de novas cartas.
Entretanto, isso muda de figura no caso extra. Achar a estratégia ótima nesse problema é menos trivial.
Uma sugestão simples, é continuar pedindo novas cartas ao atingir o valor de 22, esperando receber dois I’s seguidos e não estourar.
Lembrando que:
- Com duas cartas I o cenário muda de figura: I*I = i*i = -1, ou seja, você soma -1 pontos;
Resolvemos o problema pelo método de Monte Carlo apoiado na Lei dos Grandes Números, em que a média dos retornos para um grande número de simulações é o valor esperado da estratégia, já que a frequência relativa de um evento aleatório se estabiliza em torno de um número no longo prazo.
O código em anexo mostra a solução comentada.