Seguici su Telegram, ne vale la pena ❤️ ➡ @trovalost
Vai al contenuto

Perchè tutti sbagliano la soluzione del problema di Monty Hall

Nel 1990 un problema matematico capeggiò sulla rivista americana Parade Magazine per diversi numeri, tenendo talmente banco (e risultando così controverso e anti-intuitivo) che l’ideatrice della soluzione divenne famosa per questo motivo. Si trattava del problema di Monty Hall, ispirato ad un celebre “gioco delle tre porte“.

Un gioco in cui si sorteggiava un giocatore tra il pubblico in studio, e il famosissimo conduttore (Monty Hall, scomparso nel 2017) invitava a scegliere tra la porta 1, 2 e 3: dietro due porte c’era una capra o una scimmietta, dietro la rimanente c’era un’automobile nuova di zecca. Il conduttore, per creare un po’ di suspance, dopo la prima scelta del giocatore faceva aprire alla sua valletta una seconda porta, dietro la quale era nascosta una capra (il conduttore sapeva dove fosse nascosta la macchina): la domanda diventa, a questo punto, se al giocatore convenga cambiare porta, o convenga invece persistere sulla sua scelta iniziale (o se, al limite, la scelta sia ininfluente). Qual è la strategia corretta per massimizzare la probabilità di vittoria?

Ipotizziamo che il giocatore abbia scelto la porta 1, ad esempio, e scopra che la porta 3 contiene una capra:  gli conviene cambiare scelta, facendo uno switch sulla 2, oppure è meglio in termini di probabilità di vincita essere conservativi e rimanere sulla scelta iniziale? La statistica mostra che conviene definitivamente cambiare scelta, e che così facendo la probabilità raddoppia da 1/3 (33% circa) a 2/3 (circa il 66% di probabilità a favore).

L’intuito tuttavia suggerisce che non sia così: se rimangono due porte, la probabilità di indovinare sembra ridursi al 50%, e molti lettori della rivista erano convintissimi di questo (gli insulti che riservano al caso passarono, a loro modo, alla storia). Un’analisi rigorosa con gli strumenti adeguati dimostra abbastanza agevolmente (e in modo contrario all’intuito) che non è così, a patto di sporcarsi le mani con gli strumenti del calcolo delle probabilità. La probabilità non può essere del 50% perchè, in questo caso, il discorso manca di una parte fondamentale e, per dirla molto in breve, non tutti i casi sono equiprobabili come potrebbe sembrare.

Spiegazione del paradosso di Monty Hall

Quando il giocatore fa la scelta iniziale ha una probabilità di 1/3 di aver selezionato l’auto e una probabilità di 2/3 di aver selezionato una capra. Quando il conduttore apre una delle porte rimanenti e rivela una capra, la situazione non cambia per la porta che hai originariamente scelto, ma la probabilità condizionata delle altre due porte diventa 2/3, poiché il conduttore ha in qualche modo “spostato” la probabilità di successo.

Pertanto, cambiando la tua scelta, aumenti le tue probabilità di vincere da 1/3 iniziale a 2/3, mentre rimanere con la tua scelta originale mantiene le tue probabilità al 1/3 (e dire che sembrava 50 e 50…). Questo è il cuore del paradosso di Monty Hall: anche se può sembrare che cambiare la scelta non influenzi le probabilità, in realtà è la strategia ottimale per massimizzare le tue possibilità di vincere l’auto.

La probabilità di vincere cambiando porta, di fatto, è di 2/3.

Monty open door.svg

Il problema non si risolve facilmente con l’intuito, ma con l’ausilio della teoria diventa possibile pervenire in modo semplice alla soluzione (alla faccia di chi dice che la teoria non serve a nulla). All’epoca la questione emerse prepotentemente: molti matematici famosi contestarono la soluzione proposta al problema, che nasceva da una semplice domanda di un lettore curioso, che venne pubblicata e più volte dimostrata da Marilyn vos Savant.

Il caso è interessante perchè oltre a proporre una discussione potenzialmente seria sull’argomento evidenzia l’importanza della teoria nella pratica, oltre a mostrare come i bias o distorsioni nella valutazione possano affliggere anche i più esperti, non solo i novizi.

Spiegazione dettagliata del perchè la vera probabilità è di 2/3

Consideriamo le fasi del gioco così come è stato descritto, sulla falsariga della spiegazione fornita dal prof. Tom Leighton del MIT, possiamo distinguere tre fasi o momenti del gioco:

  1. posizionamento dell’auto dietro una delle tre porte (gli ideatori decidono dove mettere la macchina in palio);
  2. scelta iniziale del giocatore;
  3. rivelazione della “terza porta” con la capra.

A questo punto conviene cambiare scelta o no? Per ragionarla in modo metodologico corretto, sarebbe il caso di dire se conviene cambiare ognuna delle possibili scelte, il che serve a sottolineare come le casistiche siano varie e come, per sua stessa natura, un problema probabilistico debba essere affrontato in questa veste.

Messa in termini formali di teoria significa muoversi in uno spazio di probabilità composto da un sample space e soprattutto di una funzione di probabilità associata: ciò che fanno in molti, per intenderci, è ragionare solo sullo spazio di probabilità e sull’insieme dei campioni, trascurando “tragicamente” la funzione di probabilità. La cosa è complicata da vari fattori, tra cui il fatto che una trattazione teorica ci costringe a fare uso di una tupla di variabili, ognuna delle quali rappresenta i tre valori in gioco e la loro possibile evoluzione nel tempo (anche qui, per dirla meglio, ognuna delle loro possibili evoluzioni).

Funzione che, pertanto, va calcolata su tutti i casi possibili, che sono a loro volta definiti come una sequenza di passi che attraversano un albero di eventi probabilistic. Tali possibilità sono formalmente tutti i casi che possono avvenire, che possiamo enumerare mediante triple di numeri (visto che ci sono tre fasi distinte nel gioco). Non tutte le combinazioni di triple sono interessanti, peraltro, perchè non può mai succedere (ad es.) che il conduttore riveli subito la posizione dell’auto, “bruciando” il gioco e la suspance di cui sopra.

La cosa strana (nel senso di controintuitiva) di questo ragionamento è che Monty influenza la probabilità pur senza “toccare” apparentemente nulla, ma semplicemente rivelando un’informazione aggiuntiva in corsa (e senza spostare la macchina, per intenderci). Questo cambia, di nome e di fatto, il calcolo delle probabilità specificato, anche se l’intuito continua a suggerire 50 e 50, visto che sono rimaste due porte.

Se ad esempio scrivo, in notazione:

(posizionamento) = (1)

faccio riferimento simbolicamente al fatto che l’auto sia stata nascosta dietro la porta 1 (posizionamento). Se scrivo:

(posizionamento, scelta) = (1, 1)

significa che la macchina era dietro la porta 1 e il giocatore ha azzeccato la porta corretta (posizionamento, scelta), anche se ancora non lo sa. Nel nostro scenario consideriamo pure la fase tre di rivelazione, che nel nostro caso potrebbe essere che Monty apre la porta numero 3, per cui:

(posizionamento, scelta, rivelazione) = (1, 1, 3)

I casi possibili nel gioco sono i seguenti, pertanto (per non fare confusione ricordiamo che stiamo valutando esclusivamente la probabilità di vincita annessa ad un cambio di porta).

Ci sono tre macro-casi da considerare, a questo punto.

Se l’auto si trova nella porta 1, possono capitare i seguenti casi, modellati da rispettive triple di valori interi:

(1,1,2) L (l’auto era nella porta 1, viene rivelata la porta 2, il giocatore aveva scelto la porta 1 e la cambia: il giocatore perde)

(1,1,3) L (l’auto era nella porta 1, viene rivelata la porta 3, il giocatore aveva scelto la porta 1 e la cambia: il giocatore perde, di nuovo)

(1,2,3) W (l’auto era nella porta 1, viene rivelata la porta 3, il giocatore aveva scelto la porta 2 e la cambia: il giocatore stavolta vince)

(1,3,2) W (l’auto era nella porta 1, viene rivelata la porta 2, il giocatore aveva scelto la porta 3 e la cambia: il giocatore vince)

Se l’auto si trovava dietro la porta 2:

(2,1,3) W (l’auto era nella porta 2, viene rivelata la porta 3, il giocatore aveva scelto la porta 1 e la cambia: il giocatore vince)

(2,2,1) L (l’auto era nella porta 2, viene rivelata la porta 1, il giocatore aveva scelto la porta 2 e la cambia: il giocatore vince)

(2,2,3) L (l’auto era nella porta 2, viene rivelata la porta 3, il giocatore aveva scelto la porta 2 e la cambia: il giocatore vince)

(2,3,1) W (l’auto era nella porta 2, viene rivelata la porta 1, il giocatore aveva scelto la porta 3 e la cambia: il giocatore vince)

Se invece l’auto era dietro la porta 3:

(3,1,2) W (l’auto era nella porta 3, viene rivelata la porta 2, il giocatore aveva scelto la porta 1 e la cambia: il giocatore vince)

(3,2,1) W (l’auto era nella porta 3, viene rivelata la porta 1, il giocatore aveva scelto la porta 2 e la cambia: il giocatore vince)

(3,3,1) L (l’auto era nella porta 3, viene rivelata la porta 1, il giocatore aveva scelto la porta 3 e la cambia: il giocatore perde)

(3,3,2) L (l’auto era nella porta 3, viene rivelata la porta 2, il giocatore aveva scelto la porta 3 e la cambia: il giocatore perde)

W ed L fanno riferimento a Win e Lose, ovviamente, e li abbiamo lasciati come riferimento generale per sintetizzare l’esito del gioco. I casi sono 12 in tutto e quelli favorevoli sono 6, ed è qui che scatta il bias ingannevole: non è corretto dividere 6 per 12 per valutare la probabilità (come molti avevano fatto ottenendo 50%) perchè bisogna integrare nel discorso una funzione di probabilità associata ai singoli 12 casi. Contrariamente alle apparenze, infatti, non tutti i casi sono equiprobabili, come dimostra il semplice fatto che c’è solo una macchina in palio ed esistono due possibilità su tre di sbagliare che, in qualche modo, si “propagano” nel problema e ne influenzano la dinamica probabilistica.

Nel primo stadio abbiamo, pertanto, il posizionamento del premio dietro una delle tre porte: ogni scelta che facciamo avrà in questo caso probabilità 1 su 3 (1/3). I casi si dipanano a partire da qui, sul modello di un albero ternario in cui i nodi sono lo stadio in cui ci troviamo e i rami sono il caso che abbiamo scelto. Ogni ramo avrò un’etichetta che indica la probabilità che un qualcosa accada o meno. Se al secondo livello mettiamo la scelta operata dal giocatore, come abbiamo visto, potremmo combinare tutti i casi possibili in termini di due numeri:

  • (1,1) caso in cui il premio è dietro la porta 1, e il giocatore azzecca
  • (1,2) caso in cui il premio è dietro la porta 1, e il giocatore sbaglia
  • (3,3) caso in cui il premio è dietro la porta 3, e il giocatore azzecca

Se aggiungiamo anche un terzo livello le cose diventano un po’ più complesse: l’albero ternario non è completo, ma solo alcune delle scelte sono ammissibili nel gioco.

(1,1,2) L (l’auto era nella porta 1, viene rivelata la porta 2, il giocatore aveva scelto la porta 1 e la cambia: il giocatore perde)

(3,3,2) L (l’auto era nella porta 3, viene rivelata la porta 2, il giocatore aveva scelto la porta 3 e la cambia: il giocatore perde)

Se assumiamo di lavorare in uno spazio di probabilità possiamo definire una probabilità come una funzione P che associa ad ogni elemento dello spazio (dominio) un numero reale compreso tra zero e uno, tale che la somma di tutti i numeri dia 1 come risultato. Un esempio di funzione di probabilità valida è quella che associa la probabilità di uscita alle facce di un dado:

P(1) = 1/6 = 0.1666666…

P(2) = 1/6 = 0.1666666…

P(6) = 1/6 = 0.1666666…

il che ci torna, dato che ogni faccia del dado ha probabilità di 1/6 di uscire e la somma di tutti i valori fa 1 (1/6 + …+ 1/6= 6 * 1/ 6 =1).

Il problema di Monty Hall si presta in particolare ad alcune assunzioni specifiche, senza formulare le quali rischiamo di interpretarlo male:

  1. di base, la probabilità è sempre di 1/3;
  2. a prescindere di dove sia il premio, la probabilità rimane sempre di 1/3;
  3. a prescindere di dove sia il premio, il disvelamento della fase 3 (e solo questo!) avviene con probabilità 1/2;

Se andiamo ad etichettare l’albero delle scelte con le rispettive probabilità, la probabilità di ognuno dei 12 casi possibili è dato chiaramente dal prodotto delle probabilità incontrate nel cammino in questione.

La probabilità condizionata è, per inciso, un concetto chiave nella teoria delle probabilità che si riferisce alla probabilità di un evento che avviene dato che un altro evento è già avvenuto. In altre parole, la probabilità di un certo evento “A” dato che l’evento “B” è già accaduto è indicata come P(A|B), da leggersi come “la probabilità di A dato B“. Nel caso (1,1,2) abbiamo che:

P(1,1,2) = P che il premio sia dietro la porta 1 * P che il giocatore scelga la porta 1 * P che che sia rivelata la porta 2 = 1/3 * 1/3 * 1/2 = 1/18

Allo stesso modo, per capirci:

P(1,1,3) = P che il premio sia dietro la porta 1 * P che il giocatore scelga la porta 1 * P che che sia rivelata la porta 3 = 1/3 * 1/3 * 1/2 = 1/18

Oppure, ancora:

P(1,2,3) = P che il premio sia dietro la porta 1 * P che il giocatore scelga la porta 2 * P che che sia rivelata la porta 3 = 1/3 * 1/3 * 1 = 1/9

dove emerge una possibilità sottovalutata dall’intuito: se il premio è dietro la porta 1 e il giocatore sceglie la 2, Monty non potrà che rivelare la porta 3, perchè non può fare altrimenti dato che diversamente rivelerebbe la posizione del premio, motivo per cui l’evento avverrà con probabilità certa (1). Calcolando le probabilità solo degli eventi vincenti avremo pertanto che:

P(1,2,3) = P che il premio sia dietro la porta 1 * P che il giocatore scelga la porta 2 * P che che sia rivelata la porta 3 = 1/3 * 1/3 * 1 = 1/9

P(1,3,2) = P che il premio sia dietro la porta 1 * P che il giocatore scelga la porta 3 * P che che sia rivelata la porta 2 = 1/3 * 1/3 * 1 = 1/9

P(2,1,3) = P che il premio sia dietro la porta 2 * P che il giocatore scelga la porta 1 * P che che sia rivelata la porta 3 = 1/3 * 1/3 * 1 = 1/9

P(2,3,1) = P che il premio sia dietro la porta 2 * P che il giocatore scelga la porta 3 * P che che sia rivelata la porta 1 = 1/3 * 1/3 * 1 = 1/9

P(3,1,2) = P che il premio sia dietro la porta 1 * P che il giocatore scelga la porta 2 * P che che sia rivelata la porta 3 = 1/3 * 1/3 * 1 = 1/9

P(3,2,1) = P che il premio sia dietro la porta 1 * P che il giocatore scelga la porta 2 * P che che sia rivelata la porta 3 = 1/3 * 1/3 * 1 = 1/9

I sei eventi di potenziale vittoria sono mutuamente esclusivi, cioè se ne avviene uno non possono avvenirne altri contemporaneamente: quindi possono essere sommati tra loro (non moltiplicati, il che implicherebbe una probabilità condizionata come abbiamo visto). La probabilità che cercavamo, quella di valutare la bontà della scelta “cambiare porta” per massimizzare le chance di vittoria, sarà data da:

P = 6 * 1/9 = 3/2

come volevasi dimostrare. 6 sono i casi di “cammini” che portano alla vittoria, 1/9 è la probabilità di vincere nelle singole istanze di gioco. In modo completementare, la probabilità di perdere cambiare porta è di 6 * 1/ 18 ovvero 1/3. La probabilità di vincere cambiando porta è identica, per inciso, alla probabilità di perdere mantenendo la scelta della porta.

Immagine: https://it.wikipedia.org/wiki/Problema_di_Monty_Hall

👇 Da non perdere 👇



Trovalost esiste da 4497 giorni (12 anni), e contiene ad oggi 4869 articoli (circa 3.895.200 parole in tutto) e 15 servizi online gratuiti. – Leggi un altro articolo a caso
5/5 (3)

Ti sembra utile o interessante? Vota e fammelo sapere.

Questo sito contribuisce alla audience di sè stesso.
Il nostro network informativo: Lipercubo - Pagare online (il blog) - Trovalost.it