User:Airtraveller92/sandbox

= Torneo di Axelrod = Da Wikipedia, l'enciclopedia libera. Il torneo informatizzato di Axelrod è un esperimento riguardante l'emergenza dell'altruismo nell'iterazione del dilemma del prigioniero. Nel momento in cui il torneo è stato svolto, la cooperazione era un meccanismo non compreso appieno nell'ambito della biologia evoluzionistica, in quanto la selezione di gruppo si era dimostrata fallace come teoria per spiegare dinamiche di altruismo e cooperazione in chiave evoluzionistica.

Indice

 * 1 Cooperazione nel dilemma del prigioniero
 * 2 Dilemma del prigioniero iterato
 * 3 Il torneo
 * 3.1 Robustezza
 * 3.2 Stabilità
 * 3.3 Attuabilità iniziale
 * 4 Bibliografia

Cooperazione nel dilemma del prigioniero
Il dilemma del prigioniero è un famoso gioco in forma strategica, con la seguente formulazione classica:

Due criminali vengono accusati di aver commesso un reato. Gli investigatori li arrestano entrambi e li chiudono in due celle diverse, impedendo loro di comunicare. Ad ognuno di loro vengono date due scelte: confessare l'accaduto, oppure non confessare. Viene inoltre spiegato loro che: Questo gioco può essere descritto con la seguente bimatrice: In generale, la strategia cooperativa, cioè quella omertosa, garantirebbe a tutti e due i criminali di cavarsela con un numero basso di anni di carcere. Tuttavia, la razionalità dei due giocatori li spinge a confessare. Questo è vero perché qualunque cosa l'altro giocatore faccia, confessare è l'opzione che garantisce un numero minore di anni di galera. Si genera così un apparente paradosso poiché entrambi i giocatori, seguendo questo ragionamento, saranno portati a confessare ottenendo un pessimo verdetto per ciascuno. Il profilo di strategie (confessa, confessa) è l'equilibrio di Nash del gioco considerato.
 * 1) se solo uno dei due confessa, chi ha confessato evita la pena; l'altro viene però condannato a 7 anni di carcere.
 * 2) se entrambi confessano, vengono entrambi condannati a 6 anni.
 * 3) se nessuno dei due confessa, entrambi vengono condannati a 1 anno, perché comunque già colpevoli di porto abusivo di armi.

In un contesto più generale, la bimatrice del gioco è rappresentabile come segue: Gli elementi della matrice indicano il guadagno rispettivo dei giocatori riga e colonna. Il gioco del prigioniero è caratterizzato dal seguente ordinamento nei payoff:

(notare come, nell' enunciazione classica, sono indicati nella matrice dei payoff gli anni di carcere, ossia un guadagno in realtà negativo per il giocatore).

Dilemma del prigioniero iterato
Possiamo immaginare che due giocatori si affrontino più volte ripetutamente nel dilemma del prigioniero. Il gioco iterato presenta delle differenze qualitative con il gioco in forma strategica, la principale è che esistono infiniti equilibri di Nash (teoremi folk di Nash). Il profilo (D,D) = (Defeziona, Defeziona) quindi non è più l'unico realizzabile per due giocatori razionali ed intelligenti, ma è possibile realizzare anche payoff cooperativi.

Inoltre un importante teorema afferma che, una volta raggiunto un equilibrio di Nash per una popolazione di giocatori, la dinamica del replicatore conserva questo equilibrio. Questo consente di non dover più ipotizzare che i giocatori siano razionali ed intelligenti perché questi giochino all'equilibrio di Nash, ma anche piante ed animali esibiranno questo comportamento.

Quando si parla del mondo naturale però, un equilibrio in cui i giocatori cooperano appare controintuitivo: fare a meno di alcune risorse per aiutare un altro esemplare porta ad una diminuzione della fitness per l'individuo che ne fa a meno. Questo rende di difficile collocamento l'altruismo nel mondo naturale (per approfondire: vedi Selezione di gruppo).

Il mondo naturale tuttavia è pieno di esempi di interazioni tra animali o piante modellizzabili tramite il dilemma del prigioniero, in cui l'ordine dei payoff segue l'andamento tipico del gioco, nei quali si osservano meccanismi cooperativi.

La questione che segue dunque è come sia stato possibile che dei comportamento di tipo cooperativo siano emersi nel corso dell'evoluzione e secondo quali meccanismi.

Il torneo
Occorre identificare una strategia cooperativa (altruista) che sia:

- Robusta, cioè che si diffonda in una popolazione dove sono presenti molteplici strategie, anche competitive.

- Stabile, cioè resistente all' invasione di altre strategie.

- Attuabile inizialmente, cioè che sia conveniente da adottare inizialmente  in un ambiente prevalentemente non cooperativo.

Robustezza
Per verificare quali tipi di strategie possano prosperare in un ambiente vario di strategie più o meno complesse, lo scienziato politico Robert Axelrod ha condotto un torneo computerizzato per il Dilemma del Prigioniero. Le strategie sono state create da specialisti in teoria dei giochi, economia, sociologia, politica e matematica. Le regole erano quelle del dilemma del prigioniero iterato 200 volte. Le 14 strategie partecipanti venivano accoppiate a caso in ogni round, con alcune strategie anche abbastanza intricate.

Il risultato del torneo ha visto realizzare il punteggio massimo da una delle strategie più semplici: TIT FOR TAT.

Questa strategia consiste semplicemente nella cooperazione alla prima mossa e successivamente nell'imitazione della mossa dell'altro giocatore nel round precedente. Quindi TIT FOR TAT è una strategia di cooperazione basata sulla reciprocità. I risultati del primo round sono poi circolati e sono stati sollecitati input per un nuovo torneo. Questa volta c’erano 62 automi da 23 paesi e il numero di round non era fissato a priori. La maggior parte dei concorrenti avevano l’hobby del computer, ma c’erano anche professori di biologia evoluzionistica, fisica, computer science, oltre alle discipline rappresentate nel primo round. TIT FOR TAT è stata  iscritta nuovamente dal vincitore del primo round, professor Anatol Rapoport ed ha vinto ancora. Le caratteristiche principali di TIT FOR TAT sono tre: non è mai il primo a defezionare, può essere provocato e contraccambiare, e perdona dopo solo un atto di defezione. L’analisi ecologica, in cui una strategia viene introdotta nel round successivo in base al punteggio realilzzato nel round corente, ha evidenziato come TIT FOR TAT ha soppiantato tutti gli altri automi, ad ulteriore prova della sua robustezza in un ambiente variegato. Oltre alla robustezza dimostrata nel torneo di TIT FOR TAT, le altre due caratteristiche (stabilità e attuabilità iniziale) sono discusse in via teorica.

Stabilità
La strategia TIT FOR TAT garantisce un payoff cooperativo in caso di strategia cooperativa. Quindi, in linea di principio, una popolazione di automi TIT FOR TAT può essere invasa da altre strategie “nice” (cioè che non defezionano mai per prime), anch’esse cooperanti. Al contrario, TIT FOR TAT è resistente all’invasione contro strategie come ALLD (always defect), definite “nasty” (cioè che defezionano di propria iniziativa e non come ritorsione contro una defezione precedente).

Attuabilità iniziale
L’attuabilità iniziale di TIT FOR TAT dipende fortemente dall’ambiente circostante, cioè dalle strategie usate dagli altri automi. In una popolazione di ALLD, la strategia TIT FOR TAT non è conveniente, poiché il primo turno cooperativo la penalizza nel payoff finale. Questo rappresenta un problema per spiegare la diffusione di strategie cooperative in un ambiente sostanzialmente ostile. Gli autori dell’articolo si servono di un’altra teoria per spiegare l’emergenza di tali comportamenti, cioè la selezione parentale. Sarebbe cioè possibile l’adozione di un comportamento cooperativo verso gli individui vicini geneticamente (prole o fratelli); venendo quindi a creare una comunità (cluster) fortemente interagente che prospera attraverso la cooperazione, anche in un ambiente prevalentemente “nasty”. Queste “isole cooperative”, replicandosi più abbondantemente grazie al vantaggio della cooperazione reciproca, invaderanno quindi gradualmente la popolazione. Un meccanismo analogo di invasione da parte di strategie nasty non può esistere (l’interazione tra defettori avrebbe un risvolto negativo sul payoff).

Bibliografia
R. Dawkins, Il Gene egoista, Mondadori, 1992.

R. Axelrod, W.D. Hamilton, The Evolution of Cooperation, in Science, vol.211, n. 4489.