Translate Whole Page to Read and Solve

Τετάρτη 6 Δεκεμβρίου 2023

Θεωρία παιγνίων και το δίλημμα του φυλακισμένου


Πόσο κοστίζει ο εγωισμός; Γιατί εμείς οι άνθρωποι αργά ή γρήγορα πρέπει να μάθουμε να συνεργαζόμαστε; Ένα μαθηματικό παίγνιο μπορεί να απαντήσει σε αυτά τα ερωτήματα;
Καλιφόρνια 1950. Ο ψυχρός πόλεμος στα φόρτε του. Δύο Αμερικανοί μαθηματικοί, ο Merrill Meeks Flood και ο Melvin Dresher εργάζονται στο ερευνητικό κέντρο που τροφοδοτεί με μελέτες τις Αμερικανικές Ένοπλες δυνάμεις, τη RAND Corporation. Το ερευνητικό κέντρο ήθελε μελέτες στη θεωρία των παιγνίων με σκοπό την χρησιμοποίησή τους σε ενδεχόμενο πυρηνικό πόλεμο.

Κατά τη διάρκεια των ερευνών τους οι Flood και Dresher ανακαλύπτουν ένα απλό μαθηματικό μοντέλο σε μορφή παιγνίου στο οποίο οι δύο παίκτες μπορούν είτε να συνεργαστούν μεταξύ τους είτε να προδώσουν ο ένας τον άλλον. Τον ίδιο χρόνο, ο μαθηματικός Albert William Tucker (1905-1995), καθηγητής του νομπελίστα John Nash στο Princeton, απευθυνόμενος σε ψυχολόγους στο πανεπιστήμιο του Stanford, χρησιμοποιεί ένα παράδειγμα με φυλακισμένους και ποινές με σκοπό να κάνει πιο κατανοητό στο κοινό το παίγνιο των Flood και Dresher. Από τη διάλεξη του Tucker και έπειτα το παίγνιο ονομάζεται "Δίλημμα του Φυλακισμένου" και αποτελεί το πιο διάσημο πρόβλημα της θεωρίας των παιγνίων.

Το δίλημμα έχει ως εξής: Δύο άνθρωποι (εμείς θα τους αποκαλούμε Α και Β) είναι ύποπτοι για την τέλεση ενός εγκλήματος. Όμως η αστυνομία δεν έχει επαρκή στοιχεία για την ενοχή τους . Ο ανακριτής καλεί τον Α στο γραφείο του και του λέει τα εξής. Αν επιρρίψει την ευθύνη στον Β και ο Β δεν μιλήσει, θα αφεθεί ελεύθερος, ενώ ο Β θα κάνει 20 χρόνια φυλακή. Αν όμως και ο Β επιρρίψει την ευθύνη στον Α και οι δύο θα φυλακιστούν για 5 χρόνια. Αν δεν μιλήσει και τον καρφώσει ο Β, οι όροι αντιστρέφονται. Ο Β θα αφεθεί ελεύθερος και ο Α θα μείνει στη φυλακή για 20 χρόνια. Αν όμως και οι δύο δεν ομολογήσουν θα φυλακιστούν και οι δύο μόνο για 1 χρόνο. λόγω έλλειψης στοιχείων. Την ίδια συζήτηση κάνει και με τον Παίκτη Β. Ο Α και ο Β δεν συναντιούνται και δεν επικοινωνούν μεταξύ τους.

Ας έρθουμε λοιπόν στη θέση του Παίκτη Β. Σκέπτεται: "Αν ο Α με έχει καρφώσει, εμένα με συμφέρει να τον καρφώσω γιατί αν το κάνω θα φάω 5 χρόνια ενώ αν δεν το κάνω θα κάτσω στη στενή 20 χρόνια. Αν δεν με έχει καρφώσει, πάλι με συμφέρει να τον καρφώσω γιατί θα αφεθώ ελεύθερος ενώ αν δεν το κάνω θα κάτσω 1 χρόνο στη φυλακή. Άρα ό,τι και να κάνει ο Α εμένα με συμφέρει να τον καρφώσω".

Φωνάζει τον δεσμοφύλακα και του λέει ότι θα ομολογήσει και θα ρίξει την ευθύνη στον Α. Όμως και ο Α σκέφτεται με τον ίδιο τρόπο και τον καρφώνει. Συνεπώς και οι δύο φίλοι μας θα κάτσουν 5 χρόνια στη φυλακή.

Ήταν όμως λογική η επιλογή τους; Αν σκεφτούμε ότι και οι δύο σκέφτηκαν το συμφέρον τους, ναι. Και οι δύο έλπιζαν ότι ο άλλος δεν θα μιλούσε και θα αφήνονταν ελεύθεροι. Τα ήθελαν όλα για τον εαυτό τους. Να κερδίσουν όσο μπορούν περισσότερα ή έστω να υποστούν όσο το δυνατόν λιγότερη ζημιά. Να όμως που ο εγωισμός τους δεν έφερε το καλύτερο αποτέλεσμα και για τους δύο, δηλαδή να μην καρφώσει ο ένας τον άλλο και να τη γλιτώσουν φτηνά με ένα χρόνο φυλάκισης ο καθένας.

Το Δίλημμα του Φυλακισμένου έγινε ευρέως γνωστό στους επιστημονικούς κύκλους και απασχόλησε επιστήμονες από πολλούς και διαφορετικούς κλάδους. Οι οικονομολόγοι είδαν στα πρόσωπα των δύο φυλακισμένων τον homο economicus, τον άνθρωπο που συμπεριφέρεται έτσι ώστε να μεγιστοποιήσει το κέρδος και να ελαχιστοποιήσει το κόστος. Οι φιλόσοφοι ασχολήθηκαν με τα ηθικά διλήμματα των παικτών. Το δίλημμα του φυλακισμένου έχει εφαρμογές στο δίκαιο, την ψυχολογία, ακόμα και τη βιολογία. Πολύ εντυπωσιακό για ένα απλό μαθηματικό παίγνιο.

Ένας από τους επιστήμονες που εντυπωσιάστηκαν από το Δίλημμα του Φυλακισμένου στα τέλη της δεκαετίας του 1970 ήταν ο Αμερικανός μαθηματικός και πολιτικός επιστήμονας Robert Axelrod. Ο Axelrod βρήκε στο Δίλημμα του Φυλακισμένου μία πιθανή απάντηση στο ερώτημα που τον απασχολούσε: υπό ποιες συνθήκες δύο θεμελιωδώς εγωιστικά όντα μπορούν να επιλέξουν να συνεργαστούν; Για να απαντήσει στο ερώτημα δημιούργησε το Επαναλαμβανόμενο Δίλημμα του Φυλακισμένου, όπου το παίγνιο δεν παίζεται μια φορά αλλά πολλές. Στο Επαναλαμβανόμενο Δίλημμα του Φυλακισμένου οι παίκτες έχουν τη δυνατότητα να μάθουν από τα λάθη τους και να επανορθώσουν, ανοίγοντας έτσι ένα παράθυρο στην αμοιβαία συνεργασία.

Το 1979 καλεί τους σημαντικότερους θεωρητικούς των παιγνίων να υποβάλλουν στρατηγικές, υπό τη μορφή προγραμμάτων ηλεκτρονικών υπολογιστών, για να παίξουν το Επαναλαμβανόμενο Δίλημμα του Φυλακισμένου. Υποβάλλονται 14 στρατηγικές από ψυχολόγους, μαθηματικούς, κοινωνιολόγους και πολιτικούς επιστήμονες. O Axelrod βάζει τις διάφορες στρατηγικές να αναμετρηθούν μεταξύ τους. Νικητής του διαγωνισμού αναδεικνύεται ο Αμερικανοεβραίος μαθηματικός και ψυχολόγος Anatol Rapoport με τη στρατηγική Tit for Tat ή αλλιώς Μία Σου και Μία Μου. Η στρατηγική αυτή είναι πολύ απλή: Ο παίκτης ξεκινά συνεργαζόμενος με τον αντίπαλο και κατόπιν πράττει ότι έπραξε και ο αντίπαλος στον προηγούμενο γύρο. Συνεργάστηκε, θα συνεργαστεί. Πρόδωσε, θα τον προδώσει κι εκείνος στον επόμενο γύρο.

Ο Axelrod διοργάνωσε και ένα δεύτερο τουρνουά τον επόμενο χρόνο. Αυτή τη φορά υποβλήθηκαν 63 στρατηγικές. 62 καινούριες και η Μία Σου και Μία Μου. Πολλές από αυτές ήταν παραλλαγές του Μία Σου και Μία Μου. Η πιο πετυχημένη παραλλαγή ήταν η στρατηγική Δυο Σου και Μία Μου (Tit for Two Tats) του Βρετανού εξελικτικού βιολόγου και γενετιστή John Maynard Smith (1920-2004) όπου ο παίκτης προδίδει μετά από δύο συνεχόμενες προδοσίες. Όμως νικητής αναδείχθηκε και πάλι ο Rapoport

Το 1981 ο Axelrod μαζί με τον Βρετανό εξελικτικό βιολόγο William Donald Hamilton (1936-2000) δημοσιεύουν ένα άρθρο στο περιοδικό Science για την εξέλιξη της συνεργασίας. Σε αυτό μεταφέρουν τις μελέτες του Axelrod στην εξελικτική βιολογία και αποδεικνύουν ότι η συνεργασία είναι μια εξελικτικά σταθερή στρατηγική, δηλαδή μια συμπεριφορά που επιτρέπει να διαχυθούν τα χαρακτηριστικά που κάνουν ένα είδος να επικρατήσει και να επιβιώσει. Οι ζωντανοί οργανισμοί που συνεργάζονται μεταξύ τους έχουν περισσότερες πιθανότητες να αναπαραχθούν και επομένως να περάσουν τα γονίδιά τους στην επόμενη γενιά. Οι νυχτερίδες, τα ψάρια, οι μαϊμούδες, οι ιοί και οι βακτηριοφάγοι όπως ο φ6 χρησιμοποιούν κατά κόρον τη στρατηγική Μια Σου και Μία Μου.

Το άρθρο των Axelrod και Hamilton αποτελεί ένα από τα πιο πολυσυζητημένα επιστημονικά άρθρα και αναφέρεται συχνά στη σχετική βιβλιογραφία. Δεν είναι άλλωστε τυχαίο ότι το 1989 ένας από τους πιο διάσημους εκλαϊκευτές της επιστήμης, ο Βρετανός εξελικτικός βιολόγος Richard Dawkins, στη δεύτερη έκδοση του βιβλίου του Το Εγωιστικό Γονίδιο αφιερώνει ένα νέο κεφάλαιο στα ευρήματα του Axelrod και στην εφαρμογή τους στην εξελικτική βιολογία (Δυστυχώς αυτό το κεφάλαιο δεν υπάρχει στην ελληνική έκδοση του βιβλίου).

Ας φύγουμε λοιπόν τώρα από τη θεωρία και να περάσουμε στην πράξη. Όσο κι αν σας φαίνεται παράλογο η Μαφία, ο Ελευθεροτεκτονισμός και οι λοιπές μυστικές οργανώσεις έχουν μια πολύ καλή λύση στο να επιβάλλουν τη συνεργασία μεταξύ των παικτών στο Δίλημμα του Φυλακισμένου. Τον νόμο της σιωπής ή αλλιώς Ομερτά. Όποιος μιλήσει, όποιος προδώσει, πεθαίνει ή πέφτει σε δυσμένεια. Οπότε ο παίκτης δεν έχει να κάνει τίποτε άλλο από το να σιωπήσει, να συνεργαστεί και να αφήσει τον εγωισμό του στην άκρη. Το πρόβλημα λύνεται με την ιδιαίτερα μεγάλη αύξηση του κόστους της προδοσίας. Η προδοσία κοστίζει τη ζωή του παίκτη. Και η ζωή είναι ανεκτίμητη.

Όμως ο νόμος της σιωπής δεν είναι και η καλύτερη εναλλακτική λύση. Ίσως και εμείς οι άνθρωποι όπως και άλλοι ζωντανοί οργανισμοί να είμαστε γενετικά προγραμματισμένοι να συνεργαζόμαστε, πιθανόν με τη μορφή Μια Σου και Μια Μου. Ο Αμερικανός Edward Wilson, ο βιολόγος που το 1975 θεμελίωσε την Κοινωνιοβιολογία, υποστηρίζει πως όταν οι άνθρωποι συγκρότησαν κοινωνίες και δημιούργησαν πολιτισμό, η αλτρουιστική συμπεριφορά έγινε από ένστικτο κανόνας κοινωνικής συμπεριφοράς (social norm), μετά νομική επιταγή και τελικά ηθική αρχή. Οι κανόνες κοινωνικής συμπεριφοράς μας επιβάλλουν τη συνεργασία. Όμως αυτή η συζήτηση ξεφεύγει από τα όρια της εκλαϊκευμένης επιστήμης και περνά στα χωράφια των κοινωνικών επιστημών και της φιλοσοφίας.

Δεν υπάρχουν σχόλια:

Δημοσίευση σχολίου