Τρίτη, 25 Φεβρουαρίου 2014

Συνεταιριστικό παίγνιο

Ένα ενδιαφέρον πρόβλημα, συνεργασία του εκλεκτού φίλου Θανάση Παπαδημητρίου, τον οποίον και ευχαριστώ θερμά!
Σε ένα συνεταιρισμό $Ν$ ατόμων, με $N \geq 3$ ,κάποιος χορηγός κάνει την ακόλουθη πρόταση: Κάθε μέλος του συνεταιρισμού θα συνεισφέρει προαιρετικά σε ένα ειδικό ταμείο ένα ποσό $α$, το ίδιο για όλους όσοι επιθυμούν να συνεισφέρουν. Για κάθε μέλος που καταβάλλει το ποσό $α$, ο χορηγός θα καταβάλει ένα επιπλέον ποσό $β$, με: $\alpha < \beta <(N-1) \times \alpha$.
Το συνολικό ποσό που θα συγκεντρωθεί με τις καταβολές από τα μέλη και τα αντίστοιχα πρόσθετα ποσά από τον χορηγό, θα μοιραστεί εξίσου σε όλα ανεξαιρέτως τα $Ν$ μέλη του συνεταιρισμού, ασχέτως αν συνεισφέρανε ή όχι. Ποιο είναι το μέγιστο δυνατό και ποιο το αναμενόμενο κέρδος για κάθε μέλος του συνεταιρισμού, αν δεχτούμε πως κάθε μέλος επιδιώκει τη μεγιστοποίηση του κέρδους του;

31 σχόλια:

  1. Προσέθεσα ένα κάτω όριο για το Ν, και μια αλλαγή στη ανισοτική σχέση α,β, και Ν. Ζητώ συγγνώμη για την καθυστέρηση.

    ΑπάντησηΔιαγραφή
  2. Κάποιες αρχικές σκέψεις: Μεμονωμένα ένα μέλος του συνεταιρισμού δεν έχει κάποιο λόγο να συνεισφέρει ποσό α καθώς αν συνεισφέρει μόνο αυτός, ακόμα και με το μέγιστο ποσό β του χορηγού θα βγει χαμένος. Για να είναι κάποιος σίγουρος ότι δεν θα χάσει χρήματα πρέπει να είναι βέβαιος ότι θα συμμετέχουν τουλάχιστον τα μισά μέλη.
    Είναι προφανές ότι για το συνεταιρισμό σαν σύνολο, το βέλτιστο επιτυγχάνεται αν συμμετέχουν όλα τα μέλη του. Όμως αν δεν υπάρχει ποινή σε αυτόν που δε συμμετέχει είναι βέβαιο ότι όλοι θα προσπαθήσουν να κοροϊδέψουν υποσχόμενοι συμμετοχή, αλλά μη πραγματοποιώντας τη.

    ΑπάντησηΔιαγραφή
  3. Αν χ άτομα συνεισφέρουν από α ο καθένας και οι υπόλοιποι Ν-χ δε συνεισφέρουν, τότε στο ταμείο από εισφορές μελών και καταβολές του χορηγού μαζεύονται χ*α+χ*β=χ(α+β). Αυτό το ποσό μοιράζεται εξ ίσου στα Ν μέλη, δηλαδή σε όλους, και θα πάρουν έκαστος από χ(α+β)/Ν. Το καθαρό όφελος για καθέναν από τους χ που συνεισφέρανε από α έκαστος είναι χ(α+β)/Ν-α, ενώ για καθέναν από τους Ν-χ που δεν συνεισφέρανε είναι χ(α+β)/Ν.

    O μη συνεισφέρων οφελείται αλλά εάν σκεφτούν όλοι έτσι το αποτέλεσμα δεν θα είναι να μην συνεισφέρει κανείς και με αυτό τον τρόπο να μην δωθεί και κανένα εξτρά ποσό β? Επίσης όσοι πιο πολλοί δεν συνεισφέρουν τόσο πιο πολύ μικραίνει και το κέρδος τους αφού χ(α+β)/Ν και μικραίνει το χ. Ομοίως και για τους συνεισφέροντες αφού χ(α+β)/Ν-α και πάλι επηρρεάζονται από τη μείωση. Άρα απο τη μία αν ο καθένας προσπαθεί να ωφεληθεί μη συνεισφέροντας τόσο πιο πολύ μειώνεται το αναμενόμενο κέρδος του και έχουμε την κατάληξη που προανέφερα. Άρα υποθέτω πως η βέλτιστη συλλογική λύση είναι να συνεισφέρουν όλοι για να έχει κέρδος ο καθένας α+β-α=β
    Κάποιος μη συνεισφέρων θα ήθελε χ(α+β)/Ν>β άρα χ>β/(α+β)*Ν .Οι υπόλοιποι όμως Ν-χ θα έχουν κέρδος μικρότερο του β
    Άρα η καλύτερη λύση είναι η συνεργατική.
    Λαμβάνοντας όμως υπόψιν το στενό ατομικό συμφέρον του καθενός,δρώντας εγωιστικά ,δηλαδή μη συνεισφέροντας(για να μεγιστοποιήσει το κέρδος του που είναι χ(α+β)/Ν σε σχέση με αυτούς που συνεισφέρουν ( χ(α+β)/Ν-α)) τότε αυτό που αναμένεται να γίνει είναι να μην συνεισφέρει κανείς (αφού όλοι σκέφτονται εγωιστικά) και να μην δωθεί ποσό β από τον χορηγό (αφού δεν θα υπάρχει ούτε ένα ποσό α).Άρα επιδιώκοντας ο καθένας μαξιμουμ προσωπικό κέρδος στο τέλος δεν κερδίζει κανείς.

    ΑπάντησηΔιαγραφή
  4. Αν ο κάθε παίκτης αντιμετώπιζε στο τέλος της διαδικασίας τις ηθικές συνέπειες των πράξεών του από τους υπόλοιπους, τότε μάλλον όλοι θα συνεισέφεραν το ποσό α και τελικά όλοι θα είχαν το μέγιστο δυνατό όφελος.
    Αν όμως οι παίκτες δεν αντιμετώπιζαν συνέπειες τότε κάποιος από αυτούς θα σκεφτόταν ως εξής: "Αν καταβάλλω το ποσό α και κάνουν το ίδιο και όλοι οι υπόλοιποι τότε θα έχουμε όλοι το μέγιστο όφελος. Τότε όμως αν εγώ αλλάξω γνώμη θα έχω ακόμα μεγαλύτερο όφελος, γιατί θα μοιραστώ τα λεφτά των άλλων και του χορηγού χωρίς να δώσω τίποτα. Αν όμως όλοι σκεφτούν με αυτόν τον τρόπο τότε κανείς μας δεν θα καταβάλλει το ποσό και το όφελός μας θα είναι 0. Αν όμως όλοι το σκεφτούν αυτό τότε θα έπρεπε να καταβάλλουμε το ποσό ώστε να μεγιστοποιήσουμε το κέρδος μας." Έτσι οι παίκτες μπαίνουν σε έναν φαύλο κύκλο και δεν έχουν καμία καλή στρατηγική για να παίξουν το παιχνίδι. Αυτό στη θεωρία παιγνίων νομίζω λέγεται παιχνίδι χωρίς ισορροπία. Υπό αυτό το πρίσμα νομίζω πως δεν μπορεί κανείς να προβλέψει τι θα κάνουν οι υπόλοιποι, αφού δεν ξέρει ούτε τι πρέπει να κάνει ο ίδιος. Έτσι η γνώμη μου είναι πως δεν μπορούν να υπολογίσουν το αναμενόμενο κέρδος τους.
    Ηθικό δίδαγμα: όποιος κοροϊδεύει τους άλλους, κοροϊδεύει τα μούτρα του.

    ΑπάντησηΔιαγραφή
  5. Κάποια σχόλια και από εμένα. Το πρόβλημα έχει την ίδια υποκείμενη δομή με το "δίλημμα του φυλακισμένου", και όλες οι τοποθετήσεις των φίλων παραπάνω, με τις οποίες και συμφωνώ, καταδεικνύουν ότι το «κοινό συμφέρον» δεν είναι πάντα η επιλογή απόλυτα λογικά σκεπτόμενων ατόμων και πολλές φορές απόλυτα λογικά επιλογές μπορούν να οδηγήσουν σε ζημία για όλους τους εμπλεκόμενους. Η θεωρία των παιγνίων αναφέρει ότι σε μια τέτοια αντιπαράθεση, η προδοσία είναι η κυρίαρχη στρατηγική, δεδομένου ότι προσφέρει την ελαφρώς υψηλότερη πληρωμή σε ένα ταυτόχρονο παιχνίδι. Οι οικονομολόγοι αναφέρονται σε αυτό ως “Ισορροπία Nash”. Εφ'όσον λοιπόν το παιχνίδι γίνεται άπαξ (χωρίς επανάληψη οπότε να μπορεί να εφαρμοστεί η στρατηγική "κάνω ό,τι έκανες προηγουμένως", η τακτική που θα εφαρμοστεί θα είναι η εγωιστική και κανείς δεν θα συνεισφέρει.

    ΑπάντησηΔιαγραφή
  6. Ναι Στράτο, σύμφωνα με τον Nash η βέλτιστη στρατηγική είναι να μην πληρώσει ένας παίκτης γιατί αν αποκλίνει από αυτή και πληρώσει θα έχει ζημιά αντί για μηδενικό όφελος, από μία εγωιστική σκοπιά των πραγμάτων. Δεν είμαι όμως σίγουρος ότι οι παίκτες οφείλουν να κάνουν αυτό που θα ήθελε ο Nash.

    ΑπάντησηΔιαγραφή
  7. Πολύ ωραία και ενδιαφέροντα και βαθιά σχόλια από τους εκλεκτούς φίλους!
    Aς καταθέσω και γω κάποιες γενικές σκέψεις, χωρίς να είμαι και πολύ ειδικός στον μαθημ. φορμαλισμό στα παιχνίδια "Μη μηδενικού αθροίσματος" ,και περιμένοντας ασφαλώς και σχόλια/παρατηρήσεις από τον καθ'ύλην αρμόδιο του θέματος, τον Θανάση.
    Τα "Μαθηματικά της συνεργασίας" , δηλαδή τα no zero sun games, είναι φοβερά ενδιαφέροντα ,καθότι τα περίπλοκα παίγνια της πραγματικής ζωής (ανταγωνισμοί επιχειρήσεων, εξοπλισμοί, οικονομικά, κ.λ.π) είναι κατα κανόνα τέτοια.
    Συμφωνώ κι εγώ με τους προλαλήσαντες, πως το συνεταιριστικό παίγνιο δεν έχει (ή τουλάχιστον μοιάζει να μην έχει..σε περίπτωση που ο Θαν. μάς εκπλήξει. :-) ) σαγματικό σημείο ισορροπίας Nash. Αλλά νομίζω πως αυτό ήταν μάλλον αναμενόμενο, με την έννοια πως η θεωρία του Τζων Νας εφαρμόζεται κυρίως στα παιχνίδια n παικτών ,χωρις συνεργασία, και όπου απαγορεύονται οι συμμαχίες.
    Η ιδέα του Νας, είναι απόλυτα ορθολογιστική (εδώ ταιριάζει χιουμοριστικά, δεδομένης και της γνωστής ψυχικής ασθένειάς του, και το γνωστό ανέκδοτο: Tρελός είμαι ρε φίλε, όχι μ...ας! :-) ) .Όπως την έχω αντιληφτεί την ισορροπία Nash ,και χωρίς να παριστάνω πως γνωρίζω τον μαθηματικό της φορμαλισμό σε ικανοποιητικό έστω βάθος,έχει μία "εκ των υστέρων" παράμετρο, και θα την όριζα ως εξής:
    Aν φανταστούμε οτι πολλοί παίκτες παίζουν ένα παιγνίδι και ότι ο καθένας τους επέλεξε μια προκαθορισμένη στρατηγική (όποως στην περίπτωσή μας). ΜΟΛΙΣ κοινοποιηθεί το αποτέλεσμα του παιχνιδιού, ο κάθε παίκτης ας ρωτηθεί αν πιστεύει πως ο δικός του τρόπος ήταν ικανοποιητικός ή αν θα είχε προτιμήσει να παίξει διαφορετικά.
    Αν η απάντηση είναι θετική, και ΟΛΟΙ οι παίκτες θεωρούν ότι διάλεξαν μια καλή στρατηγική, το αποτέλεσμα (το σχετικό τετράγωνο στον "πίνακα πληρωμών") αποτελεί ένα σημείο ισορροπίας υπό την έννοια Nash. Θα επανέλθω πιθανόν αργότερα.

    ΑπάντησηΔιαγραφή
  8. Αν δεν θυμάμαι πολύ λάθος (αν ναι, ας με διορθώσει κάποιος!) ο Nash κατάφερε να αποδείξει ότι κάθε πεπερασμένο παιχνίδι ανάμεσα σε 2 άτομα έχει τουλάχιστον ένα σημείο ισορροπίας., και έτσι επέκτεινε το γμνωστό θεώρημα Minimax των Νόϋμαν και Μόργκενστερν (που εφαρμόζεται στα zero sum παίγνια).
    Υπ'αυτή την έννοια , το μόνο πιθανό αποτέλεσμα για το οποίο ΚΑΝΕΝΑΣ από τους Ν παίκτες ΔΕΝ θα μετάνιωνε είναι η στρατηγική "βάζω α" και παίρνω πίσω το ΜΕΓΙΣΤΟ δυνατόν.
    Τώρα ,το αν θα συμβεί αυτό σε real case study ,είναι μάλλον άλλο καπέλο.

    ΑπάντησηΔιαγραφή
  9. Mάλλον λάθος είναι το αποπάνω πόρισμά μου, τώρα που βλέπω αναλυτικά τις "πληρωμές" στο σχόλιο του Μπάτμαν.
    Καθότι δεν υπάρχει εξασφαλισμένο ΜΙΝΙΜΟΥΜ ΘΕΤΙΚΟ για οποιονδήποτε παίκτη, αν δεν υπάρξει μια μίνιμουμ συμμετοχή σε α.
    Άρα, δεν υπάρχει σταθερή λύση (υπο την έννοια Nash) και το παίγνιο είναι ασταθές. Αλλά πειμένω κι άλλες γνώμες και την θέση του Θανάση.

    ΑπάντησηΔιαγραφή
  10. Αυτό το σχόλιο αφαιρέθηκε από τον συντάκτη.

    ΑπάντησηΔιαγραφή
    Απαντήσεις
    1. Σωτήρη, καλό. :-) Αλλά κάπως cut the knot προσέγγιση, όχι; Aν γίνει αυτή η αλλαγή στο καταστατικό το παίγνιο γίνεται αυτόματα "δεδομένης βέλτιστης τιμής" και προφανώς όλοι συμμετέχουν με χαρά. Άσε που τότε, είναι μάλλον και μηδενικού αθροίσματος ,αφού ό,τι χάσει -προσφέρει ο σποόνσορας θα το κερδίσουν και μοιραστούν σίγουρα (και δίκαια-ισόποσα) όλοι οι N.

      Διαγραφή
    2. Σωστά. Πιο πολύ για αστείο το έγραψα. ;-)
      Σόρρυ που διέγραψα την αρχική μου ανάρτηση, αλλά δεν εμφανιζόταν ακόμη η απάντησή σου ενώ η ανάρτησή μου ήταν αρκετά ασύντακτη και την ξανάγραψα λίγο καλύτερα.

      Διαγραφή
  11. Η πιο λογική λύση και δεδομένου ότι μπορεί να δημιουργηθεί ένα πλειοψηφικό ρεύμα ατόμων που θα ήθελαν να συνεισφέρουν το ποσό α, καθώς πρέπει να συνεισφέρουν τουλάχιστον οι μισοί για να μην κινδυνεύουν να χάσουν χρήματα, είναι τα άτομα αυτά, σαν πρώτη προτεραιότητα, να αποφασίσουν την αλλαγή του καταστατικού, ώστε τα χρήματα να μοιραστούν μόνο σε όσους θα συμμετέχουν.
    Στη συνέχεια, με τα νέα δεδομένα, όλοι θέλουν πια να συνεισφέρουν.

    ΑπάντησηΔιαγραφή
  12. Ευχαριστώ και συγχαίρω τους φίλτατους Μπάτη, Πάνο, Στράτο, Σωτήρη και Γιώργο για τα εξαιρετικά σχόλια και τις επισημάνσεις τους. Επιτρέψτε μου να συνοψίσω κάπως την ανάλυση και τις κοινωνικές προεκτάσεις του παιγνίου, αφού πρώτα διευκρινίσω ότι το κάνω κατά καμιά έννοια ως ειδικός, αλλά ως ένας απλός, κριτικός και όχι φανατικός, ‘οπαδός’ της θεωρίας των παιγνίων:

    Το μέγιστο ποσό που μπορεί να συγκεντρωθεί στο κοινό ταμείο, από συνεισφορές όλων των μελών (Ν*α) και καταβολές από το χορηγό (Ν*β), είναι Ν*(α+β), που μοιράζεται στους Ν και παίρνει ο καθένας ποσό α+β. Με την αφαίρεση της ατομικής συνεισφοράς α, μένει στον καθένα καθαρή απόδοση/κέρδος β. Αυτό μοιάζει να είναι εκ πρώτης ένα φυσικό - ιδεώδες – βέλτιστο - δίκαιο αποτέλεσμα για το συνεταιρισμό και για τα μέλη του, που συνεισφέρουν όλοι και κερδίζουν όλοι εξ ίσου.

    Είναι όμως αυτό το βέλτιστο ταυτόχρονα και εφικτό / βιώσιμο, με δεδομένα τα ιδιοτελή κίνητρα των μελών; Με άλλα λόγια, αντιστοιχεί το αποτέλεσμα αυτό σε μια κατάσταση ισορροπίας, με την έννοια ότι κανένα μέλος δε θα μπει στον πειρασμό να το υπονομεύει; Δυστυχώς όχι και να γιατί:

    Κάθε μέλος έχει δύο εναλλακτικές στρατηγικές, συνεισφορά ή όχι και η μεταξύ αυτών επιλογή αποφασίζεται από σύγκριση των αποδόσεων καθεμιάς, σε συνδυασμό με τις ενδεχόμενες επιλογές των άλλων μελών. 'Εστω λοιπόν ότι ο αριθμός των άλλων που επιλέγουν να συνεισφέρουν είναι χ, οπότε αν εγώ επιλέξω να συνεισφέρω θα έχω απόδοση Α=(χ+1)*(α+β)/Ν - α, ενώ αν επιλέξω να μη συνεισφέρω θα έχω απόδοση Β=χ*(α+β)/Ν.

    Έχω λοιπόν:
    A = (χ+1)(α+β)/Ν - α = χ(α+β)/Ν + (α+β)/Ν - α
    B = χ(α+β)/Ν
    Επομένως: Α = Β + (α+β)/Ν - α ==> A = Β + [β-(Ν-1)α]/Ν ==> A-B = [β-(Ν-1)α]/Ν
    Αφού όμως ισχύει β<(Ν-1)α ==> Α-Β <0 ==> Α<Β για κάθε χ<Ν

    Αυτό σημαίνει ότι είτε επιλέγουν συνεισφορά όλοι οι υπόλοιποι, είτε δεν την επιλέγει κανένας τους, είτε την επιλέγουν κάποιοι και κάποιοι άλλοι όχι, για εμένα η επιλογή της συνεισφοράς είναι πάντα η επιλογή που μού μειώνει την καθαρή απόδοση σε σύγκριση με την επιλογή της μη συνεισφοράς, οπότε η επιδίωξη μεγιστοποίησης της απόδοσής μου / ελαχιστοποίησης της ζημιάς μου με οδηγεί αναπόφευκτα στην επιλογή να μη συνεισφέρω. Αν μάλιστα (σκέφτομαι) είμαι τυχερός και συνεισφέρουν όλοι οι άλλοι, τότε επιτυγχάνω το μέγιστο δυνατό ατομικό όφελος (Ν-1)*(α+β)/Ν, που είναι μεγαλύτερο από το ιδεώδες - βέλτιστο - δίκαιο β για τον καθένα. Αν αντίθετα επέλεγα να συνεισφέρω, ενώ κανένας από τους υπόλοιπους δε συνεισφέρει, τότε θα έγραφα καθαρή ζημία [β-(Ν-1)α] / Ν <0, ενώ επιλέγοντας να μη συνεισφέρω απλά δεν κερδίζω (στη χειρότερη περίπτωση), σίγουρα όμως ούτε χάνω κιόλας.
    (συνεχίζεται)

    ΑπάντησηΔιαγραφή
  13. Είναι η λογική του free rider / τζαμπατζή που δε συνεισφέρει καθόλου, αλλά (συν)καρπώνεται τις πιθανές συνεισφορές των άλλων. Επειδή όμως αυτός ο τρόπος σκέψης / στάθμισης των εναλλακτικών δεν αφορά μόνο εμένα, αλλά και όλα τα άλλα μέλη, το (θεωρητικό τουλάχιστον) αποτέλεσμα θα είναι να μη συνεισφέρει κανένας (εκτός κι αν υπάρχουν ‘βλάκες – κορόιδα’), και κατά συνέπεια είμαστε όλοι χαμένοι, με την έννοια της απώλειας ευκαιρίας να κερδίσουμε, αφού το τελικό καθαρό όφελος, για όλους ανεξαιρέτως, είναι 0.

    Να λοιπόν ποια είναι η κατά Nash ισορροπία στο παίγνιο. Επιλέγουν όλοι να μη συνεισφέρουν και το καθαρό όφελος για όλους και για τον καθένα είναι μηδενικό. Υπενθυμίζω ότι η ισορροπία Nash είναι το μίγμα των συνδυασμένων στρατηγικών των παικτών, στο οποίο κανένας παίκτης δεν έχει όφελος να μετακινηθεί από τη στρατηγική του, με δεδομένες τις στρατηγικές των άλλων παικτών. Είναι κατά κάποιον τρόπο το σημείο συνεπούς στοίχισης των προσδοκιών των παικτών (consistent alignment of beliefs). Και εδώ βλέπουμε ότι η κυρίαρχη στρατηγική κάθε παίκτη, οτιδήποτε κι αν επιλέξουν οι άλλοι παίκτες, είναι η στρατηγική της μη συνεισφοράς. Συνεπώς, το σημείο που θα στοιχιστούν με συνέπεια οι στρατηγικές όλων, η ισορροπία Nash του παιγνίου, είναι το να μη συνεισφέρει κανείς.

    Το πρόβλημα χαρακτηρίζεται από μια δομή που είναι χαρακτηριστική πολλών καταστάσεων που συναντάμε στην πραγματική ζωή. Είναι, όπως πολύ σωστά επεσήμανε ο Στράτος, η δομή του λεγόμενου ‘διλήμματος των κρατουμένων’, όπου η κυρίαρχη στρατηγική των παικτών / συμμετεχόντων είναι ‘απέχω’ (από τα βάρη, όχι τα οφέλη), ‘παρασιτώ’ 'εξαπατώ' (ότι κι αν επιλέγουν τελικά οι άλλοι) και το αποτέλεσμα είναι να χάνουν όλοι. Παρόμοιες δομές βαρών / ωφελειών και κινήτρων αναγνωρίζονται σε πλείστα όσα πεδία της κοινωνικής και οικονομικής δραστηριότητας (καταστροφή περιβάλλοντος, αστοχίες στη διαχείριση κοινόχρηστων αγαθών, οικονομικός και στρατιωτικός ανταγωνισμός, διαφθορά κ.ο.κ.) όπου τα ατομικά κίνητρα και οι εγωιστικές συμπεριφορές μάς απομακρύνουν συχνά από τα κοινωνικά βέλτιστα αποτελέσματα, υπονομεύοντας τελικά και το ίδιο το ατομικό συμφέρον.

    Σε συνάφεια με τα ζητήματα αυτά, υπάρχει μια μεγάλη συζήτηση για το κατά πόσο το ‘υπόδειγμα’ του λειτουργικού ορθολογιστή (μεγιστοποιού ατομικής ωφέλειας και στενόμυαλου εγωιστή) που γίνεται δεκτό στην ανάλυση και κατ’ επέκταση στην κρατούσα οικονομική θεωρία, αποδίδει ορθά, έστω κατά ‘ιδανική’ προσέγγιση, τις πραγματικές δομές των ανθρώπινων κινήτρων και συμπεριφορών και κατά πόσο μπορεί, συνεπώς, να προβλέψει την έκβαση τέτοιου είδους παιγνίων και διλημμάτων. Πόσο χώρο αφήνει τελικά η θεωρία και πώς εξηγεί έννοιες όπως κοινωνική αντίληψη και ευθύνη, συλλογικό συμφέρον, αλτρουισμός κ.ο.κ.; Το σίγουρο είναι ότι οι ισορροπίες που προβλέπει η ανάλυση της θεωρίας παιγνίων, χωρίς να ακυρώνεται η μεγάλη ισχύς της ως αναλυτικού εργαλείου, δεν επιβεβαιώνονται πάντα στα πραγματικά παίγνια της ζωής..

    ΑπάντησηΔιαγραφή
  14. Να πω ότι στο δίλημμα του φυλακισμένου, η ισορροπία Νας προβλέπει ότι θα ομολογήσουν και οι δύο. Στη περίπτωση μας τώρα, ας παρακολουθήσουμε τη σκέψη κάθε μεμονωμένου παίκτη, η οποία είναι κάπως έτσι:
    Οι υπόλοιποι παίκτες έχουν βάλει κάποιο ποσό, έστω Κ. Αν βάλω και εγώ το ποσόν α, τότε θα μοιραστούμε όλοι (Κ+α+β) /Ν, οπότε θα εχω καθαρό όφελος (Κ+α+β)/Ν-α.
    Αν δεν βάλω κανένα ποσόν, θα έχω καθαρό όφελος Κ/Ν, το οποίο, επειδή β<(Ν-1)*α, είναι μεγαλύτερο από το προηγούμενο όφελος, όπως άλλωστε το ανέλυσε σωστά ο Μπάτης. Επομένως, ο κάθε παίκτης που έβαλε ποσόν, από την καθαρά ατομική σκοπιά του, θα μετανοιώσει για την επιλογή του.

    ΑπάντησηΔιαγραφή
  15. Θανάση , σαπώ για την ακριβή ποσοτική ανάλυση, προσδιορισμό της ισορροπίας! και σαπώ^2 και για τις -γενικότερης φύσης-επεκτάσεις που έδωσες!

    ΑπάντησηΔιαγραφή
  16. Με πρόλαβε στη συλλογιστική ο Θανάσης, το σχόλιο του οποίου δεν ειχα δει, και με το οποίο φυσικά συμφωνώ απόλυτα

    ΑπάντησηΔιαγραφή
  17. Πάντως αν τα μέλη του συνεταιρισμού ήμασταν εμείς που γράψαμε τις σκέψεις μας μέχρι τώρα, τότε ο Μπάτης, ο Στράτος και ο Θανάσης δεν θα έδιναν δεκάρα τσακιστή, ο Γιώργος κι εγώ δεν θα ξέραμε τι να κάνουμε και ο Σωτήρης θα πρότεινε αλλαγή των κανόνων. Τρέχα γύρευε δηλαδή...

    ΑπάντησηΔιαγραφή
    Απαντήσεις
    1. Πέστο ψέματα Πάνο! :-)
      Aνάθεμα στα μη ντετερμινιστικά Μαθηματικά! :-)

      Διαγραφή
  18. Να κάνω μία μικρή παραλλαγή στο πρόβλημα;
    Ας υποθέσουμε ότι η κατάσταση επαναλαμβάνεται, π.χ. κάθε χρόνο (μήνα, μέρα, δεν έχει σημασία), εμφανίζεται ένας χορηγός και κάνει την ίδια πρόταση. Πως πιστεύετε ότι θα αντιδράσουν τώρα οι παίκτες τη πρώτη φορά, ξέροντας ότι η συμπεριφορά τους καταγράφηκε και ότι ακολουθούν και άλλες αντίστοιχες καταστάσεις; Μήπως τώρα θα ενεργήσουν διαφορετικά; Το ερώτημα δεν είναι ίσως τόσο μαθηματικό (που ίσως και να είναι), όσο κοινωνικό....

    ΑπάντησηΔιαγραφή
  19. Στράτο, ενδιαφέρουσα παραλλαγή βάζεις. Ψηφίζω ...μια απ'τα ίδια.:-) Δεχόμενοι πως οι παίκτες ,ακολουθώντας την ψυχρή "ατομική" λογική (που ταυτίζεται με την μαθηματική ,όπως την ποσοτικοποίησε ο Θανάσης) ενήργησαν την πρώτη φορά μη συμμετέχοντας, είναι πλέον πεπεισμένοι πως η ορθολογικότερη στρατηγική είναι η αλτρουιστική , την οποια αν ακολουθήσουν πάνω από τους μισούς, θα υπάρχει για τον καθέναν θετική απόδοση. Οπότε , σίγουρα > από τον κρίσιμο αριθμό θα συμμετέχουν, οπότε ΕΓΩ δεν θα συμμετέχω και μεγιστοποιώ την απόδοσή μου. Αλλά ΕΓΩ=ΟΛΟΙ σκέφτονται το ίδιο άπληστα , άρα και πάλι τζίφος. :-)

    Διάβασα εντελώς τυχαία(;) (δεν πολυπιστεύω στην Synchronicity του Γιουνγκ..,αλλά μια πισινή την κρατάω :-)) πριν, έναν κέλτικο λαϊκό μύθο/παραβολή που έχει μεγάλη σχέση με το θέμα μας, και τον μοιράζομαι με τους φίλους. Νομίζω θα αρέσει :
    Ο άπληστος άνθρωπος βάδιζε σ'ενα μονοπάτι όταν βλέπει τον φθονερό να προπορεύεται. Σαν άπληστος που είναι, ανοίγει το βήμα για να τον προσπεράσει και ο φθονερός (ως φθονερός!) του βάζει τρικλοποδιά. Καταλήγουν να παλεύουν μανιασμένα και κάποια στιγμή ο ένας σηκώνει μια πέτρα για να σπάσει το κεφάλι του άλλου. Κάτω από την πέτρα όμως ήταν για καλή (;) τους τύχη ένα μαγικό λυχνάρι, με την επιγραφή "Μία ευχή για σένα!" Ορμούνε και οι δυο να διεκδικήσουν το λυχνάρι, το τραβούν από δώ ,το τραβούν απο κεί, ΤΣΟΥΠ! πετιέται ένα τζίνι και τους λέει : "Kανονικά,προσφέρω την ικανοποίηση σε ένα άτομο, αλλά μιας και είστε δύο και έχω καιρό να ξεσκουριάσω, θα πραγματοποιήσω και στους δυο σας από μία ευχή. Αλλά δεν γίνεται να ακούσω παρά μόνο ένα αίτημα, έτσι θα κάνει ο ένας μία ευχή πρώτος και ο άλλος θα πάρει τα διπλά αυτομάτως!"
    Ερώτηση: Ποιος μίλησε πρώτος; και τι ζήτησε;
    (Θα ήταν καλό παζλ, αλλά εμπιστευόμενος την ικανότητα όλων των φίλων το κάνω ρητορικό. :-) )
    Aπάντηση: O φθονερός. Ο άπληστος δεν λέει τίποτε, γιατί σκέφτεται "Αν μιλήσει ο άλλος πρώτος, ό,τι και να ζητήσει , εγώ θα πάρω τα διπλά, άρα θα είμαι διπλά κερδισμένος!"
    Ο Φθονερός μιλάει λοιπόν πρώτος και λέει " Θέλω να μού βγάλεις ένα μάτι!"
    ΗΘΙΚΟΝ ΔΙΔΑΓΜΑ: Είτε οι μαθηματικοί είναι αρκούντως ανόητοι ώστε να πιστεύουν πως ο ορθολογισμός κινεί τον κόσμο, είτε (στα πλαίσια της Θ.Παιγνίων) είναι αρκούντως ..ένοχοι και υπόλογοι έναντι της ανθρωπότητας που πιστεύουν (όπως ο Nash) ότι τον κόσμο τον κινεί η απληστία, ενώ στην πραγματικότητα τον κινεί η ζηλοφθονία! :-)

    ΑπάντησηΔιαγραφή
  20. Πολύ ενδιαφέρουσα πράγματι η επέκταση που προτείνει ο Στράτος, όπως εξαιρετικά ενδιαφέρουσα και σχετική με τη συζήτηση για την ορθολογικότητα και την ανθρώπινη υποκίνηση η ιστορία που με μοναδική γλαφυρότητα μάς αφηγήθηκε ο Γιώργος.
    Το επαναλαμβανόμενο δίλημμα των κρατουμένων (ΕΔΚ) είναι ένα νέο, διαφορετικό παίγνιο που μπορεί να έχει διαφορετικές ισορροπίες από τη στατική εκδοχή του. Στη νέα εκδοχή, οι στρατηγικές των παικτών δεν είναι αναγκαστικά απλές κινήσεις ‘συνεργάζομαι’ ή ‘αποστατώ’ στη σειρά, αλλά ολοκληρωμένα σχέδια πολλαπλών διαδοχικών κινήσεων, καθεμιά από τις οποίες παίρνει feed back από το ιστορικό των προηγούμενων κινήσεων των άλλων και περιέχει τη δυνατότητα εναλλαγής μεταξύ συνεργασίας και αποστασίας.
    Οι τελικές αποδόσεις των παικτών, επίσης, οικοδομούνται σε μια μεγαλύτερη διάρκεια και όχι εφάπαξ, αφού αποτελούν άθροισμα των αποδόσεών του σε κάθε γύρο. Το γεγονός αυτό εισάγει, σε μια πιο αυστηρή ανάλυση, και την παράμετρο του χρόνου, με την έννοια της στάθμισης των παρουσών με τις αναμενόμενες μελλοντικές αποδόσεις, μέσω μιας διαδικασίας αναγωγής των επί μέρους αποδόσεων σε κοινή βάση (π.χ. με χρήση ενός προεξοφλητικού επιτοκίου για τις μελλοντικές αποδόσεις).
    Όταν το παίγνιο επαναλαμβάνεται και οι κινήσεις των παικτών σε κάθε γύρο καταγράφονται και παρατηρούνται από τους άλλους παίκτες, αποκτούν πλέον σημασία και υπόσταση οι έννοιες της παραδειγματικής συμπεριφοράς, της δοκιμασίας κάθε στρατηγικής, της τιμωρίας των αποστατών, της οικοδόμησης εμπιστοσύνης κ.ο.κ.
    Μεγάλη σημασία, σε κάθε περίπτωση, έχει ο ορίζοντας του παιγνίου (ο αριθμός επαναλήψεων) και το κατά πόσο αυτός είναι ορισμένος και γνωστός σε όλους τους παίκτες ή απροσδιόριστος. Στην πρώτη περίπτωση, θεωρητικά τουλάχιστον, ανεξάρτητα από τις στρατηγικές των παικτών στους αρχικούς γύρους, στον τελευταίο γύρο, αφού δεν υπάρχει το αύριο, η επιλογή όλων θα είναι η αποστασία. Καθώς όμως αυτό είναι δεδομένο και σε κοινή γνώση όλων, ο προτελευταίος γύρος καθίσταται ουσιαστικά τελευταίος και εν συνεχεία ο αμέσως προηγούμενος επίσης κ.ο.κ., οπότε μέσω αυτής της αντίστροφα επαγωγικής συλλογιστικής δεν υπάρχει χώρος για τη συνεργασία, ως επιλέξιμη στρατηγική, σε κανένα γύρο του παιγνίου.
    (συνεχίζεται)

    ΑπάντησηΔιαγραφή
  21. Διαφορετική είναι η κατάσταση σε απροσδιόριστο αριθμό γύρων, οπότε η διηνεκής προσδοκία πιθανής ύπαρξης και ενός επόμενου γύρου μετασχηματίζει / εξομοιώνει το παίγνιο με ένα παίγνιο άπειρου αριθμού γύρων. Εδώ πλέον ανοίγει χώρος για πιο περίτεχνα σχέδια στρατηγικών κινήσεων και σχεδίων, όπου αναδύεται ισχυρή η δυνατότητα της συνεργασίας ως μέρους τουλάχιστον μιας αποτελεσματικής, αμοιβαία ωφέλιμης, στρατηγικής.
    Γενικά, στο ΕΔΚ δεν υπάρχουν πλέον κυρίαρχες στρατηγικές για τους παίκτες, δηλαδή στρατηγικές που οδηγούν σε βέλτιστη ωφέλεια κάθε παίκτη ανεξαρτήτως των στρατηγικών των άλλων παικτών, ενώ οι ισορροπίες Nash είναι πολλαπλές και όχι μία, όπως είναι στο στατικό ΔΚ. Μάλιστα, όπως αποδεικνύεται και μαθηματικά, οι αποδόσεις των παικτών σε κάθε τέτοια ισορροπία κυριαρχούν, τουλάχιστον ασθενώς, των αποδόσεων του στατικού παιγνίου, πράγμα που μας λέει ότι η εισαγωγή της συνεργασίας στη ΄σύσταση’ των στρατηγικών των παικτών ωφελεί τουλάχιστον έναν παίκτη, ενώ δε βλάπτει κανέναν, σε σύγκριση με τη στρατηγική της αποστασίας σε κάθε γύρο του στατικού ΔΚ.
    Μια απλή στη διατύπωση και εφαρμογή της στρατηγική στο ΕΔΚ, που έχει αποδειχθεί ασυναγώνιστη και πειραματικά, είναι η στρατηγική ‘μία σου και μία μου’ (tit for tat). Η στρατηγική αυτή, σε ΕΔΚ μεταξύ δύο παικτών, ξεκινάει με επιλογή συνεργασίας στον πρώτο γύρο και στη συνέχεια, σε κάθε γύρο, ανταπόδοση της στρατηγικής που επέλεξε ο αντίπαλος στον αμέσως προηγούμενο γύρο (συνεργασία ή αποστασία, αναλόγως). Η στρατηγική αυτή περιέχει τέσσερα βασικά και αποτελεσματικά συστατικά: καλοσύνη (αφού ξεκινάει με επιλογή συνεργασίας), σαφήνεια (αφού απλά επαναλαμβάνει την προηγούμενη επιλογή του αντιπάλου), προκλητικότητα (αφού τιμωρεί την αποστασία με αποστασία) και συγχωρητικότητα (αφού αφήνει πάντα ανοιχτή τη δυνατότητα αποκατάστασης της συνεργασίας).
    Θα αναφέρω, ως παραλειπόμενο, ότι σε ένα μεγάλο διαγωνισμό στρατηγικών σε ΕΔΚ, που διοργάνωσε ο παιγνιοθεωρητικός R.Axelrod το 1980 στο Michigan, με στρατηγικές υλοποιημένες σε προγράμματα Η/Υ, ο αλγόριθμος της στρατηγικής tit for tat που παρουσίασε ο καθηγητής μαθηματικών Anatol Rapoport κέρδισε σε συνολικό επίπεδο όλες τις άλλες στρατηγικές.

    ΑπάντησηΔιαγραφή
  22. Καθώς το συγκεκριμένο πρόβλημα μας έδωσε την ευκαιρία να το συνδέσουμε εκτός από μαθηματικά, και με κοινωνικές, πολιτικές, ηθικές, ψυχολογικές κλπ προεκτάσεις, θα ήθελα να δώσω ένα παράδειγμα από τον τομέα της αγοράς, Είναι η περίπτωση όπου δύο εταιρείες αγωνίζονται για την κυριαρχία στο ίδιο κομμάτι της αγοράς. Στη πιο απλοϊκή μορφή του θα μπορούσε να διατυπωθεί ως εξής:

    Σε μια περιοχή υπάρχουν μόνο δύο καφετέριες και ο νόμος λέει ότι στην αρχή κάθε μήνα ο κάθε ιδιοκτήτης πρέπει να ορίζει την τιμή του καφέ για το κατάστημα του για όλο τον προσεχή μήνα. Οι επιτρεπόμενες τιμές είναι μόνο δύο: 1 ευρώ και 1,5 ευρώ. Αν οι δυνητικοί πελάτες είναι πάντα οι ίδιοι, πόσο θα χρεώνουν τον καφέ οι δύο καφετέριες; Με την υψηλή ή τη χαμηλή τιμή;
    Οι δύο ιδιοκτήτες μπορούν να συμφωνήσουν και να κρατήσουν την τιμή στο 1,5 ευρώ. Οι πελάτες θα μοιραστούν δίκαια και στις δύο καφετέριες. Όμως αν ένας από τους δύο χαμηλώσει την τιμή, θα «κλέψει» πελάτες του άλλου και συνεπώς θα κερδίζει περισσότερα. Όπως σε όλα τα ανάλογα παραδείγματα, οι παίκτες τείνουν να «προδίδουν» ο ένας τον άλλο. Γιατί ο καθένας σκέφτεται ως εξής: Αν ο άλλος χρεώσει την υψηλή τιμή, εμένα με συμφέρει να χρεώσω τη χαμηλή, γιατί θα πάρω όλη τη πελατεία. Αν πάλι ο άλλος χρεώσει τη χαμηλή τιμή, πάλι με συμφέρει και εμένα η χαμηλή τιμή, ώστε τουλάχιστον να έχω τους μισούς πελάτες.

    Η κύρια διαφορά εδώ είναι ότι το «δίλημμα του καφέ» επαναλαμβάνεται, άρα μπορεί να προκύψει η συνεργασία. Αν κάποιος από τους δύο προδώσει τον άλλο, πρέπει να περιμένει ότι στο μέλλον ο αντίπαλός του θα κάνει το ίδιο. Είναι λοιπόν πιθανό να κρατήσουν και οι δύο την τιμή στο 1,5 ευρώ σχηματίζοντας ένα «καρτέλ» ακόμα και χωρίς συγκεκριμένη συμφωνία. Αυτό εξηγεί γιατί είναι πολύ δύσκολο για τους ελέγχους αντιτράστ να αποδείξουν την ύπαρξη των «καρτέλ»: μπορεί να υπάρχει σύμπραξη ανάμεσα σε εταιρείες που δραστηριοποιούνται στον ίδιο τομέα ακόμα και χωρίς συγκεκριμένες μυστικές συμφωνίες.

    ΑπάντησηΔιαγραφή
  23. Η ενδιαφέρουσα case study του Στράτου μού δίνει αφορμή να παραθέσω και μια δυνητικά θετική λειτουργία της λογικής του ΔΚ, το πώς δηλαδή η επιδίωξη του ιδιωτικού κέρδους των εμπόρων μπορεί να οδηγεί στην εξυπηρέτηση του δημόσιου συμφέροντος. Καθώς λοιπόν κάθε έμπορος έχει να επιλέξει μεταξύ της χαμηλής και της υψηλής τιμής και, παρόλο που σε απουσία ανταγωνισμού ο ίδιος θα προτιμούσε την υψηλή τιμή, η κυρίαρχη στρατηγική που του υπαγορεύει η δομή του ανταγωνισμού είναι η επιλογή της χαμηλής τιμής. Έτσι οι τιμές πέφτουν, το κυνήγι του κέρδους συμπιέζει ή εξαφανίζει το περιθώριό του και ο καταναλωτής απολαμβάνει φθηνά αγαθά. Είναι το λεγόμενο ‘αόρατο χέρι’, στη σκέψη του Άνταμ Σμιθ, που κινείται πίσω από τις πλάτες των ανθρώπων, συντονίζει τις εγωιστικές τους προσπάθειες και, σε αντίθεση με τα ‘ταπεινά’ τους ελατήρια, προάγει το δημόσιο συμφέρον.

    ΑπάντησηΔιαγραφή
  24. Γιώργο, μου άρεσε πολύ η παραβολή που έγραψες και το ηθικό δίδαγμα που έβγαλες!

    ΑπάντησηΔιαγραφή
  25. Μιας και ο λόγος για παραβολές και ηθικά διδάγματα, προτείνω και μια διαφορετική θεολογική / φιλοσοφική προσέγγιση του θέματος:
    Η στρατηγική ‘μία σου και μία μου’, που ανέφερα σε προηγούμενο σχόλιό μου, θυμίζει κάπως το ‘οφθαλμόν αντί οφθαλμού’ της Παλαιάς Διαθήκης. Η στρατηγική αυτή δίνει μεν χώρο στη συνεργασία, επιτρέπει όμως και την εξαπάτηση, έστω ως ‘τιμωρία’ στην εξαπάτηση των άλλων.
    Αν περάσουμε όμως από το ‘Κάνε στους άλλους ό,τι σού έχουν κάνει’ του Μωσαϊκού νόμου, στο χρυσό κανόνα του Χριστιανισμού ‘Μην κάνεις στους άλλους αυτό που δε θα ήθελες να σου κάνουν’, τότε πλέον δεν υφίσταται δίλημμα του κρατουμένου. Αφού η εξαπάτηση, ως επιλογή των άλλων, είναι η ανεπιθύμητη στρατηγική που μειώνει τη γενικότερη αλλά και τη δική μου ωφέλειά, τότε κι εγώ δε θα εξαπατήσω. ‘Ετσι η βέλτιστη απόδοση, για όλους και εξ ίσου, θα γίνει εφικτή, μη λογαριάζοντας καθόλου τις πιθανές ανταμοιβές σε μια μέλλουσα ζωή, που καθιστά ορθολογική τη συνεργασία ακόμα και για τους εγωιστές :-).
    Και καθώς φυσικά δεν είναι μόνο οι θρησκευτικές ηθικές διδασκαλίες που αντιμάχονται το στείρο εγωισμό, οι φιλοσοφημένοι αλλά μη θρησκευόμενοι ορθολογιστές ας ανατρέξουν στην ‘Κατηγορική προσταγή’ του Καντ, η οποία συστήνει τον ίδιο ακριβώς κανόνα.

    ΑπάντησηΔιαγραφή
  26. Ωραιες οι προεκτασεις που θετεις Θαναση. Εκτος απο τις ηθικες επιπτωσεις απο τους υπολοιπους παικτες που ανεφερα, υπαρχουν για καποιους επιπτωσεις στον "αλλο κοσμο", ενω για καποιους αλλους η ηθικη τους οριζεται απο τους ιδιους και αποτελει τον οδηγο του βιου τους, ανεξαρτητα απο την ανταμοιβη ή οχι απο τους αλλους. Αυτα τα παραδειγματα ειναι πιο πραγματικα απο τον εγωιστη ορθολογιστη του Νας και γι αυτο οι ανθρωπινες συμπεριφορες κανουν τοσο δυσκολη τη διατυπωση ρεαλιστικων θεωριων στη θεωρια παιγνιων.

    ΑπάντησηΔιαγραφή
  27. Θα συμφωνήσω Πάνο ότι κανένας ηθικός κανόνας δε χρειάζεται, για την επικύρωσή του, θεολογική / θρησκευτική αναφορά ή επίκληση σε οποιαδήποτε αυθεντία. Και κανένας κανόνας πράξης που βασίζεται αποκλειστικά στην προσδοκία ανταμοιβών σε κάποια μεταθανάτια ζωή δεν μπορεί να είναι ουσιαστικά ηθικός.
    Πιστεύω παρ' όλα αυτά ότι οι ηθικοί κανόνες δεν είναι προϊόντα επιλογής κάποιας ελεύθερης ατομικής βούλησης. Είναι προϊόντα κοινωνικής αλληλεπίδρασης σε συγκεκριμένα πολιτισμικά πλαίσια και, ως τέτοια, υπόκεινται σε διαφοροποίηση και εξέλιξη. Με την έννοια αυτή, θα μπορούσε να αποτελούν επιτυχημένες στρατηγικές που έχουν προκύψει εξελικτικά από επαναλαμβανόμενα κοινωνικά παίγνια.

    ΑπάντησηΔιαγραφή
  28. Μάλλον εδώ ,σε αυτή την ωραία ανάρτηση και παλιά συζήτηση, ταιριάζει να πούμε ένα τελευταίο αντίο σε ένα μεγάλο μυαλό.
    Farewell τρελοαπίθανε και αδικοχαμένε Τζων Νας!

    ΑπάντησηΔιαγραφή