Τρίτη 8 Οκτωβρίου 2013

Πιθανοτικές προβλέψεις και απροσδιοριστία

"..Σε τί μπορώ να ελπίζω;..."
Ιμάνουελ Καντ
Ας υποθέσουμε πως ο κος Ταδόπουλος, που προβλέπει σωστά  στο 75%  των περιπτώσεων, προβλέπει ότι ένα γεγονός Χ δεν θα συμβεί. Φαίνεται λοιπόν πως η πιθανότητα να συμβεί το Χ είναι 0,25. Ο κος Δεινόπουλος από την άλλη, που προβλέπει σωστά με επιτυχία στο 60% των περιπτώσεων, ισχυρίζεται πως το γεγονός Χ θα συμβεί! Δεδομένων αυτών των προβλέψεων (και της αναλογούσας a priori αξιοπιστίας για κάθε κύριο), ποια είναι η πιθανότητα πως το Χ θα συμβεί;

Ουσιαστικά το πρόβλημα έχει τρεις παραμέτρους. Την Τ (η πρόβλεψη Ταδόπουλου). Την Δ (η πρόβλεψη Δεινόπουλου) , και την Α (Αληθινή/τελική έκβαση , δηλαδή Χ ή "όχι Χ")
Έτσι, θέτοντας "ν" και "ο" ,όπου "ναι" και "όχι" αντίστοιχα, να σημαίνουν Χ και "όχι Χ" ,έχουμε για τις 8 διαφορετικές δυνατότητες και τις πιθανότητές τους:
Τ  Δ  Α  Πιθανότητα
ο  ο  ο   p0
o  o  ν   p1
o  ν  ο   p2
ο  ν  ν   p3
ν  ο  ο   p4
ν  ο  ν   p5
ν  ν  ο   p6
ν  ν  ν   p7
όπου: p0+p1+p2+p3+p4+p5+p6+p7=1
Επίσης, μια και Τ=Α στο 75% των περιπτώσεων, έχουμε:
p0+p2+p5+p7=0,75
και μια και Δ=Α στο 60% των περιπτώσεων, έχουμε:
p0+p3+p4+p7=0,60
Το ζητούμενο λοιπόν ισοδυναμεί με τον προσδιορισμό της πιθανότητας ότι Α=ν(αι) δεδομένου ότι
Τ=ο(χι) και Δ=ν.
Έτσι, πρέπει να βρούμε την τιμή: p3/(p2+p3), η οποία είναι η πιθανότητα για [ο ν ν] ,διά την πιθανότητα για [ ο ν *]  ,όπου "*" σημαίνει: "είτε ν ,είτε ο"
Ξεκάθαρα πλέον, βλέπουμε ότι το πρόβλημα ΔΕΝ είναι σαφώς και μονοσήμαντα ορισμένο!
Θέτοντας χάριν απλοποίησης a=p0+p7, b= p1+p6, c=p2+p5 και d=p3+p4, οι συνθήκες μας μετασχηματίζονται ως ακολούθως:
a+b+c+d=1
a+c=0,75
a+d=0,60
Aυτό είναι ένα γραμμικό σύστημα 3 εξισώσεων με 4 αγνώστους (συν την έξτρα δέσμευση ότι κάθε πιθανότητα ανήκει στο διάστημα 0 ώς 1) , το οποίο έχει άπειρες λύσεις.
Για παράδειγμα, μπορούμε να θέσουμε a=0,5  b=0,25  c=0,15 και d=0,10 και να ικανοποιήσουμε και τις 3 εξισώσεις.  Aλλά θα μπορούσαμε κάλλιστα να θέσουμε επίσης:
a=0,6  b=0,25  c=0,15 και d=0
Επιπροσθέτως (εξίσου σημαντικό!) , ακόμη κι αν αυθαίρετα επιλέξουμε κάποια από τις διάφορες λύσεις, υπάρχουν και πάλι άπειροι τρόποι να διαμερίσουμε τα c και d ώστε να δίνουν τις τιμές των p2 και p3. Έστω ας πούμε πως διαλέγουμε τη λύση με c=0,15 και d=0,10. Έχουμε σ'αυτήν την περίπτωση p2+p5=0,15 και p3+p4=0,10
Aν πάρουμε p4=0,10 και p5=0,00 έχουμε p3=0 και p2=0,15 άρα η πιθανότητα του Χ είναι 0.
Από την άλλη , μπορούμε εξίσου σωστά να πάρουμε p4=0 και p5=0,15 που μας δίνουν:
p3=0,10 και p2=0 , έτσι η πιθανότητα του Χ είναι 1.
Έτσι λοιπόν, κάθε απάντηση από το 0 έως και το 1 είναι αυστηρώς συνεπής(και άρα σωστή) με τις δοθείσες συνθήκες της εκφώνησης!
Tούτων λεχθέντων , κάποιος μπορεί εύλογα να ρωτήσει "Και τι γίνεται στην πραγματική ζωή σε ανάλογες περιπτώσεις"; Στο κάτω-κάτω και εκεί τα προβλήματα που αντιμετωπίζουμε ΣΥΧΝΑ (αν όχι πάντα..) είναι "ελλιπώς ορισμένα". Υπάρχουν "εύλογες" υποθέσεις που μπορούμε να κάνουμε , απουσία αναλυτικής πληροφόρησης, που θα μπορούσαν να μας οδηγήσουν σε "λογική-συγκεκριμένη" απάντηση; Συνήθως υπάρχουν!
Μια προσέγγιση θα ήταν να εκτιμήσουμε (ή "μαντέψουμε") το βαθμό συσχέτισης (correlation) που υπάρχει μεταξύ της αξιοπιστίας/ορθότητας προβλέψεων του Ταδόπουλου και του Δεινόπουλου. Για παράδειγμα ,αφού ο Ταδόπουλος (λόγω του 75%) μοιάζει "πιο έξυπνος-αξιόπιστος" από τον Δεινόπουλο, ας πούμε λόγου χάριν ότι είναι δύο Μετεωρολογικοί σταθμοί-φορείς ανισοβαρούς κύρους, μπορούμε εύλογα να υποθέσουμε πως ο Δ έχει δίκιο όταν και ο Τ έχει δίκιο και επίσης πως ο Δ έχει δίκιο σε κάποιες περιπτώσεις-πειράματα τύχης όταν ο Τ έχει άδικο!
Αυτό,με βάση τα παραπάνω, θα σήμαινε πως p3=p4=0 και p2>0, άρα η πιθανότητα να συμβεί το Χ θα ήταν 0.
Μια άλλη προσέγγιση ,θα ήταν να υποθέσουμε πως οι προβλέψεις των Τ και Δ είναι στατιστικώς ανεξάρτητες, με την έννοια ότι είναι το ΙΔΙΟ πιθανό να έχει δίκιο ο καθένας ανεξάρτητα με το αν ο ΑΛΛΟΣ έχει δίκιο ή άδικο. Εδώ βέβαια, πρέπει να παρατηρήσω ότι η πλήρης στατιστική ανεξαρτησία-μη συσχέτιση, είναι πολύ δύσκολη στην πραγματική ζωή. Είναι σχεδόν απίθανο να μην λαμβάνονται υπ'όψιν κάποιος ή κάποιοι κοινοί παρανομαστές/παράμετροι . Aυτή η υπόθεση θα σήμαινε:
0,60 = (p0+p7)/(p0+p2+p5+p7) = (p3+p4)/(p1+p3+p4+p6)
και: 0,75 = (p0+p7)/(p0+p3+p4+p7) = (p2+p5)/(p1+p2+p5+p6)
Θέτοντας κ=0,6 και μ=0,75 τα πιθανοτικά ποσοστά επιτυχίας για τους Δ και Τ αντίστοιχα, αυτές οι εξισώσεις μαζί με τις προηγουμένως αναφερθείσες δεσμεύσεις προσδιορίζουν μοναδικά τα τέσσερα αθροίσματα:
p0+p7 = κμ = 9/20
p1+p6 = (1-κ)(1-μ) = 2/20
p2+p5= (1-κ)*μ = 6/20
p3+p4 = κ* (1-μ) = 3/20
αλλά, ακόμη και τώρα, αυτές δεν καθορίζουν μονοσήμαντα  την τιμή p2/(p2+p3).
Xρειαζόμαστε ακόμη μία (τουλάχιστον) υπόθεση! Αυτή είναι η "Συμμετρία" ,δηλαδή το ισοπίθανο ή αλλιώς η ΟΜΟΙΟΜΟΡΦΗ ΠΙΘΑΝΟΤΙΚΑ ΚΑΤΑΝΟΜΗ της έκβασης ν(αι) ή ό(χι).
Μ'άλλα λόγια υποθέτουμε ότι η πιθανότητα οποιουδήποτε συνδυασμού 'ν' και 'ο' είναι ίση με αυτή του συμπληρωματικού συνδυασμού, αν αλλάξουν αμοιβαία μεταξύ τους θέσεις τα ν και ο.
Αυτό ισοδυναμεί με την υπόθεση πως το Χ (η πραγματική έκβαση. Π.χ αλήθεια-ψέμα, βροχή -μή βροχή για δύο μετεωρολογικούς σταθμούς, κ.λ.π.) έχει  μια a priori πιθανότητα ίση με 1/2, και ότι η πιθανότητα για σωστή πρόβλεψη είναι η ίδια, ανεξαρτήτως αν το Α είναι "ν" ή "ο".
Μ'αυτή τη βάση (και μ'αυτές τις προϋποθέσεις!) έχουμε:
p0=p7 , p1=p6 , p2=p5 , και p3=p4 και προκύπτει άρα:
p2= 6/40 , p3= 3/40 και p3/(p2+p3)= 1/3.
Eν κατακλείδι, με την προϋπόθεση πως οι Τ και Δ δεν είναι στατιστικώς συσχετισμένοι  και με την προϋπόθεση πως οι δύο εκβάσεις "ν(αι)"  και "ό(χι)" είναι συμμετρικές, η πιθανότητα για Χ , δεδομένου ότι ο Τ (75%) λέει ότι δεν θα συμβεί το Χ και ο Δ (60%) λέει πως θα συμβεί, είναι 33,3%. Κάθε (θετική) συσχέτιση μεταξύ Τ και Δ θα τείνει να μειώσει αυτή την πιθανότητα.
Για τους εκλεκτούς φίλους του ιστολογίου προτείνω το εξής ,ελαφρώς πιο πολύπλοκο αλλά πάνω στην ίδια λογική βασισμένο, πρόβλημα:
"Ας υποθέσουμε πως η ικανότητα του κυρίου Ταδόπουλου  να προσδιορίσει σωστά την έκβαση ενός μελλοντικού γεγονότος/πειράματος με τιμές ΑΛΗΘΕΣ/ΨΕΥΔΕΣ είναι 75%. Του κυρίου Δεινόπουλου είναι 60%, και του κυρίου Αλλόπουλου είναι 55%. Αν και οι τρεις κύριοι συμφωνούν ότι η έκβαση του πειράματος είναι "ΑΛΗΘΕΣ", είναι η πιθανότητα για "ΑΛΗΘΕΣ" 75% ; ή σταθμίζεται κάπου μεταξύ του 75% και του 55% ; "

6 σχόλια:

  1. Διευκρινιστικά/αποσαφηνιστικά να συμπληρώσω (στο τέλος του άρθρου μου) το εξής:
    Η ευρεθεισα Πιθανότητα (33,33%) για το Χ δεν είναι βεβαίως ίση με την a priori τιμη 1/2 που υποθέσαμε ,αντιστοιχώντας "συμμετρία" στην κατανομη των Ναι-Όχι (ΑΛΗΘΕΣ-ΨΕΥΔΕΣ, κ.λ.π) . Αν έχουμε κάποιον a priori λόγο να πιστεύουμε πως η πιθανότητα του Χ έχει διαφορετική τιμή από το 1/2 , θα μπορούσαμε να ξανακάνουμε τον υπολογισμό χρησιμοποιώντας αυτή την τιμή!
    Φυσικά, ΔΕΝ μπορούμε να χρησιμοποιήσουμε την υπολογεισμένη τιμή του Χ για τις συγκεκριμένες του προβλήματος συνθήκες, επειδή ακριβώς η a priori πιθανότητα του Χ εφαρμόζεται σε όλες τις δυνατές συνθήκες και ΟΧΙ ΜΟΝΟ όταν ο Τ λέει " δεν θα γίνει το Χ" και ο Δ λέει "θα γινει το Χ" !
    Για να συνυπολογίσουμε λοιπόν αυτήν την πληροφορία (αν την έχουμε διαθέσιμη!) ας ορίσουμε έστω ως x την a priori πιθανότητα του Χ , οπότε έχουμε:
    p0=κμ(1-x)
    p1=(1-k)(1-μ)x
    p2=(1-k)*μ*(1-x)
    p3=κ(1-μ)x
    p4=k(1-μ)(1-x)
    p5=(1-κ)μx
    p6= (1-κ)(1-μ)(1-x)
    p7= κ*μ*x
    Aρα η P(X)=p3/(p2+p3)= κ(1-x)μ / [(1-κ)μ(1-x) + κ(1-μ)x ]
    Bεβαίως, αν δεν έχουμε γνώση για την a priori πιθανότητα του Χ , απλώς υποθέτουμε x=1/2 , και ο παραπάνω τύπος γίνεται ο τύπος που έχω στο άρθρο.

    ΑπάντησηΔιαγραφή
  2. Καταρχάς, έχοντας ολοκληρώσει την ανάγνωση και φτάσει σε κατανόηση (ελπίζω) της ανάρτησης και του συμπληρωματικού σχολίου τού αγαπητού Γιώργου, με αφορμή και το εισαγωγικό κείμενο του Καντ, θέλω να συστήσω στους αγαπητούς φίλους του ιστολογίου, που τυχόν δεν έχουν διαβάσει ακόμη την 'Κριτική του Καθαρού Λόγου', του μεγάλου φιλοσόφου, να μη φοβηθούν να το κάνουν. Πρόκειται για ένα πολύ βατό κείμενο, που θα τους ξεκουράσει :-).

    Επί της ουσίας της ανάρτησης: Θα συμφωνήσω ότι το πρόβλημα είναι σαφώς υποκαθορισμένο ως προς τα βασικά του δεδομένα του, αν σε αυτά δεν συμπεριλαμβάνονται αφενός η ανεξαρτησία των προβλέψεων Ταδόπουλου και Δεινόπουλου και αφετέρου η a priori (να 'τος πάλι ο Καντ) πλήρης δική μας άγνοια /απουσία πληροφόρησης (από άλλες ενδεχομένως πηγές) για τις πιθανότητες να συμβεί ή όχι το όποιο γεγονός αφορά η πρόβλεψή τους. Η άγνοια αυτή και μόνο είναι νομίζω αρκετή για να αποδώσουμε αρχικές πιθανότητες από 1/2 στα ενδεχόμενα να συμβεί ή να μη συμβεί το γεγονός, οπότε έτσι καλύπτεται και ο απαιτούμενος όρος της συμμετρίας για να έχουμε σαφή καθορισμό και λύση (1/3). Η πιθανοτική κατανομή όμως του υπό πρόβλεψη γεγονότος αυτού καθαυτό δε νομίζω ότι έχει σχέση το πρόβλημα.

    Ως προς το επαυξημένο πρόβλημα με τους Ταδόπουλο, Δεινόπουλο και Αλλόπουλο, νομίζω ότι η τελική εκτίμηση πρέπει να είναι πάνω και από το 75%.

    ΑπάντησηΔιαγραφή
  3. Συμπληρώνω το προηγούμενο σχόλιό μου, ως προς την απάντηση στο επαυξημένο πρόβλημα, με τον ακριβή υπολογισμό της εκτίμησης πιθανότητας του ενδεχομένου 'ΑΛΗΘΕΣ'.

    Δεδομένου ότι οι τρεις κύριοι προβλέπουν όλοι 'ΑΛΗΘΕΣ', τα ενδεχόμενα είναι δύο: ή επαληθεύονται και οι τρεις με p1=0,75*0,60*0,55=0,2475 ή διαψεύδονται και οι τρεις με p2=0,25*0,40*0,45=0,045, οπότε η τελική εκτίμηση της πιθανότητας 'ΑΛΗΘΕΣ' είναι 0,2475/(0,2475+0,045)=0,846.., δηλαδή κάπου κοντά στο 85%.

    ΑπάντησηΔιαγραφή
  4. Kαι πάλι το πρόβλημα είναι "υποκαθορισμένο/απροσδιόριστο", αλλά αν εφαρμόσουμε την υπόθεση της "ανα-δύο ανεξάρτητοι προγνώστες" και της συμμετρίας "Α-Ψ", τότε στην γενική περίπτωση Ν προγνωστών, οι 2 αυτές υποθέσεις αρκούν.
    Αν Ν άνθρωποι/προγνώστες με αξιοπιστίες: α1, α2, ..., αN αντίστοιχα έχουν δώσει πρόβλεψη "ΑΛΗΘΕΣ", και αν υποθέσουμε ότι η ακρίβεια των προβλέψεών τους δεν έχουν στατιστική συσχέτιση, τότε η πιθανότητα για "ΑΛΗΘΗ' έκβαση είναι:
    p(ΑΛ)=α1*α2*α3*...*αn / [(α1α2...αn) + (1-α1)(1-α2)...*(1-αn)]

    Και στην περίπτωση μας άρa, όπου έχουμε
    α1=3/4 , α2=3/5 και α3=11/20 ο τύπος δίνει p=11/13 (ή 84,6%, όπως σωστά υπολόγισε ο αγαπητός papadim)

    ΑπάντησηΔιαγραφή
  5. Ευχαριστώ για την επιβεβαίωση, αγαπητέ Γιώργο.

    Με την ευκαιρία θέλω να προσθέσω ότι αυτό που εσύ ονομάζεις ‘συμμετρία Α-Ψ’ και από τη μεριά μου το περιέγραψα ως μια κατάσταση πλήρους a priori άγνοιάς μας ως προς τις ‘αντικειμενικές’ πιθανότητες του υπό πρόβλεψη γεγονότος Χ, δεν είναι τίποτε άλλο από τη λεγόμενη ‘αρχή της αδιαφορίας’ (principle of indifference, principle of insufficient reason), με βάση την οποία όταν δεν έχουμε καμιά πληροφόρηση που να ευνοεί τη μια έκβαση ως πιθανότερη έναντι της άλλης, τότε σε όλες τους αποδίδουμε ίσες πιθανότητες.

    Κι ένα τελευταίο σχόλιο, που αφορά το ερώτημα του Καντ που επέλεξες να παραθέσεις, ως προοίμιο της ανάρτησης. Από τα τέσσερα μείζονα ερωτήματα που διατρέχουν τη φιλοσοφία του, δεν είναι το κατ’εξοχήν θεολογικό ‘For what may I hope?’ αυτό που έχει τη μεγαλύτερη συνάφεια με το θέμα της ανάρτησης, αλλά το μεταφυσικό / επιστημολογικό ‘What can I Know?’ :-)

    ΑπάντησηΔιαγραφή
    Απαντήσεις
    1. Τουναντίον! To Wass kann ich wissen? (=What can I Know?) στην περίπτωσή μας δεν μπορεί να υπάρξει σαν ερώτημα αν δεν προϋπάρξει το Was darf ich hoffen? :-)
      Aν δεν ελπίσουμε πρώτα να ισχύει ότι δεν είμαστε ας πούμε σε ζώνη που βρέχει 5 ή 305 μέρες το χρόνο, ή δεν ελπίσουμε οι προγνώστες να ρίχνουν ουσιαστικά ζάρια (γιατί αλλιώς κάποια συσχέτιση αιτιοκρατικής φύσεως θα έχουν οι προβλέψεις μεταξύ τους) δεν μπορούμε να Wissen (γνωρίσουμε) τίποτα! (όπως έδειξα νομίζω με αρκούντως ικανοποιητική μαθηματική ακρίβεια). :-)
      Στα εντελώς σοβαρά τώρα αγαπητέ φίλε, το θέμα είναι μάλλον πιο πολύ φιλοσοφικό παρά μαθηματικό, αλλά οι "πρακτικές" του εφαρμογές είναι πολύ σημαντικές.
      ΥΓ. Eλπίζω μόνο να μην κατηγορηθώ ότι επιχειρώ να εισαγάγω την σύνδεση συχέτισης και αιτιότητας (correlation / causality) "από την πίσω πόρτα" ! :-)

      Διαγραφή