Τετάρτη 26 Μαρτίου 2014

Πρώτα ποιο;

Ένα πρόβλημα πιθανοτήτων του φίλου Θανάση Παπαδημητρίου (papadim).
Σε συνεχόμενες ρίψεις ενός συνηθισμένου τίμιου ζαριού όσες φορές χρειαστεί, ποιο από τα δύο ενδεχόμενα είναι πιθανότερο να συμβεί πρώτα: 
$α) $Δύο διαδοχικές εμφανίσεις του $5$ ή 
$β)$ Τρεις διαδοχικές εμφανίσεις αριθμών που διαιρούνται με το $3$;

50 σχόλια:

  1. Με monte carlo προσομοίωση (σε R) προκύπτει πιθανότερο το β.
    http://ideone.com/TbLdDe
    (Πατηστε fork για επανεκτέλεση της προσομοίωσης)

    Είχα υπολογίσει μέσο αριθμό ρίψεων 37 για το α) και 29 για το β), αλλά μάλλον κάτι έχω κάνει λάθος. Οι προσομοιώσεις (αν είναι σωστές κι αυτές) φαίνεται να συγκλίνουν σε 42 και 39 αντίστοιχα.

    ΑπάντησηΔιαγραφή
  2. Unknown, μια ερώτηση.
    Τα 40,084 και 40,205 στο τέλος (stdout) είναι οι τυπικές αποκλίσεις (standard deviation) για τις δυο περιπτώσεις αντίστοιχα;

    ΑπάντησηΔιαγραφή
    Απαντήσεις
    1. Όχι, είναι οι μέσες τιμές από 1000 επαναλήψεις (για κάθε περίπτωση)
      Το stdout είναι το "Standard output stream", εκεί δηλαδή εμφανίζεται το αποτέλεσμα.

      Διαγραφή
  3. Ευχαριστώ με τη σειρά μου το φίλο Unknown για την ενδιαφέρουσα πειραματική του προσέγγιση. Για τους φίλους που από την brute force των υπολογιστικών εργαλείων και των πολλαπλών (εικονικών) επαναλήψεων της ρίψης του ζαριού θα προτιμούσαν την brute reason των πιο θεωρητικών μαθηματικών, θα έλεγα ότι υπάρχει και τέτοια δυνατότητα, με ελάχιστες επαναλήψεις ενός απλού αριθμητικού υπολογισμού!.
    Προτείνω να σκεφτούμε, όπως έκανε και ο Unknown, με όρους αναμενόμενου αριθμού (δηλαδή μέσου όρου ή μαθηματικής ελπίδας) επαναλήψεων, για να συμβεί το ένα ή το άλλο από τα εξεταζόμενα ενδεχόμενα, και να εκφράσουμε τους αριθμούς αυτούς συναρτήσει των αντίστοιχων επαναλήψεων για την απλή εμφάνιση του 5 ή αριθμού διαιρούμενου με το 3. Υπενθυμίζω ότι για ένα στοιχειώδες ενδεχόμενο πιθανότητας p ο μέσος όρος επαναλήψεων μέχρι την εμφάνισή του είναι 1/p. Π.χ. για την εμφάνιση του 5 που έχει πιθανότητα 1/6, απαιτούνται κ.μ.ό. 6 επαναλήψεις.

    ΑπάντησηΔιαγραφή
  4. Κάπως έτσι σκέφτηκα (άλλαξα το όνομα Unknown σε κάτι λιγότερο κοινό).
    Δηλ το ενδεχόμενο εμφάνισης 2 διαδοχικών 5 θα έχει p1 = 1/36, άρα η αναμονή θα ήταν (1-p1)/p1 = 35, συν 2 ρίψεις με πεντάρια = 37. Αντίστοιχα και για το άλλο. Είναι σωστό όμως; (Τα αποτελέσματα του πειράματος δεν είναι ενθαρρυντικά.)

    ΑπάντησηΔιαγραφή
    Απαντήσεις
    1. Sehr geehrter freund "halb Wesen halb Ding" :-) ,
      nicht ganz genau so!
      Όχι 37. Όπως έγραψε κι ο papadim, ο μέσος όρος αναμονής για να δούμε ένα 5άρι είναι 6 ζαριές. Έστω πως έχουμε φερει το πρώτο 5 και η επόμενη ζαριά μας μπορεί να είναι και το 2ο πεντάρι που θέλουμε. Ένας διαισθητικός, αλλά ισχυρός λογικά τρόπος σκέψης είναι πως το μήκος της ακολουθίας είναι μεν random, αλλά το ΜΕΣΟ ΜΗΚΟΣ μιας τέτοιας κατάστασης είναι 7.
      xxxxx5x .Πόσες τέτοιου τύπου ακολουθίες θα δούμε προτού πάρουμε μία ακολουθία που να τελειώνει σε $55$ ; Το τελευταίο x μάς ενδιαφέρει μόνο και προφανώς έχουμε 1 στις 6 πιθανότητες να πάρουμε το δεύτερο 5. Αρα ο μέσος απαιτούμενος αριθμός τετοιων ακολουθιών είναι 6.
      Αν το πολ/σουμε αυτό με το "μέσο μήκος" έχουμε:
      $6 * 7=42$
      To ίδιο επιχείρημα ,μπορεί να εφαρμοστεί και για τριάδα. Ας πούμε αν θέλαμε 3 πεντάρια στη σειρά ,το μέσο μήκος αναμονής θα ήταν 42+1=43. Αρα 43*6=258 ζαριές ,κατά ΜΕΣΟ ΟΡΟ, πριν δούμε 3 διαδοχικά 5άρια. Χρειάζεται όμως ένα fine tunning για το δικό μας β) εδώ...

      Διαγραφή
  5. Πράγματι, οι αποκλίσεις μεταξύ του υπολογισμού σου και των ευρημάτων της προσομοίωσης είναι σημαντικές, ενώ οι επαναλήψεις του πειράματος νομίζω ότι είναι αρκετές για να αγνοηθεί το πειραματικό αποτέλεσμα. Επομένως, θα πρέπει μάλλον να βελτιωθεί κάπως ο θεωρητικός υπολογισμός για να καταλήγει εκεί που καταλήγει και η προσομοίωση.
    Θα πρότεινα να σκεφτούμε ως εξής: αν κ.μ.ό. μια εμφάνιση του '5' είναι ένα 'ναι' στη θέση 6 ενός string μετά από πέντε 'όχι' στις θέσεις 1-5 του string, τότε πόσες κ.μ.ό. επαναλήψεις ενός string 6+1 θέσεων θα χρειαζόμασταν μέχρι να δούμε ένα ακόμα 'ναι' στη θέση 7 πλάι στο 'ναι' της θέσης 6;

    ΑπάντησηΔιαγραφή
    Απαντήσεις
    1. Θανάση, γράφαμε ταυτόχρονα σχεδόν. Παρντόν για το ακούσιο καπέλωμα! Εξάλλου εσύ τα έγραψες καλύτερα και με μεγαλύτερη σαφήνεια μάλλον.

      Διαγραφή
    2. Παρακαλώ Γιώργη, να ΄σαι καλά! Εξήγησες ωραιότατα το 42 και με ανάλογο τρόπο μπορεί εύκολα πλέον να εξηγηθεί και το 39 της προσομοίωσης.
      Τι μένει τώρα; σκέφτομαι μήπως να ζητούσαμε από το φίλο halb Wesen halb Ding να έβαζε κανέναν προσομοιωτή να λύσει, εκτός από ‘ανούσιες ασκησούλες’ και κανένα πραγματικό πρόβλημα, όπως π.χ. 1-1 = χ :-)

      Διαγραφή
  6. Μετά από την ωραία ανάλυση της περίπτωσης των διαδοχικών εμφανίσεων του ‘5’, θα επιχειρήσω μια γενίκευση. Σε διακριτές κατανομές πιθανοτήτων, όπως ρίψεις ζαριών, νομισμάτων κ.ο.κ., ισχύουν τα ακόλουθα:
    Αν η πιθανότητα απλής εμφάνισης ενός ενδεχομένου σε μια δοκιμή είναι p, τότε:
    α. ο αναμενόμενος αριθμός δοκιμών Ε(1), μέχρι την πρώτη εμφάνιση του ενδεχομένου αυτού, είναι: Ε(1) = 1/p
    β. ο αναμενόμενος αριθμός δοκιμών Ε(ν), μέχρι την πολλαπλή εμφάνιση του ενδεχομένου ν φορές διαδοχικά, υπολογίζεται από την αναδρομική σχέση:
    Ε(ν) = [Ε(ν-1) + 1] * 1/p
    Από τις πιο πάνω σχέσεις α και β προκύπτουν εύκολα τα ακόλουθα:
    Ε(1) = 1/p
    E(2) = (1/p)^2 + 1/p
    E(3) = (1/p)^3 + (1/p)^2 + 1/p
    ….
    ….
    E(ν) = (1/p)^ν + (1/p)^(ν-1) + … (1/p)^2 + 1/p

    Αντικαθιστώντας τα p και ν με τις κατάλληλες τιμές κατά περίπτωση, έχουμε το μέσο ‘χρόνο αναμονής’ που ζητάμε.

    ΑπάντησηΔιαγραφή
  7. Ωραίος ο γενικός τύπος Θανάση. Ευχαριστούμε για το ωραίο θέμα!
    Το E(ν) = (1/p)^ν + (1/p)^(ν-1) + … (1/p)^2 + 1/p =
    $\frac{( p^{(-n)}-1 }{1-p} $
    Για p=1/6 και ν=2 (2συνεχόμενα 5) παίρνουμε Ε=42
    Για p=1/3 (αφού η πιθανότητα για 3 ή 6 είναι 1/3) και ν=3, παίρνουμε Ε=39. Άρα το β) θα συμβεί προτού συμβεί το α).
    Ας συμπληρώσω και τη διαισθητική προσέγγιση για το β).
    p(3 ή 6)=1/3 . Άρα το μέσο μήκος είναι 3+1=4
    4*3=12
    12+1=13
    13*3=39
    Μια εναλλακτική αυστηρή προσέγγιση είναι μέσω "generating functions" (γεννήτριες συναρτήσεις)που έχουμε ξαναδεί παλιότερα.
    Το να φέρουμε στην 1η ριξιά: 1,2,3,4 ή 6 συμβαίνει με πιθανότητα 5/6 και "κόστος/χρόνο σε ριξιές"=1 ,άρα αντιπροσωπεύεται από το $(5/6) x$
    Nα ρίξουμε 5 ,ακολουθόυμενο από 1,2,3,4 ή 6 έχει 5 στις 36 και κόστος χρόνου=2 ριξιές, άρα : $\frac{5}{36} x^{2}$
    5 ακολουθούμενο από 5 : (1/36 ,χρονος 2), άρα:
    $\frac{1}{36} x^{2}$
    Nα μην πολυλογώ ,με λίγη ανάλυση,προκύπτει η συνάρτηση: $f(x)= \frac{ \frac{1}{36} x^{2} }{1- \frac{5}{6}x- \frac{5}{36} x^{2} } $
    (Σημείωση: f(1)=1 o.k.)
    Tώρα για να βρούμε το Ε(ν), παραγωγίζουμε ,πολ/ζουμε με x kai υπολογίζουμε την τιμή στο 1.
    ...και προκύπτει Ε(ν)=42. (για x=1)
    To προχώρησα (παραγώγιση ξανά,κ.λ.π) και έχουμε
    Ε(ν^2)=3414
    Αρα η διακύμανση τπυ αριθμού ρίψεων είναι:
    E(n^2) - E(n)^2=3414-42^2=1650
    sqrt(1650)=40,62 = τυπική απόκλιση της κατανομής.
    (γι'αυτό και ρώτησα χθες σχετικά για την Μοντε-Κάρλο, halb Wesen)

    ΑπάντησηΔιαγραφή
    Απαντήσεις
    1. Ευχαριστώ όλους για τα διαφωτιστικά σχόλια. Ήδη κοιτάζω το σχετικό κεφάλαιο από το (κλασικό) βιβλίο του Feller - "An introduction to probability theory and its applications", σχετικά με Recurrent events (τόμος 1ος, - στη σελ. 324 αναφέρεται ο παραπάνω τύπος για τη μέση τιμή). Δεν είχα ξανασυναντήσει το θέμα. Αν έχετε υπόψη και κάποιο άλλο βιβλίο που διαπραγματεύεται το αντικείμενο αυτό, θα με ενδιέφερε να το ψάξω.

      Διαγραφή
    2. @halb Wesen:
      Introduction to Probability Models (10th edition) by Sheldon Ross (σελίδα 156. ) Υπάρχει ονλάιν:
      http://math39.com/book/409/Introduction_to_Probability_Models_by_%20Sheldon_M_Ross_www.math39.com.pdf

      Διαγραφή
  8. Να’ σαι καλά Γιώργη, ευχαριστώ με τη σειρά μου για την πλήρη και μαθηματικά αυστηρή κάλυψη του θέματος, μέσω γεννητριών συναρτήσεων κ.λπ.
    Αξιοσημείωτο είναι ότι ο υπολογισμός του μέσου ‘χρόνου αναμονής’ είναι ένα ιδιαίτερα χρήσιμο εργαλείο και για την πιθανοτική ανάλυση προτύπων διαδοχικής κατά σειρά εμφάνισης διαφορετικών ενδεχομένων και όχι αναγκαστικά πολλαπλής διαδοχικής εμφάνισης ενός και του ίδιου ενδεχομένου. Π.χ. κατά τον ίδιο στην ουσία τρόπο μπορεί να υπολογιστεί πόσο θα περιμένουμε κ.μ.ό μέχρι να δούμε ένα εξάρι, ακολουθούμενο από ένα μονό, ακολουθούμενο από ένα πολλαπλάσιο του 3, ακολουθούμενο από ένα 3+ κ.ο.κ.
    Αρκετά προβλήματα πιθανοτήτων (σε διακριτές τουλάχιστον κατανομές) που είναι δύσκολα διαχειρίσιμα μέσω της ευθείας προσέγγισης (ανάλυση του δειγματικού χώρου και απόδοση πιθανότητας σε κάθε ενδεχόμενο) λύνονται μάλλον εύκολα με ‘πλαγιοκόπηση’ μέσω υπολογισμού του μέσου όρου δοκιμών. Προτείνω ενδεικτικά, για όσους θα ήθελαν να δοκιμάσουν, την εξής ‘στοιχηματική’ εφαρμογή:

    Σε διαδοχικές ρίψεις ενός ζαριού όσες φορές χρειαστεί μέχρι την ανάδειξη νικητή, εάν ο Α στοιχηματίζει σε 2 διαδοχικές εμφανίσεις αριθμών που διαιρούνται με το 3, ενώ ο Β σε 3 διαδοχικές εμφανίσεις αριθμών που διαιρούνται με το 2, ποιες είναι οι πιθανότητες υπέρ του ενός και του άλλου παίκτη?
    (προσοχή! εδώ παίζει και ισοπαλία.)

    ΑπάντησηΔιαγραφή
  9. Θανάση, επιχειρώ μιας εντελώς διαισθητική προσέγγιση στην ενδιαφέρουσα "στοιχηματική εφαρμογή" που πρότεινες.
    Εφόσον έχουμε τομή στα ενδεχόμενα, και δη το $6$ ,που κάνει και στον Α και στον Β, μπορούμε νομίζω απλώς να "αφαιρέσουμε" το 6 σαν ενδεχόμενο,(ή να σκεφτούμε πως έχει ήδη έρθει ένα 6 αρχικά,που κάνει και στους δύο) οπότε το πρόβλημα ανάγεται στο ποιο είναι πιο γρήγορο: Να έρθει ένα 3 ή 6 Ή δύο συνεχόμενα 2,4, ή 6.;
    Το 1ο έχει Ε=(3+1)*3=12 και το 2ο έχει Ε=[((2+1)*2)+1]*2=14
    Άρα το Α συμφέρει.

    ΑπάντησηΔιαγραφή
    Απαντήσεις
    1. Πολύ σωστά καταλήγεις Γιώργο ότι οι πιθανότητες ευνοούν τελικά τον Α. Για να βρούμε όμως τις ακριβείς πιθανότητες υπέρ του Α και του Β, πέρα από τους μέσους χρόνους αναμονής για τις εμφανίσεις των αποτελεσμάτων που ευνοούν τον ένα ή τον άλλο παίκτη (12 και 14 αντιστοίχως, όπως σωστά τα υπολογίζεις, περιλαμβανομένων όμως σε αυτά και των ισοπαλιών), χρειαζόμαστε και έναν υπολογισμό του μέσου χρόνου αναμονής για την εμφάνιση της ισοπαλίας. Διευκρινίζω ότι για να έλθει ισοπαλία, θα πρέπει να εμφανισθεί μια από τις ακολουθίες 2-6-6 ή 4-6-6.

      Διαγραφή
    2. Τι εννοείς ακριβώς με το "ακριβείς πιθανότητες";
      Μέσες τιμές (expectation) δεν συγκρίνουμε εδώ; Αφού η ισσοπαλία περιλαμβάνεται στα Ε(Α) και Ε(Β) δεν επηρεάζει την επιλογή μας. Όχι;
      Ίσως κάτι έχω παρανοήσει στην εκφώνηση.

      Διαγραφή
    3. Γιώργο, με 'ακριβείς πιθανότητες' εννοούμε να βρούμε τις πιθανότητες να κερδίσει ο Α ή να κερδίσει ο Β, δηλαδή δύο αριθμούς που να αθροίζονται τελικά στη μονάδα. Η ισοπαλία δεν παίζει σαν τελική έκβαση του παιχνιδιού, αφού σε κάθε περίπτωση οι ρίψεις επαναλαμβάνονται μέχρι την ανάδειξη νικητή. Πρέπει όμως νομίζω να υπολογιστεί σαν ενδιάμεσο ενδεχόμενο. Αν λέγαμε ότι οι πιθανότητες είναι 14/12=7/8 υπέρ του Α έναντι του Β, δηλαδή Ρα=7/13 και Ρβ=6/13, δε νομίζω ότι θα ήμασταν ακριβείς.

      Διαγραφή
    4. Σόρι, 7/6 υπέρ του Α έναντι του Β

      Διαγραφή
  10. Αυτό το σχόλιο αφαιρέθηκε από τον συντάκτη.

    ΑπάντησηΔιαγραφή
  11. Αυτό το σχόλιο αφαιρέθηκε από τον συντάκτη.

    ΑπάντησηΔιαγραφή
    Απαντήσεις
    1. Γεια σου Ευθύμη, ευχαριστώ!
      Ο υπολογισμός σου για τις ισοπαλίες μας δίνει μεν την αναλογία των ισόπαλων τριάδων 2-6-6 ή 4-6-6 σε σχέση με όλες τις πιθανές τριάδες αποτελεσμάτων σε 3 διαδοχικές ρίψεις, αλλά αυτή η αναλογία, κατά τη γνώμη μου, δε μας δίνει την πιθανότητα ισοπαλίας στο παιχνίδι.
      Θα πρότεινα εναλλακτικά να υπολογίσουμε το μέσο χρόνο αναμονής μέχρι να εμφανιστεί μια ισόπαλη τριάδα, δηλαδή ένα string του τύπου (2ή4)-6-6, με μια κατάλληλη προσαρμογή του σχετικού αναδρομικού τύπου που αναφέραμε πιο πάνω. Εδώ οι πιθανότητες των στοιχειωδών ενδεχομένων είναι 1/3 για το 2 ή 4 (αναμονή 3 ρίψεις κ.μ.ό.) και 1/6 για το 6 (αναμονή 6 ρίψεις κ.μ.ό.).

      Διαγραφή
    2. Γειά σου Θανάση
      Η διαγραφή του σχολίου μου έγινε πριν το σχόλιο σου,όπως φαίνεται καθαρά από τους χρόνους ανάρτησης των σχολίων (ταυτόχρονα, 7:16 !)
      Πέραν της σύλληψης σωστής ή λάθους, λάθους προφανώς, ήταν λάθος και ο επιμερισμός!
      Αυτό που γράφεις και προτείνεις το σκέφτηκα και ο ίδιος θεωρητικά αλλά λόγω της ελάχιστης εμπειρίας μου δεν μπορώ να το κωδικοποιήσω!

      Διαγραφή
    3. Εννοούσα με το "η διαγραφή του σχολίου μου έγινε πριν το σχόλιο σου" ότι η ανάγνωση του σχολίου σου έγινε μετά την αποστολή του σχολίου μου, παρακάτω, που έγινε ταυτόχρονα με το δικό σου.

      Διαγραφή
  12. Με τις ισοπαλίες ενσωματωμένες οι μέσοι χρόνοι αναμονής
    για Α και Β είναι από τους τύπους που ήδη έχουμε
    Α:p=2/6=1/3 =>1/p=3 =>E(A)=3+3^2=12
    B:p=3/6=1/2 =>1/p=2 =>E(B)=2+2^2+2^3=14
    Εύρεση ισοπαλιών
    Από τις διατάξεις των 6 ανά 3 =120 οι 2 διατάξεις
    2-6-6 και 4-6-6 δίνουν ισοπαλία.(Πισοπαλίας=2/120)
    άρα στους 12+14=26 μέσους χρόνους οι μέσες ισοπαλίες είναι
    26*2/120=13/30
    Άρα για τον Α έχουμε 12-13/30=347/30
    και για τον B:14-13/30=407/30
    και η πιθανότητα νίκης υπέρ του Α έναντι του Β
    είναι (407/30)/(347/30)

    ΑπάντησηΔιαγραφή
  13. Να εξηγήσω λίγο καλύτερα τη σκέψη μου:
    Για να εμφανιστεί ισοπαλία, δηλαδή μια ακολουθία (2ή4)-6-6, θα χρειαστεί να περιμένουμε κ.μ.ό. [(3+1)*6+1]*6 = 150 ρίψεις.
    Τώρα ξέρουμε πλέον ότι κ.μ.ό.:
    ανά 12 ρίψεις κερδίζει ο Α ή έρχεται ισοπαλία,
    ανά 14 ρίψεις κερδίζει ο Β ή έρχεται ισοπαλία και
    ανά 150 ρίψεις έρχεται ισοπαλία
    Πώς θα μπορούσαν όλα αυτά να μεταφραστούν σε πιθανότητες;

    ΑπάντησηΔιαγραφή
  14. Άρα στις 150 ρίψεις που απαιτούνται κατά Μ.Ο να έρθει
    για πρώτη φορά ισοπαλία ο Α θα έχει 150*12/26= 900/13
    αναλογία ρίψεων νίκης ή ισοπαλίας
    και ο Β 150*14/26=1050/13 αναλογία ρίψεων νίκης ή ισ/λίας
    και άρα ο Α θα έχει αναλογία ρίψεων νίκης 900/13 -1=887/13 και ο Β 1050/13 -1=1037/13 και τελικά η πιθανότητα νίκης
    του Α έναντι του Β είναι (1037/13)/(887/13)=1037/887 >7/6 ?

    ΑπάντησηΔιαγραφή
  15. Ευθύμη, ο αναλογικός επιμερισμός των ισοπαλιών, με βάση το 12 και το 14, στα ενδεχόμενα νίκης του Α ή του Β αντιστοίχως, θα ήταν ίσως ενδεδειγμένος αν τα 12 και 14 εξέφραζαν μέσες περιόδους εμφάνισης των καθαρών ενδεχομένων νίκης του Α ή του Β, πράγμα που όμως δε συμβαίνει εδώ. Προτείνω επομένως να το αντιμετωπίσουμε ως εξής:
    Αν για ευκολία ορίσουμε ως Α, Β και Ι τα ενδεχόμενα νίκης του Α, νίκης του Β και ισοπαλίας αντιστοίχως, αυτό που ξέρουμε είναι ότι ισχύουν τα εξής:
    Ε(A U I) = 12, E(B U I) = 14 και E(I) = 150
    Αφού όμως ο δειγματικός χώρος των εκβάσεων του παιχνιδιού, περιλαμβανομένης και της ισοπαλίας, εξαντλείται στα ενδεχόμενα Α, Β και Ι, θα πρέπει οι λόγοι των μέσων περιόδων εμφάνισης των κατά περίπτωση εκβάσεων, όπως υπολογίστηκαν πιο πάνω, να εκφράζουν ακριβώς τους αντίστροφους λόγους των πιθανοτήτων των αντίστοιχων ενδεχομένων, δηλαδή:

    P(A U I) / P(B U I) = E(B U I) / Ε(A U I) ==>
    [P(A)+P(I)] / [P(B)+P(I)] = 14/12 και

    P(A U I) / P( I) = E( I) / Ε(A U I) ==>
    [P(A)+P(I)] / P(I) = 150/12

    'Εχουμε τώρα 2 εξισώσεις με 3 αγνώστους, τους P(A), P(B) και P(I) και μας λείπει μία εξίσωση. Ποια μπορεί να είναι αυτή;

    ΑπάντησηΔιαγραφή
  16. Θανάση λέω να το αντιμετωπίσω με την απλή λογική.
    Στις 150 ρ. ο Α έχει 150/12 (Ν+Ι) -1 Ι=23/2=11.5 Ν
    Στις 150 ρ. ο Β έχει 150/14 (Ν+Ι) -1 Ι =68/7 Ν άρα
    P(A)=11.5/(11.5+68/7 +1) =161/311=0.51768
    P(B)=(68/7)/(11.5+68/7 +1) =136/311 =0.4373
    P(I) =1/(11.5+68/7+1)=14/311=0.045

    Υ.Γ Και φυσικά η τρίτη εξίσωση είναι κάτι σαν την γάτα στα κεραμίδια...! :-)

    ΑπάντησηΔιαγραφή
    Απαντήσεις
    1. Ευθύμη, η απλή λογική είναι μία από τις σπανιότερες αρετές!
      Θαυμάσια, είναι ακριβώς όπως τα υπολόγισες. Το εύκολο τώρα (και απολύτως θεμιτό) είναι να κάνουμε και την αναγωγή των αναποφάσιστων (συγγνώμη, παρασύρθηκα από τις δημοσκοπήσεις, των ισοπαλιών θέλω να πω) στα καθαρά ενδεχόμενα υπέρ του Α και του Β και να πούμε ότι Ρ(Α)=161/297=54,21% και Ρ(Β)=136/297=45,79%.
      Για όσους δυσκολεύονται να φανταστούν σε τι μοιάζει μια γάτα στα κεραμίδια, να προσθέσω ότι είναι κάπως έτσι: P(A)+P(B)+P(I) = 1 :-)
      Μπράβο Ευθύμη και καληνύχτα!

      Διαγραφή
    2. Θανάση καλημέρα και σε ευχαριστώ για το ενδιαφέρον θέμα και τις ωραίες προσεγγίσεις σου, όπως και όλων των συμμετεχόντων!
      Δεν ανταποκρίθηκα στο τελευταίο σχόλιο σου γιατί είχα ήδη αποχωρήσει για ύπνο!

      Διαγραφή
  17. Καλημέρα. Επιτρέψτε μου κάποιες απορίες/ενστάσεις.
    Η πλήρης αντιμετώπιση -δεδομένου πως το παιχνίδι δεν έχει ισοπαλία και συνεχίζεται μέχρι νίκη Α ή νίκη Β- θεωρώ ότι απαιτεί χρήση transition probabilities. Δηλαδή μια στοχαστική Μαρκοβιανή αλυσίδα από διακριτές καταστάσεις (states) όπου και το κρίσιμα σημεία είναι το προτελευταίο state πριν τη νίκη (Α ή Β).
    Θανάση, οι τύποι που χρησιμοποιείς έχουν εφαρμογή για ξένα μεταξύ τους υποσύνολα (disjoint events) που σουμάρονται στον δειγματικό χώρο, και γενικά μιλώντας, παρότι η expectation είναι προσθετική ,δηλαδή E(X)+E(Y)=E(X+Y) (για Χ και Υ διακριτές μεταβλητές),ανεξαρτήτως αν οι Χ και Υ είναι mutually disjoint ή ΟΧΙ, οι πιθανότητες ΔΕΝ είναι.
    Με απλά λόγια, δεν μπορούμε να ξεχωρίσουμε έτσι απλά τα Α ,Β και Ι (=ισοπαλία) από τις αντίστοιχες μέσες τιμές τους, γιατί ας πούμε η τιμή Ε(Α) περιλαμβάνει υπακολουθίες που "εμπίπτουν" και στην Ε(Ι) , και αντιστρόφως.

    ΑπάντησηΔιαγραφή
  18. Αν ο φίλτατος Halb Wesen halb Ding διαβάζει και έχει όρεξη και τρόπο να εκτελέσει κάποιες πειραματικές προσομοιώσεις Mοντε Κάρλο του: (2 consecutive 3 or 6 vs 3 consecutive 2 or 4 or 6) , θα είχαμε μια σαφή ένδειξη νομίζω.

    ΑπάντησηΔιαγραφή
  19. To ότι η διαδικασία είναι μαρκοβιανή (και έχει την απαραίτητη "μαρκοβιανή ιδιότητα"(markovian property), δηλαδή ναι μεν είναι "χωρίς μνήμη" αλλά δεν επηρεάζεται από το παρελθόν ΔΕΔΟΜΕΝΟΥ του παρόντος) φαίνεται και από την εξέταση της μέσης τιμής ρίψεων για να πάρουμε ας πούμε ,όχι 2 πεντάρια όπως στο αρχικό μας πρόβλημα, αλλά ένα 5 ακολουθούμενο από ένα 6 φερ'ειπείν.
    Τότε ,η μέση τιμή δεν είναι 42 .
    Για τα δύο ίδια (τα 5άρια) ναι μεν ισχύει η αναδρομική σχέση:
    E=6+(1/6)*1 +(5/6)(E+1) η οποία δίνει λυση Ε=42
    αλλά στην ερώτηση : Πόσες φορές κατά μέσο όρο πρέπει να ριχθεί το ζάρι για να έρθει η ακολουθία 5-6 η απάντηση είναι διαφορετική. Στο πρώτο πρόβλημα ,άπαξ και φέρουμε ένα 5 υπάρχουν ΜΟΝΟ δύο δυνατότητες: α) ή θα φέρουμε και δεύτερο 5 , ή β)ξαναρχίζουμε τη διαδικασία (και το μέτρημα) απ'την αρχή.
    Στο δεύτερο πρόβλημα όμως ,μόλις φέρουμε το πρώτο 5 έχουμε ΤΡΕΙΣ δυνατότητες: a)να φέρουμε 6 ,β) να φέρουμε 5 ή γ)να ξεκινήσουμε απ'την αρχή.
    Και πάλι λύνεται με "αναδρομή" αλλά θέλουμε δύο εξισώσεις:
    Eστω Ε η μαθ.ελπίδα μεχρι το 56 γενικά, και Ε(5) ο αντίστοιχος αναμενόμενος αριθμός ρίψεων μέχρι το 56 αλλά ΞΕΚΙΝΩΝΤΑΣ με ένα 5.
    Ε(5)=(1/6)(Ε(5)+1) + (4/6)(Ε+1) +1/6 (1)
    Ε=(1/6)(Ε(5)+1) + (5/6) (Ε+1) (2)
    Από τις (1) και (2) έχουμε: E=36, E(5)=30
    Bλέπουμε δηλαδή πως θέλουμε λιγότερες μέσες ρίψεις για να δούμε 56 απότι για να δούμε 55.

    ΑπάντησηΔιαγραφή
  20. Από μία προσομοίωση στο excel τα αποτελέσματα του πειράματος μέχρι να έχουμε 10.000.000 νίκες των Α και Β ήταν τα ακόλουθα:
    A: 56353460
    B: 43646540
    I: 4211616

    Ελπίζω να μην έκανα λάθος στο πρόγραμμα, το οποίο παραθέτω για έλεγχο.
    Κώδικας:
    Dim sumA, sumB, sumI, A, B, I As Long
    Dim zari As Integer

    sumA = 0
    sumB = 0
    sumI = 0

    Randomize

    While sumA + sumB < 100000000
    A = 0
    B = 0
    I = 0
    Do
    zari = Int((6 * Rnd) + 1)
    If zari Mod 3 = 0 Then A = A + 1 Else A = 0
    If zari Mod 2 = 0 Then B = B + 1 Else B = 0
    If A = 2 And B = 3 Then
    sumI = sumI + 1
    Exit Do
    End If
    If A = 2 Then
    sumA = sumA + 1
    Exit Do
    End If
    If B = 3 Then
    sumB = sumB + 1
    Exit Do
    End If
    Loop

    Wend

    Worksheets("sim").Cells(1, 2) = sumA
    Worksheets("sim").Cells(2, 2) = sumB
    Worksheets("sim").Cells(3, 2) = sumI

    End Sub

    ΑπάντησηΔιαγραφή
  21. Ευχαριστώ Γιώργο και Σωτήρη για τα πολύ ενδιαφέροντα και ουσιαστικά σχόλιά σας.
    Γιώργο, νομίζω ότι έχεις δίκιο ότι η διαμέριση του δειγματικού χώρου των εκβάσεων του παιχνιδιού, όπως την πρότεινα μέσω του συγκεκριμένου υπολογισμού των μέσων χρόνων αναμονής 12, 14 και 150, δεν είναι η πιο ενδεδειγμένη, για τους λόγους που εύστοχα ανέλυσες.
    Το πρόγραμμα που έφτιαξε ο Σωτήρης, του οποίου η άρτια κατά τη γνώμη μου κατασκευή δεν αφήνει περιθώρια αμφιβολίας για τα αποτελέσματα που δίνει, είναι νομίζω εξαιρετικά διαφωτιστικό ως προς τη βασική πηγή παραμόρφωσης των αποτελεσμάτων. Συγκεκριμένα, οι (πριν από την αναγωγή ισοπαλιών) πιθανότητες που προκύπτουν από το πρόγραμμα του Σωτήρη είναι +2,31%, -1,85%, -0,46% διαφορετικές από τις αντίστοιχες που του δικού μου υπολογισμού για νίκη Α, νίκη Β και ισοπαλία αντιστοίχως.
    Νομίζω ότι ο κυριότερος λόγος που συμβαίνει αυτό είναι ότι στις εμφανίσεις των ενδεχομένων που υπολόγισα (μέση αναμονή 14 ρίψεις) υπέρ Β ή ισοπαλίας έχω προσμετρήσει και την ακολουθία 6-6-6, η οποία όμως δεν υπάρχει στο παιχνίδι, αφού με το που θα εμφανιστούν τα δύο πρώτα συνεχόμενα 6 το παιχνίδι λήγει υπέρ του Α.
    Τώρα το αν και πώς θα μπορούσε να διορθωθεί το υπάρχον θεωρητικό μοντέλο ή να φτιαχτεί ένα καινούργιο εξ αρχής, ώστε να προβλέπει ακριβώς τα αποτελέσματα του Σωτήρη, παραμένει ένα ανοιχτό θέμα.

    ΑπάντησηΔιαγραφή
  22. Μοντελοποίησα το πρόβλημα με μια μαρκοβιανή απορροφητική αλυσίδα και το αποτέλεσμα είναι το ακόλουθο:
    P(A)=0,563515755
    P(B)=0,436484245
    Αν μπορέσω θα στείλω και τη λύση αναλυτικά.

    ΑπάντησηΔιαγραφή
  23. Αυτό το σχόλιο αφαιρέθηκε από τον συντάκτη.

    ΑπάντησηΔιαγραφή
  24. Κόμβος 1: Α0,Β0
    Κόμβος 2: Α1,Β0
    Κόμβος 3: Α0,Β1
    Κόμβος 4: Α1,Β1
    Κόμβος 5: Α1,Β2
    Κόμβος 6: Α0,Β2
    Κόμβος 7: Α2,Β3
    Κόμβος 8: Α2,Β0
    Κόμβος 9: Α2,Β1
    Κόμβος 10: Α2,Β2
    Κόμβος 11: Α1,Β3
    Κόμβος 12: Α0,Β3
    Στον κόμβο 7 έχουμε ισοπαλία και το παιχνίδι αρχίζει από την αρχή.
    Οι κόμβοι 8-12 είναι απορροφητικοί καθώς σ’ αυτούς το παιχνίδι τελειώνει. Για τους 8-10 κερδίζει ο παίκτης Α και για τους 11-12 ο παίκτης Β.
    Ο πίνακας μετάβασης $P$ δόθηκε στο προηγούμενο μήνυμα και έχει γραφεί στη μορφή $\begin{pmatrix}Q & R \\0 & I \end{pmatrix}$, όπου $Q$ είναι το κομμάτι που αφορά τις πιθανότητες μετάβασης από μια μεταβατική κατάσταση σε μια άλλη μεταβατική, το $R$ αφορά τις πιθανότητες μετάβασης από μεταβατική κατάσταση σε απορροφητική, ενώ το $0$ και το $I$ αφορούν τις απορροφητικές καταστάσεις και δείχνουν ότι αν φτάσεις σε αυτές θα παραμείνεις εκεί.

    ΑπάντησηΔιαγραφή
  25. Ο θεμελιώδης πίνακας $N$ υπολογίζεται από τη σχέση $\begin{pmatrix}I - Q\end{pmatrix}^{-1}$ και είναι ο ακόλουθος:
    $\begin{bmatrix}\frac{2}{3} & -\frac{1}{6} & -\frac{1}{3} & -\frac{1}{6} & 0 & 0 & 0 \\-\frac{1}{3} & 1 & -\frac{1}{3} & 0 & 0 & 0 & 0 \\-\frac{1}{3} & -\frac{1}{6} & 1 & 0 & -\frac{1}{6} & -\frac{1}{3} & 0 \\-\frac{1}{3} & 0 & 0 & 1 & 0 & -\frac{1}{3} & 0 \\-\frac{1}{3} & 0 & 0 & 0 & 1 & 0 & -\frac{1}{6} \\-\frac{1}{3} & -\frac{1}{6} & 0 & 0 & 0 & 1 & 0 \\-1 & 0 & 0 & 0 & 0 & 0 & 1 \end{bmatrix}^{-1}$ και μετά τις πράξεις:
    $\begin{bmatrix}3,582089552 & 0,967164179 & 1,51641791 & 0,597014925 & 0,252736318 & 0,704477612 & 0,04212272 \\1,970149254 & 1,611940299 & 1,194029851 & 0,328358209 & 0,199004975 & 0,507462687 & 0,033167496 \\2,328358209 & 0,868656716 & 2,065671642 & 0,388059701 & 0,344278607 & 0,817910448 & 0,057379768 \\1,701492537 & 0,519402985 & 0,740298507 & 1,28358209 & 0,123383085 & 0,674626866 & 0,020563847 \\1,791044776 & 0,48358209 & 0,758208955 & 0,298507463 & 1,126368159 & 0,352238806 & 0,187728027 \\1,52238806 & 0,591044776 & 0,704477612 & 0,253731343 & 0,117412935 & 1,319402985 & 0,019568823 \\3,582089552 & 0,967164179 & 1,51641791 & 0,597014925 & 0,252736318 & 0,704477612 & 1,04212272 \end{bmatrix}$

    ΑπάντησηΔιαγραφή
  26. Η πιθανότητα απορρόφησης όταν ξεκινάμε από έναν μεταβατικό κόμβο, βρίσκεται από τον γινόμενο του θεμελιώδους πίνακα $N$ με τον πίνακα $R$ και για το πρόβλημά μας είναι ο παρακάτω πίνακας:
    $\begin{bmatrix}0,302819237 & 0,16119403 & 0,099502488 & 0,201658375 & 0,234825871 \\0,35655058 & 0,268656716 & 0,054726368 & 0,150912106 & 0,169154229 \\0,266832504 & 0,144776119 & 0,064676617 & 0,251077944 & 0,272636816 \\0,32106136 & 0,086567164 & 0,213930348 & 0,153565506 & 0,224875622 \\0,318076285 & 0,080597015 & 0,049751244 & 0,434162521 & 0,117412935 \\0,160364842 & 0,098507463 & 0,042288557 & 0,259038143 & 0,439800995 \\0,302819237 & 0,16119403 & 0,099502488 & 0,201658375 & 0,234825871 \end{bmatrix}$
    Περισσότερες λεπτομέρειες μπορεί να βρει κανείς στο ακόλουθο λήμμα της Βικιπαίδειας:
    http://en.wikipedia.org/wiki/Absorbing_Markov_chain

    ΑπάντησηΔιαγραφή
  27. Ο σωστός πίνακας μετάβασης είναι ο εξής:
    $\begin{bmatrix}\frac{2}{6} & \frac{1}{6} & \frac{2}{6} & \frac{1}{6} & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\\frac{2}{6} & 0 & \frac{2}{6} & 0 & 0 & 0 & 0 & \frac{1}{6} & \frac{1}{6} & 0 & 0 & 0 \\\frac{2}{6} & \frac{1}{6} & 0 & 0 & \frac{1}{6} & \frac{2}{6} & 0 & 0 & 0 & 0 & 0 & 0 \\\frac{2}{6} & 0 & 0 & 0 & 0 & \frac{2}{6} & 0 & \frac{1}{6} & 0 & \frac{1}{6} & 0 & 0 \\\frac{2}{6} & 0 & 0 & 0 & 0 & 0 & \frac{1}{6} & \frac{1}{6} & 0 & 0 & \frac{2}{6} & 0 \\\frac{2}{6} & \frac{1}{6} & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & \frac{1}{6} & \frac{2}{6} \\1 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\0 & 0 & 0 & 0 & 0 & 0 & 0 & 1 & 0 & 0 & 0 & 0 \\0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 1 & 0 & 0 & 0 \\0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 1 & 0 & 0 \\0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 1 & 0 \\0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 1 \end{bmatrix}$

    ΑπάντησηΔιαγραφή
  28. Καλημέρα και καλό μήνα!
    Σωτήρη, εξαιρετική δουλειά! Ευχαριστούμε που τη μοιράστηκες.
    Για όποιον ενδιαφέρεται, ένα κείμενο διαφωτιστικό με πολλά δουλεμένα παραδείγματα:
    https://www.csupomona.edu/~sparisay/Courses/ie417/.../TimExtra.docx‎

    ΑπάντησηΔιαγραφή
  29. Ξαναδίνω το λινκ:
    https://www.csupomona.edu/~sparisay/Courses/ie417/handout/studentSolution/TimExtra.docx

    ΑπάντησηΔιαγραφή
  30. Καταπληκτική η εργασία σου Σωτήρη και σε ευχαριστώ με τη σειρά μου για το χρόνο και το μυαλό που διέθεσες για να τη φέρεις σε πέρας!!
    Μια επεξήγηση μόνο, αν είναι εύκολο: πώς από τα δεδομένα της επεξεργασίας των μητρών καταλήγουμε στις πιθανότητες Ρ(Α) και Ρ(Β) που αναφέρεις στο εισαγωγικό σου σχόλιο;

    ΑπάντησηΔιαγραφή
    Απαντήσεις
    1. Θανάση, ίσως να μην είναι πρέπον να απαντάω για το Σωτήρη, αλλά οι κακές συνήθειες δεν κόβονται εύκολα.:-)
      0,201658375 +0,234825871=0,436484246= p(B)
      Το άθροισμα των δύο τελευταίων τιμών (p74+p75) του τελικού πίνακα (I-Q)^-1*R
      To άθροισμα κάθε σειράς αυτού του πίνακα είναι =1
      Το p(A) το αφήνω σαν άσκηση. :-)

      Διαγραφή
    2. Ευχαριστώ Γιώργο! Κρατάω τις τρεις πρώτες και σε κερδίζω :-)

      Διαγραφή
    3. Πολύ σωστά και τα 2 σχόλια! Τυπικά τις πιθανότητες τις υπολογίζουμε από τον αρχικό κόμβο που συνήθως τον τοποθετούμε στην πρώτη γραμμή του τελικού πίνακα, όμως στο πρόβλημα αυτό η γραμμή 1 είναι ισοδύναμη με τη γραμμή 7 που είναι η περίπτωση ισοπαλίας, αφού στην ισοπαλία γυρίζουμε με πιθανότητα 1 στον αρχικό κόμβο. Να παρατηρήσουμε ότι, με το που βρίσκουμε τον πίνακα με τις πιθανότητες απορρόφησης, έχουμε λύσει ένα πιο σύνθετο πρόβλημα από αυτό για το οποίο ερωτηθήκαμε αρχικά, καθώς μπορούμε π.χ. να δώσουμε την πιθανότητα νίκης των Α και Β αν είναι ήδη γνωστή η πρώτη ζαριά.

      Διαγραφή
  31. Πολύ ωραία η επέκταση του στοιχήματος που σκέφτηκες Σωτήρη.
    Νομίζω ότι κάθε γραμμή, κατά σειρά, του τελικού πίνακα Ν*R μας δίνει τις πιθανότητες των εκβάσεων του παιχνιδιού (ΡΑ: άθροισμα τριών πρώτων τιμών, ΡΒ: άθροισμα δύο τελευταίων τιμών) όταν η αντίστοιχη αρχική κατάσταση (κόμβος εκκίνησης) είναι η Α0Β0, Α1Β0, Α0Β1, Α1Β1, Α1Β2, Α0Β2 και Α2Β3. Επομένως:
    Αν η πρώτη ζαριά έδωσε 1 ή 5 παραμένουμε στην 1η γραμμή (αρχ. κόμβος Α0Β0)
    Αν η πρώτη ζαριά έδωσε 2 ή 4 πηγαίνουμε στην 3η γραμμή (αρχ. κόμβος Α0Β1)
    Αν η πρώτη ζαριά έδωσε 3 πηγαίνουμε στη 2η γραμμή (αρχ. κόμβος Α1Β0) και
    Αν η πρώτη ζαριά έδωσε 6 πηγαίνουμε στην 4η γραμμή (αρχ. κόμβος Α1Β1)
    Οι γραμμές 5η, 6η και η 7η (ισοπαλία), που αντιστοιχούν στους υπόλοιπους μεταβατικούς κόμβους, προϋποθέτουν περισσότερες από μία αρχικές ζαριές.
    Ουσιαστικά, αυτό που κάνουμε, ξέροντας τον αρχικό κόμβο / κατάσταση, είναι να πολλαπλασιάζουμε έναν πίνακα-γραμμή 1Χ7 που έχει το 1 στη θέση του αρχικού κόμβου και 0 στις υπόλοιπες θέσεις με τον πίνακα Ν*R (7Χ5). Το αποτέλεσμα είναι ένας πίνακας – γραμμή 1Χ5 που είναι ακριβώς η αντίστοιχη στη δεδομένη αρχική κατάσταση γραμμή του πίνακα Ν*R.
    Κάπως έτσι η αρχική μας στοιχηματική εφαρμογή μπορεί κάλλιστα να γίνει και ένα ωραιότατο live-bet. :-)

    ΑπάντησηΔιαγραφή