Πέμπτη 25 Ιουλίου 2013

▪ Σωστές Στατιστικές, εξωφρενικά συμπεράσματα!

Οι τακτικοί επισκέπτες του ιστολογίου, σίγουρα έχουν αντιληφθεί  πως τα αγαπημένα μου θέματα είναι αυτά που σχετίζονται με Θεωρία Αριθμών και με Πιθανότητες - Στατιστική και Συνδυαστική. Ειδικά οι Πιθανότητες και η Στατιστική είναι από τους τομείς των Μαθηματικών,που αν και αναμφισβήτητα έχουν καθημερινή εφαρμογή στη ζωή μας,  είναι διαδεδομένη μια γενικότερη άγνοια και το ακόμη χειρότερο: Ημιμάθεια! (ακόμη και από (αυτο)αποκαλούμενους "ειδικούς"..) 
H ζωή μας - καλώς ή κακώς- δεν είναι ντετερμινιστική, αλλά μάλλον κυριαρχείται από στοχαστικές (δηλαδή πιθανοτικές - τυχαίες) διαδικασίες, και η Στατιστική και οι Πιθανότητες είναι κυρίαρχες όταν βρισκόμαστε αντιμέτωποι με την αβεβαιότητα. Δηλαδή, σχεδόν πάντα!
Η Στατιστική ειδικά, είναι τόσο βάναυσα κακοποιημένη και κακώς "αναγνωσμένη", που ίσως δικαιολογημένα ο μέσος ανθρωπος να τη θεωρεί κατώτερη και ύποπτη ως μαθηματική δημιουργία. Δεν είναι όμως έτσι! Δεν φταίει το εργαλείο, αν εγώ δεν ξέρω το χειρισμό του και χρησιμοποιώ ας πούμε το τσουγκράνι για να φτυαρίσω.
Όπως λέει ο φίλος μου στατιστικολόγος-μαθηματικός Πέρε Γκρίμα: "Όταν έχουμε στη διάθεσή μας κάποια στατιστικά στοιχεία, είναι εύκολο να βρούμε κάποιες λογικοφανείς εξηγήσεις που να τα δικαιολογούν". Στο σημείο αυτό όμως, έρχεται να παίξει το ρόλο της η προσεκτική ανάγνωση και η βαθιά γνώση τέτοιων θεμάτων.
Πρόσφατα, συζητούσα με κάποιους φίλους περί βραβείων και υποψηφιοτήτων  Νόμπελ και έπεσα τυχαία πάνω σ’αυτό:
Παλιό σχετικά άρθρο είναι (από το 2008) αλλά αξίζει να σχολιαστεί, μιας και λέει για Νομπελίστες και μια και είναι άλλο ένα φαιδρό επεισόδιο της γνωστής σειράς:
“Ηλίθια συμπεράσματα από σωστές Στατιστικές, των μαθηματικώς ημιμαθών”. Λέει λοιπόν ο συντάκτης Mark Stibich Ph.D ο οποίος είναι: “..behavior change expert with experience helping individuals make lasting lifestyle changes” (ειδικός σύμβουλος αλλαγής συμπεριφοράς, με εμπειρία στο να βοηθά ανθρώπους να κάνουν μόνιμες αλλαγές στον τρόπο ζωής τους..):
“When 524 nominees for the Nobel Prize were examined and compared to the actual winners from 1901 to 1950, the winners lived longer by 1.4 years. Why? It seems just having won and knowing you are on top gives you a boost of 1.8% to your life expectancy.”
Mετάφραση: "Εξετάστηκε το δείγμα 524 υποψηφίων για το βραβείο Νόμπελ και συγκρίθηκε με το αντίστοιχο των νικητών των βραβείων, για το διάστημα: 1901 έως 1950, και βρέθηκε πως οι νικητές ζουν κατα μέσο όρο περισσότερο 1,4 χρόνια. Γιατί; Φαίνεται πως το γεγονός ότι έχεις κερδίσει το Νόμπελ και ξέροντας πως είσαι στην κορυφή του τομέα σου, σού δίνει μια ώθηση κατά 1,8% στο προσδόκιμο της ζωής σου."
Πολύ λογικό και "προφανές" συμπέρασμα, θα μπορούσε να σκεφτεί κάποιος που θα διαβάσει επιφανειακά αυτό το συμπέρασμα του "επιστήμονα"! Κι όμως...
Ανοησίες ,αγαπητέ κύριε Στίμπιτς!! Εντελώς αυθαίρετο συμπέρασμα. Δεν μπορεί να προκύψει δηλαδή ως απόρροια των ΣΩΣΤΩΝ στατιστικών στοιχείων,αλλά μόνο από άλλης φύσεως "εκτιμήσεις". Αλλά  λίγο μαθηματικό "κύρος" καθαγιάζει τις ιδεοληψίες μας...
Σε ΚΑΘΕ είδους βραβείο με πολλαπλές υποψηφιότητες (π.χ Ακαδημίες, κ.λ.π) στο οποίο οι υποψήφιοι μπορεί να είναι υποψήφιοι πολλές διαδοχικές φορές (όπως στα Νόμπελ) και που οι βραβευμένοι είναι μιας κάποιας ηλικίας συνήθως και οι προτεινόμενοι μπορεί να είναι υποψήφιοι πολλές φορές ακόμη και σε μη-διαδοχικά έτη, είναι ΜΑΘΗΜΑΤΙΚΩΣ ΑΝΑΜΕΝΟΜΕΝΟ  ο μέσος όρος ηλικίας των βραβευμένων να είναι μεγαλύτερος, γιατί απλούστατα ,όσοι πέθαναν νέοι ΔΕΝ ΠΡΟΛΑΒΑΝ να βραβευτούν!
Δηλαδή, ο διδάκτωρ (Ph.D) Stibich, μάς λέει ουσιαστικά ας πούμε, ότι η κύρια αιτία θανάτου των ηλικιωμένων είναι η…συνταξιοδότηση ή ότι το προσδόκιμο ζωής (life expectancy) σε ένα γηροκομείο είναι μεγαλύτερο από ό,τι σε ένα βρεφοκομείο...
Πάλι καλά βέβαια, γιατί θα μπορούσε να καταλήξει,με βάση την λανθασμένη λογική και τρόπο ερμηνείας του, ότι σε ένα δείγμα 1678 θανάτων, και οι 1678 (100%) πριν πεθάνουν, ζούσαν! Άρα η βασική αιτία του θανάτου είναι η ζωή...

7 σχόλια:

  1. Εξαιρετικό άρθρο!Από περιέργεια μαθηματικός είστε ή έχετε κάνει σπουδές συνδυάζοντας και στέρεο μαθηματικό υπόβαθρο?(κάποιο μεταπτυχιακό ίσως?)

    ΑπάντησηΔιαγραφή
  2. Σ'ευχαριστώ για την εκτίμηση αγαπητέ Ντονάλτιε!
    (κάτι τέτοιο ναι.:-) Μηχανικός είμαι)

    ΑπάντησηΔιαγραφή
  3. Στην ρήση του Πέρε Γκρίμα θα πρόσθετα το απόφθεγμα του Ronald Coase: "If you torture the data enough, nature will always confess"
    (https://en.wikipedia.org/wiki/Ronald_Coase)
    και το γνωστό διάγραμμα πελαργών-γεννήσεων στην πόλη του Oldenburg
    (http://www.futilitycloset.com/category/science-math/page/2/)

    ΑπάντησηΔιαγραφή
    Απαντήσεις
    1. MN, εξαιρετική σελίδα! Ευχαριστούμε!
      Δίνω και το ακριβές λινκ για τους πελαργούς του Όλντενμπουργκ. :-)
      http://www.futilitycloset.com/2013/04/02/correlation-causation/

      Διαγραφή
  4. Ο τομέας στον οποίο οι λάθος (είτε εσκεμμένα είτε λόγω ημιμάθειας)εκτιμήσεις/συσχετίσεις και συμπεράσματα είναι στο καθημερινό πρόγραμμα ,είναι αυτός των στατιστικών που σχετίζονται με φάρμακα και γενικότερα θέματα υγείας.
    Θα άξιζε σίγουρα ξεχωριστό άρθρο, αλλά μιας και θα κάνω μια αναφορά σε πολιτικό πρόσωπο,προτιμώ το σχόλιο, ώστε ο όποιος αντίκτυπος/ευθύνη λόγου να βαρύνει αποκλειστικά εμένα,και όχι το ιστολόγιο.
    Δεν θα ξεχάσω ποτέ, τόση εντύπωση μού είχε κάνει, στην γνωστή ιστορία τότε με τα εμβόλια της περίφημης "θανατηφόρας" γρίππης, τον τότε υπουργο υγείας Αβραμόπουλο(είτε από άγνοια είτε σε μια απέλπιδα ίσως προσπάθεια ξεπουλήματος του στοκ...τα είχαμε προπληρώσει άλλωστε τα εμβόλια ,σαν φερέγγυο κράτος..)να δηλώνει σε συνέντευξή του : "To 95% όσων εμβολιάστηκαν, θεραπεύτηκαν. Το εμβόλιο είναι αποτελεσματικό! Εμπιστευτείτε το!" Διευκρινίζω ότι ,αν και ανέτρεξα σε πηγές, δεν μπορεσα να βρω την ακριβή διατύπωση, πάντως το νόημα ήταν αυτό,ίσως το ποσοστό που ανέφερε (95%) να ήταν και μεγαλύτερο.
    Το χειρότερο βέβαια ήταν ,πως δεν βγήκε ΕΝΑΣ με στοιχειώδη γνώση τέτοιων θεμάτων ,να πει:
    "Mα τι λέτε κύριε υπουργέ; Έτσι ελέγχεται η αποτελεσματικότητα ενός φαρμάκου;" ΔΕΝ υπάρχουν "ομάδες ελέγχου";, δεν απαιτείται χρόνος; δεν ..χιλια-δυο δεν!
    Ας υποθέσουμε ότι δοκιμάζεται ένα καινούργιο φάρμακο και διαπιστώνεται ότι όσοι το παίρνουν θεραπεύονται μέσα σε 10 μέρες. Μπορούμε να πούμε ότι είναι αποτελεσματικό;
    ΟΧΙ! Υπάρχει η πιθανότητα οι ασθενείς να θεραπεύονταν και χωρίς να πάρουν τίποτε. Μπορεί ακόμη και να θεραπεύονταν συντομότερα αν δεν έπαιρναν το φάρμακο!
    Γι’ αυτόν ακριβώς το λόγο ,όταν δοκιμάζονται αποτελεσματικότητες σε φάρμακα ή εμβόλια ή γενικά μεθόδους θεραπειών κλπ, επιλέγεται ένα ΑΝΤΙΠΡΟΣΩΠΕΥΤΙΚΟ δείγμα από άτομα στα οποία απευθύνεται αυτό, και χωρίζεται σε δυο ομάδες κατά ΤΥΧΑΙΟ τρόπο, έτσι ώστε να εξασφαλίζεται η αμεροληψία των αποτελεσμάτων. Το φάρμακο δηλαδή, δίνεται μόνο στη μία ομάδα ενώ η άλλη χρησιμεύει μόνο για τη σύγκριση των επιπτώσεων του φαρμάκου και αποκαλείται αυτή «Ομάδα ελέγχου».
    Έτσι έγινε πχ η έρευνα για το εμβόλιο της πολιομυελίτιδας και εκεί πρωτοεισάχθηκε και η ιδέα του πλασίμπο (placebo) . Δεν είναι σκόπιμο να αναπτύξω σε μεγάλο εύρος το θέμα ,αλλά η γενική αρχή είναι ότι για να αποφευχθεί η περίπτωση το φαινόμενο πλασέμπο να λειτουργήσει ευνοϊκά μόνο σε όσους λαμβάνουν την θεραπεία , προτιμάται να δεχτούν όλοι μια φαινομενικά όμοια θεραπεία, έτσι ώστε να μην γνωρίζουν αν λαμβάνουν το πραγματικό ή το εικονικό φάρμακο το οποίο έχει ΙΔΙΑ ΓΕΥΣΗ ΚΑΙ ΟΨΗ και αποκαλείται πλασίμπο.
    Όμως δεν πρέπει να είναι ΜΟΝΟ ο συμμετέχων που δεν γνωρίζει αν ανήκει στην ομάδα που δέχεται την θεραπεία ή στην ομάδα ελέγχου ,ΑΛΛΑ ΚΑΙ Ο ΓΙΑΤΡΟΣ που παρακολουθεί το άτομο.
    Αυτό ,γενικά μιλώντας.., γίνεται, όχι γιατί οι γιατροί δεν είναι έμπιστοι , αλλά υπάρχει η πιθανότητα να επηρεαστούν από τη γνώση τους αυτή και αν ο ασθενής ανήκει στην «ομάδα θεραπείας» να τον προϊδεάσουν για μεγαλύτερη βελτίωση, ενώ αν ανήκει στην «ομάδα ελεγχου» να τον προϊδεάσουν αρνητικά.
    Για να εξαλειφθεί λοιπόν αυτή η πιθανότητα, οι έρευνες αυτού του τύπου σχεδιάζονται με τρόπο που ΟΥΤΕ ο «ασθενής» ,ΟΥΤΕ ο «γιατρός» που τον παρακολουθεί να γνωρίζει αν παίρνει το πραγματικό φάρμακο ή το πλασέμπο και γι’αυτό η συγκεκριμένη ερευνητική (και γενικότερα "Στατιστική")μέθοδος ονομάζεται «Διπλά τυφλή μέθοδος».

    ΑπάντησηΔιαγραφή
  5. Μεγάλη προσοχή χρειάζεται και στα συμπεράσματα που βγάζουμε από σωστούς μεν,παραπλανητικούς δε,αν δεν ξέρουμε να τους ερμηνεύσουμε σε βάθος, μέσους όρους!
    Εδώ,κατά την ταπεινή μου γνώμη, έχει μεγάλη ευθύνη και χρέος και το εκπαιδευτικό σύστημα και οι διαμορφωτές του. ΧΙΛΙΕΣ φορές να μη μάθει ο μαθητής (έτσι κι αλιώς ,μόλις βγει απο τον περίβολο του σχολειού βλαστημώντας τη "Θεωρία" θα τα ξεχάσει!)για τους δειγματικούς χώρους και τις σχετικές συχνότητες και τις μονοτονίες των συναρτήσεων, αλλά ΝΑ ΜΑΘΕΙ και ΝΑ ΚΑΤΑΝΟΗΣΕΙ ότι όταν ας πουμε θα πιάσει δουλειά σε μια εταιρεία , θα πρέπει να συγκρίνει το μισθό του με την ΔΙΑΜΕΣΟ τιμή και όχι τη μέση τιμή των μισθών ,για να καταλάβει αν είναι ψηλά (>50%) ή "χαμηλά" (<50% των μισθών)αμειβόμενος! Έτσι θα είχαμε λιγότερους "αγόμενους και φερόμενους" πολίτες.
    Ως συγγενής χρόνιου καρκινοπαθούς, έχω δει δυστυχώς εκτρωματικά συμπεράσματα σε στατιστικές ,βασισμένα σε παραπλανητικούς μέσους όρους!
    Μια πολλή συνηθισμένη σχετική παρεξήγηση , με πολλή απλή μαθηματική εξήγηση είναι η εξής:
    Με την "κοινή λογική" όταν ο μέσος όρος ενός συνόλου πέφτει εξ αιτίας μιας μετακίνησης ατόμων, ο μέσος όρος του δεύτερου συνόλου περιμένουμε να ανέβει.
    Δεν είναι όμως έτσι γενικά.
    Για παράδειγμα.
    Το σύνολο Α έχει τους αριθμούς 2,3,4 μέ μέσον όρο 3.
    Το σύνολο Β έχει τους αριθμούς 5,6,7 με μέσον όρο 6.
    Αν ο αριθμός 5 μετακινηθεί από το σύνολο Β στο σύνολο Α τότε η καινούργια εικόνα θα είναι

    Α 2,3,4,5 με μέσο όρο 3,5
    Β 6,7 με μέσο όρο 6,5

    Βλέπουμε στο απλό αυτό παράδειγμα ότι η μετακίνηση του 5 είχε σαν αποτέλεσμα να αυξηθούν οι μέσοι όροι και των δύο συνόλων!
    Το "παράδοξο" αυτό φαινόμενο έχει απλή μαθηματική εξήγηση.
    Ο αριθμός που μετακινείται πρέπει να είναι μικρότερος από τον μέσο όρο του συνόλου αφετηρίας αλλά ταυτόχρονα μεγαλύτερος από τον μέσο όρο του συνόλου που καταλήγει.
    Έστω τώρα πως το σύνολο Α είναι οι υγιείς και το σύνολο Β είναι οι καρκινοπαθείς.
    Ενας καρκινοπαθής σε πρώτο στάδιο φεύγει από το σύνολο Α, κατά συνέπεια ανεβάζει τον προσδοκώμενο μέσο όρο ζωής του Α και εντάσσεται στο σύνολο Β. Επειδή όμως είναι πιο υγιής από τον μέσον όρο του Β, η μετακίνηση αυτή θα βελτιώσει και τον μέσο όρο ζωής του συνόλου Β! Κάποιος δηλαδή που έπαθε μόλις καρκίνο, αντιμετωπιζόμενος σαν "μαθηματική-στατιστική μονάδα" βελτιώνει την "μέση" υγεία γενικώς!! Είναι απίστευτο πόσες τέτοιες "στατιστικές" υπάρχουν και ακόμη πιο απίστευτο ότι όταν κάποτε προσπάθησα να εξηγήσω σε κάποιον γιατρό τον σχετικό μου προβληματισμό , μου απάντησε "H Ιατρική δεν είναι Μαθηματικά. Είναι "αποτελέσματα"!" ...

    ΑπάντησηΔιαγραφή
  6. Δεν ξέρω τι λέτε εσείς αγαπητοί, εγώ ξέρω πως αν δεν πάρω φάρμακο στην γρίπη με ταλαιπωρεί 7 ολόκληρες ημέρες, αν όμως πάρω που περνά σε μόλις 1 εβδομάδα!

    ΑπάντησηΔιαγραφή