Κατανομή Pearson: ορισμός, εφαρμογή

Πίνακας περιεχομένων:

Κατανομή Pearson: ορισμός, εφαρμογή
Κατανομή Pearson: ορισμός, εφαρμογή
Anonim

Τι είναι ο νόμος κατανομής του Pearson; Η απάντηση σε αυτό το ευρύ ερώτημα δεν μπορεί να είναι απλή και συνοπτική. Το σύστημα Pearson σχεδιάστηκε αρχικά για να μοντελοποιεί ορατές παραμορφωμένες παρατηρήσεις. Εκείνη την εποχή, ήταν ευρέως γνωστό πώς να συντονιστείτε ένα θεωρητικό μοντέλο ώστε να ταιριάζει με τις δύο πρώτες συσσωρευτές ή στιγμές παρατηρούμενων δεδομένων: οποιαδήποτε κατανομή πιθανότητας μπορεί να επεκταθεί άμεσα για να σχηματιστεί μια ομάδα κλίμακων τοποθεσίας.

Υπόθεση του Pearson σχετικά με την κανονική κατανομή των κριτηρίων

Εκτός από παθολογικές περιπτώσεις, η κλίμακα εντοπισμού μπορεί να γίνει ώστε να ταιριάζει με τον παρατηρούμενο μέσο όρο (πρώτος συσσωρευτής) και τη διακύμανση (δεύτερος συσσωρευτής) με αυθαίρετο τρόπο. Ωστόσο, δεν ήταν γνωστός ο τρόπος κατασκευής κατανομών πιθανότητας στις οποίες η λοξότητα (τυποποιημένο τρίτο συσσωρευτικό) και η κύρτωση (τυποποιημένο τέταρτο σωρευτικό) θα μπορούσαν να ελεγχθούν εξίσου ελεύθερα. Αυτή η ανάγκη έγινε εμφανής κατά την προσπάθεια προσαρμογής γνωστών θεωρητικών μοντέλων σε παρατηρούμενα δεδομένα,που έδειξε ασυμμετρία.

Στο παρακάτω βίντεο μπορείτε να δείτε την ανάλυση της κατανομής chi Pearson.

Image
Image

Ιστορία

Στο πρωτότυπο έργο του, ο Pearson προσδιόρισε τέσσερις τύπους κατανομών (με αρίθμηση I έως IV) εκτός από την κανονική κατανομή (η οποία αρχικά ήταν γνωστή ως τύπος V). Η ταξινόμηση εξαρτάται από το εάν οι κατανομές υποστηρίζονται σε ένα περιορισμένο διάστημα, σε ημιάξονα ή σε ολόκληρη την πραγματική γραμμή και αν ήταν δυνητικά λοξές ή αναγκαστικά συμμετρικές.

Δύο παραλείψεις διορθώθηκαν στη δεύτερη εργασία: επαναπροσδιόρισε την κατανομή τύπου V (αρχικά ήταν μόνο η κανονική κατανομή, αλλά τώρα με αντίστροφο γάμμα) και εισήγαγε την κατανομή τύπου VI. Μαζί, τα δύο πρώτα άρθρα καλύπτουν τους πέντε κύριους τύπους του συστήματος Pearson (I, III, IV, V και VI). Στην τρίτη εργασία, ο Pearson (1916) εισήγαγε πρόσθετους υποτύπους.

Συναρτήσεις κατανομής Pearson
Συναρτήσεις κατανομής Pearson

Βελτιώστε την έννοια

Ο

Ο Ριντ εφηύρε έναν απλό τρόπο οπτικοποίησης του χώρου παραμέτρων του συστήματος Pearson (ή της κατανομής των κριτηρίων), τον οποίο υιοθέτησε αργότερα. Σήμερα, πολλοί μαθηματικοί και στατιστικολόγοι χρησιμοποιούν αυτή τη μέθοδο. Οι τύποι κατανομών Pearson χαρακτηρίζονται από δύο ποσότητες, που συνήθως ονομάζονται β1 και β2. Το πρώτο είναι το τετράγωνο της ασυμμετρίας. Η δεύτερη είναι η παραδοσιακή κύρτωση, ή η τέταρτη τυποποιημένη στιγμή: β2=γ2 + 3.

Οι σύγχρονες μαθηματικές μέθοδοι ορίζουν την κύρτωση γ2 ως σωρευτικά αντί για ροπές, έτσι για ένα κανονικόκατανομή έχουμε γ2=0 και β2=3. Εδώ αξίζει να ακολουθήσουμε το ιστορικό προηγούμενο και να χρησιμοποιήσουμε το β2. Το διάγραμμα στα δεξιά δείχνει ποιος τύπος είναι μια συγκεκριμένη κατανομή Pearson (συμβολίζεται με την τελεία (β1, β2).

Στατιστικά Pearson
Στατιστικά Pearson

Πολλές από τις λοξές και/ή μη μεσοκουρτικές διανομές που γνωρίζουμε σήμερα δεν ήταν ακόμη γνωστές στις αρχές της δεκαετίας του 1890. Αυτό που τώρα είναι γνωστό ως κατανομή βήτα χρησιμοποιήθηκε από τον Thomas Bayes ως η οπίσθια παράμετρος της κατανομής Bernoulli στην εργασία του του 1763 σχετικά με την αντίστροφη πιθανότητα.

Η διανομή βήτα έγινε γνωστή λόγω της παρουσίας της στο σύστημα Pearson και ήταν γνωστή μέχρι τη δεκαετία του 1940 ως διανομή Pearson τύπου I. Η κατανομή Τύπου ΙΙ είναι μια ειδική περίπτωση του Τύπου Ι, αλλά συνήθως δεν ξεχωρίζει πλέον.

Η διανομή Gamma προήλθε από τη δική του δουλειά και ήταν γνωστή ως Pearson Type III Normal Distribution πριν αποκτήσει το σύγχρονο όνομά της στις δεκαετίες του 1930 και του 1940. Μια εργασία του 1895 από έναν επιστήμονα παρουσίασε την κατανομή Τύπου IV, η οποία περιέχει την κατανομή t του Student, ως ειδική περίπτωση, πριν από την επακόλουθη χρήση του William Seely Gosset κατά αρκετά χρόνια. Η εργασία του του 1901 παρουσίασε μια κατανομή με αντίστροφο γάμμα (τύπος V) και βήτα πρώτους (τύπος VI).

Μια άλλη γνώμη

Σύμφωνα με τον Ord, ο Pearson ανέπτυξε τη βασική μορφή της εξίσωσης (1) με βάση τον τύπο για την παράγωγο του λογάριθμου της συνάρτησης πυκνότητας κανονικής κατανομής (που δίνει μια γραμμική διαίρεση με το τετραγωνικόδομή). Πολλοί ειδικοί εξακολουθούν να ασχολούνται με τον έλεγχο της υπόθεσης σχετικά με την κατανομή των κριτηρίων Pearson. Και αποδεικνύει την αποτελεσματικότητά του.

Εναλλακτική διανομή Pearson
Εναλλακτική διανομή Pearson

Ποιος ήταν ο Karl Pearson

Ο Karl Pearson ήταν Άγγλος μαθηματικός και βιοστατιστικός. Του πιστώνεται η δημιουργία της πειθαρχίας της μαθηματικής στατιστικής. Το 1911 ίδρυσε το πρώτο τμήμα στατιστικής στον κόσμο στο University College του Λονδίνου και συνέβαλε σημαντικά στους τομείς της βιομετρίας και της μετεωρολογίας. Ο Pearson ήταν επίσης υποστηρικτής του κοινωνικού δαρβινισμού και της ευγονικής. Ήταν ο προστατευόμενος και βιογράφος του Sir Francis G alton.

Βιομετρικά

Ο Karl Pearson συνέβαλε καθοριστικά στη δημιουργία της σχολής της βιομετρίας, η οποία ήταν μια ανταγωνιστική θεωρία για την περιγραφή της εξέλιξης και της κληρονομιάς των πληθυσμών στις αρχές του 20ου αιώνα. Η σειρά των δεκαοκτώ εργασιών του «Μαθηματική συμβολή στη Θεωρία της Εξέλιξης» τον καθιέρωσε ως τον ιδρυτή της βιομετρικής σχολής της κληρονομικότητας. Στην πραγματικότητα ο Pearson αφιέρωσε μεγάλο μέρος του χρόνου του κατά την περίοδο 1893-1904 σε ανάπτυξη στατιστικών μεθόδων βιομετρίας. Αυτές οι μέθοδοι, που χρησιμοποιούνται ευρέως σήμερα για στατιστικές αναλύσεις, περιλαμβάνουν το τεστ χ-τετράγωνο, την τυπική απόκλιση, τη συσχέτιση και τους συντελεστές παλινδρόμησης.

Συντελεστής συσχέτισης Pearson
Συντελεστής συσχέτισης Pearson

Το ζήτημα της κληρονομικότητας

Ο νόμος της κληρονομικότητας του Pearson έλεγε ότι το βλαστικό πλάσμα αποτελείται από στοιχεία που κληρονομήθηκαν από γονείς, καθώς και από πιο μακρινούς προγόνους, η αναλογία των οποίων ποικίλλει ανάλογα με διάφορα χαρακτηριστικά. Ο Karl Pearson ήταν οπαδός του G alton, και παρόλο που τουςτα έργα διέφεραν από ορισμένες απόψεις, ο Pearson χρησιμοποίησε ένα σημαντικό μέρος των στατιστικών εννοιών του δασκάλου του στη διαμόρφωση ενός βιομετρικού σχολείου για κληρονομικότητα, όπως ο νόμος της παλινδρόμησης.

Κατανομή Pearson
Κατανομή Pearson

Σχολικά χαρακτηριστικά

Η βιομετρική σχολή, σε αντίθεση με τους Μεντελιανούς, δεν επικεντρώθηκε στην παροχή ενός μηχανισμού κληρονομικότητας, αλλά στην παροχή μιας μαθηματικής περιγραφής που δεν είχε αιτιώδη φύση. Ενώ ο G alton πρότεινε μια ασυνεχή θεωρία της εξέλιξης στην οποία τα είδη θα άλλαζαν με μεγάλα άλματα αντί για μικρές αλλαγές που συσσωρεύονταν με την πάροδο του χρόνου, ο Pearson επεσήμανε ελαττώματα σε αυτό το επιχείρημα και χρησιμοποίησε τις ιδέες του για να αναπτύξει μια συνεχή θεωρία της εξέλιξης. Οι Μεντελιανοί προτιμούσαν την ασυνεχή θεωρία της εξέλιξης.

Ενώ ο G alton επικεντρώθηκε κυρίως στην εφαρμογή στατιστικών μεθόδων στη μελέτη της κληρονομικότητας, ο Pearson και ο συνάδελφός του Weldon επέκτειναν τη συλλογιστική τους σε αυτόν τον τομέα, την παραλλαγή, τους συσχετισμούς φυσικής και σεξουαλικής επιλογής.

Τυπική κατανομή
Τυπική κατανομή

Μια ματιά στην εξέλιξη

Για τον Pearson, η θεωρία της εξέλιξης δεν αποσκοπούσε στον προσδιορισμό του βιολογικού μηχανισμού που εξηγεί τα πρότυπα κληρονομικότητας, ενώ η μεντελιανή προσέγγιση δήλωσε ότι το γονίδιο είναι ο μηχανισμός κληρονομικότητας.

Ο Pearson επέκρινε τον Bateson και άλλους βιολόγους επειδή δεν υιοθέτησαν βιομετρικές μεθόδους στη μελέτη τους για την εξέλιξη. Καταδίκασε τους επιστήμονες που δεν εστίασαν σεστατιστική εγκυρότητα των θεωριών τους, δηλώνοντας:

"Προτού μπορέσουμε να αποδεχτούμε [οποιαδήποτε αιτία προοδευτικής αλλαγής] ως παράγοντα, πρέπει όχι μόνο να δείξουμε την αληθοφάνειά του, αλλά, αν είναι δυνατόν, να επιδείξουμε την ποσοτική του ικανότητα."

Οι βιολόγοι έχουν υποκύψει σε "σχεδόν μεταφυσικές εικασίες σχετικά με τα αίτια της κληρονομικότητας" που έχουν αντικαταστήσει τη διαδικασία συλλογής πειραματικών δεδομένων, η οποία μπορεί στην πραγματικότητα να επιτρέψει στους επιστήμονες να περιορίσουν τις πιθανές θεωρίες.

στατιστική γέφυρα
στατιστική γέφυρα

Νόμοι της φύσης

Για τον Pearson, οι νόμοι της φύσης ήταν χρήσιμοι για την πραγματοποίηση ακριβών προβλέψεων και για τη σύνοψη των τάσεων στα παρατηρούμενα δεδομένα. Ο λόγος ήταν η εμπειρία "ότι μια ορισμένη ακολουθία συνέβη και επαναλήφθηκε στο παρελθόν."

Έτσι, ο εντοπισμός ενός συγκεκριμένου μηχανισμού γενετικής δεν ήταν μια αξιόλογη προσπάθεια για τους βιολόγους, οι οποίοι θα έπρεπε αντ' αυτού να επικεντρωθούν σε μαθηματικές περιγραφές των εμπειρικών δεδομένων. Αυτό οδήγησε εν μέρει σε μια πικρή διαμάχη μεταξύ βιομετρών και Μεντελιανών, συμπεριλαμβανομένου του Bateson.

Αφού ο τελευταίος απέρριψε ένα από τα χειρόγραφα του Pearson που περιγράφει μια νέα θεωρία της παραλλαγής ή της ομοτυπίας των απογόνων, ο Pearson και ο Weldon ίδρυσαν την εταιρεία Biometrika το 1902. Αν και η βιομετρική προσέγγιση της κληρονομικότητας τελικά έχασε τη Μεντελική της οπτική, οι μέθοδοι που ανέπτυξαν εκείνη την εποχή είναι ζωτικής σημασίας για τη μελέτη της βιολογίας και της εξέλιξης σήμερα.

Συνιστάται: