Βασικές έννοιες της μαθηματικής στατιστικής. Εφαρμογή μαθηματικών στατιστικών

Πίνακας περιεχομένων:

Βασικές έννοιες της μαθηματικής στατιστικής. Εφαρμογή μαθηματικών στατιστικών
Βασικές έννοιες της μαθηματικής στατιστικής. Εφαρμογή μαθηματικών στατιστικών
Anonim

Οι μαθηματικές στατιστικές είναι μια μεθοδολογία που σας επιτρέπει να λαμβάνετε τεκμηριωμένες αποφάσεις ενόψει αβέβαιων συνθηκών. Η μελέτη μεθόδων συλλογής και συστηματοποίησης δεδομένων, η επεξεργασία των τελικών αποτελεσμάτων πειραμάτων και πειραμάτων με μαζική τυχαιότητα και η ανακάλυψη τυχόν προτύπων είναι αυτό που κάνει αυτός ο κλάδος των μαθηματικών. Εξετάστε τις βασικές έννοιες της μαθηματικής στατιστικής.

Διαφορά με τη θεωρία πιθανοτήτων

Μέθοδοι μαθηματικών στατιστικών διασταυρώνονται στενά με τη θεωρία πιθανοτήτων. Και οι δύο κλάδοι των μαθηματικών ασχολούνται με τη μελέτη πολλών τυχαίων φαινομένων. Οι δύο κλάδοι συνδέονται με οριακά θεωρήματα. Ωστόσο, υπάρχει μεγάλη διαφορά μεταξύ αυτών των επιστημών. Εάν η θεωρία πιθανοτήτων καθορίζει τα χαρακτηριστικά μιας διαδικασίας στον πραγματικό κόσμο με βάση ένα μαθηματικό μοντέλο, τότε η μαθηματική στατιστική κάνει το αντίθετο - ορίζει τις ιδιότητες του μοντέλου σεμε βάση τις παρατηρούμενες πληροφορίες.

Θεωρία πιθανοτήτων και ματ. στατιστική
Θεωρία πιθανοτήτων και ματ. στατιστική

Βήματα

Η εφαρμογή μαθηματικών στατιστικών μπορεί να πραγματοποιηθεί μόνο σε σχέση με τυχαία γεγονότα ή διαδικασίες, ή μάλλον, με δεδομένα που λαμβάνονται από την παρατήρησή τους. Και αυτό συμβαίνει σε διάφορα στάδια. Πρώτον, τα δεδομένα των πειραμάτων και των πειραμάτων υφίστανται συγκεκριμένη επεξεργασία. Παραγγέλλονται για λόγους σαφήνειας και ευκολίας ανάλυσης. Στη συνέχεια γίνεται μια ακριβής ή κατά προσέγγιση εκτίμηση των απαιτούμενων παραμέτρων της παρατηρούμενης τυχαίας διαδικασίας. Μπορούν να είναι:

  • αξιολόγηση της πιθανότητας ενός συμβάντος (η πιθανότητά του είναι αρχικά άγνωστη);
  • μελετώντας τη συμπεριφορά μιας αόριστης συνάρτησης κατανομής;
  • εκτίμηση προσδοκιών;
  • εκτίμηση διακύμανσης
  • κλπ.
Βασικές αρχές του χαλιού. στατιστική
Βασικές αρχές του χαλιού. στατιστική

Το τρίτο στάδιο είναι η επαλήθευση τυχόν υποθέσεων που τέθηκαν πριν από την ανάλυση, δηλαδή η απόκτηση απάντησης στο ερώτημα πώς τα αποτελέσματα των πειραμάτων αντιστοιχούν στους θεωρητικούς υπολογισμούς. Στην πραγματικότητα, αυτό είναι το κύριο στάδιο της μαθηματικής στατιστικής. Ένα παράδειγμα θα ήταν να εξετάσουμε εάν η συμπεριφορά μιας παρατηρούμενης τυχαίας διεργασίας είναι εντός της κανονικής κατανομής.

Πληθυσμός

Οι βασικές έννοιες της μαθηματικής στατιστικής περιλαμβάνουν γενικούς πληθυσμούς και πληθυσμούς δείγματος. Αυτή η πειθαρχία ασχολείται με τη μελέτη ενός συνόλου ορισμένων αντικειμένων σε σχέση με κάποια ιδιοκτησία. Ένα παράδειγμα είναι η δουλειά ενός ταξιτζή. Εξετάστε αυτές τις τυχαίες μεταβλητές:

  • φόρτωση ή αριθμός πελατών: ανά ημέρα, πριν από το μεσημεριανό γεύμα, μετά το μεσημεριανό γεύμα, …;
  • μέσος χρόνος ταξιδιού;
  • αριθμός εισερχόμενων εφαρμογών ή προσάρτησή τους σε συνοικίες της πόλης και πολλά άλλα.

Αξίζει επίσης να σημειωθεί ότι είναι δυνατό να μελετηθεί ένα σύνολο παρόμοιων τυχαίων διαδικασιών, οι οποίες θα είναι επίσης μια τυχαία μεταβλητή που μπορεί να παρατηρηθεί.

Πληθυσμός
Πληθυσμός

Έτσι, στις μεθόδους της μαθηματικής στατιστικής, ολόκληρο το σύνολο των υπό μελέτη αντικειμένων ή τα αποτελέσματα διαφόρων παρατηρήσεων που πραγματοποιούνται υπό τις ίδιες συνθήκες σε ένα δεδομένο αντικείμενο ονομάζεται γενικός πληθυσμός. Με άλλα λόγια, μαθηματικά πιο αυστηρά, είναι μια τυχαία μεταβλητή που ορίζεται στο χώρο των στοιχειωδών γεγονότων, με μια κατηγορία υποσυνόλων που ορίζονται σε αυτήν, τα στοιχεία της οποίας έχουν γνωστή πιθανότητα.

Πληθυσμός δείγματος

Υπάρχουν περιπτώσεις που είναι αδύνατο ή μη πρακτικό για κάποιο λόγο (κόστος, χρόνος) η διεξαγωγή συνεχούς μελέτης για τη μελέτη κάθε αντικειμένου. Για παράδειγμα, το άνοιγμα κάθε βάζου σφραγισμένης μαρμελάδας για να ελέγξετε την ποιότητά του είναι μια αμφίβολη απόφαση και η προσπάθεια εκτίμησης της τροχιάς κάθε μορίου αέρα σε ένα κυβικό μέτρο είναι αδύνατη. Σε τέτοιες περιπτώσεις, χρησιμοποιείται η μέθοδος της επιλεκτικής παρατήρησης: ένας συγκεκριμένος αριθμός αντικειμένων επιλέγεται (συνήθως τυχαία) από τον γενικό πληθυσμό και υποβάλλονται στην ανάλυσή τους.

Δείγμα από τον στρατηγόαδρανή
Δείγμα από τον στρατηγόαδρανή

Αυτές οι έννοιες μπορεί να φαίνονται περίπλοκες στην αρχή. Επομένως, για να κατανοήσετε πλήρως το θέμα, πρέπει να μελετήσετε το εγχειρίδιο του V. E. Gmurman "Θεωρία Πιθανοτήτων και Μαθηματική Στατιστική". Έτσι, ένα σύνολο ή δείγμα δειγματοληψίας είναι μια σειρά αντικειμένων που επιλέγονται τυχαία από το γενικό σύνολο. Με αυστηρούς μαθηματικούς όρους, αυτή είναι μια ακολουθία ανεξάρτητων, ομοιόμορφα κατανεμημένων τυχαίων μεταβλητών, για καθεμία από τις οποίες η κατανομή συμπίπτει με αυτή που υποδεικνύεται για τη γενική τυχαία μεταβλητή.

Βασικές έννοιες

Ας εξετάσουμε εν συντομία μια σειρά από άλλες βασικές έννοιες της μαθηματικής στατιστικής. Ο αριθμός των αντικειμένων στον γενικό πληθυσμό ή στο δείγμα ονομάζεται όγκος. Οι τιμές του δείγματος που λαμβάνονται κατά τη διάρκεια του πειράματος ονομάζονται υλοποίηση του δείγματος. Για να είναι αξιόπιστη μια εκτίμηση του γενικού πληθυσμού με βάση ένα δείγμα, είναι σημαντικό να υπάρχει ένα λεγόμενο αντιπροσωπευτικό ή αντιπροσωπευτικό δείγμα. Αυτό σημαίνει ότι το δείγμα πρέπει να αντιπροσωπεύει πλήρως τον πληθυσμό. Αυτό μπορεί να επιτευχθεί μόνο εάν όλα τα στοιχεία του πληθυσμού έχουν ίση πιθανότητα να βρίσκονται στο δείγμα.

ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ
ΒΑΣΙΚΕΣ ΕΝΝΟΙΕΣ

Τα δείγματα κάνουν διάκριση μεταξύ επιστροφής και μη επιστροφής. Στην πρώτη περίπτωση, στο περιεχόμενο του δείγματος, το επαναλαμβανόμενο στοιχείο επιστρέφεται στο γενικό σύνολο, στη δεύτερη περίπτωση, δεν είναι. Συνήθως, στην πράξη, χρησιμοποιείται δειγματοληψία χωρίς αντικαταστάσεις. Θα πρέπει επίσης να σημειωθεί ότι το μέγεθος του γενικού πληθυσμού υπερβαίνει πάντα σημαντικά το μέγεθος του δείγματος. Υπάρχουνπολλές επιλογές για τη διαδικασία δειγματοληψίας:

  • simple - τα στοιχεία επιλέγονται τυχαία ένα κάθε φορά;
  • typed - ο γενικός πληθυσμός χωρίζεται σε τύπους και γίνεται επιλογή από τον καθένα. ένα παράδειγμα είναι μια έρευνα κατοίκων: άνδρες και γυναίκες ξεχωριστά·
  • μηχανικό - για παράδειγμα, επιλέξτε κάθε 10ο στοιχείο;
  • σειρά - η επιλογή γίνεται σε σειρά στοιχείων.

Στατιστική κατανομή

Σύμφωνα με τον Gmurman, η θεωρία πιθανοτήτων και η μαθηματική στατιστική είναι εξαιρετικά σημαντικοί κλάδοι στον επιστημονικό κόσμο, ειδικά στο πρακτικό του κομμάτι. Εξετάστε τη στατιστική κατανομή του δείγματος.

Ας υποθέσουμε ότι έχουμε μια ομάδα μαθητών που δοκιμάστηκαν στα μαθηματικά. Ως αποτέλεσμα, έχουμε ένα σύνολο εκτιμήσεων: 5, 3, 1, 4, 3, 4, 2, 5, 4, 4, 5 - αυτό είναι το κύριο στατιστικό υλικό μας.

Πρώτα απ' όλα, πρέπει να το ταξινομήσουμε ή να εκτελέσουμε μια λειτουργία κατάταξης: 1, 2, 3, 3, 4, 4, 4, 4, 5, 5, 5 - και έτσι να λάβουμε μια μεταβλητή σειρά. Ο αριθμός των επαναλήψεων καθεμιάς από τις αξιολογήσεις ονομάζεται συχνότητα αξιολόγησης και η αναλογία τους προς το μέγεθος του δείγματος ονομάζεται σχετική συχνότητα. Ας κάνουμε έναν πίνακα της στατιστικής κατανομής του δείγματος ή απλώς μια στατιστική σειρά:

ai 1 2 3 4 5
pi 1 1 2 4 3

ή

ai 1 2 3 4 5
pi 1/11 1/11 2/11 4/11 3/11

Ας έχουμε μια τυχαία μεταβλητή στην οποία θα διεξάγουμε μια σειρά πειραμάτων και θα δούμε τι τιμή παίρνει αυτή η μεταβλητή. Ας υποθέσουμε ότι πήρε την τιμή a1 - m1 φορές; a2 - m2 φορές, κ.λπ. Το μέγεθος αυτού του δείγματος θα είναι m1 + … + mk=m. Το σύνολο ai, όπου το i ποικίλλει από 1 έως k, είναι μια στατιστική σειρά.

Διαστημική κατανομή

Στο βιβλίο του VE Gmurman «Θεωρία Πιθανοτήτων και Μαθηματική Στατιστική» παρουσιάζεται επίσης μια στατιστική σειρά διαστημάτων. Η σύνταξή του είναι δυνατή όταν η τιμή του υπό μελέτη χαρακτηριστικού είναι συνεχής σε ένα συγκεκριμένο διάστημα και ο αριθμός των τιμών είναι μεγάλος. Σκεφτείτε μια ομάδα μαθητών, ή μάλλον, το ύψος τους: 163, 180, 185, 172, 161, 171, 189, 157, 165, 174, 180, 181, 175, 182, 167, 13,16, 171 179, 160, 180, 166, 178, 156, 180, 189, 173, 174, 175 - 30 μαθητές συνολικά. Προφανώς, το ύψος ενός ανθρώπου είναι μια συνεχής τιμή. Πρέπει να ορίσουμε το βήμα του διαστήματος. Για αυτό, χρησιμοποιείται ο τύπος Sturges.

h= μέγιστο - ελάχ. = 190 - 156 = 33 = 5, 59
1+log 1+log230 5, 9

Έτσι, η τιμή του 6 μπορεί να ληφθεί ως το μέγεθος του διαστήματος. Θα πρέπει επίσης να ειπωθεί ότι η τιμή 1+log2m είναι ο τύπος γιαπροσδιορισμός του αριθμού των διαστημάτων (φυσικά, με στρογγυλοποίηση). Έτσι, σύμφωνα με τους τύπους, λαμβάνονται 6 διαστήματα, καθένα από τα οποία έχει μέγεθος 6. Και η πρώτη τιμή του αρχικού διαστήματος θα είναι ο αριθμός που καθορίζεται από τον τύπο: min - h / 2=156 - 6/2=153. Ας φτιάξουμε έναν πίνακα που θα περιέχει διαστήματα και τον αριθμό των μαθητών των οποίων η ανάπτυξη έπεσε σε ένα συγκεκριμένο διάστημα.

H [153; 159) [159; 165) [165; 171) [171; 177) [177; 183) [183; 189)
P 2 5 3 9 8 3
P 0, 06 0, 17 0, 1 0, 3 0, 27 0, 1

Φυσικά, δεν είναι μόνο αυτό, γιατί υπάρχουν πολύ περισσότεροι τύποι στις μαθηματικές στατιστικές. Εξετάσαμε μόνο μερικές βασικές έννοιες.

Πρόγραμμα διανομής

Διαγράμματα διανομής
Διαγράμματα διανομής

Οι βασικές έννοιες της μαθηματικής στατιστικής περιλαμβάνουν επίσης μια γραφική αναπαράσταση της κατανομής, η οποία διακρίνεται από σαφήνεια. Υπάρχουν δύο τύποι γραφημάτων: το πολύγωνο και το ιστόγραμμα. Η πρώτη χρησιμοποιείται για μια διακριτή στατιστική σειρά. Και για συνεχή διανομή, αντίστοιχα, το δεύτερο.

Συνιστάται: