Λογιστική παλινδρόμηση: μοντέλο και μέθοδοι

Πίνακας περιεχομένων:

Λογιστική παλινδρόμηση: μοντέλο και μέθοδοι
Λογιστική παλινδρόμηση: μοντέλο και μέθοδοι
Anonim

Οι μέθοδοι λογιστικής παλινδρόμησης και διακριτικής ανάλυσης χρησιμοποιούνται όταν είναι απαραίτητο να διαφοροποιηθούν ξεκάθαρα οι ερωτηθέντες ανά κατηγορίες-στόχους. Σε αυτήν την περίπτωση, οι ίδιες οι ομάδες αντιπροσωπεύονται από επίπεδα μιας παραμέτρου μίας παραλλαγής. Ας ρίξουμε μια πιο προσεκτική ματιά στο μοντέλο λογιστικής παλινδρόμησης και ας μάθουμε γιατί χρειάζεται.

υλικοτεχνική παλινδρόμηση
υλικοτεχνική παλινδρόμηση

Γενικές πληροφορίες

Ένα παράδειγμα προβλήματος στο οποίο χρησιμοποιείται λογιστική παλινδρόμηση είναι η ταξινόμηση των ερωτηθέντων σε ομάδες που αγοράζουν και δεν αγοράζουν μουστάρδα. Η διαφοροποίηση πραγματοποιείται σύμφωνα με τα κοινωνικοδημογραφικά χαρακτηριστικά. Αυτά περιλαμβάνουν, ειδικότερα, ηλικία, φύλο, αριθμό συγγενών, εισόδημα κ.λπ. Στις πράξεις υπάρχουν κριτήρια διαφοροποίησης και μεταβλητή. Το τελευταίο κωδικοποιεί τις κατηγορίες-στόχους στις οποίες, στην πραγματικότητα, θα πρέπει να χωριστούν οι ερωτηθέντες.

Nuances

Πρέπει να ειπωθεί ότι το εύρος των περιπτώσεων στις οποίες εφαρμόζεται η λογιστική παλινδρόμηση είναι πολύ στενότερο από ό,τι για τη διακριτική ανάλυση. Από αυτή την άποψη, εξετάζεται η χρήση της τελευταίας ως καθολικής μεθόδου διαφοροποίησηςπερισσότερο προτιμώμενο. Επιπλέον, οι ειδικοί συνιστούν την έναρξη μελετών ταξινόμησης με διακριτική ανάλυση. Και μόνο σε περίπτωση αβεβαιότητας σχετικά με τα αποτελέσματα, μπορείτε να χρησιμοποιήσετε λογιστική παλινδρόμηση. Αυτή η ανάγκη οφείλεται σε διάφορους παράγοντες. Η λογιστική παλινδρόμηση χρησιμοποιείται όταν υπάρχει σαφής κατανόηση του τύπου των ανεξάρτητων και εξαρτημένων μεταβλητών. Αντίστοιχα, επιλέγεται μία από τις 3 πιθανές διαδικασίες. Στη διακριτική ανάλυση, ο ερευνητής ασχολείται πάντα με μια στατική πράξη. Περιλαμβάνει μία εξαρτημένη και πολλές ανεξάρτητες κατηγορικές μεταβλητές με οποιοδήποτε τύπο κλίμακας.

Προβολές

Το καθήκον μιας στατιστικής μελέτης που χρησιμοποιεί λογιστική παλινδρόμηση είναι να προσδιορίσει την πιθανότητα ένας συγκεκριμένος ερωτώμενος να ανατεθεί σε μια συγκεκριμένη ομάδα. Η διαφοροποίηση πραγματοποιείται σύμφωνα με ορισμένες παραμέτρους. Στην πράξη, σύμφωνα με τις τιμές ενός ή περισσοτέρων ανεξάρτητων παραγόντων, είναι δυνατό να ταξινομηθούν οι ερωτηθέντες σε δύο ομάδες. Σε αυτή την περίπτωση, λαμβάνει χώρα δυαδική λογιστική παλινδρόμηση. Επίσης, οι καθορισμένες παράμετροι μπορούν να χρησιμοποιηθούν κατά τη διαίρεση σε ομάδες άνω των δύο. Σε μια τέτοια κατάσταση, λαμβάνει χώρα πολυωνυμική λογιστική παλινδρόμηση. Οι ομάδες που προκύπτουν εκφράζονται σε επίπεδα μιας μεμονωμένης μεταβλητής.

υλικοτεχνική παλινδρόμηση
υλικοτεχνική παλινδρόμηση

Παράδειγμα

Ας υποθέσουμε ότι υπάρχουν οι απαντήσεις των ερωτηθέντων στο ερώτημα εάν ενδιαφέρονται για την προσφορά αγοράς οικοπέδου στα προάστια της Μόσχας. Οι επιλογές είναι "όχι"και ναι. Είναι απαραίτητο να μάθουμε ποιοι παράγοντες έχουν κυρίαρχη επιρροή στην απόφαση των πιθανών αγοραστών. Για να γίνει αυτό, οι ερωτώμενοι υποβάλλονται σε ερωτήσεις σχετικά με την υποδομή της επικράτειας, την απόσταση από την πρωτεύουσα, την περιοχή της τοποθεσίας, την παρουσία / απουσία κτιρίου κατοικιών κ.λπ. Χρησιμοποιώντας δυαδική παλινδρόμηση, είναι δυνατή η διανομή οι ερωτηθέντες χωρίζονται σε δύο ομάδες. Το πρώτο θα περιλαμβάνει όσους ενδιαφέρονται για την εξαγορά - υποψήφιους αγοραστές και το δεύτερο, αντίστοιχα, όσους δεν ενδιαφέρονται για μια τέτοια προσφορά. Για κάθε ερωτώμενο, επιπλέον, θα υπολογιστεί η πιθανότητα να εκχωρηθεί σε μία ή άλλη κατηγορία.

Συγκριτικά χαρακτηριστικά

Η διαφορά από τις δύο παραπάνω επιλογές είναι ο διαφορετικός αριθμός ομάδων και ο τύπος των εξαρτημένων και ανεξάρτητων μεταβλητών. Στη δυαδική παλινδρόμηση, για παράδειγμα, μελετάται η εξάρτηση ενός διχοτόμου παράγοντα από μία ή περισσότερες ανεξάρτητες συνθήκες. Επιπλέον, το τελευταίο μπορεί να έχει οποιοδήποτε τύπο κλίμακας. Η πολυωνυμική παλινδρόμηση θεωρείται παραλλαγή αυτής της επιλογής ταξινόμησης. Σε αυτήν, περισσότερες από 2 ομάδες ανήκουν στην εξαρτημένη μεταβλητή. Οι ανεξάρτητοι παράγοντες πρέπει να έχουν είτε τακτική είτε ονομαστική κλίμακα.

Λογιστική παλινδρόμηση στο spss

Στο στατιστικό πακέτο 11-12 εισήχθη μια νέα έκδοση ανάλυσης - τακτική. Αυτή η μέθοδος χρησιμοποιείται όταν ο εξαρτημένος παράγοντας ανήκει στην ίδια ονομαστική (τακτική) κλίμακα. Σε αυτήν την περίπτωση, επιλέγονται ανεξάρτητες μεταβλητές ενός συγκεκριμένου τύπου. Πρέπει να είναι είτε τακτικά είτε ονομαστικά. Η ταξινόμηση σε διάφορες κατηγορίες θεωρείται η πλέονΠαγκόσμιος. Αυτή η μέθοδος μπορεί να χρησιμοποιηθεί σε όλες τις μελέτες που χρησιμοποιούν λογιστική παλινδρόμηση. Ωστόσο, ο μόνος τρόπος για να βελτιώσετε την ποιότητα ενός μοντέλου είναι να χρησιμοποιήσετε και τις τρεις τεχνικές.

ποιοτικός έλεγχος επάρκειας και υλικοτεχνική παλινδρόμηση
ποιοτικός έλεγχος επάρκειας και υλικοτεχνική παλινδρόμηση

Τακτική ταξινόμηση

Πρέπει να ειπωθεί ότι νωρίτερα στο στατιστικό πακέτο δεν υπήρχε τυπική δυνατότητα διενέργειας εξειδικευμένης ανάλυσης για εξαρτημένους παράγοντες με τακτική κλίμακα. Για όλες τις μεταβλητές με περισσότερες από 2 ομάδες, χρησιμοποιήθηκε η πολυονομαστική παραλλαγή. Η σχετικά πρόσφατα εισαχθείσα τακτική ανάλυση έχει μια σειρά από χαρακτηριστικά. Λαμβάνουν υπόψη τις ιδιαιτερότητες της κλίμακας. Εν τω μεταξύ, στα εκπαιδευτικά βοηθήματα, η τακτική λογιστική παλινδρόμηση συχνά δεν θεωρείται ως ξεχωριστή τεχνική. Αυτό οφείλεται στο εξής: η τακτική ανάλυση δεν έχει σημαντικά πλεονεκτήματα έναντι της πολυωνυμικής. Ο ερευνητής μπορεί κάλλιστα να χρησιμοποιήσει το τελευταίο παρουσία τόσο μιας τακτικής όσο και μιας ονομαστικής εξαρτημένης μεταβλητής. Ταυτόχρονα, οι ίδιες οι διαδικασίες ταξινόμησης σχεδόν δεν διαφέρουν μεταξύ τους. Αυτό σημαίνει ότι η εκτέλεση της τακτικής ανάλυσης δεν θα προκαλέσει δυσκολίες.

Επιλογή ανάλυσης

Ας εξετάσουμε μια απλή περίπτωση - δυαδική παλινδρόμηση. Ας υποθέσουμε ότι, στη διαδικασία της έρευνας μάρκετινγκ, αξιολογείται η ζήτηση για πτυχιούχους ενός συγκεκριμένου μητροπολιτικού πανεπιστημίου. Στο ερωτηματολόγιο, οι ερωτηθέντες τέθηκαν ερωτήσεις, όπως:

  1. Είστε απασχολούμενος; (ql).
  2. Εισαγάγετε το έτος αποφοίτησης (q 21).
  3. Ποιος είναι ο μέσος όροςβαθμολογία αποφοίτησης (μέσος όρος).
  4. Φύλο (q22).

Η λογιστική παλινδρόμηση θα αξιολογήσει τον αντίκτυπο των ανεξάρτητων παραγόντων aver, q 21 και q 22 στη μεταβλητή ql. Με απλά λόγια, ο σκοπός της ανάλυσης θα είναι να προσδιορίσει την πιθανή απασχόληση των αποφοίτων με βάση πληροφορίες σχετικά με τον κλάδο, το έτος αποφοίτησης και τη ΣΔΣ.

δείκτης λογιστικής σιγμοειδούς παλινδρόμησης
δείκτης λογιστικής σιγμοειδούς παλινδρόμησης

Logistic Regression

Για να ορίσετε παραμέτρους χρησιμοποιώντας δυαδική παλινδρόμηση, χρησιμοποιήστε το μενού Analyze►Regression►Binary Logistic. Στο παράθυρο Logistic Regression, επιλέξτε τον εξαρτημένο παράγοντα από τη λίστα των διαθέσιμων μεταβλητών στα αριστερά. Είναι ql. Αυτή η μεταβλητή πρέπει να τοποθετηθεί στο πεδίο Εξαρτημένο. Μετά από αυτό, είναι απαραίτητο να εισαχθούν ανεξάρτητοι παράγοντες στο οικόπεδο Covariates - q 21, q 22, aver. Στη συνέχεια, πρέπει να επιλέξετε πώς θα τα συμπεριλάβετε στην ανάλυσή σας. Εάν ο αριθμός των ανεξάρτητων παραγόντων είναι μεγαλύτερος από 2, τότε χρησιμοποιείται η μέθοδος ταυτόχρονης εισαγωγής όλων των μεταβλητών, η οποία έχει οριστεί από προεπιλογή, αλλά βήμα προς βήμα. Ο πιο δημοφιλής τρόπος είναι το Backward:LR. Χρησιμοποιώντας το κουμπί Επιλογή, μπορείτε να συμπεριλάβετε στη μελέτη όχι όλους τους ερωτηθέντες, αλλά μόνο μια συγκεκριμένη κατηγορία στόχου.

Ορισμός κατηγορικών μεταβλητών

Το κουμπί Κατηγορία θα πρέπει να χρησιμοποιείται όταν μία από τις ανεξάρτητες μεταβλητές είναι ονομαστική με περισσότερες από 2 κατηγορίες. Σε αυτήν την περίπτωση, στο παράθυρο Ορισμός Κατηγορικών Μεταβλητών, ακριβώς μια τέτοια παράμετρος τοποθετείται στην ενότητα Κατηγορικές Συμμεταβλητές. Σε αυτό το παράδειγμα, δεν υπάρχει τέτοια μεταβλητή. Μετά από αυτό, στην αναπτυσσόμενη λίστα ακολουθεί η Αντίθεσηεπιλέξτε το στοιχείο Απόκλιση και πατήστε το κουμπί Αλλαγή. Ως αποτέλεσμα, πολλές εξαρτημένες μεταβλητές θα σχηματιστούν από κάθε ονομαστικό παράγοντα. Ο αριθμός τους αντιστοιχεί στον αριθμό των κατηγοριών της αρχικής συνθήκης.

Αποθήκευση νέων μεταβλητών

Χρησιμοποιώντας το κουμπί Αποθήκευση στο κύριο πλαίσιο διαλόγου της μελέτης, ορίζεται η δημιουργία νέων παραμέτρων. Θα περιέχουν τους δείκτες που υπολογίζονται στη διαδικασία παλινδρόμησης. Συγκεκριμένα, μπορείτε να δημιουργήσετε μεταβλητές που ορίζουν:

  1. Ανήκουν σε μια συγκεκριμένη κατηγορία ταξινόμησης (Groupmembership).
  2. Πιθανότητα ανάθεσης ενός ερωτώμενου σε κάθε ομάδα μελέτης (Πιθανότητες).

Όταν χρησιμοποιεί το κουμπί Επιλογές, ο ερευνητής δεν έχει σημαντικές επιλογές. Κατά συνέπεια, μπορεί να αγνοηθεί. Αφού κάνετε κλικ στο κουμπί "OK", τα αποτελέσματα της ανάλυσης θα εμφανιστούν στο κύριο παράθυρο.

συντελεστής λογιστικής παλινδρόμησης
συντελεστής λογιστικής παλινδρόμησης

Έλεγχος ποιότητας για επάρκεια και υλικοτεχνική παλινδρόμηση

Εξετάστε τον πίνακα Συντελεστών Μοντέλων Δοκιμών Omnibus. Εμφανίζει τα αποτελέσματα της ανάλυσης της ποιότητας της προσέγγισης του μοντέλου. Λόγω του γεγονότος ότι ορίστηκε μια επιλογή βήμα προς βήμα, πρέπει να δείτε τα αποτελέσματα του τελευταίου σταδίου (Βήμα 2). Ένα θετικό αποτέλεσμα θα ληφθεί υπόψη εάν διαπιστωθεί αύξηση του δείκτη Chi-square κατά τη μετάβαση στο επόμενο στάδιο σε υψηλό βαθμό σημαντικότητας (Sig. < 0,05). Η ποιότητα του μοντέλου αξιολογείται στη γραμμή Model. Εάν ληφθεί αρνητική τιμή, αλλά δεν θεωρείται σημαντική με τη συνολική υψηλή ουσιαστικότητα του μοντέλου, η τελευταίαμπορεί να θεωρηθεί πρακτικά κατάλληλο.

Tables

Σύνοψη μοντέλου καθιστά δυνατή την εκτίμηση του συνολικού δείκτη διακύμανσης, ο οποίος περιγράφεται από το κατασκευασμένο μοντέλο (Δείκτης R Square). Συνιστάται η χρήση της τιμής Nagelker. Η παράμετρος Nagelkerke R Square μπορεί να θεωρηθεί θετικός δείκτης εάν είναι πάνω από 0,50. Στη συνέχεια, αξιολογούνται τα αποτελέσματα της ταξινόμησης, στην οποία συγκρίνονται οι πραγματικοί δείκτες που ανήκουν σε μια ή την άλλη κατηγορία υπό μελέτη με αυτούς που προβλέπονται με βάση το μοντέλο παλινδρόμησης. Για αυτό, χρησιμοποιείται ο Πίνακας Ταξινόμησης. Μας επιτρέπει επίσης να εξάγουμε συμπεράσματα σχετικά με την ορθότητα της διαφοροποίησης για κάθε ομάδα υπό εξέταση.

μοντέλο λογιστικής παλινδρόμησης
μοντέλο λογιστικής παλινδρόμησης

Ο ακόλουθος πίνακας παρέχει την ευκαιρία να μάθετε τη στατιστική σημασία των ανεξάρτητων παραγόντων που εισήχθησαν στην ανάλυση, καθώς και κάθε μη τυποποιημένο συντελεστή λογιστικής παλινδρόμησης. Με βάση αυτούς τους δείκτες, είναι δυνατό να προβλεφθεί η συμμετοχή κάθε ερωτώμενου στο δείγμα σε μια συγκεκριμένη ομάδα. Χρησιμοποιώντας το κουμπί Αποθήκευση, μπορείτε να εισάγετε νέες μεταβλητές. Θα περιέχουν πληροφορίες σχετικά με το αν ανήκουν σε μια συγκεκριμένη κατηγορία ταξινόμησης (Προβλεπόμενη κατηγορία) και την πιθανότητα να συμπεριληφθούν σε αυτές τις ομάδες (Προβλεπόμενες πιθανότητες ένταξη). Αφού κάνετε κλικ στο "OK", τα αποτελέσματα υπολογισμού θα εμφανιστούν στο κύριο παράθυρο της Πολυωνυμικής Logistic Regression.

Ο πρώτος πίνακας, ο οποίος περιέχει δείκτες σημαντικούς για τον ερευνητή, είναι οι Πληροφορίες προσαρμογής μοντέλου. Ένα υψηλό επίπεδο στατιστικής σημασίας θα υποδηλώνει υψηλή ποιότητα καικαταλληλότητα χρήσης του μοντέλου στην επίλυση πρακτικών προβλημάτων. Ένας άλλος σημαντικός πίνακας είναι το Pseudo R-Square. Σας επιτρέπει να υπολογίσετε το ποσοστό της συνολικής διακύμανσης στον εξαρτημένο παράγοντα, το οποίο καθορίζεται από τις ανεξάρτητες μεταβλητές που επιλέχθηκαν για ανάλυση. Σύμφωνα με τον πίνακα Likelihood Ratio Tests, μπορούμε να βγάλουμε συμπεράσματα σχετικά με τη στατιστική σημασία του τελευταίου. Οι εκτιμήσεις παραμέτρων αντικατοπτρίζουν μη τυποποιημένους συντελεστές. Χρησιμοποιούνται στην κατασκευή της εξίσωσης. Επιπλέον, για κάθε συνδυασμό μεταβλητών προσδιορίστηκε η στατιστική σημασία της επίδρασής τους στον εξαρτημένο παράγοντα. Εν τω μεταξύ, στην έρευνα μάρκετινγκ, συχνά καθίσταται απαραίτητο να διαφοροποιούνται οι ερωτηθέντες ανά κατηγορία όχι μεμονωμένα, αλλά ως μέρος της ομάδας στόχου. Για αυτό, χρησιμοποιείται ο πίνακας παρατηρούμενων και προβλεπόμενων συχνοτήτων.

Πρακτική εφαρμογή

Η εξεταζόμενη μέθοδος ανάλυσης χρησιμοποιείται ευρέως στις εργασίες των εμπόρων. Το 1991 αναπτύχθηκε ο δείκτης λογιστικής σιγμοειδούς παλινδρόμησης. Είναι ένα εύχρηστο και αποτελεσματικό εργαλείο για την πρόβλεψη πιθανών τιμών πριν «υπερθερμανθούν». Η ένδειξη εμφανίζεται στο γράφημα ως κανάλι που σχηματίζεται από δύο παράλληλες γραμμές. Απέχουν εξίσου από την τάση. Το πλάτος του διαδρόμου θα εξαρτηθεί αποκλειστικά από το χρονοδιάγραμμα. Ο δείκτης χρησιμοποιείται όταν εργάζεστε με όλα σχεδόν τα περιουσιακά στοιχεία - από ζεύγη νομισμάτων έως πολύτιμα μέταλλα.

λογιστική παλινδρόμηση στο spss
λογιστική παλινδρόμηση στο spss

Στην πράξη, έχουν αναπτυχθεί 2 βασικές στρατηγικές για τη χρήση του οργάνου: για ξεσπάσματα καιγια μια στροφή. Στην τελευταία περίπτωση, ο έμπορος θα επικεντρωθεί στη δυναμική των μεταβολών των τιμών εντός του καναλιού. Καθώς η τιμή πλησιάζει τη γραμμή στήριξης ή αντίστασης, τοποθετείται ένα στοίχημα στην πιθανότητα ότι η κίνηση θα ξεκινήσει προς την αντίθετη κατεύθυνση. Εάν η τιμή πλησιάζει το ανώτερο περίγραμμα, τότε μπορείτε να απαλλαγείτε από το περιουσιακό στοιχείο. Εάν είναι στο κατώτερο όριο, τότε θα πρέπει να σκεφτείτε την αγορά. Η στρατηγική ξεμπλοκαρίσματος περιλαμβάνει τη χρήση παραγγελιών. Τοποθετούνται εκτός ορίων σε σχετικά μικρή απόσταση. Λαμβάνοντας υπόψη ότι η τιμή σε ορισμένες περιπτώσεις τα παραβιάζει για μικρό χρονικό διάστημα, θα πρέπει να παίξετε ασφαλή και να ορίσετε στοπ απώλειες. Ταυτόχρονα, φυσικά, ανεξάρτητα από την επιλεγμένη στρατηγική, ο έμπορος πρέπει να αντιληφθεί και να αξιολογήσει την κατάσταση που έχει προκύψει στην αγορά όσο το δυνατόν πιο ήρεμα.

Συμπέρασμα

Έτσι, η χρήση της λογιστικής παλινδρόμησης σάς επιτρέπει να ταξινομείτε γρήγορα και εύκολα τους ερωτηθέντες σε κατηγορίες σύμφωνα με τις δεδομένες παραμέτρους. Κατά την ανάλυση, μπορείτε να χρησιμοποιήσετε οποιαδήποτε συγκεκριμένη μέθοδο. Συγκεκριμένα, η πολυωνυμική παλινδρόμηση είναι καθολική. Ωστόσο, οι ειδικοί συνιστούν τη χρήση όλων των μεθόδων που περιγράφονται παραπάνω σε συνδυασμό. Αυτό οφείλεται στο γεγονός ότι σε αυτή την περίπτωση η ποιότητα του μοντέλου θα είναι σημαντικά υψηλότερη. Αυτό, με τη σειρά του, θα επεκτείνει το εύρος της εφαρμογής του.

Συνιστάται: