Γραμμική εξάρτηση στο excel. Τα βασικά καθήκοντα της παλινδρόμησης στο Excel: ένα παράδειγμα οικοδόμησης μοντέλου

Σε προηγούμενες σημειώσεις, το αντικείμενο της ανάλυσης έγινε συχνά μια ξεχωριστή αριθμητική μεταβλητή, για παράδειγμα, η κερδοφορία των αμοιβαίων κεφαλαίων, ο χρόνος φόρτωσης μιας ιστοσελίδας ή ο όγκος κατανάλωσης αναψυκτικών. Σε αυτήν και στις παρακάτω σημειώσεις, θα εξετάσουμε μεθόδους για την πρόβλεψη των τιμών μίας αριθμητικής μεταβλητής ανάλογα με τις τιμές μιας ή περισσοτέρων άλλων αριθμητικών μεταβλητών.

Το υλικό θα απεικονισθεί με ένα εγκάρσιο παράδειγμα. Πρόβλεψη πωλήσεων σε κατάστημα ειδών ένδυσης.Η αλυσίδα καταστημάτων έκπτωσης Sunflowers επεκτείνεται συνεχώς εδώ και 25 χρόνια. Ωστόσο, η εταιρεία αυτή τη στιγμή δεν έχει συστηματική προσέγγιση για την επιλογή νέων καταστημάτων. Ο τόπος όπου η εταιρεία πρόκειται να ανοίξει ένα νέο κατάστημα καθορίζεται βάσει υποκειμενικών εκτιμήσεων. Τα κριτήρια επιλογής είναι ευνοϊκές συνθήκες ενοικίασης ή παραστάσεις του διαχειριστή σχετικά με την ιδανική τοποθεσία του καταστήματος. Φανταστείτε ότι είστε ο επικεφαλής των ειδικών σχεδίων και του τμήματος σχεδιασμού. Σας δόθηκε η εντολή να αναπτύξετε ένα στρατηγικό σχέδιο για το άνοιγμα νέων καταστημάτων. Το σχέδιο αυτό θα πρέπει να περιλαμβάνει πρόβλεψη για ετήσιες πωλήσεις σε νεοαποκτηθέντα καταστήματα. Πιστεύετε ότι η περιοχή πωλήσεων σχετίζεται άμεσα με τον όγκο των εσόδων και θέλετε να λάβετε υπόψη αυτό το γεγονός στη διαδικασία λήψης αποφάσεων. Πώς να αναπτύξετε ένα στατιστικό μοντέλο για να προβλέψετε ετήσιες πωλήσεις με βάση το μέγεθος ενός νέου καταστήματος;

Συνήθως, η ανάλυση παλινδρόμησης χρησιμοποιείται για την πρόβλεψη μεταβλητών τιμών. Ο σκοπός του είναι να αναπτύξει ένα στατιστικό μοντέλο που επιτρέπει την πρόβλεψη των τιμών της εξαρτώμενης μεταβλητής ή απόκρισης από τις τιμές μιας τουλάχιστον ανεξάρτητης ή επεξηγηματικής μεταβλητής. Σε αυτή τη σημείωση, θα εξετάσουμε μια απλή γραμμική παλινδρόμηση - μια στατιστική μέθοδος που σας επιτρέπει να προβλέψετε τις τιμές της εξαρτημένης μεταβλητής Υ  με τιμές μιας ανεξάρτητης μεταβλητής Χ. Οι επόμενες σημειώσεις περιγράφουν ένα μοντέλο πολλαπλής παλινδρόμησης που έχει σχεδιαστεί για να προβλέψει τις τιμές μιας ανεξάρτητης μεταβλητής. Υ  από τις τιμές πολλών εξαρτημένων μεταβλητών ( Χ1, Χ2, ..., Χκ).

Λήψη σημείωσης σε μορφή ή, παραδείγματα σε μορφή

Τύποι μοντέλων παλινδρόμησης

όπου ρ 1   - συντελεστής αυτοσυσχέτισης · εάν ρ 1   \u003d 0 (χωρίς αυτοσυσχέτιση), Δ  ≈ 2; εάν ρ 1   ≈ 1 (θετική αυτοσυσχέτιση), Δ  ≈ 0; εάν ρ 1 \u003d -1 (αρνητική αυτοσυσχέτιση), Δ ≈ 4.

Στην πράξη, η εφαρμογή του κριτηρίου Durbin-Watson βασίζεται στη σύγκριση του Δ  με κρίσιμες θεωρητικές τιμές d L  και d U  για ένα δεδομένο αριθμό παρατηρήσεων n, ο αριθμός των ανεξάρτητων μεταβλητών του μοντέλου k  (για απλή γραμμική παλινδρόμηση k  \u003d 1) και το επίπεδο σημασίας α. Αν Δ< d L , η υπόθεση της ανεξαρτησίας των τυχαίων αποκλίσεων απορρίπτεται (συνεπώς, υπάρχει μια θετική αυτοσυσχέτιση). εάν D\u003e d U, η υπόθεση δεν απορρίπτεται (δηλαδή, απουσιάζει η αυτοσυσχέτιση). εάν d L< D < d U Δεν υπάρχουν επαρκείς λόγοι για τη λήψη απόφασης. Όταν υπολογίζεται η τιμή Δ  υπερβαίνει το 2, τότε με d L  και d U  δεν συγκρίνεται ο συντελεστής Δ, και η έκφραση (4- Δ).

Για να υπολογίσουμε τα στατιστικά στοιχεία Durbin-Watson στο Excel, γυρίζουμε στο κάτω πίνακα στο Σχ. 14 Υπόλοιπο απόσυρσης. Ο αριθμητής σε έκφραση (10) υπολογίζεται χρησιμοποιώντας τη συνάρτηση \u003d SUMMKVRAZN (array1; array2) και ο παρονομαστής \u003d SUMMKVRAZN (πίνακας) (Εικ. 16).

Το Σχ. 16. Φόρμες για τον υπολογισμό των στατιστικών του Durbin-Watson

Στο παράδειγμά μας Δ  \u003d 0.883. Το κύριο ερώτημα είναι: ποια αξία των στατιστικών Durbin-Watson θα πρέπει να θεωρηθεί ότι είναι αρκετά μικρή για να καταλήξει στο συμπέρασμα ότι υπάρχει μια θετική αυτοσυσχέτιση; Είναι απαραίτητο να συσχετιστεί η τιμή του D με τις κρίσιμες τιμές ( d Lκαι   d U) ανάλογα με τον αριθμό των παρατηρήσεων n  και το επίπεδο σημασίας α (Σχήμα 17).

Το Σχ. 17. Σημαντικές τιμές των στατιστικών Durbin-Watson (τμήμα του πίνακα)

Έτσι, στο πρόβλημα των πωλήσεων σε ένα κατάστημα που παραδίδει αγαθά στο σπίτι σας, υπάρχει μια ανεξάρτητη μεταβλητή ( k  \u003d 1), 15 παρατηρήσεις ( n  \u003d 15) και το επίπεδο σημαντικότητας α \u003d 0,05. Επομένως d L\u003d 1,08 και δ  U  \u003d 1.36. Δεδομένου ότι Δ = 0,883 < d L\u003d 1,08, υπάρχει θετική αυτοσυσχέτιση μεταξύ των υπολειμμάτων, η μέθοδος των ελαχίστων τετραγώνων δεν μπορεί να εφαρμοστεί.

Δοκιμή υποθέσεων για κλίση και συντελεστή συσχέτισης

Η παραπάνω παλινδρόμηση χρησιμοποιήθηκε αποκλειστικά για την πρόβλεψη. Για τον προσδιορισμό των συντελεστών παλινδρόμησης και την πρόβλεψη της τιμής μιας μεταβλητής Υ  για μια δεδομένη τιμή μιας μεταβλητής Χ  χρησιμοποιήθηκε η μέθοδος των ελάχιστων τετραγώνων. Επιπλέον, εξετάσαμε το τυπικό σφάλμα της εκτίμησης και το μικτό συντελεστή συσχέτισης. Εάν η ανάλυση των υπολειμμάτων επιβεβαιώσει ότι οι συνθήκες εφαρμογής της μεθόδου των ελαχίστων τετραγώνων δεν παραβιάζονται και το απλό μοντέλο γραμμικής παλινδρόμησης είναι επαρκές, βάσει δεδομένων δειγμάτων, μπορεί να υποστηριχθεί ότι υπάρχει μια γραμμική σχέση μεταξύ των μεταβλητών του πληθυσμού.

Εφαρμογήt κριτήριο για κλίση.Ελέγχοντας αν η κλίση του πληθυσμού β 1 είναι ίση με το μηδέν, μπορεί να καθοριστεί εάν υπάρχει στατιστικά σημαντική σχέση μεταξύ των μεταβλητών Χ  και Υ. Αν αυτή η υπόθεση απορριφθεί, μπορεί να υποστηριχθεί ότι μεταξύ μεταβλητών Χ  και Υ  υπάρχει μια γραμμική σχέση. Οι μηδενικές και οι εναλλακτικές υποθέσεις διαμορφώνονται ως εξής: H 0: β 1 \u003d 0 (καμία γραμμική σχέση), H1: β 1 ≠ 0 (υπάρχει γραμμική σχέση). Εξ ορισμού t-στατιστική είναι ίση με τη διαφορά μεταξύ της κλίσης του δείγματος και της υποθετικής τιμής της κλίσης του πληθυσμού διαιρούμενη με το τυπικό σφάλμα της εκτίμησης της κλίσης:

(11) t = (β 1 β 1 ) / S b 1

όπου β 1   Είναι η κλίση της άμεσης παλινδρόμησης σύμφωνα με τα δεδομένα δείγματος, β1 είναι η υποθετική κλίση του άμεσου γενικού πληθυσμού, , και στατιστικά στοιχεία δοκιμών t  έχει tδιανομή με n - 2  βαθμούς ελευθερίας.

Ελέγξτε εάν υπάρχει στατιστικά σημαντική σχέση μεταξύ μεγέθους καταστήματος και ετήσιων πωλήσεων για α \u003d 0,05. t- το κριτήριο εμφανίζεται μαζί με άλλες παραμέτρους κατά τη χρήση Πακέτο ανάλυσης  (επιλογή Η παλινδρόμηση) Τα πλήρη αποτελέσματα του πακέτου ανάλυσης φαίνονται στο Σχ. 4, ένα κομμάτι που σχετίζεται με τα στατιστικά στοιχεία t - στο Σχ. 18.

Το Σχ. 18. Αποτελέσματα εφαρμογής t

Από τον αριθμό των καταστημάτων n  \u003d 14 (βλέπε σχήμα 3), την κρίσιμη τιμή t-στατιστικά σε επίπεδο σημαντικότητας α \u003d 0,05 μπορεί να βρεθεί από τον τύπο: t L  \u003d STUDENT.OBR (0.025; 12) \u003d -2.1788, όπου το 0.025 είναι το ήμισυ του επιπέδου σημαντικότητας και 12 \u003d n – 2; t U  \u003d STUDENT.OBR (0.975, 12) \u003d + 2.1788.

Δεδομένου ότι t-στατιστικά \u003d 10.64\u003e t U  \u003d 2.1788 (Σχήμα 19), η μηδενική υπόθεση H 0  αποκλίνει. Από την άλλη πλευρά σ-τιμή για Χ  \u003d 10.6411, που υπολογίζεται από τον τύπο \u003d 1-STUDENT.DISC (D3; 12; TRUE), είναι περίπου ίσο με το μηδέν, επομένως η υπόθεση H 0  αποκλίνει ξανά. Το γεγονός ότι σ- η τιμή είναι σχεδόν μηδενική, πράγμα που σημαίνει ότι εάν δεν υπήρχε πραγματική γραμμική σχέση μεταξύ του μεγέθους των καταστημάτων και του ετήσιου όγκου πωλήσεων, θα ήταν πρακτικά αδύνατο να το ανιχνεύσουμε χρησιμοποιώντας γραμμική παλινδρόμηση. Συνεπώς, υπάρχει στατιστικά σημαντική γραμμική σχέση μεταξύ των μέσων ετήσιων πωλήσεων στα καταστήματα και του μεγέθους τους.

Το Σχ. 19. Δοκιμή της υπόθεσης για την κλίση του πληθυσμού σε επίπεδο σημασίας 0,05 και 12 βαθμών ελευθερίας

ΕφαρμογήF κριτήριο για κλίση.Μια εναλλακτική προσέγγιση για τη δοκιμή υποθέσεων σχετικά με την κλίση της απλής γραμμικής παλινδρόμησης είναι η χρήση Fκριτήριο. Θυμηθείτε αυτό F-criterion χρησιμοποιείται για να ελέγξει τη σχέση μεταξύ δύο διακυμάνσεων (βλέπε λεπτομέρειες). Κατά τη δοκιμή της υπόθεσης κλίσης, το μέτρο τυχαίων σφαλμάτων είναι η διακύμανση του σφάλματος (το άθροισμα των τετραγώνων σφαλμάτων διαιρούμενο με τον αριθμό βαθμών ελευθερίας), επομένως F- το κριτήριο χρησιμοποιεί τον λόγο διακύμανσης που εξηγείται από την παλινδρόμηση (δηλ. SSRδιαιρούμενο με τον αριθμό των ανεξάρτητων μεταβλητών k), στη διακύμανση των σφαλμάτων ( MSE \u003d SY  Χ 2 ).

Εξ ορισμού F-στατιστικά είναι ίσο με το μέσο τετράγωνο των αποκλίσεων λόγω παλινδρόμησης (MSR) διαιρούμενο με τη διακύμανση του σφάλματος (MSE): F = MSR/ MSEόπου MSR \u003dSSR / k, MSE \u003dSSE/(n- k - 1), k  - ο αριθμός ανεξάρτητων μεταβλητών στο μοντέλο παλινδρόμησης. Δοκιμάστε στατιστικά στοιχεία F  έχει Fδιανομή με k  και n  - k - 1  βαθμούς ελευθερίας.

Για ένα δεδομένο επίπεδο σημασίας α, ο κανόνας απόφασης διατυπώνεται ως εξής: if F\u003e f  UΗ μηδενική υπόθεση απορρίπτεται. διαφορετικά δεν αποκλίνει. Τα αποτελέσματα, που παρουσιάζονται με τη μορφή ενός περιστροφικού πίνακα της ανάλυσης της διακύμανσης, φαίνονται στο Σχ. 20.

Το Σχ. 20. Ανάλυση μεταβλητότητας πίνακα για να ελεγχθεί η υπόθεση της στατιστικής σημασίας του συντελεστή παλινδρόμησης

Ομοίως tκριτήριο F-το κριτήριο εμφανίζεται στον πίνακα όταν χρησιμοποιείται Πακέτο ανάλυσης  (επιλογή Η παλινδρόμηση) Πλήρη αποτελέσματα Πακέτο ανάλυσης  δίδονται στο σχ. 4, ένα τμήμα που σχετίζεται με F-στατιστική - στο σχ. 21.

Το Σχ. 21. Αποτελέσματα εφαρμογής Fκριτήρια που λαμβάνονται χρησιμοποιώντας το πακέτο ανάλυσης Excel

Το στατιστικό στοιχείο F είναι 113,23 και σ- τιμή κοντά στο μηδέν (κελί ΣυνάφειαF) Εάν το επίπεδο σημαντικότητας α είναι 0,05, καθορίστε την κρίσιμη τιμή F-διανομές με έναν και 12 βαθμούς ελευθερίας μπορεί να είναι σύμφωνα με τον τύπο F u  \u003d F. OBD (1-0,05 · 1 · 12) \u003d 4,7472 (Σχήμα 22). Δεδομένου ότι F = 113,23 > F u  \u003d 4.7472, και σ- τιμή κοντά στο 0< 0,05, нулевая гипотеза H 0  αποκλίνει, δηλ. το μέγεθος του καταστήματος συνδέεται στενά με τις ετήσιες πωλήσεις του.

Το Σχ. 22. Έλεγχος της υπόθεσης για την κλίση του πληθυσμού σε επίπεδο σημαντικότητας 0,05, με ένα και 12 βαθμούς ελευθερίας

Το διάστημα εμπιστοσύνης που περιέχει κλίση β 1.  Για να ελεγχθεί η υπόθεση της ύπαρξης γραμμικής σχέσης μεταξύ των μεταβλητών, μπορεί κανείς να κατασκευάσει ένα διάστημα εμπιστοσύνης που περιέχει την κλίση β 1 και να βεβαιωθεί ότι η υποθετική τιμή β 1 \u003d 0 ανήκει σε αυτό το διάστημα. Το κέντρο του διαστήματος εμπιστοσύνης που περιέχει την κλίση β 1 είναι η επιλεκτική κλίση β 1 , και τα όριά του είναι ποσότητες b 1 ±t n –2 S b 1

Όπως φαίνεται στο σχ. 18, β 1 = +1,670, n = 14, S b 1 = 0,157. t 12   \u003d STUDENT.OBR (0.975, 12) \u003d 2.1788. Επομένως b 1 ±t n –2 S b 1 \u003d +1.670 ± 2.1788 * 0.157 \u003d +1.670 ± 0.342, ή + 1.328 ≤ β 1 ≤ + 2.012. Έτσι, η κλίση του πληθυσμού με πιθανότητα 0,95 βρίσκεται στην περιοχή από +1,328 έως +2,012 (δηλαδή από $ 1,328,000 έως $ 2,012,000). Δεδομένου ότι οι τιμές αυτές είναι μεγαλύτερες από το μηδέν, υπάρχει στατιστικά σημαντική γραμμική σχέση μεταξύ των ετήσιων πωλήσεων και της περιοχής αποθεματοποίησης. Αν το διάστημα εμπιστοσύνης ήταν μηδέν, δεν υπήρχε εξάρτηση μεταξύ των μεταβλητών. Επιπλέον, ένα διάστημα εμπιστοσύνης σημαίνει ότι κάθε αύξηση στην αποθήκη κατά 1.000 τετραγωνικά μέτρα. ft οδηγεί σε αύξηση των μέσων πωλήσεων κατά $ 1.328.000 έως $ 2.012.000.

Χρήσηt -criterion για τον συντελεστή συσχέτισης.  εφαρμόστηκε συντελεστής συσχέτισης r, το οποίο είναι ένα μέτρο της σχέσης μεταξύ δύο αριθμητικών μεταβλητών. Μπορεί να χρησιμοποιηθεί για να προσδιοριστεί εάν υπάρχει στατιστικά σημαντική σχέση μεταξύ των δύο μεταβλητών. Προσδιορίστε τον συντελεστή συσχέτισης μεταξύ των πληθυσμών και των δύο μεταβλητών με ρ. Οι μηδενικές και οι εναλλακτικές υποθέσεις διατυπώνονται ως εξής: H 0: ρ \u003d 0 (χωρίς συσχέτιση), Η 1: ρ ≠ 0 (υπάρχει συσχέτιση). Ελέγξτε για συσχέτιση:

όπου r = + εάν β 1 > 0, r = – εάν β 1 < 0. Тестовая статистика t  έχει tδιανομή με n - 2  βαθμούς ελευθερίας.

Στο πρόβλημα της αλυσίδας καταστημάτων Sunflowers r 2  \u003d 0,904 και β 1- +1.670 (βλέπε σχήμα 4). Δεδομένου ότι β 1  \u003e 0, ο συντελεστής συσχέτισης μεταξύ των ετήσιων πωλήσεων και του μεγέθους του καταστήματος είναι r  \u003d + √0.904 \u003d +0.951. Επαληθεύουμε την μηδενική υπόθεση ότι δεν υπάρχει συσχέτιση μεταξύ αυτών των μεταβλητών χρησιμοποιώντας t-στατιστικά:

Σε επίπεδο σημαντικότητας α \u003d 0,05, η μηδενική υπόθεση πρέπει να απορριφθεί, δεδομένου ότι t  \u003d 10.64\u003e 2.1788. Έτσι, μπορεί να υποστηριχθεί ότι υπάρχει στατιστικά σημαντική σχέση μεταξύ των ετήσιων πωλήσεων και του μεγέθους του καταστήματος.

Κατά τη συζήτηση συμπερασμάτων σχετικά με την κλίση του πληθυσμού, τα διαστήματα εμπιστοσύνης και τα κριτήρια για την εξέταση των υποθέσεων είναι εναλλάξιμα εργαλεία. Ωστόσο, ο υπολογισμός του διαστήματος εμπιστοσύνης που περιέχει τον συντελεστή συσχέτισης είναι δυσκολότερος, δεδομένου ότι η μορφή της κατανομής των στατιστικών στοιχείων του δείγματος r  εξαρτάται από τον πραγματικό συντελεστή συσχέτισης.

Εκτίμηση της μαθηματικής προσδοκίας και πρόβλεψη των μεμονωμένων τιμών

Αυτή η ενότητα περιγράφει μεθόδους για την αξιολόγηση της μαθηματικής προσδοκίας μιας απάντησης. Υ  και προβλέψεις για μεμονωμένες τιμές Υ  σε δεδομένες τιμές μιας μεταβλητής Χ.

Κατασκευή διαστήματος εμπιστοσύνηςΣτο παράδειγμα 2 (βλέπε παραπάνω Μέθοδος ελαχίστων τετραγώνων) η εξίσωση παλινδρόμησης κατέστησε δυνατή την πρόβλεψη της τιμής της μεταβλητής Υ Χ. Στο πρόβλημα της επιλογής μιας θέσης για ένα κατάστημα λιανικής πώλησης, ο μέσος ετήσιος όγκος πωλήσεων σε ένα τετράγωνο 4000 τ.μ. ft ήταν ίσο με 7.644 εκατομμύρια δολάρια. Ωστόσο, αυτή η εκτίμηση των μαθηματικών προσδοκιών του πληθυσμού είναι ένα σημείο. Για να εκτιμηθεί η μαθηματική προσδοκία του πληθυσμού, προτάθηκε η έννοια του διαστήματος εμπιστοσύνης. Ομοίως, μπορούμε να εισαγάγουμε την ιδέα διάστημα εμπιστοσύνης για απόκριση προσδοκίας  σε μια δεδομένη τιμή μιας μεταβλητής Χ:

όπου , = β 0 + β 1 X i  - η προβλεπόμενη τιμή είναι μεταβλητή Υ  στο Χ = X i, S yx  - τυπικό σφάλμα n  - μέγεθος δείγματος, Χ  i  - καθορισμένη τιμή της μεταβλητής Χ, µ   Υ|  Χ =   Χ  i  - μεταβλητή προσδοκιών Υ  στο Χ = X i, SSX \u003d

Μια ανάλυση του τύπου (13) δείχνει ότι το πλάτος του διαστήματος εμπιστοσύνης εξαρτάται από διάφορους παράγοντες. Για ένα δεδομένο επίπεδο σπουδαιότητας, μια αύξηση στο εύρος των ταλαντώσεων γύρω από την παλινδρομική γραμμή, μετρούμενη με το πρότυπο σφάλμα, οδηγεί σε αύξηση του πλάτους του διαστήματος. Από την άλλη πλευρά, όπως αναμένεται, η αύξηση του μεγέθους του δείγματος συνοδεύεται από τη μείωση του διαστήματος. Επιπλέον, το πλάτος του διαστήματος ποικίλει ανάλογα με τις τιμές. Χ  i. Αν η τιμή της μεταβλητής Υ  προβλεπόμενη για τις ποσότητες Χκοντά στον μέσο όρο , το διάστημα εμπιστοσύνης είναι μικρότερο από ό, τι στην πρόβλεψη της απόκρισης για τιμές μακριά από το μέσο όρο.

Ας υποθέσουμε ότι, επιλέγοντας ένα χώρο για ένα κατάστημα, θέλουμε να δημιουργήσουμε ένα διάστημα εμπιστοσύνης 95% για τις μέσες ετήσιες πωλήσεις σε όλα τα καταστήματα με έκταση 4000 τετραγωνικών μέτρων. ft:

Κατά συνέπεια, οι μέσες ετήσιες πωλήσεις σε όλα τα καταστήματα με έκταση 4.000 τετραγωνικών μέτρων. ft, με πιθανότητα 95%, βρίσκεται μεταξύ $ 6.971 και $ 8.317 εκατομμυρίων.

Ο υπολογισμός του διαστήματος εμπιστοσύνης για την προβλεπόμενη τιμή.Εκτός από το διάστημα εμπιστοσύνης για το μαθηματικό προσδόκιμο μιας απόκρισης για μια δεδομένη τιμή μιας μεταβλητής ΧΕίναι συχνά απαραίτητο να γνωρίζουμε το διάστημα εμπιστοσύνης για την προβλεπόμενη τιμή. Παρά το γεγονός ότι ο τύπος για τον υπολογισμό ενός τέτοιου διαστήματος εμπιστοσύνης είναι πολύ παρόμοιος με τον τύπο (13), αυτό το διάστημα περιέχει την προβλεπόμενη τιμή και όχι την εκτίμηση των παραμέτρων. Προβλεπόμενο διάστημα απόκρισης Υ  Χ =   Xi  σε μια συγκεκριμένη τιμή μιας μεταβλητής Χ  i  που καθορίζεται από τον τύπο:

Ας υποθέσουμε ότι όταν επιλέγουμε μια θέση για ένα κατάστημα λιανικής, θέλουμε να δημιουργήσουμε ένα διάστημα εμπιστοσύνης 95% για τον προβλεπόμενο ετήσιο όγκο πωλήσεων σε ένα κατάστημα με έκταση 4000 τετραγωνικών μέτρων. ft:

Κατά συνέπεια, οι προβλεπόμενες ετήσιες πωλήσεις στο κατάστημα, των οποίων η επιφάνεια είναι 4000 τετραγωνικά μέτρα. ft, με πιθανότητα 95%, κυμαίνεται από $ 5.433 έως $ 9.854 εκατομμύρια.Όπως μπορείτε να δείτε, το διάστημα εμπιστοσύνης για την προβλεπόμενη τιμή απόκρισης είναι πολύ μεγαλύτερο από το διάστημα εμπιστοσύνης για τη μαθηματική του προσδοκία. Αυτό συμβαίνει επειδή η μεταβλητότητα στην πρόβλεψη μεμονωμένων τιμών είναι πολύ μεγαλύτερη από την εκτίμηση της μαθηματικής προσδοκίας.

Καταπακτές και ηθικά ζητήματα που συνδέονται με την υποχώρηση

Δυσκολίες σχετικές με την ανάλυση παλινδρόμησης:

  • Παράβλεψη των συνθηκών εφαρμογής των ελάχιστων τετραγώνων.
  • Εσφαλμένη εκτίμηση των συνθηκών εφαρμογής της μεθόδου των ελαχίστων τετραγώνων.
  • Λάθος επιλογή εναλλακτικών μεθόδων εάν παραβιάζονται οι συνθήκες εφαρμογής της μεθόδου των ελαχίστων τετραγώνων.
  • Η χρήση ανάλυσης παλινδρόμησης χωρίς βαθιά γνώση του αντικειμένου της μελέτης.
  • Εξαγωγή της παλινδρόμησης πέρα \u200b\u200bαπό το εύρος της επεξηγηματικής μεταβλητής.
  • Η σύγχυση μεταξύ στατιστικών και αιτιακών σχέσεων.

Η εκτεταμένη χρήση υπολογιστικών φύλλων και λογισμικού στατιστικού υπολογισμού εξάλειψε τα υπολογιστικά προβλήματα που εμπόδισαν τη χρήση της ανάλυσης παλινδρόμησης. Ωστόσο, αυτό οδήγησε στο γεγονός ότι η ανάλυση παλινδρόμησης άρχισε να χρησιμοποιείται από χρήστες που δεν διαθέτουν επαρκή προσόντα και γνώσεις. Πώς γνωρίζουν οι χρήστες εναλλακτικές μέθοδοι, αν πολλοί από αυτούς δεν έχουν καν την παραμικρή ιδέα για τις συνθήκες εφαρμογής της μεθόδου των ελαχίστων τετραγώνων και δεν είναι σε θέση να επαληθεύσουν την εφαρμογή τους;

Ο ερευνητής δεν θα πρέπει να παρασυρθεί με λείανση αριθμών - υπολογίζοντας τη μετατόπιση, την κλίση και το συντελεστή μικτής συσχέτισης. Χρειάζεται βαθύτερη γνώση. Εικονογραφούμε αυτό με ένα κλασικό παράδειγμα που προέρχεται από εγχειρίδια. Ο Anscombe έδειξε ότι και τα τέσσερα σύνολα δεδομένων που φαίνονται στο Σχ. 23, έχουν τις ίδιες παραμέτρους παλινδρόμησης (Εικ. 24).

Το Σχ. 23. Τέσσερα σύνολα τεχνητών δεδομένων

Το Σχ. 24. Ανάλυση παλινδρόμησης τεσσάρων τεχνητών συνόλων δεδομένων. εκτελείται με χρήση Πακέτο ανάλυσης(κάντε κλικ στην εικόνα για μεγέθυνση εικόνας)

Έτσι, από την άποψη της ανάλυσης παλινδρόμησης, όλα αυτά τα σύνολα δεδομένων είναι εντελώς όμοια. Εάν η ανάλυση είχε ολοκληρωθεί γι 'αυτό, θα χάσαμε πολλές χρήσιμες πληροφορίες. Αυτό αποδεικνύεται από τα διαγράμματα διασκορπισμού (Σχήμα 25) και τα υπόλοιπα διαγράμματα (Σχήμα 26) που έχουν κατασκευαστεί για αυτά τα σύνολα δεδομένων.

Το Σχ. 25. Διάγραμμα διασποράς για τέσσερα σύνολα δεδομένων

Τα διαγράμματα διάσπασης και τα υπόλοιπα οικόπεδα υποδεικνύουν ότι τα δεδομένα αυτά διαφέρουν μεταξύ τους. Το μόνο σύνολο που κατανέμεται κατά μήκος μιας ευθείας γραμμής είναι το σύνολο Α. Το γράφημα των υπολειμμάτων που υπολογίζεται από το σύνολο Α δεν έχει κανονικότητα. Αυτό δεν μπορεί να λεχθεί για τα σύνολα Β, Γ και Δ. Το διάγραμμα σκέδασης που κατασκευάζεται από το σετ Β δείχνει ένα προφανές τετραγωνικό μοντέλο. Αυτό το συμπέρασμα επιβεβαιώνεται από ένα παραβολικό σχήμα των υπολειμμάτων. Η συσχέτιση διασποράς και η υπολειμματική γραφική παράσταση δείχνουν ότι το σύνολο δεδομένων Β περιέχει ένα εξάρτημα. Σε αυτή την περίπτωση, είναι απαραίτητο να αποκλείσουμε την απόκλιση από το σύνολο δεδομένων και να επαναλάβουμε την ανάλυση. Μία μέθοδος για την ανίχνευση και την εξάλειψη των ακραίων τιμών από τις παρατηρήσεις ονομάζεται ανάλυση επιπτώσεων. Μετά την εξάλειψη της απόκλισης, το αποτέλεσμα της επαναξιολόγησης του μοντέλου μπορεί να είναι εντελώς διαφορετικό. Το διάγραμμα σκέδασης που κατασκευάστηκε από τα δεδομένα από το σετ D απεικονίζει μία ασυνήθιστη κατάσταση στην οποία το εμπειρικό μοντέλο εξαρτάται σημαντικά από την ατομική απόκριση ( X 8 = 19, Υ 8   \u003d 12,5). Αυτά τα μοντέλα παλινδρόμησης πρέπει να υπολογιστούν με ιδιαίτερη προσοχή. Έτσι, τα διαγράμματα διάσπασης και τα υπολείμματα είναι ένα βασικό εργαλείο για την ανάλυση παλινδρόμησης και πρέπει να αποτελούν αναπόσπαστο τμήμα της. Χωρίς αυτές, η ανάλυση παλινδρόμησης δεν είναι αξιόπιστη.

Το Σχ. 26. Υπολειμματικά οικόπεδα για τέσσερα σύνολα δεδομένων

Πώς να αποφύγετε παγίδες στην ανάλυση παλινδρόμησης:

  • Ανάλυση της πιθανής σχέσης μεταξύ μεταβλητών Χ  και Υ  ξεκινήστε πάντα με την κατασκευή ενός διαγράμματος διασποράς.
  • Πριν ερμηνεύσετε τα αποτελέσματα μιας ανάλυσης παλινδρόμησης, ελέγξτε τις συνθήκες εφαρμογής της.
  • Δημιουργήστε ένα γράφημα της εξάρτησης των υπολειμμάτων σε μια ανεξάρτητη μεταβλητή. Αυτό θα επιτρέψει να προσδιοριστεί πόσο το εμπειρικό μοντέλο ταιριάζει με τα αποτελέσματα παρατήρησης και να ανιχνεύει παραβίαση της σταθερότητας της διακύμανσης.
  • Για να επιβεβαιώσετε την υπόθεση μιας κανονικής κατανομής σφαλμάτων, χρησιμοποιήστε ιστογράμματα, διαγράμματα κορμών και φύλλων, διαγράμματα μπλοκ και κανονικά διαγράμματα κατανομής.
  • Εάν δεν πληρούνται οι προϋποθέσεις εφαρμογής της μεθόδου των ελαχίστων τετραγώνων, χρησιμοποιήστε εναλλακτικές μεθόδους (για παράδειγμα, μοντέλα τετραγωνικής ή πολλαπλής παλινδρόμησης).
  • Εάν πληρούνται οι προϋποθέσεις για τη δυνατότητα εφαρμογής της μεθόδου των ελαχίστων τετραγώνων, είναι αναγκαίο να ελεγχθεί η υπόθεση της στατιστικής σημασίας των συντελεστών παλινδρόμησης και να δημιουργηθούν διαστήματα εμπιστοσύνης που περιέχουν το μαθηματικό προσδόκιμο και την προβλεπόμενη τιμή απόκρισης.
  • Αποφύγετε να προβλέψετε τις τιμές της εξαρτημένης μεταβλητής εκτός του εύρους της ανεξάρτητης μεταβλητής.
  • Λάβετε υπόψη ότι οι στατιστικές εξαρτήσεις δεν είναι πάντα αιτιώδεις. Θυμηθείτε ότι η συσχέτιση μεταξύ των μεταβλητών δεν σημαίνει ότι υπάρχει μια αιτιώδης σχέση μεταξύ τους.

ΠερίληψηΌπως φαίνεται στο μπλοκ διάγραμμα (σχήμα 27), η σημείωση περιγράφει ένα απλό μοντέλο γραμμικής παλινδρόμησης, τις συνθήκες εφαρμογής του και μεθόδους για τον έλεγχο αυτών των συνθηκών. Επανεξέταση t- Κριτήρια για τον έλεγχο της στατιστικής σημασίας της κλίσης της παλινδρόμησης. Χρησιμοποιήθηκε ένα μοντέλο παλινδρόμησης για την πρόβλεψη των τιμών της εξαρτημένης μεταβλητής. Ένα παράδειγμα θεωρείται ότι σχετίζεται με την επιλογή ενός χώρου για ένα κατάστημα λιανικής πώλησης στο οποίο διερευνάται η εξάρτηση των ετήσιων πωλήσεων στην περιοχή του καταστήματος. Οι πληροφορίες που έχετε συγκεντρώσει σας επιτρέπουν να επιλέγετε με μεγαλύτερη ακρίβεια μια θέση για το κατάστημα και να προβλέπετε τις ετήσιες πωλήσεις του. Οι παρακάτω σημειώσεις θα συνεχίσουν τη συζήτηση της ανάλυσης παλινδρόμησης, καθώς και μοντέλα πολλαπλής παλινδρόμησης.

Το Σχ. 27. Δομικό διάγραμμα μιας σημείωσης

Τα υλικά του βιβλίου χρησιμοποιούνται από τον Levin και άλλους. - Μ .: Williams, 2004. 792-872

Εάν η εξαρτημένη μεταβλητή είναι κατηγορηματική, πρέπει να εφαρμοστεί η διοικητική παλινδρόμηση.

Η ανάλυση παλινδρόμησης είναι μία από τις πιο δημοφιλείς μεθόδους στατιστικής έρευνας. Με τη βοήθειά του, είναι δυνατόν να καθοριστεί ο βαθμός επιρροής των ανεξάρτητων ποσοτήτων στην εξαρτημένη μεταβλητή. Η λειτουργικότητα του Microsoft Excel διαθέτει εργαλεία που έχουν σχεδιαστεί για την εκτέλεση αυτού του τύπου ανάλυσης. Ας δούμε τι είναι και πώς να τις χρησιμοποιήσετε.

Πακέτο ανάλυσης σύνδεσης

Αλλά, για να χρησιμοποιήσετε τη λειτουργία που σας επιτρέπει να πραγματοποιήσετε μια ανάλυση παλινδρόμησης, πρώτα απ 'όλα, πρέπει να ενεργοποιήσετε το πακέτο ανάλυσης. Μόνο τότε τα απαραίτητα εργαλεία για αυτήν τη διαδικασία θα εμφανιστούν στην ταινία Excel.

  1. Μεταβαίνουμε στην καρτέλα "Αρχείο".
  2. Μεταβείτε στην ενότητα "Παράμετροι".
  3. Ανοίγει το παράθυρο επιλογών του Excel. Μεταβείτε στην υποενότητα "Πρόσθετα".
  4. Στο κάτω μέρος του παραθύρου που ανοίγει, αλλάξτε το διακόπτη στο μπλοκ "Διαχείριση" στη θέση "Πρόσθετα Excel" αν βρίσκεται σε διαφορετική θέση. Κάντε κλικ στο κουμπί "Μετάβαση".
  5. Ανοίγει ένα παράθυρο των διαθέσιμων πρόσθετων του Excel. Βάλουμε ένα σημάδι ελέγχου δίπλα στο στοιχείο "Πακέτο ανάλυσης". Κάντε κλικ στο κουμπί "OK".

Τώρα, όταν πηγαίνουμε στην καρτέλα "Δεδομένα", στην κορδέλα στο μπλοκ εργαλείων "Ανάλυση", θα δούμε ένα νέο κουμπί - "Ανάλυση δεδομένων".

Τύποι ανάλυσης παλινδρόμησης

Υπάρχουν διάφοροι τύποι παλινδρόμησης:

  • παραβολικό;
  • εκθετική;
  • λογαριθμική;
  • εκθετική;
  • ενδεικτικό.
  • υπερβολικό
  • γραμμική παλινδρόμηση.

Θα μιλήσουμε περισσότερο για την εκτέλεση του τελευταίου τύπου ανάλυσης παλινδρόμησης στο Excel.

Γραμμική παλινδρόμηση Excel

Παρακάτω, για παράδειγμα, παρουσιάζεται ένας πίνακας που δείχνει τη μέση ημερήσια θερμοκρασία αέρα στο δρόμο και τον αριθμό αγοραστών για την αντίστοιχη εργάσιμη ημέρα. Ας μάθουμε με τη βοήθεια της ανάλυσης παλινδρόμησης πώς ακριβώς οι καιρικές συνθήκες με τη μορφή της θερμοκρασίας του αέρα μπορούν να επηρεάσουν τη συμμετοχή ενός εμπορικού καταστήματος.

Η γενική εξίσωση γραμμικής παλινδρόμησης έχει ως εξής: Y \u003d a0 + a1x1 + ... + akhk. Σ 'αυτόν τον τύπο, Y σημαίνει μια μεταβλητή, την επιρροή των παραγόντων στους οποίους προσπαθούμε να μελετήσουμε. Στην περίπτωσή μας, αυτός είναι ο αριθμός των αγοραστών. Η τιμή του x είναι οι διάφοροι παράγοντες που επηρεάζουν μια μεταβλητή. Οι παράμετροι a είναι συντελεστές παλινδρόμησης. Δηλαδή, αυτοί καθορίζουν τη σημασία ενός συγκεκριμένου παράγοντα. Ο δείκτης k δηλώνει τον συνολικό αριθμό αυτών των ίδιων παραγόντων.


Ανάλυση ανάλυσης

Τα αποτελέσματα της ανάλυσης παλινδρόμησης εμφανίζονται με τη μορφή πίνακα στον τόπο που καθορίζεται στις ρυθμίσεις.

Ένας από τους κύριους δείκτες είναι το R-τετράγωνο. Υποδεικνύει την ποιότητα του μοντέλου. Στην περίπτωσή μας, αυτός ο συντελεστής είναι 0,705 ή περίπου 70,5%. Αυτό είναι ένα αποδεκτό επίπεδο ποιότητας. Μια εξάρτηση μικρότερη από 0,5 είναι κακή.

Ένας άλλος σημαντικός δείκτης βρίσκεται στο κελί στη διασταύρωση της γραμμής "Y-intersection" και στη στήλη "Odds". Δείχνει ποια αξία θα έχει η Υ, και στην περίπτωσή μας, αυτός είναι ο αριθμός των πελατών, με όλους τους άλλους παράγοντες ίσους με το μηδέν. Στον πίνακα αυτό, αυτή η τιμή είναι 58,04.

Η τιμή στη διασταύρωση των στηλών "Μεταβλητή Χ1" και "Αποδόσεις" δείχνει το επίπεδο εξάρτησης του Υ στο Χ. Στην περίπτωσή μας, αυτό είναι το επίπεδο εξάρτησης του αριθμού των πελατών των καταστημάτων από τη θερμοκρασία. Ο συντελεστής 1,31 θεωρείται μάλλον υψηλός δείκτης επιρροής.

Όπως μπορείτε να δείτε, χρησιμοποιώντας το πρόγραμμα Microsoft Excel, είναι πολύ απλό να συντάξετε έναν πίνακα ανάλυσης παλινδρόμησης. Όμως, μόνο ένα εκπαιδευμένο άτομο μπορεί να εργαστεί με τα δεδομένα που λαμβάνονται στην έξοδο, και να καταλάβει την ουσία τους.

Είμαστε ευτυχείς που ήμασταν σε θέση να σας βοηθήσουμε στην επίλυση του προβλήματος.

Ρωτήστε την ερώτησή σας στα σχόλια, αναφέροντας τη φύση του προβλήματος. Οι ειδικοί μας θα προσπαθήσουν να απαντήσουν το συντομότερο δυνατό.

Το βοήθησε αυτό το άρθρο;

Η μέθοδος γραμμικής παλινδρόμησης μας επιτρέπει να περιγράψουμε μια ευθεία γραμμή που ταιριάζει περισσότερο σε μια σειρά από ταξινομημένα ζεύγη (x, y). Η εξίσωση για μια ευθεία γραμμή, γνωστή ως γραμμική εξίσωση, παρουσιάζεται παρακάτω:

ŷ - η αναμενόμενη τιμή του y για μια δεδομένη τιμή του x,

Το x είναι μια ανεξάρτητη μεταβλητή

a - τμήμα στον άξονα y για μια ευθεία γραμμή,

b είναι η κλίση της ευθείας γραμμής.

Στο παρακάτω σχήμα, αυτή η έννοια παρουσιάζεται γραφικά:

Το παραπάνω σχήμα δείχνει τη γραμμή που περιγράφεται από την εξίσωση ŷ \u003d 2 + 0.5x. Το τμήμα γραμμής στον άξονα y είναι το σημείο τομής με τη γραμμή του άξονα y. στην περίπτωσή μας, a \u003d 2. Η κλίση της γραμμής, b, ο λόγος ανόδου της γραμμής με το μήκος της γραμμής, έχει τιμή 0,5. Μια θετική κλίση σημαίνει ότι η γραμμή ανεβαίνει από αριστερά προς τα δεξιά. Εάν b \u003d 0, η γραμμή είναι οριζόντια, πράγμα που σημαίνει ότι δεν υπάρχει σύνδεση μεταξύ εξαρτημένων και ανεξάρτητων μεταβλητών. Με άλλα λόγια, η αλλαγή της τιμής του x δεν επηρεάζει την τιμή του y.

Συχνά σύγχυση ŷ και y. Το γράφημα δείχνει 6 ταξινομημένα ζεύγη σημείων και μία γραμμή, σύμφωνα με αυτή την εξίσωση

Αυτή η εικόνα δείχνει το σημείο που αντιστοιχεί στο διατεταγμένο ζεύγος x \u003d 2 και y \u003d 4. Σημειώστε ότι η αναμενόμενη τιμή του y σύμφωνα με τη γραμμή στο x  \u003d 2 είναι ŷ. Μπορούμε να το επιβεβαιώσουμε χρησιμοποιώντας την ακόλουθη εξίσωση:

ŷ \u003d 2 + 0,5x \u003d 2 + 0,5 (2) \u003d 3.

Η τιμή του y αντιπροσωπεύει το πραγματικό σημείο και η τιμή της y είναι η αναμενόμενη τιμή του y χρησιμοποιώντας μια γραμμική εξίσωση για μια δεδομένη τιμή του x.

Το επόμενο βήμα είναι να προσδιορίσουμε τη γραμμική εξίσωση που ταιριάζει περισσότερο με το σύνολο των ταξινομημένων ζευγών, μιλήσαμε γι 'αυτό στο προηγούμενο άρθρο, όπου προσδιορίσαμε τη μορφή της εξίσωσης χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων.

Χρησιμοποιώντας το Excel για τον προσδιορισμό της γραμμικής παλινδρόμησης

Για να χρησιμοποιήσετε το εργαλείο ανάλυσης παλινδρόμησης ενσωματωμένο στο Excel, πρέπει να ενεργοποιήσετε το πρόσθετο Πακέτο ανάλυσης. Μπορείτε να το βρείτε κάνοντας κλικ στην καρτέλα Αρχείο -\u003e Επιλογές(2007+), στο παράθυρο διαλόγου που εμφανίζεται ΠαράμετροιExcelμεταβείτε στην καρτέλα Πρόσθετα.Στο πεδίο Διαχείρισηεπιλέξτε ΠρόσθεταExcelκαι κάντε κλικ Πήγαινε.Στο παράθυρο που εμφανίζεται, ελέγξτε το παράθυρο απέναντι Το πακέτο ανάλυσης,κάντε κλικ στο κουμπί Εντάξει

Στην καρτέλα Δεδομέναστην ομάδα Ανάλυσηθα εμφανιστεί ένα νέο κουμπί Ανάλυση δεδομένων.

Για να δείξουμε τη δουλειά του πρόσθετου, θα χρησιμοποιήσουμε τα δεδομένα από το προηγούμενο άρθρο, όπου ένας άντρας και ένα κορίτσι μοιράζονται ένα τραπέζι στο μπάνιο. Καταχωρίστε τα δεδομένα από το παράδειγμα λουτρών μας στις στήλες Α και Β ενός λευκού φύλλου.

Μεταβείτε στην καρτέλα Δεδομέναστην ομάδα Ανάλυσηκάντε κλικ στο κουμπί Ανάλυση δεδομένων.Στο παράθυρο που εμφανίζεται Ανάλυση δεδομένων  επιλέξτε Η παλινδρόμησηόπως φαίνεται, και κάντε κλικ στο OK.

Ορίστε τις απαιτούμενες παραμέτρους παλινδρόμησης στο παράθυρο Η παλινδρόμησηόπως φαίνεται στην εικόνα:

Πατήστε ΕντάξειΤο παρακάτω σχήμα δείχνει τα αποτελέσματα:

Τα αποτελέσματα αυτά αντιστοιχούν σε αυτά που ελήφθησαν με ανεξάρτητους υπολογισμούς στο προηγούμενο άρθρο.

Η ανάλυση παλινδρόμησης είναι μια μέθοδος στατιστικής έρευνας που σας επιτρέπει να δείξετε την εξάρτηση μιας παραμέτρου από μία ή περισσότερες ανεξάρτητες μεταβλητές. Στην εποχή πριν από τον υπολογιστή, η χρήση του ήταν μάλλον δύσκολη, ειδικά όταν αφορούσε μεγάλα ποσά δεδομένων. Σήμερα, έχοντας μάθει πώς να οικοδομήσουμε μια παλινδρόμηση στο Excel, μπορείτε να λύσετε σύνθετα στατιστικά προβλήματα μέσα σε λίγα λεπτά. Τα ακόλουθα είναι ειδικά παραδείγματα από τον τομέα των οικονομικών.

Τύποι παλινδρόμησης

Αυτή η ιδέα εισήχθη στα μαθηματικά από τον Francis Galton το 1886. Η παλινδρόμηση συμβαίνει:

  • γραμμική
  • παραβολικό;
  • νόμος περί εξουσίας.
  • εκθετική;
  • hyperbolic;
  • ενδεικτικό.
  • λογαριθμική.

Παράδειγμα 1

Εξετάστε το καθήκον να προσδιορίσετε την εξάρτηση του αριθμού των μελών της ομάδας που εγκαταλείπουν τη μέση αμοιβή σε 6 βιομηχανικές επιχειρήσεις.

Πρόκληση. Έξι επιχειρήσεις ανέλυαν τον μέσο μηνιαίο μισθό και τον αριθμό των εργαζομένων που έφυγαν μόνοι τους. Σε μορφή πίνακα έχουμε:

Για να προσδιοριστεί η εξάρτηση του αριθμού των υπαλλήλων που εγκαταλείπουν το μέσο μισθό σε 6 επιχειρήσεις, το μοντέλο παλινδρόμησης έχει τη μορφή της εξίσωσης Y \u003d a0 + a1 × 1 + ... + akxk, όπου xi είναι οι μεταβλητές επηρεασμού, ai είναι οι συντελεστές παλινδρόμησης και k είναι ο αριθμός παραγόντων.

Για το έργο αυτό, ο Y είναι ο δείκτης των συνταξιούχων υπαλλήλων και ο παράγοντας που επηρεάζει είναι ο μισθός, ο οποίος δηλώνεται από τον X.

Χρησιμοποιώντας τις δυνατότητες του επεξεργαστή Excel

Η ανάλυση παλινδρόμησης του Excel θα πρέπει να προηγείται με την εφαρμογή ενσωματωμένων λειτουργιών σε υπάρχοντα πινακοποιημένα δεδομένα. Ωστόσο, για αυτούς τους λόγους είναι καλύτερο να χρησιμοποιήσετε το πολύ χρήσιμο add-on "Package Analysis". Για να την ενεργοποιήσετε χρειάζεστε:

  • μεταβείτε στην ενότητα "Παράμετροι" από την καρτέλα "Αρχείο".
  • στο παράθυρο που ανοίγει, επιλέξτε τη γραμμή "Πρόσθετα".
  • Κάντε κλικ στο κουμπί "Go" που βρίσκεται στην κάτω δεξιά πλευρά της γραμμής "Διαχείριση".
  • επιλέξτε το πλαίσιο δίπλα στο όνομα "Package Analysis" και επιβεβαιώστε τις ενέργειές σας κάνοντας κλικ στο "OK".

Εάν όλα γίνονται σωστά, το δεξιό κουμπί θα εμφανιστεί στη δεξιά πλευρά της καρτέλας "Δεδομένα", που βρίσκεται πάνω από το φύλλο εργασίας "Excel".

Γραμμική παλινδρόμηση στο Excel

Τώρα που διαθέτετε όλα τα απαραίτητα εικονικά εργαλεία για την πραγματοποίηση οικονομετρικών υπολογισμών, μπορούμε να αρχίσουμε να λύνουμε το πρόβλημά μας. Για να γίνει αυτό:

  • κάντε κλικ στο κουμπί "Ανάλυση δεδομένων"?
  • στο παράθυρο που ανοίγει, κάντε κλικ στο κουμπί "Regression".
  • στην καρτέλα που εμφανίζεται, εισάγετε το εύρος τιμών για το Y (τον αριθμό των παραιτηθέντων εργαζομένων) και για το X (το μισθό τους).
  • επιβεβαιώστε τις ενέργειές σας κάνοντας κλικ στο κουμπί "Ok".

Ως αποτέλεσμα, το πρόγραμμα θα συμπληρώσει αυτόματα ένα νέο φύλλο του πίνακα επεξεργαστή με δεδομένα ανάλυσης παλινδρόμησης. Δώστε προσοχή! Στο Excel, μπορείτε να ορίσετε ανεξάρτητα τον τόπο που προτιμάτε για το σκοπό αυτό. Για παράδειγμα, μπορεί να είναι το ίδιο φύλλο όπου βρίσκονται οι τιμές των Υ και X ή ακόμα και ένα νέο βιβλίο ειδικά σχεδιασμένο για την αποθήκευση τέτοιων δεδομένων.

Ανάλυση των αποτελεσμάτων της παλινδρόμησης για το R-τετράγωνο

Στο Excel, τα δεδομένα που λαμβάνονται κατά την επεξεργασία των δεδομένων αυτού του παραδείγματος έχουν τη μορφή:

Πρώτα απ 'όλα, πρέπει να δώσετε προσοχή στην αξία του R-τετραγώνου. Αντιπροσωπεύει τον συντελεστή προσδιορισμού. Σε αυτό το παράδειγμα, το R-τετράγωνο \u003d 0.755 (75.5%), δηλ. Οι υπολογισμένες παράμετροι μοντέλου εξηγούν τη σχέση μεταξύ των παραμέτρων που εξετάστηκαν κατά 75.5%. Όσο υψηλότερη είναι η τιμή του συντελεστή προσδιορισμού, το επιλεγμένο μοντέλο θεωρείται περισσότερο εφαρμόσιμο για μια συγκεκριμένη εργασία. Θεωρείται ότι περιγράφει σωστά την πραγματική κατάσταση με τιμή R-τετραγώνου πάνω από 0,8. Εάν το R-τετράγωνο είναι tcr, τότε απορρίπτεται η υπόθεση της ασήμαντοτητας του ελεύθερου όρου της γραμμικής εξίσωσης.

Στο υπό εξέταση πρόβλημα, για τον ελεύθερο όρο, χρησιμοποιώντας τα εργαλεία του Excel, βρέθηκε ότι t \u003d 169.20903 και p \u003d 2.89E-12, δηλαδή, έχουμε μηδενική πιθανότητα να απορριφθεί η αληθινή υπόθεση σχετικά με την ασήμαντο του ελεύθερου όρου. Για τον συντελεστή με το άγνωστο, t \u003d 5.79405, και p \u003d 0.001158. Με άλλα λόγια, η πιθανότητα να απορριφθεί η ορθή υπόθεση για την ασήμαντη σημασία του συντελεστή με το άγνωστο είναι 0,12%.

Έτσι, μπορεί να υποστηριχθεί ότι η ληφθείσα εξίσωση γραμμικής παλινδρόμησης είναι επαρκής.

Το καθήκον της καταλληλότητας αγοράς ενός συνόλου μετοχών

Η πολλαπλή παλινδρόμηση στο Excel πραγματοποιείται χρησιμοποιώντας το ίδιο εργαλείο ανάλυσης δεδομένων. Εξετάστε μια συγκεκριμένη εφαρμογή.

Η διοίκηση της NNN πρέπει να αποφασίσει σχετικά με τη σκοπιμότητα της αγοράς 20% του MMM. Το κόστος του πακέτου (SP) είναι 70 εκατομμύρια δολάρια ΗΠΑ. Οι ειδικοί του NNN συνέλεξαν δεδομένα σχετικά με παρόμοιες συναλλαγές. Αποφασίστηκε να εκτιμηθεί η αξία του συνόλου μετοχών με τέτοιες παραμέτρους, εκφρασμένες σε εκατομμύρια δολάρια ΗΠΑ, ως εξής:

  • πληρωτέοι λογαριασμοί (VK).
  • ετήσιος κύκλος εργασιών (VO) ·
  • εισπρακτέοι λογαριασμοί (VD) ·
  • αξία παγίων περιουσιακών στοιχείων (SOF).

Επιπλέον, η παράμετρος χρέους μισθοδοσίας επιχείρησης (V3 P) χρησιμοποιείται σε χιλιάδες δολάρια ΗΠΑ.

Λύση χρησιμοποιώντας τον επεξεργαστή υπολογιστικών φύλλων του Excel

Πρώτα απ 'όλα, πρέπει να δημιουργήσετε έναν πίνακα δεδομένων προέλευσης. Έχει την ακόλουθη μορφή:

  • καλέστε το παράθυρο "Ανάλυση δεδομένων".
  • επιλέξτε την ενότητα "Παλινδρόμηση".
  • στο παράθυρο "Εισαγωγή διάστημα Y" εισάγετε το εύρος τιμών των εξαρτημένων μεταβλητών από τη στήλη G.
  • Κάντε κλικ στο εικονίδιο με το κόκκινο βέλος στα δεξιά του παραθύρου "Εισαγωγή χρονικού διαστήματος X" και επιλέξτε το εύρος όλων των τιμών από τις στήλες B, C, D, F στο φύλλο.

Σημειώστε το στοιχείο "Νέο φύλλο εργασίας" και κάντε κλικ στο "Ok".

Πάρτε μια ανάλυση παλινδρόμησης για αυτό το έργο.

Εκμάθηση των αποτελεσμάτων και των συμπερασμάτων

"Συλλέγουμε" από τα στρογγυλεμένα δεδομένα που παρουσιάζονται παραπάνω στο φύλλο του επεξεργαστή υπολογιστικού φύλλου Excel, την εξίσωση παλινδρόμησης:

SP \u003d 0,103 * SOF + 0,541 * VO - 0,031 * VK + 0,405 * VD + 0,691 * VZP - 265,844.

Σε μια πιο γνωστή μαθηματική μορφή, μπορεί να γραφτεί ως:

γ \u003d 0.103 * χ1 + 0.541 * χ2 - 0.031 * χ3 + 0.405 * χ4 + 0.691 * χ5 - 265.844

Τα στοιχεία για την MMM JSC παρουσιάζονται στον πίνακα:

Με την υποκατάστασή τους στην εξίσωση παλινδρόμησης, λαμβάνουν ένα ποσό 64,72 εκατομμυρίων δολαρίων ΗΠΑ. Αυτό σημαίνει ότι οι μετοχές της MMM δεν αξίζει να αγοράσουν, καθώς η αξία των 70 εκατομμυρίων δολαρίων είναι αρκετά υπερτιμημένη.

Όπως μπορείτε να δείτε, η χρήση του επεξεργαστή Excel και η εξίσωση παλινδρόμησης κατέστησαν δυνατή την λήψη τεκμηριωμένης απόφασης σχετικά με τη σκοπιμότητα μιας πολύ συγκεκριμένης συναλλαγής.

Τώρα ξέρετε ποια είναι η παλινδρόμηση. Τα παραδείγματα στο Excel που αναφέρονται παραπάνω θα σας βοηθήσουν στην επίλυση πρακτικών προβλημάτων από τον τομέα της οικονομετρίας.

Το πακέτο MS Excel σάς επιτρέπει να κάνετε το μεγαλύτερο μέρος της εργασίας πολύ γρήγορα όταν δημιουργείτε την εξίσωση γραμμικής παλινδρόμησης. Είναι σημαντικό να κατανοήσετε τον τρόπο ερμηνείας των αποτελεσμάτων. Για να δημιουργήσετε ένα μοντέλο παλινδρόμησης, επιλέξτε το στοιχείο Εργαλεία \\ Δεδομένα ανάλυσης \\ Regression (στο Excel 2007 αυτή η λειτουργία βρίσκεται στην ενότητα Data / Data Analysis / Regression). Στη συνέχεια, αντιγράψτε τα αποτελέσματα σε ένα μπλοκ για ανάλυση.

Δεδομένα προέλευσης:

Αποτελέσματα ανάλυσης

Συμπεριλάβετε στην αναφορά
Ο υπολογισμός των παραμέτρων της εξίσωσης παλινδρόμησης
Θεωρητικό υλικό
Βασική εξίσωση παλινδρόμησης κλίμακας
Πολλαπλός συντελεστής συσχέτισης (πολλαπλός δείκτης συσχέτισης)
Μερικοί παράγοντες ελαστικότητας
Συγκριτική αξιολόγηση της επίδρασης των παραγόντων που αναλύθηκαν στο αποτελεσματικό σημείο (d - συντελεστές χωριστού προσδιορισμού)

Ποιοτικός έλεγχος της κατασκευασμένης εξίσωσης παλινδρόμησης
Η σημασία των συντελεστών παλινδρόμησης b i (t-στατιστικό κριτήριο σπουδαστών)
Σημασία της εξίσωσης ως συνόλου (στατιστική F, κριτήριο Fisher). Συντελεστής προσδιορισμού
Ιδιωτικά κριτήρια F

Σημασιακό επίπεδο 0.005 0.01 0.025 0.05 0.1 0.25 0.4

Κατά τη γνώμη μου, ως σπουδαστής, η οικονομετρία είναι μια από τις πιο εφαρμοσμένες επιστήμες από όλα όσα κατάφερα να γνωρίσω στα τείχη του πανεπιστημίου μου. Με τη βοήθεια του, είναι πράγματι δυνατή η επίλυση προβλημάτων εφαρμοσμένης φύσης σε όλη την επιχείρηση. Πόσο αποτελεσματικές θα είναι αυτές οι αποφάσεις είναι το τρίτο ερώτημα. Η κατώτατη γραμμή είναι ότι οι περισσότερες από τις γνώσεις θα παραμείνουν μια θεωρία, αλλά η οικονομετρία και η ανάλυση παλινδρόμησης αξίζει να εξερευνήσετε με ιδιαίτερη προσοχή.

Τι εξηγεί την παλινδρόμηση;

Πριν αρχίσουμε να εξετάζουμε τις λειτουργίες του MS Excel, που μας επιτρέπουν να λύσουμε αυτά τα προβλήματα, θα ήθελα να σας εξηγήσω με τα δάχτυλά σας τι στην ουσία περιλαμβάνει ανάλυση παλινδρόμησης. Έτσι θα είναι πιο εύκολο για εσάς να περάσετε τις εξετάσεις, και το σημαντικότερο, πιο ενδιαφέρον να μελετήσετε το θέμα.

Ας ελπίσουμε ότι είστε εξοικειωμένοι με την έννοια των λειτουργιών από τα μαθηματικά. Μια συνάρτηση είναι η σχέση δύο μεταβλητών. Όταν αλλάζει μια μεταβλητή, συμβαίνει κάτι σε άλλο. Αλλαγή Χ, αλλαγή Υ, αντίστοιχα. Οι λειτουργίες περιγράφουν διάφορους νόμους. Γνωρίζοντας τη λειτουργία, μπορούμε να υποκαταστήσουμε τις αυθαίρετες τιμές του Χ και να δούμε πώς αλλάζει το Υ σε αυτό.

Αυτό έχει μεγάλη σημασία, καθώς η παλινδρόμηση είναι μια προσπάθεια εξήγησης των μη συστηματικών και χαοτικών διαδικασιών με τη βοήθεια μιας συγκεκριμένης λειτουργίας. Έτσι, για παράδειγμα, είναι δυνατόν να προσδιοριστεί η σχέση μεταξύ του δολαρίου και της ανεργίας στη Ρωσία.

Εάν μπορεί να βρεθεί αυτή η κανονικότητα, τότε σύμφωνα με τη λειτουργία που έχουμε αποκτήσει κατά τη διάρκεια των υπολογισμών, μπορούμε να κάνουμε μια πρόβλεψη για το ποιο ποσοστό ανεργίας θα είναι στην ισοτιμία N-του δολαρίου έναντι του ρουβλίου.
  Αυτή η σχέση θα ονομάζεται συσχέτιση. Η ανάλυση παλινδρόμησης περιλαμβάνει τον υπολογισμό του συντελεστή συσχέτισης, ο οποίος θα εξηγεί τη στενή σχέση μεταξύ των μεταβλητών που εξετάζουμε (την ισοτιμία του δολαρίου και τον αριθμό των θέσεων εργασίας).

Αυτή η αναλογία μπορεί να είναι θετική και αρνητική. Οι τιμές του κυμαίνονται από -1 έως 1. Συνεπώς, μπορούμε να παρατηρήσουμε μια υψηλή αρνητική ή θετική συσχέτιση. Εάν είναι θετική, τότε η αύξηση του δολαρίου θα ακολουθήσει η εμφάνιση νέων θέσεων εργασίας. Αν είναι αρνητική, τότε η αύξηση του ποσοστού θα ακολουθήσει μείωση των θέσεων εργασίας.

Η παλινδρόμηση είναι πολλών τύπων. Μπορεί να είναι γραμμική, παραβολική, δύναμη, εκθετική, κλπ. Η επιλογή ενός μοντέλου που κάνουμε εξαρτάται από το ποια παλινδρόμηση θα αντιστοιχεί ειδικά στην περίπτωσή μας, ποιο μοντέλο θα είναι όσο το δυνατόν πιο κοντά στον συσχετισμό μας. Σκεφτείτε το ως παράδειγμα ενός προβλήματος και επιλύστε το στο MS Excel.

Γραμμική παλινδρόμηση στο MS Excel

Για την επίλυση των προβλημάτων γραμμικής παλινδρόμησης, θα χρειαστείτε τη λειτουργικότητα "Ανάλυση δεδομένων". Μπορεί να μην περιλαμβάνεται μαζί σας και πρέπει να ενεργοποιηθεί.

  • Κάντε κλικ στο κουμπί "Αρχείο".
  • Επιλέξτε το στοιχείο "Παράμετροι".
  • Κάντε κλικ στην προτελευταία καρτέλα "Πρόσθετα" στην αριστερή πλευρά.



  • Παρακάτω θα δείτε την επιγραφή "Διαχείριση" και το κουμπί "Μετάβαση". Κάντε κλικ σε αυτό.
  • Βάζουμε ένα σημάδι στο "πακέτο ανάλυσης".
  • Κάντε κλικ στο κουμπί OK.



Παράδειγμα εργασίας

Η λειτουργία ανάλυσης παρτίδας είναι ενεργοποιημένη. Λύπουμε το ακόλουθο πρόβλημα. Έχουμε δείγμα δεδομένων για αρκετά χρόνια σχετικά με τον αριθμό καταστάσεων έκτακτης ανάγκης στην επιχείρηση και τον αριθμό των απασχολουμένων. Πρέπει να προσδιορίσουμε τη σχέση μεταξύ αυτών των δύο μεταβλητών. Υπάρχει μια επεξηγηματική μεταβλητή X - αυτός είναι ο αριθμός των εργαζομένων και μια εξηγηθείσα μεταβλητή - Y - αυτός είναι ο αριθμός των καταστάσεων έκτακτης ανάγκης. Διανέμουμε τα δεδομένα προέλευσης σε δύο στήλες.

Μεταβείτε στην καρτέλα "δεδομένα" και επιλέξτε "Ανάλυση δεδομένων"

Στη λίστα που εμφανίζεται, επιλέξτε "Regression". Στα διαστήματα εισόδου Y και X, επιλέξτε τις κατάλληλες τιμές.

Κάντε κλικ στο κουμπί OK. Η ανάλυση γίνεται, και σε ένα νέο φύλλο θα δούμε τα αποτελέσματα.

Οι πιο σημαντικές τιμές για εμάς σημειώνονται στο παρακάτω σχήμα.

Πολλαπλό R είναι ο συντελεστής προσδιορισμού. Έχει μια σύνθετη φόρμουλα υπολογισμού και δείχνει πόσο μπορείτε να εμπιστευτείτε τον συντελεστή συσχέτισης. Κατά συνέπεια, όσο μεγαλύτερη είναι αυτή η αξία, τόσο περισσότερη εμπιστοσύνη, τόσο πιο επιτυχημένο είναι το μοντέλο μας στο σύνολό του.

Η διασταύρωση Y και η διατομή X1 είναι οι συντελεστές της παλινδρόμησης μας. Όπως ήδη αναφέρθηκε, η παλινδρόμηση είναι μια συνάρτηση και έχει ορισμένους συντελεστές. Έτσι, η λειτουργία μας θα έχει τη μορφή: Y \u003d 0.64 * X-2.84.

Τι μας δίνει αυτό; Αυτό μας δίνει την ευκαιρία να κάνουμε μια πρόβλεψη. Ας υποθέσουμε ότι θέλουμε να μισθώσουμε 25 εργαζόμενους στην επιχείρηση και πρέπει να φανταστούμε σε ποιο βαθμό θα είναι ο αριθμός των καταστάσεων έκτακτης ανάγκης. Υπολογίζουμε αυτή την τιμή στη συνάρτηση μας και παίρνουμε το αποτέλεσμα Y \u003d 0.64 * 25 - 2.84. Περίπου 13 έκτακτες περιπτώσεις θα συμβούν.

Ας δούμε πώς λειτουργεί. Ρίξτε μια ματιά στην παρακάτω εικόνα. Η λειτουργία που λάβαμε υποκαθιστά τις πραγματικές τιμές για τους εμπλεκόμενους υπαλλήλους. Δείτε πόσο κοντά είναι οι αξίες σε πραγματικά παιχνίδια.

Μπορείτε επίσης να δημιουργήσετε ένα πεδίο συσχέτισης επιλέγοντας την περιοχή των παιχνιδιών και των Χs, κάνοντας κλικ στην καρτέλα "Εισαγωγή" και επιλέγοντας ένα διάγραμμα σκέδασης.

Τα σημεία είναι διάσπαρτα, αλλά γενικά ανεβαίνουν, σαν να βρίσκεται μια ευθεία στη μέση. Και μπορείτε επίσης να προσθέσετε αυτή τη γραμμή πηγαίνοντας στην καρτέλα "Layout" στο MS Excel και επιλέγοντας "Trend Line"

Κάντε διπλό κλικ στη γραμμή που εμφανίζεται και θα δείτε τι αναφέρθηκε προηγουμένως. Μπορείτε να αλλάξετε τον τύπο της παλινδρόμησης ανάλογα με τον τρόπο εμφάνισης του πεδίου συσχετισμού.

Μπορεί να σας φανεί ότι τα σημεία έλκουν μια παραβολή, όχι μια ευθεία γραμμή, και είναι προτιμότερο να επιλέξετε διαφορετικό τύπο παλινδρόμησης.


Συμπέρασμα

Ας ελπίσουμε ότι αυτό το άρθρο σας έχει δώσει μια καλύτερη κατανόηση της ανάλυσης παλινδρόμησης και γιατί είναι απαραίτητη. Όλα αυτά έχουν μεγάλη εφαρμοσμένη αξία.

Στο Excel  υπάρχει ακόμα πιο γρήγορος και πιο βολικός τρόπος για να δημιουργήσετε ένα γράφημα γραμμικής παλινδρόμησης (και ακόμη και τους κύριους τύπους μη γραμμικών παλινδρομήσεων, βλ. παρακάτω). Αυτό μπορεί να γίνει ως εξής:

1) επιλέξτε στήλες με δεδομένα Χ  και Υ  (θα πρέπει να βρίσκονται με αυτή τη σειρά!);

2) κλήση Οδηγός γραφημάτων  και επιλέξτε την ομάδα ΠληκτρολογήστεΣημείο  και κάντε αμέσως κλικ Έγινε;

3) χωρίς να αφαιρέσετε την επιλογή από το γράφημα, επιλέξτε το κύριο στοιχείο μενού που εμφανίζεται Διάγραμμαστην οποία θα επιλέξετε Προσθέστε γραμμή τάσεων;

4) στο παράθυρο διαλόγου που εμφανίζεται Γραμμή τάσης  στην καρτέλα Πληκτρολογήστενα επιλέξει Γραμμική;

5) στην καρτέλα Παράμετροιμπορεί να ενεργοποιηθεί ο διακόπτης Εμφάνιση εξίσωσης στο γράφημα, που μας επιτρέπει να δούμε την εξίσωση γραμμικής παλινδρόμησης (4.4), στην οποία υπολογίζονται οι συντελεστές (4.5).

6) Στην ίδια καρτέλα, μπορείτε να ενεργοποιήσετε το διακόπτη Τοποθετήστε την τιμή αξιοπιστίας προσέγγισης (R ^ 2) στο διάγραμμα. Αυτή η τιμή είναι το τετράγωνο του συντελεστή συσχέτισης (4.3) και δείχνει πόσο καλά η υπολογιζόμενη εξίσωση περιγράφει την πειραματική εξάρτηση. Αν R  2 είναι κοντά στην ενότητα, τότε η εξίσωση θεωρητικής παλινδρόμησης περιγράφει την πειραματική εξάρτηση καλά (η θεωρία συμφωνεί καλά με το πείραμα), και αν R  2 είναι κοντά στο μηδέν, τότε αυτή η εξίσωση δεν είναι κατάλληλη για την περιγραφή της πειραματικής εξάρτησης (η θεωρία δεν είναι σύμφωνη με το πείραμα).

Ως αποτέλεσμα της εφαρμογής των περιγραφόμενων ενεργειών, λαμβάνουμε ένα διάγραμμα με ένα γράφημα παλινδρόμησης και την εξίσωσή του.

§4.3. Οι κύριοι τύποι μη γραμμικής παλινδρόμησης

Παραβολική και πολυωνυμική παλινδρόμηση.

Παραβολικό  εξάρτηση από Υ  από την αξία Χ  η εξάρτηση εκφράζεται ως τετραγωνική συνάρτηση (parabola δεύτερης τάξης):

Αυτή η εξίσωση καλείται παράσταση παραβολικής παλινδρόμησης Υ  on Χ. Παράμετροι αλλά, β, με  καλούνται παραβολικών συντελεστών παλινδρόμησης. Ο υπολογισμός των παραβολικών συντελεστών παλινδρόμησης είναι πάντα δυσκίνητος, επομένως συνιστάται η χρήση υπολογιστών για υπολογισμούς.

Η εξίσωση (4.8) παραβολικής παλινδρόμησης είναι μια ειδική περίπτωση μιας γενικότερης παλινδρόμησης, που ονομάζεται πολυώνυμο. Πολυώνυμο  εξάρτηση από Υ  από την αξία Χ  που ονομάζεται εξάρτηση που εκφράζεται από ένα πολυώνυμο nη τάξη:

όπου είναι οι αριθμοί και i (i=0,1,…, n) καλούνται συντελεστές πολυωνυμικής παλινδρόμησης.

Υποτροπή ισχύος.

Ισχύς  εξάρτηση από Υ  από την αξία Χ  που ονομάζεται εξάρτηση της φόρμας:

Αυτή η εξίσωση καλείται εξίσωση παλινδρόμησης ισχύος Y  on Χ. Παράμετροι αλλά  και β  καλούνται συντελεστές παλινδρόμησης ισχύος.

ln \u003d ln α+βln x. (4.11)

Αυτή η εξίσωση περιγράφει μια ευθεία γραμμή σε ένα επίπεδο με λογαριθμικά άξονα συντεταγμένων ln x  και ln. Επομένως, το κριτήριο για την εφαρμογή της παλινδρόμησης ισχύος είναι η απαίτηση ότι τα σημεία των λογαρίθμων των εμπειρικών δεδομένων ln x i  και ln i  ήταν πιο κοντά στη γραμμή (4.11).

Εκθετική παλινδρόμηση.

Ενδεικτικόεκθετική) από την εξάρτηση του Υ  από την αξία Χ  που ονομάζεται εξάρτηση της φόρμας:

  (ή). (4.12)

Αυτή η εξίσωση καλείται εκθετική εξίσωση  (ή εκθετική) regression y  on Χ. Παράμετροι αλλά  (ή k) και β  καλούνται εκθετικούς συντελεστές  (ή εκθετική) παλινδρόμηση.

Εάν προβάλλουμε και τις δύο πλευρές της εξίσωσης παλινδρόμησης εξουσίας, παίρνουμε την εξίσωση

ln \u003d xln α+ ln β  (ή ln \u003d k x+ ln β). (4.13)

Αυτή η εξίσωση περιγράφει τη γραμμική εξάρτηση του λογαρίθμου μιας ποσότητας ln σε μια άλλη ποσότητα x. Επομένως, το κριτήριο για την εφαρμογή της παλινδρόμησης ισχύος είναι η απαίτηση ότι τα σημεία των εμπειρικών δεδομένων του ίδιου μεγέθους x i  και λογάριθμοι άλλης ποσότητας ln i  ήταν πιο κοντά στη γραμμή (4.13).

Λογαριθμική παλινδρόμηση.

Λογαριθμικήεξάρτηση από Υ  από την αξία Χ  που ονομάζεται εξάρτηση της φόρμας:

=α+βln x. (4.14)

Αυτή η εξίσωση καλείται η εξίσωση λογαριθμικής παλινδρόμησης Υ  on Χ. Παράμετροι αλλά  και β  καλούνται συντελεστές λογαριθμικής παλινδρόμησης.

Υπερβολική παλινδρόμηση.

Υπερβολικό  εξάρτηση από Υ  από την αξία Χ  που ονομάζεται εξάρτηση της φόρμας:

Αυτή η εξίσωση καλείται εξίσωση υπερβολικής παλινδρόμησης Υ  on Χ. Παράμετροι αλλά  και β  καλούνται υπερβολικούς συντελεστές παλινδρόμησης  και προσδιορίζονται με τη μέθοδο των ελαχίστων τετραγώνων. Η εφαρμογή αυτής της μεθόδου οδηγεί στους τύπους:

Στους τύπους (4.16-4.17), η άθροιση πραγματοποιείται με δείκτη i  από έναν έως τον αριθμό παρατηρήσεων n.

Δυστυχώς στο Excel  δεν υπάρχει λειτουργία υπολογισμού των υπερβολικών συντελεστών παλινδρόμησης. Σε περιπτώσεις όπου είναι προφανές ότι δεν είναι γνωστό ότι οι μετρηθείσες τιμές σχετίζονται με αντίστροφη αναλογικότητα, συνιστάται αντί της εξίσωσης υπερβολικής παλινδρόμησης να αναζητήσετε την εξίσωση παλινδρόμησης ισχύος, έτσι ώστε Excel  υπάρχει μια διαδικασία για την εύρεση του. Αν υποτεθεί υπερβολική εξάρτηση μεταξύ των μετρημένων τιμών, τότε οι συντελεστές παλινδρόμησης θα πρέπει να υπολογιστούν χρησιμοποιώντας πίνακες βοηθητικών υπολογισμών και πράξεις αθροίσεως σύμφωνα με τους τύπους (4.16-4.17).

Συνέχιση του θέματος:
Υπολογιστής

Ακολουθεί μια λύση μη αυτόματης (όχι μικροεφαρμογής) δύο προβλημάτων με τη μέθοδο simplex (παρόμοια με την επίλυση μιας μικροεφαρμογής) με λεπτομερείς εξηγήσεις για την κατανόηση του αλγορίθμου για την επίλυση προβλημάτων ...