Δημιουργία γραμμικής ευθυγράμμισης του Excel. Μη γραμμική παλινδρόμηση στο Excel

Η κατασκευή της γραμμικής παλινδρόμησης, η εκτίμηση των παραμέτρων και η σημασία της μπορούν να εκτελεστούν πολύ πιο γρήγορα χρησιμοποιώντας το πακέτο ανάλυσης Excel (Regression). Εξετάστε την ερμηνεία των αποτελεσμάτων στη γενική περίπτωση ( k  επεξηγηματικές μεταβλητές) σύμφωνα με το παράδειγμα 3.6.

Στο τραπέζι στατιστικά στοιχεία παλινδρόμησης  δίνονται οι ακόλουθες τιμές:

Πολλαπλές R   - πολλαπλό συντελεστή συσχέτισης ·

R- τετράγωνο  - συντελεστής προσδιορισμού R 2 ;

Κανονικοποιημένο R - τετράγωνο  - προσαρμοσμένο R  2 προσαρμοσμένη για τον αριθμό των βαθμών ελευθερίας.

Τυπικό σφάλμα- τυπικό σφάλμα παλινδρόμησης S;

Παρατηρήσεις -αριθμός παρατηρήσεων n.

Στο τραπέζι Ανάλυση διακύμανσηςδίνονται:

1. Στήλη df   - ο αριθμός των βαθμών ελευθερίας ίσος με

για συμβολοσειρά Η παλινδρόμηση df = k;

για συμβολοσειρά Το υπόλοιποdf = nk – 1;

για συμβολοσειρά Σύνολοdf = n– 1.

2. Στήλη SS -άθροισμα τετραγωνικών αποκλίσεων ίσων με

για συμβολοσειρά Η παλινδρόμηση ;

για συμβολοσειρά Το υπόλοιπο ;

για συμβολοσειρά Σύνολο .

3. Στήλη Καδιακυμάνσεις που καθορίζονται από τον τύπο Κα = SS/df:

για συμβολοσειρά Η παλινδρόμηση  - διασπορά παράγοντα,

για συμβολοσειρά Το υπόλοιπο- υπολειμματική διασπορά.

4. Στήλη F - υπολογιζόμενη τιμή Fκριτήριο που υπολογίζεται από τον τύπο

F = Κα(παλινδρόμηση) / Κα(ισορροπία).

5. Στήλη Συνάφεια F   -Η τιμή του επιπέδου σπουδαιότητας που αντιστοιχεί στο υπολογιζόμενο Fστατιστικά στοιχεία .

Συνάφεια F  \u003d FRASP ( F-στατιστικά στοιχεία df(παλινδρόμηση) df(ισορροπία)).

Αν σημασία F < стандартного уровня значимости, то R  2 είναι στατιστικά σημαντική.

Αποδόσεις Τυπικό σφάλμα t-sta-tistica Τιμή P Κάτω 95% Κορυφαία 95%
Υ 65,92 11,74 5,61 0,00080 38,16 93,68
Χ 0,107 0,014 7,32 0,00016 0,0728 0,142

Αυτός ο πίνακας δείχνει:

1. Αποδόσεις- τιμές των συντελεστών α, β.

2. Τυπικό σφάλμα-Τα πρότυπα σφάλματα συντελεστή παλινδρόμησης S a, S b.



3. t-στατιστικά στοιχεία  - υπολογιζόμενες τιμές t - Κριτήρια που υπολογίζονται από τον τύπο:

t-στατιστική \u003d Αποδόσεις / τυπικό σφάλμα.

4.P-τιμή (σημασία t) Είναι η τιμή του επιπέδου σημαντικότητας που αντιστοιχεί στο υπολογιζόμενο t-στατιστικά στοιχεία.

P-value \u003d STUDRASP(tστατιστικά στοιχεία df(ισορροπία)).

Αν P-άλλη< стандартного уровня значимости, то соответствующий коэффициент статистически значим.

5. Κάτω 95% και άνω 95%- τα κατώτερα και ανώτερα όρια των διαστημάτων εμπιστοσύνης 95% για τους συντελεστές της θεωρητικής εξίσωσης γραμμικής παλινδρόμησης.

  ΟΘΟΝΗ ΕΞΟΔΟΥ
  Παρατήρηση   Πρόβλεψη y   Απομεινάρια e
72,70 -29,70
82,91 -20,91
94,53 -4,53
105,72 5,27
117,56 12,44
129,70 19,29
144,22 20,77
166,49 24,50
268,13 -27,13

Στο τραπέζι ΟΘΟΝΗ ΕΞΟΔΟΥέδειξε:

στη στήλη Παρατήρηση- αριθμός παρατήρησης ·

στη στήλη Προβλέπεται y - υπολογισμένες τιμές της εξαρτημένης μεταβλητής,

στη στήλη Τα απομεινάρια ε - τη διαφορά μεταξύ των παρατηρούμενων και υπολογιζόμενων τιμών της εξαρτώμενης μεταβλητής.

Παράδειγμα 3.6Υπάρχουν δεδομένα (συμβατικές μονάδες) σχετικά με το κόστος των τροφίμων y  και κατά κεφαλήν εισόδημα xγια εννέα ομάδες οικογενειών:

  x
  y

Χρησιμοποιώντας τα αποτελέσματα του πακέτου ανάλυσης Excel (Regression), αναλύουμε την εξάρτηση του κόστους των τροφίμων από την αξία του κατά κεφαλήν εισοδήματος.

Τα αποτελέσματα της ανάλυσης παλινδρόμησης συνήθως γράφονται ως εξής:

όπου οι παρενθέσεις είναι τα τυπικά σφάλματα των συντελεστών παλινδρόμησης.

Συντελεστές παλινδρόμησης αλλά = 65,92 και β  \u003d 0,107. Κατεύθυνση επικοινωνίας μεταξύ y  και xκαθορίζει το σημάδι του συντελεστή παλινδρόμησης β  \u003d 0,107, δηλ. Η επικοινωνία είναι άμεση και θετική. Συντελεστής β  \u003d 0,107 δείχνει ότι με αύξηση του κατά κεφαλήν εισοδήματος κατά 1 srvc. μονάδες το κόστος των τροφίμων αυξάνεται κατά 0,107 srvc. μονάδες

Ας αξιολογήσουμε τη σημασία των συντελεστών του προκύπτοντος μοντέλου. Η σημασία των συντελεστών ( α, β) ελέγχονται από tδοκιμή:

Τιμή P ( α) = 0,00080 < 0,01 < 0,05

Τιμή P ( β) = 0,00016 < 0,01 < 0,05,

συνεπώς, οι συντελεστές ( α, β) είναι σημαντικές σε επίπεδο 1%, και ακόμη περισσότερο σε επίπεδο σημαντικότητας 5%. Έτσι, οι συντελεστές παλινδρόμησης είναι σημαντικοί και το μοντέλο είναι επαρκές για τα αρχικά δεδομένα.

Τα αποτελέσματα της εκτίμησης της παλινδρόμησης είναι συμβατά όχι μόνο με τις ληφθείσες τιμές των συντελεστών παλινδρόμησης, αλλά και με μερικές από αυτές (το διάστημα εμπιστοσύνης). Με πιθανότητα 95%, τα διαστήματα εμπιστοσύνης για τους συντελεστές είναι (38,16 - 93,68) για α  και (0,0728 - 0,142) για β.

Η ποιότητα του μοντέλου υπολογίζεται με τον συντελεστή προσδιορισμού R 2 .

Τιμή R  2 \u003d 0.884 σημαίνει ότι ο κατά κεφαλήν συντελεστής εισοδήματος μπορεί να εξηγήσει το 88,4% της διακύμανσης (διαφορά) στα έξοδα διατροφής.

Συνάφεια R  2 επιβεβαιωμένη από F-δοκιμή: σημασία F = 0,00016 < 0,01 < 0,05, следовательно, R  2 σε επίπεδο 1%, και ακόμη περισσότερο σε επίπεδο σημαντικότητας 5%.

Στην περίπτωση της συνδυασμένης γραμμικής παλινδρόμησης, ο συντελεστής συσχέτισης μπορεί να οριστεί ως   . Η ληφθείσα τιμή του συντελεστή συσχετισμού δείχνει ότι η σχέση μεταξύ των δαπανών τροφίμων και του κατά κεφαλήν εισοδήματος είναι πολύ στενή.

28 Οκτ

Καλησπέρα, αγαπητοί αναγνώστες blog! Σήμερα θα μιλήσουμε για μη γραμμικές παλινδρομήσεις. Η λύση γραμμικών παλινδρομήσεων μπορεί να βρεθεί στο LINK.

Αυτή η μέθοδος χρησιμοποιείται κυρίως στην οικονομική μοντελοποίηση και πρόβλεψη. Σκοπός του είναι να παρατηρήσει και να προσδιορίσει τις σχέσεις μεταξύ των δύο δεικτών.

Οι κύριοι τύποι μη γραμμικών παλινδρομήσεων είναι:

  • πολυώνυμο (τετραγωνικό, κυβικό);
  • υπερβολικό
  • εκθετική;
  • ενδεικτικό.
  • λογαριθμική.

Διάφοροι συνδυασμοί μπορούν επίσης να χρησιμοποιηθούν. Για παράδειγμα, για την ανάλυση των χρονοσειρών στον τραπεζικό τομέα, τις ασφαλιστικές, δημογραφικές μελέτες, χρησιμοποιήστε την καμπύλη Gompzer, η οποία είναι ένα είδος λογαριθμικής παλινδρόμησης.

Στην πρόβλεψη χρησιμοποιώντας μη γραμμικές παλινδρομήσεις, το κυριότερο είναι να βρούμε τον συντελεστή συσχέτισης, ο οποίος θα μας δείξει εάν υπάρχει στενή σχέση ανάμεσα στο μέλι και δύο παραμέτρους ή όχι. Κατά κανόνα, εάν ο συντελεστής συσχέτισης είναι κοντά στο 1, τότε υπάρχει μια σύνδεση και η πρόβλεψη θα είναι αρκετά ακριβής. Ένα άλλο σημαντικό στοιχείο των μη γραμμικών παλινδρομήσεων είναι το μέσο σχετικό σφάλμα ( Α ) αν είναι μεταξύ<8…10%, значит модель достаточно точна.

Σε αυτό, ίσως, θα τερματίσουμε το θεωρητικό μπλοκ και θα προχωρήσουμε σε πρακτικούς υπολογισμούς.

Έχουμε έναν πίνακα πωλήσεων αυτοκινήτων για την περίοδο των 15 ετών (το δηλώνουμε με X), ο αριθμός των βημάτων μέτρησης θα είναι το επιχείρημα n, έχουμε επίσης έσοδα για αυτές τις περιόδους (το δηλώνουμε από το Y), πρέπει να προβλέψουμε ποια θα είναι τα έσοδα στο μέλλον. Δημιουργήστε τον παρακάτω πίνακα:

Για την έρευνα, πρέπει να λύσουμε την εξίσωση (την εξάρτηση του Υ επί του Χ): y \u003d ax 2 + bx + c + e. Αυτή είναι η αντιστοιχισμένη τετραγωνική παλινδρόμηση. Εφαρμόζουμε στην περίπτωση αυτή τη μέθοδο των ελάχιστων τετραγώνων, για να βρούμε τα άγνωστα επιχειρήματα - a, b, c. Θα οδηγήσει σε ένα σύστημα αλγεβρικών εξισώσεων της μορφής:

Για να λύσουμε αυτό το σύστημα, χρησιμοποιούμε, για παράδειγμα, τη μέθοδο Cramer. Βλέπουμε ότι τα ποσά που περιλαμβάνονται στο σύστημα είναι συντελεστές για άγνωστα. Για να τα υπολογίσουμε, προσθέστε μερικές στήλες στο τραπέζι (D, E, F, G, H) και υπογράψτε τους σύμφωνα με την έννοια των υπολογισμών - στη στήλη D τοποθετούμε το x σε τετράγωνο, σε Ε σε κύβο, στο F για να τροφοδοτήσουμε 4, στο G πολλαπλασιάζουμε τους εκθέτες x και y, στο Η το τετράγωνο x και πολλαπλασιάζουμε με το y.

Το αποτέλεσμα είναι ένας πίνακας της μορφής που απαιτείται για την επίλυση της εξίσωσης.

Θα σχηματίσουμε μια μήτρα Α   σύστημα που αποτελείται από συντελεστές για άγνωστες στις αριστερές πλευρές των εξισώσεων. Τοποθετήστε το στο κελί A22 και ονομάστε το " A \u003d". Ακολουθούμε το σύστημα των εξισώσεων που επιλέξαμε να λύσουμε την παλινδρόμηση.

Δηλαδή, στο κελί Β21 πρέπει να βάλουμε το άθροισμα της στήλης όπου ανεβάσαμε τον εκθέτη Χ στην τέταρτη δύναμη - F17. Απλά ανατρέξτε στο κελί - "\u003d F17". Στη συνέχεια, χρειαζόμαστε το άθροισμα της στήλης όπου το X ήταν ενσωματωμένο σε έναν κύβο - E17, τότε ακολουθούμε αυστηρά σύμφωνα με το σύστημα. Έτσι, θα πρέπει να συμπληρώσουμε ολόκληρο τον πίνακα.

Σύμφωνα με τον αλγόριθμο Cramer, επιλέγουμε μια μήτρα Α1, παρόμοια με την Α, στην οποία αντί των στοιχείων της πρώτης στήλης πρέπει να τοποθετηθούν στοιχεία των δεξιών πλευρών των εξισώσεων του συστήματος. Δηλαδή το άθροισμα της τετραγωνικής στήλης Χ πολλαπλασιασμένης με το Υ, το άθροισμα της στήλης ΧΥ και το άθροισμα της στήλης Υ.

Θα χρειαστούμε επίσης δύο ακόμα πίνακες - θα τις ονομάσουμε Α2 και Α3 στις οποίες η δεύτερη και η τρίτη στήλη θα αποτελούνται από τους συντελεστές των δεξιών πλευρών των εξισώσεων. Η εικόνα θα είναι η εξής.

Μετά τον επιλεγμένο αλγόριθμο, θα χρειαστεί να υπολογίσουμε τις τιμές των καθοριστικών παραγόντων (καθοριστικοί παράγοντες, D) των μητρών που προκύπτουν. Χρησιμοποιούμε τον τύπο MOPRED. Τοποθετήστε τα αποτελέσματα στα κελιά J21: K24.

Ο υπολογισμός των συντελεστών της εξίσωσης σύμφωνα με τον Kramer θα πραγματοποιηθεί στα κύτταρα απέναντι από τους αντίστοιχους καθοριστικούς παράγοντες σύμφωνα με τον τύπο: α  (στο κελί M22) - "\u003d K22 / K21". β  (στο κελί Μ23) - "\u003d Κ23 / Κ21". με(στο κελί M24) - "\u003d K24 / K21".

Παίρνουμε την επιθυμητή ζευγαρωτή αντισταθμιστική εξίσωση:

y \u003d -0.074χ 2 + 2.151χ + 6.523

Υπολογίζουμε τη στεγανότητα της γραμμικής σχέσης από τον δείκτη συσχέτισης.

Για να υπολογίσετε, προσθέστε μια πρόσθετη στήλη J στον πίνακα (ας το ονομάσουμε y *). Ο υπολογισμός θα είναι ο ακόλουθος (σύμφωνα με την εξίσωση παλινδρόμησης) - "\u003d $ Μ $ 22 * \u200b\u200bΒ2 * Β2 + $ Μ $ 23 * Β2 + $ Μ $ 24."Τοποθετήστε το στο κελί J2. Παραμένει να σύρετε τον δείκτη αυτόματης συμπλήρωσης στο κελί J16.

Για να υπολογίσετε τα ποσά (μέσος όρος Y-Y) 2, προσθέστε τις στήλες K και L στον πίνακα με τους αντίστοιχους τύπους. Ο μέσος όρος της στήλης Υ υπολογίζεται χρησιμοποιώντας τη συνάρτηση AVERAGE.

Στο κελί Κ25 τοποθετούμε τον τύπο για τον υπολογισμό του δείκτη συσχέτισης - "\u003d ROOT (1- (K17 / L17))".

Βλέπουμε ότι η τιμή των 0.959 είναι πολύ κοντά στο 1, πράγμα που σημαίνει ότι υπάρχει στενή μη γραμμική σχέση μεταξύ πωλήσεων και ετών.

Απομένει να αξιολογηθεί η ποιότητα της προσαρμογής της ληφθείσας εξίσωσης τετραγωνικής παλινδρόμησης (δείκτης προσδιορισμού). Υπολογίζεται από τον τύπο του τετραγώνου του δείκτη συσχέτισης. Δηλαδή, ο τύπος στο κελί K26 θα είναι πολύ απλός - "\u003d K25 * K25".

Ο συντελεστής 0,920 είναι κοντά στο 1, πράγμα που υποδεικνύει μια υψηλής ποιότητας εφαρμογή.

Το τελευταίο βήμα είναι να υπολογίσουμε το σχετικό σφάλμα. Προσθέστε μια στήλη και προσθέστε τον τύπο: "\u003d ABS ((C2-J2) / C2), μονάδα ABS, απόλυτη τιμή. Τραβήξτε τον δείκτη προς τα κάτω και στο κελί M18 εμφανίζουμε τη μέση τιμή (AVERAGE), ορίστε τη μορφή ποσοστού στα κελιά. Το αποτέλεσμα - 7.79% είναι εντός των αποδεκτών τιμών σφάλματος<8…10%. Значит вычисления достаточно точны.

Αν προκύψει η ανάγκη, μπορούμε να δημιουργήσουμε ένα γράφημα με βάση τις ληφθείσες τιμές.

Το αρχείο με ένα παράδειγμα επισυνάπτεται - LINK!

  Κατηγορίες:   / από 10.28.2017

Η γραμμή παλινδρόμησης είναι μια γραφική αντανάκλαση της σχέσης μεταξύ των φαινομένων. Μπορείτε πολύ καθαρά να σχεδιάσετε τη γραμμή παλινδρόμησης στο Excel.

Για να το κάνετε αυτό, πρέπει:

1. Ανοίξτε το πρόγραμμα Excel

2. Δημιουργήστε στήλες με δεδομένα. Στο παράδειγμά μας, θα χτίσουμε μια σειρά παλινδρόμησης ή τη σχέση μεταξύ επιθετικότητας και αυτοσυγκέντρωσης στους πρωτοβάθμιους. Στο πείραμα συμμετείχαν 30 παιδιά, τα δεδομένα παρουσιάζονται στον πίνακα Excel:

1 στήλη - αριθμός θέματος

2 στήλη - επιθετικότητα  σε σημεία

3 στήλη - αυτο-αμφιβολία  σε σημεία

3. Στη συνέχεια, πρέπει να επιλέξετε και τις δύο στήλες (χωρίς το όνομα της στήλης), κάντε κλικ στην καρτέλα   εισαγωγή , να επιλέξει σημείο , και από τις προτεινόμενες διατάξεις επιλέξτε το πρώτο   σημείο με δείκτες .

4. Έχουμε λοιπόν ένα κενό για τη γραμμή παλινδρόμησης - το λεγόμενο - διασκορπισμένη οικόπεδο. Για να μεταβείτε στη γραμμή παλινδρόμησης, κάντε κλικ στο προκύπτον σχήμα, κάντε κλικ στην καρτέλα κατασκευαστή βρείτε στην οθόνη   γραφήματα   και επιλέξτε   Μ αλλάket9 , εξακολουθεί να είναι γραμμένο σε αυτό   f (x)

5. Έτσι, έχουμε μια γραμμή παλινδρόμησης. Το γράφημα δείχνει επίσης την εξίσωση του και το τετράγωνο του συντελεστή συσχέτισης

6. Απομένει να προσθέσετε το όνομα του γράφου, το όνομα των αξόνων. Επίσης, εάν θέλετε, μπορείτε να καταργήσετε τον θρύλο, να μειώσετε τον αριθμό των οριζόντιων γραμμών πλέγματος (καρτέλα διάταξη τότε πλέγμα ) Οι κύριες αλλαγές και ρυθμίσεις πραγματοποιούνται στην καρτέλα Διάταξη

Η γραμμή παλινδρόμησης είναι ενσωματωμένη στο MS Excel. Τώρα μπορεί να προστεθεί στο κείμενο της εργασίας.

Κατά τη γνώμη μου, ως σπουδαστής, η οικονομετρία είναι μία από τις πιο εφαρμοσμένες επιστήμες από όλα όσα κατάφερα να γνωρίσω στα τείχη του πανεπιστημίου μου. Με τη βοήθεια του, είναι πράγματι δυνατή η επίλυση προβλημάτων εφαρμοσμένης φύσης σε όλη την επιχείρηση. Πόσο αποτελεσματικές θα είναι αυτές οι αποφάσεις είναι το τρίτο ερώτημα. Η κατώτατη γραμμή είναι ότι οι περισσότερες από τις γνώσεις θα παραμείνουν μια θεωρία, αλλά η οικονομετρία και η ανάλυση παλινδρόμησης αξίζει να εξερευνήσετε με ιδιαίτερη προσοχή.

Τι εξηγεί την παλινδρόμηση;

Πριν αρχίσουμε να εξετάζουμε τις λειτουργίες του MS Excel, που μας επιτρέπουν να λύσουμε αυτά τα προβλήματα, θα ήθελα να σας εξηγήσω με τα δάχτυλά σας τι στην ουσία περιλαμβάνει ανάλυση παλινδρόμησης. Έτσι θα είναι πιο εύκολο για εσάς να περάσετε τις εξετάσεις, και το σημαντικότερο, πιο ενδιαφέρον να μελετήσετε το θέμα.

Ας ελπίσουμε ότι είστε εξοικειωμένοι με την έννοια των λειτουργιών από τα μαθηματικά. Μια συνάρτηση είναι η σχέση δύο μεταβλητών. Όταν αλλάζει μια μεταβλητή, συμβαίνει κάτι σε άλλο. Αλλαγή Χ, αλλαγή Υ, αντίστοιχα. Οι λειτουργίες περιγράφουν διάφορους νόμους. Γνωρίζοντας τη λειτουργία, μπορούμε να υποκαταστήσουμε τις αυθαίρετες τιμές του Χ και να δούμε πώς αλλάζει το Υ σε αυτό.

Αυτό έχει μεγάλη σημασία, καθώς η παλινδρόμηση είναι μια προσπάθεια εξήγησης των μη συστηματικών και χαοτικών διαδικασιών με τη βοήθεια μιας συγκεκριμένης λειτουργίας. Έτσι, για παράδειγμα, είναι δυνατόν να προσδιοριστεί η σχέση μεταξύ του δολαρίου και της ανεργίας στη Ρωσία.

Εάν μπορεί να βρεθεί αυτή η κανονικότητα, τότε σύμφωνα με τη λειτουργία που έχουμε αποκτήσει κατά τη διάρκεια των υπολογισμών, μπορούμε να κάνουμε μια πρόβλεψη για το ποιο ποσοστό ανεργίας θα είναι στην ισοτιμία N-του δολαρίου έναντι του ρουβλίου.
Αυτή η σχέση θα ονομάζεται συσχέτιση. Η ανάλυση παλινδρόμησης συνεπάγεται τον υπολογισμό του συντελεστή συσχέτισης, ο οποίος θα εξηγήσει τη στενή σχέση μεταξύ των μεταβλητών που εξετάζουμε (συναλλαγματική ισοτιμία δολαρίου και αριθμό θέσεων εργασίας).

Αυτή η αναλογία μπορεί να είναι θετική και αρνητική. Οι τιμές του κυμαίνονται από -1 έως 1. Συνεπώς, μπορούμε να παρατηρήσουμε μια υψηλή αρνητική ή θετική συσχέτιση. Εάν είναι θετική, τότε η αύξηση του δολαρίου θα ακολουθήσει η εμφάνιση νέων θέσεων εργασίας. Αν είναι αρνητική, τότε η αύξηση του ποσοστού θα ακολουθήσει μείωση των θέσεων εργασίας.

Η παλινδρόμηση είναι πολλών τύπων. Μπορεί να είναι γραμμική, παραβολική, δύναμη, εκθετική, κλπ. Η επιλογή ενός μοντέλου που κάνουμε εξαρτάται από το ποια παλινδρόμηση θα αντιστοιχεί ειδικά στην περίπτωσή μας, ποιο μοντέλο θα είναι όσο το δυνατόν πιο κοντά στον συσχετισμό μας. Σκεφτείτε το ως παράδειγμα ενός προβλήματος και επιλύστε το στο MS Excel.

Γραμμική παλινδρόμηση στο MS Excel

Για την επίλυση των προβλημάτων γραμμικής παλινδρόμησης, θα χρειαστείτε τη λειτουργικότητα "Ανάλυση δεδομένων". Μπορεί να μην περιλαμβάνεται μαζί σας και πρέπει να ενεργοποιηθεί.

  • Κάντε κλικ στο κουμπί "Αρχείο".
  • Επιλέξτε το στοιχείο "Παράμετροι".
  • Κάντε κλικ στην προτελευταία καρτέλα "Πρόσθετα" στην αριστερή πλευρά.



  • Παρακάτω θα δείτε την επιγραφή "Διαχείριση" και το κουμπί "Μετάβαση". Κάντε κλικ σε αυτό.
  • Βάζουμε ένα σημάδι στο "πακέτο ανάλυσης".
  • Κάντε κλικ στο κουμπί OK.



Παράδειγμα εργασίας

Η λειτουργία ανάλυσης παρτίδας είναι ενεργοποιημένη. Λύπουμε το ακόλουθο πρόβλημα. Έχουμε δείγμα δεδομένων για αρκετά χρόνια σχετικά με τον αριθμό καταστάσεων έκτακτης ανάγκης στην επιχείρηση και τον αριθμό των απασχολουμένων. Πρέπει να προσδιορίσουμε τη σχέση μεταξύ αυτών των δύο μεταβλητών. Υπάρχει μια επεξηγηματική μεταβλητή X - αυτός είναι ο αριθμός των εργαζομένων και μια εξηγηθείσα μεταβλητή - Y - αυτός είναι ο αριθμός των καταστάσεων έκτακτης ανάγκης. Διανέμουμε τα δεδομένα προέλευσης σε δύο στήλες.

Μεταβείτε στην καρτέλα "δεδομένα" και επιλέξτε "Ανάλυση δεδομένων"

Στη λίστα που εμφανίζεται, επιλέξτε "Regression". Στα διαστήματα εισόδου Y και X, επιλέξτε τις κατάλληλες τιμές.

Κάντε κλικ στο κουμπί OK. Η ανάλυση γίνεται, και σε ένα νέο φύλλο θα δούμε τα αποτελέσματα.

Οι πιο σημαντικές τιμές για εμάς σημειώνονται στο παρακάτω σχήμα.

Πολλαπλό R είναι ο συντελεστής προσδιορισμού. Έχει μια σύνθετη φόρμουλα υπολογισμού και δείχνει πόσο μπορείτε να εμπιστευτείτε τον συντελεστή συσχέτισης. Κατά συνέπεια, όσο μεγαλύτερη είναι αυτή η αξία, τόσο περισσότερη εμπιστοσύνη, τόσο πιο επιτυχημένη είναι το μοντέλο μας ως σύνολο.

Η διασταύρωση Y και η διατομή X1 είναι οι συντελεστές της παλινδρόμησης μας. Όπως ήδη αναφέρθηκε, η παλινδρόμηση είναι μια συνάρτηση και έχει ορισμένους συντελεστές. Έτσι, η λειτουργία μας θα έχει τη μορφή: Y \u003d 0.64 * X-2.84.

Τι μας δίνει αυτό; Αυτό μας δίνει την ευκαιρία να κάνουμε μια πρόβλεψη. Ας υποθέσουμε ότι θέλουμε να μισθώσουμε 25 εργαζόμενους στην επιχείρηση και πρέπει να φανταστούμε σε ποιο βαθμό θα είναι ο αριθμός των καταστάσεων έκτακτης ανάγκης. Υπολογίζουμε αυτή την τιμή στη συνάρτηση μας και παίρνουμε το αποτέλεσμα Y \u003d 0.64 * 25 - 2.84. Περίπου 13 έκτακτες περιπτώσεις θα συμβούν.

Ας δούμε πώς λειτουργεί. Ρίξτε μια ματιά στην παρακάτω εικόνα. Η λειτουργία που λάβαμε υποκαθιστά τις πραγματικές τιμές για τους εμπλεκόμενους υπαλλήλους. Δείτε πόσο κοντά είναι οι αξίες σε πραγματικά παιχνίδια.

Μπορείτε επίσης να δημιουργήσετε ένα πεδίο συσχέτισης επιλέγοντας την περιοχή των παιχνιδιών και των Χs, κάνοντας κλικ στην καρτέλα "Εισαγωγή" και επιλέγοντας ένα διάγραμμα σκέδασης.

Τα σημεία είναι διάσπαρτα, αλλά γενικά ανεβαίνουν, σαν να βρίσκεται μια ευθεία στη μέση. Και μπορείτε επίσης να προσθέσετε αυτή τη γραμμή πηγαίνοντας στην καρτέλα "Layout" στο MS Excel και επιλέγοντας "Trend Line"

Κάντε διπλό κλικ στη γραμμή που εμφανίζεται και θα δείτε τι αναφέρθηκε προηγουμένως. Μπορείτε να αλλάξετε τον τύπο της παλινδρόμησης ανάλογα με τον τρόπο εμφάνισης του πεδίου συσχετισμού.

Μπορεί να σας φανεί ότι τα σημεία έλκουν μια παραβολή, όχι μια ευθεία γραμμή, και είναι προτιμότερο να επιλέξετε διαφορετικό τύπο παλινδρόμησης.


Συμπέρασμα

Ας ελπίσουμε ότι αυτό το άρθρο σας έχει δώσει μια καλύτερη κατανόηση της ανάλυσης παλινδρόμησης και γιατί είναι απαραίτητη. Όλα αυτά έχουν μεγάλη εφαρμοσμένη αξία.

Το πακέτο MS Excel σάς επιτρέπει να κάνετε το μεγαλύτερο μέρος της εργασίας πολύ γρήγορα όταν δημιουργείτε την εξίσωση γραμμικής παλινδρόμησης. Είναι σημαντικό να κατανοήσετε τον τρόπο ερμηνείας των αποτελεσμάτων.

Για τη λειτουργία απαιτείται πρόσθετο Πακέτο ανάλυσηςνα συμπεριληφθούν στο στοιχείο μενού Υπηρεσία \\ Πρόσθετα

Στο Excel 2007, για να ενεργοποιήσετε το πακέτο ανάλυσης, κάντε κλικ στο κουμπί go to block Επιλογές του Excelκάνοντας κλικ στο πλήκτρο επάνω αριστερά και στη συνέχεια στο κουμπί " Επιλογές του Excel»Στο κάτω μέρος του παραθύρου:



Για να δημιουργήσετε ένα μοντέλο παλινδρόμησης, επιλέξτε Υπηρεσία \\ Ανάλυση δεδομένων \\ Οπισθοδρόμηση. (Στο Excel 2007, αυτή η λειτουργία βρίσκεται στο μπλοκ Ανάλυση δεδομένων / δεδομένων / παλινδρόμηση) Εμφανίζεται ένα παράθυρο διαλόγου που πρέπει να συμπληρωθεί:

1) Εισαγωγικό διάστημα Y  ¾ περιέχει μια σύνδεση με κελιά που περιέχουν τιμές ενός παραγωγικού χαρακτηριστικού y. Οι τιμές πρέπει να βρίσκονται σε μια στήλη.

2) Εισαγωγικό διάστημα X  ¾ περιέχει μια σύνδεση με κελιά που περιέχουν τιμές παράγοντα. Οι τιμές πρέπει να διευθετούνται σε στήλες.

3) Υπογράψτε Ετικέτες ορίστε εάν τα πρώτα κελιά περιέχουν επεξηγηματικό κείμενο (υπογραφές δεδομένων).

4) Επίπεδο αξιοπιστίας  ¾ Αυτή είναι μια πιθανότητα εμπιστοσύνης, η οποία εξ ορισμού θεωρείται ίση με 95%. Αν αυτή η τιμή δεν ταιριάζει, τότε πρέπει να ενεργοποιήσετε αυτή τη λειτουργία και να εισαγάγετε την επιθυμητή τιμή.

5) Υπογράψτε Συνεχής μηδέν  ενεργοποιείται εάν είναι απαραίτητο να δημιουργηθεί μια εξίσωση στην οποία μια ελεύθερη μεταβλητή.

6) Επιλογές εξόδου  καθορίστε πού πρέπει να τοποθετηθούν τα αποτελέσματα. Δημιουργία από προεπιλογή Νέο φύλλο εργασίας;

7) Αποκλεισμός Τα απομεινάρια  σας επιτρέπει να συμπεριλάβετε την απόσυρση υπολειμμάτων και την κατασκευή των προγραμμάτων τους.

Ως αποτέλεσμα, εμφανίζονται πληροφορίες που περιέχουν όλες τις απαραίτητες πληροφορίες και ομαδοποιούνται σε τρία μπλοκ: Στατιστικά στοιχεία παλινδρόμησης, Ανάλυση διακύμανσης, Υπόλοιπο απόσυρσης. Ας τις εξετάσουμε λεπτομερέστερα.

1. Στατιστικά στοιχεία παλινδρόμησης:

πληθυντικός R  καθορίζεται από τον τύπο ( Συντελεστής συσχέτισης Pearson);

R (συντελεστής προσδιορισμού);

Κανονικοποιημένο R-η κλίμακα υπολογίζεται από τον τύπο   (χρησιμοποιείται για πολλαπλή παλινδρόμηση).

Τυπικό σφάλμα S  υπολογίζεται από τον τύπο ;

Παρατηρήσεις ¾ αυτή είναι η ποσότητα των δεδομένων n.

2. Ανάλυση διακύμανσης, γραμμή Η παλινδρόμηση:

Παράμετρος df  ισούται με m  (αριθμός συνόλων παραγόντων x);

Παράμετρος SS  καθορίζεται από τον τύπο.

Παράμετρος Κα  καθορίζεται από τον τύπο.

Στατιστικά στοιχεία F  καθορίζεται από τον τύπο.

Συνάφεια F. Εάν ο αριθμός που έχει ληφθεί υπερβαίνει, τότε μια υπόθεση είναι αποδεκτή (δεν υπάρχει γραμμική σχέση), διαφορετικά μια υπόθεση είναι αποδεκτή (υπάρχει μια γραμμική σχέση).


3. Ανάλυση διακύμανσης, γραμμή Το υπόλοιπο:

Παράμετρος df  είναι ίση με?

Παράμετρος SS  που καθορίζεται από τον τύπο ;

Παράμετρος Κα  που καθορίζεται από τον τύπο.

4. Ανάλυση διακύμανσης, γραμμή Σύνολο  περιέχει το άθροισμα των πρώτων δύο στηλών.

5. Ανάλυση διακύμανσης, γραμμή Y τομή  περιέχει την τιμή του συντελεστή, τυπικού σφάλματος και tστατιστικά στοιχεία.

P-value ¾ είναι η τιμή των επιπέδων σημασίας που αντιστοιχεί στο υπολογιζόμενο tστατιστικά στοιχεία. Καθορίζεται από τη λειτουργία STUDUSTER ( t-στατιστικά στοιχεία. ) Αν PΕάν η τιμή υπερβαίνει, τότε η αντίστοιχη μεταβλητή είναι στατιστικά ασήμαντη και μπορεί να αποκλειστεί από το μοντέλο.

Κάτω 95%  και Κορυφαία 95%  ¾ Αυτά είναι τα κατώτερα και ανώτερα όρια των διαστημάτων εμπιστοσύνης 95 τοις εκατό για τους συντελεστές της θεωρίας της γραμμικής εξίσωσης γραμμικής παλινδρόμησης. Αν στο πεδίο εισαγωγής δεδομένων η τιμή εμπιστοσύνης έμεινε στην προεπιλογή, τότε οι δύο τελευταίες στήλες θα διπλασιάσουν τις προηγούμενες. Εάν ο χρήστης έχει εισαγάγει την τιμή εμπιστοσύνης του, οι δύο τελευταίες στήλες περιέχουν τα κατώτατα και ανώτερα όρια για το καθορισμένο επίπεδο εμπιστοσύνης.

6. Ανάλυση διακύμανσης, οι γραμμές περιέχουν τιμές συντελεστών, τυπικά σφάλματα, tστατιστικολόγος P-τιμές και διαστήματα εμπιστοσύνης για τα αντίστοιχα.

7. Αποκλεισμός Υπόλοιπο απόσυρσης  περιέχει τις προβλεπόμενες τιμές y  (στο σημείωμά μας αυτό) και τα υπόλοιπα.

Συνέχιση του θέματος:
Υπολογιστής

Ακολουθεί μια λύση μη αυτόματης (όχι μικροεφαρμογής) δύο προβλημάτων με τη μέθοδο simplex (παρόμοια με την επίλυση μιας μικροεφαρμογής) με λεπτομερείς εξηγήσεις για την κατανόηση του αλγορίθμου για την επίλυση προβλημάτων ...