Γραμμική παλινδρόμηση στο excel μέσω ανάλυσης δεδομένων. Πώς να φτιάξετε μια εξίσωση παλινδρόμησης στο excel

Αυτός είναι ο πιο συνηθισμένος τρόπος εμφάνισης της εξάρτησης κάποιας μεταβλητής από άλλες, για παράδειγμα, όπως επίπεδο ΑΕΠαπό την αξία ξένη επένδυσηή από πιστωτικό επιτόκιο της Εθνικής Τράπεζαςή από τιμές για βασικούς ενεργειακούς πόρους.

Η μοντελοποίηση σάς επιτρέπει να δείξετε το μέγεθος αυτής της εξάρτησης (συντελεστές), χάρη στους οποίους μπορείτε να κάνετε απευθείας μια πρόβλεψη και να πραγματοποιήσετε κάποιο είδος προγραμματισμού με βάση αυτές τις προβλέψεις. Επίσης, με βάση την ανάλυση παλινδρόμησης, είναι δυνατό να ληφθούν διαχειριστικές αποφάσεις με στόχο την τόνωση των αιτιών προτεραιότητας που επηρεάζουν το τελικό αποτέλεσμα και το ίδιο το μοντέλο θα βοηθήσει στην ανάδειξη αυτών των παραγόντων προτεραιότητας.

Γενική άποψη του μοντέλου γραμμικής παλινδρόμησης:

Y=a 0 +a 1 x 1 +...+a k x k

όπου ένα - παράμετροι (συντελεστές) παλινδρόμησης, Χ - παράγοντες που επηρεάζουν, κ είναι ο αριθμός των παραγόντων του μοντέλου.

Αρχικά στοιχεία

Μεταξύ των αρχικών δεδομένων, χρειαζόμαστε ένα συγκεκριμένο σύνολο δεδομένων που θα αποτελείται από πολλές διαδοχικές ή διασυνδεδεμένες τιμές της τελικής παραμέτρου Υ (για παράδειγμα, ΑΕΠ) και τον ίδιο αριθμό τιμών των δεικτών των οποίων την επιρροή μελετάμε ( για παράδειγμα, ξένες επενδύσεις).

Το παραπάνω σχήμα δείχνει έναν πίνακα με τα ίδια αρχικά δεδομένα, το Y είναι ένας δείκτης του οικονομικά ενεργού πληθυσμού και ο αριθμός των επιχειρήσεων, το ύψος της επένδυσης σε κεφάλαιο και το εισόδημα του πληθυσμού είναι παράγοντες που επηρεάζουν, δηλαδή τα x.

Από το σχήμα, μπορεί κανείς επίσης να κάνει ένα εσφαλμένο συμπέρασμα ότι η μοντελοποίηση μπορεί να μιλήσει μόνο για δυναμικές σειρές, δηλαδή σειρές ροπών που καθορίζονται διαδοχικά στο χρόνο, αλλά αυτό δεν συμβαίνει, με την ίδια επιτυχία είναι δυνατό να μοντελοποιηθεί στο πλαίσιο η δομή, για παράδειγμα, οι τιμές που καθορίζονται στον πίνακα μπορούν να χωριστούν όχι ανά έτη, αλλά ανά περιοχές.

Για την κατασκευή επαρκών γραμμικών μοντέλων, είναι επιθυμητό τα αρχικά δεδομένα να μην έχουν έντονες πτώσεις ή καταρρεύσεις, σε τέτοιες περιπτώσεις είναι επιθυμητό να πραγματοποιηθεί εξομάλυνση, αλλά θα μιλήσουμε για εξομάλυνση την επόμενη φορά.

Πακέτο ανάλυσης

Οι παράμετροι ενός μοντέλου γραμμικής παλινδρόμησης μπορούν επίσης να υπολογιστούν χειροκίνητα χρησιμοποιώντας τη μέθοδο των ελάχιστων τετραγώνων (OLS), αλλά αυτό είναι αρκετά χρονοβόρο. Λίγο πιο γρήγορα, αυτό μπορεί να υπολογιστεί χρησιμοποιώντας την ίδια μέθοδο χρησιμοποιώντας τύπους στο Excel, όπου το πρόγραμμα θα κάνει τους υπολογισμούς μόνο του, αλλά θα πρέπει να καταγράψετε τους τύπους με μη αυτόματο τρόπο.

Το Excel έχει ένα πρόσθετο Πακέτο ανάλυσηςπου είναι όμορφο ισχυρό εργαλείογια να βοηθήσει τον αναλυτή. Αυτή η εργαλειοθήκη, μεταξύ άλλων, είναι σε θέση να υπολογίσει παραμέτρους παλινδρόμησης, σύμφωνα με το ίδιο OLS, με λίγα μόνο κλικ, στην πραγματικότητα, θα συζητηθεί περαιτέρω ο τρόπος χρήσης αυτού του εργαλείου.

Ενεργοποίηση του πακέτου ανάλυσης

Από προεπιλογή, αυτό το πρόσθετο είναι απενεργοποιημένο και δεν θα το βρείτε στο μενού καρτελών, οπότε ας ρίξουμε μια ματιά βήμα προς βήμα στον τρόπο ενεργοποίησής του.

Στο Excel, επάνω αριστερά, ενεργοποιήστε την καρτέλα Αρχείο, στο μενού που ανοίγει, αναζητήστε το στοιχείο Παράμετροικαι κάντε κλικ σε αυτό.

Στο παράθυρο που ανοίγει, στα αριστερά, αναζητήστε το στοιχείο πρόσθετακαι ενεργοποιήστε το, σε αυτήν την καρτέλα στο κάτω μέρος θα υπάρχει μια αναπτυσσόμενη λίστα με στοιχεία ελέγχου, όπου από προεπιλογή θα γραφτεί Πρόσθετα Excel, στα δεξιά της αναπτυσσόμενης λίστας θα υπάρχει ένα κουμπί Πηγαίνω, πρέπει να κάνετε κλικ σε αυτό.

Ένα αναδυόμενο παράθυρο θα σας ζητήσει να επιλέξετε τα διαθέσιμα πρόσθετα, σε αυτό πρέπει να επιλέξετε το πλαίσιο δίπλα στο Πακέτο ανάλυσηςκαι ταυτόχρονα, για παν ενδεχόμενο, Εύρεση Λύσης(επίσης χρήσιμο πράγμα), και στη συνέχεια επιβεβαιώστε την επιλογή κάνοντας κλικ στο κουμπί Εντάξει.

Οδηγίες για την εύρεση παραμέτρων γραμμικής παλινδρόμησης με χρήση του πακέτου ανάλυσης

Αφού ενεργοποιήσετε το πρόσθετο του πακέτου ανάλυσης, θα είναι πάντα διαθέσιμο στην καρτέλα του κύριου μενού Δεδομένακάτω από τον σύνδεσμο Ανάλυση δεδομένων

Στο παράθυρο του ενεργού εργαλείου Ανάλυση δεδομένωναπό τη λίστα δυνατοτήτων, αναζητήστε και επιλέξτε Οπισθοδρόμηση

Στη συνέχεια, θα ανοίξει ένα παράθυρο για τη ρύθμιση και την επιλογή των αρχικών δεδομένων για τον υπολογισμό των παραμέτρων του μοντέλου παλινδρόμησης. Εδώ πρέπει να καθορίσετε τα διαστήματα των αρχικών δεδομένων, δηλαδή την περιγραφόμενη παράμετρο (Y) και τους παράγοντες που την επηρεάζουν (X), όπως φαίνεται στο παρακάτω σχήμα, οι υπόλοιπες παράμετροι, κατ' αρχήν, είναι προαιρετικές για ρύθμιση.

Αφού επιλέξετε τα δεδομένα προέλευσης και κάνετε κλικ στο κουμπί OK, το Excel εμφανίζει τους υπολογισμούς σε ένα νέο φύλλο του ενεργού βιβλίου εργασίας (αν δεν είχε οριστεί διαφορετικά στις ρυθμίσεις), αυτοί οι υπολογισμοί μοιάζουν με αυτό:

Γέμισα τα βασικά κελιά με κίτρινο χρώμα, είναι αυτά που πρέπει πρώτα απ 'όλα να προσέξετε, οι άλλες παράμετροι είναι επίσης σημαντικές, αλλά η λεπτομερής ανάλυσή τους απαιτεί ίσως μια ξεχωριστή ανάρτηση.

Ετσι, 0,865 - Αυτό R2- συντελεστής προσδιορισμού, που δείχνει ότι το 86,5% των υπολογισμένων παραμέτρων του μοντέλου, δηλαδή το ίδιο το μοντέλο, εξηγούν την εξάρτηση και τις αλλαγές στη μελετημένη παράμετρο - Υαπό τους παράγοντες που μελετήθηκαν - Χ. Αν είναι υπερβολικό, τότε είναι ένας δείκτης της ποιότητας του μοντέλουκαι όσο πιο ψηλά είναι τόσο το καλύτερο. Είναι σαφές ότι δεν μπορεί να είναι περισσότερο από 1 και θεωρείται καλό όταν το R 2 είναι πάνω από 0,8, και εάν είναι μικρότερο από 0,5, τότε η λογική ενός τέτοιου μοντέλου μπορεί να αμφισβητηθεί με ασφάλεια.

Τώρα ας προχωρήσουμε στο συντελεστές μοντέλου:
2079,85 - Αυτό ένα 0- ένας συντελεστής που δείχνει ποιο θα είναι το Y εάν όλοι οι παράγοντες που χρησιμοποιούνται στο μοντέλο είναι ίσοι με 0, εννοείται ότι πρόκειται για εξάρτηση από άλλους παράγοντες που δεν περιγράφονται στο μοντέλο.
-0,0056 - Α'1- ένας συντελεστής που δείχνει το βάρος της επιρροής του παράγοντα x 1 στο Y, δηλαδή, ο αριθμός των επιχειρήσεων σε αυτό το μοντέλο επηρεάζει τον δείκτη του οικονομικά ενεργού πληθυσμού με βάρος μόνο -0,0056 (ένας μάλλον μικρός βαθμός επιρροής ). Το πρόσημο μείον δείχνει ότι αυτή η επιρροή είναι αρνητική, δηλαδή, όσο περισσότερες επιχειρήσεις, τόσο λιγότερο οικονομικά ενεργός πληθυσμός, όσο παράδοξη και αν είναι αυτή.
-0,0026 - Α2- ο συντελεστής επιρροής του όγκου των επενδύσεων σε κεφάλαιο στο μέγεθος του οικονομικά ενεργού πληθυσμού, σύμφωνα με το μοντέλο, αυτή η επιρροή είναι επίσης αρνητική.
0,0028 - α 3είναι ο συντελεστής της επίδρασης του εισοδήματος του πληθυσμού στο μέγεθος του οικονομικά ενεργού πληθυσμού, εδώ η επιρροή είναι θετική, δηλαδή, σύμφωνα με το μοντέλο, μια αύξηση του εισοδήματος θα συμβάλει στην αύξηση του μεγέθους του οικονομικά ενεργού πληθυσμού ενεργό πληθυσμό.

Συλλέγουμε τους υπολογισμένους συντελεστές στο μοντέλο:

Υ = 2079,85 - 0,0056x 1 - 0,0026x 2 + 0,0028x 3

Στην πραγματικότητα, αυτό είναι ένα μοντέλο γραμμικής παλινδρόμησης, το οποίο μοιάζει ακριβώς με αυτό για τα αρχικά δεδομένα που χρησιμοποιούνται στο παράδειγμα.

Μοντέλο Εκτιμώμενες Αξίες και Πρόβλεψη

Όπως συζητήσαμε παραπάνω, το μοντέλο έχει κατασκευαστεί όχι μόνο για να δείχνει το μέγεθος των εξαρτήσεων της μελετημένης παραμέτρου από τους παράγοντες που επηρεάζουν, αλλά και έτσι ώστε γνωρίζοντας αυτούς τους παράγοντες που επηρεάζουν να είναι δυνατή η πραγματοποίηση μιας πρόβλεψης. Για να κάνετε αυτή την πρόβλεψη είναι αρκετά απλή, απλά πρέπει να αντικαταστήσετε τις τιμές των παραγόντων που επηρεάζουν τη θέση των αντίστοιχων x στην εξίσωση του μοντέλου που προκύπτει. Στο παρακάτω σχήμα, αυτοί οι υπολογισμοί γίνονται στο Excel σε ξεχωριστή στήλη.

Οι πραγματικές τιμές (αυτές που πραγματοποιήθηκαν στην πραγματικότητα) και οι υπολογισμένες τιμές για το μοντέλο στο ίδιο σχήμα εμφανίζονται με τη μορφή γραφημάτων για να δείξουν τη διαφορά και ως εκ τούτου το σφάλμα του μοντέλου.

Επαναλαμβάνω για άλλη μια φορά, για να γίνει μια πρόβλεψη για το μοντέλο, είναι απαραίτητο να υπάρχουν γνωστοί παράγοντες που επηρεάζουν, και αν μιλάμε για μια χρονολογική σειρά και, κατά συνέπεια, μια πρόβλεψη για το μέλλον, για παράδειγμα, για την επόμενη έτος ή μήνα, τότε δεν είναι πάντα δυνατό να μάθουμε ποιοι θα είναι οι παράγοντες που θα επηρεάσουν αυτό ακριβώς το μέλλον. Σε τέτοιες περιπτώσεις, είναι επίσης απαραίτητο να γίνει μια πρόβλεψη για τους παράγοντες που επηρεάζουν, τις περισσότερες φορές αυτό γίνεται χρησιμοποιώντας ένα αυτοπαλινδρομικό μοντέλο - ένα μοντέλο στο οποίο οι παράγοντες που επηρεάζουν είναι το υπό μελέτη αντικείμενο και ο χρόνος, δηλαδή η εξάρτηση του δείκτη διαμορφώνεται σε αυτό που ήταν στο παρελθόν.

Θα εξετάσουμε πώς να δημιουργήσουμε ένα αυτοπαλινδρομικό μοντέλο στο επόμενο άρθρο και τώρα υποθέτουμε ότι γνωρίζουμε ποιες θα είναι οι τιμές των παραγόντων που επηρεάζουν τη μελλοντική περίοδο (στο παράδειγμα, 2008), αντικαθιστώντας αυτές τις τιμές με με τους υπολογισμούς, θα πάρουμε την πρόβλεψή μας για το 2008.

Δείχνει την επίδραση ορισμένων τιμών (ανεξάρτητων, ανεξάρτητων) στην εξαρτημένη μεταβλητή. Για παράδειγμα, το πώς ο αριθμός του οικονομικά ενεργού πληθυσμού εξαρτάται από τον αριθμό των επιχειρήσεων, τους μισθούς και άλλες παραμέτρους. Ή: πώς οι ξένες επενδύσεις, οι τιμές της ενέργειας κ.λπ. επηρεάζουν το επίπεδο του ΑΕΠ.

Το αποτέλεσμα της ανάλυσης σας επιτρέπει να βάλετε προτεραιότητες. Και με βάση τους κύριους παράγοντες, να προβλέψει, να σχεδιάσει την ανάπτυξη των τομέων προτεραιότητας, να λάβει αποφάσεις διαχείρισης.

Η παλινδρόμηση συμβαίνει:

γραμμικό (y = a + bx);

παραβολική (y = a + bx + cx 2);

εκθετική (y = a * exp(bx));

Ισχύς (y = a*x^b);

υπερβολική (y = b/x + a);

λογαριθμική (y = b * 1n(x) + a);

εκθετική (y = a * b^x).

Εξετάστε το παράδειγμα δημιουργίας ενός μοντέλου παλινδρόμησης στο Excel και ερμηνείας των αποτελεσμάτων. Ας πάρουμε γραμμικού τύπουοπισθοδρόμηση.

Μια εργασία. Σε 6 επιχειρήσεις αναλύθηκε ο μέσος μηνιαίος μισθός και ο αριθμός των εργαζομένων που αποχώρησαν. Είναι απαραίτητο να προσδιοριστεί η εξάρτηση του αριθμού των συνταξιούχων από τον μέσο μισθό.

Το μοντέλο γραμμικής παλινδρόμησης έχει την ακόλουθη μορφή:

Y \u003d a 0 + a 1 x 1 + ... + a k x k.

Όπου a είναι οι συντελεστές παλινδρόμησης, x οι μεταβλητές που επηρεάζουν και k είναι ο αριθμός των παραγόντων.

Στο παράδειγμά μας, το Y είναι ο δείκτης των εργαζομένων που εγκατέλειψαν. Ο παράγοντας που επηρεάζει είναι οι μισθοί (x).

Το Excel έχει ενσωματωμένες συναρτήσεις που μπορούν να χρησιμοποιηθούν για τον υπολογισμό των παραμέτρων ενός μοντέλου γραμμικής παλινδρόμησης. Αλλά το πρόσθετο Analysis ToolPak θα το κάνει πιο γρήγορα.

Ενεργοποιήστε ένα ισχυρό αναλυτικό εργαλείο:

1. Κάντε κλικ στο κουμπί "Office" και μεταβείτε στην καρτέλα "Επιλογές Excel". "Πρόσθετα".

2. Παρακάτω, κάτω από την αναπτυσσόμενη λίστα, στο πεδίο "Διαχείριση" θα υπάρχει η επιγραφή "Πρόσθετα Excel" (αν δεν υπάρχει, κάντε κλικ στο πλαίσιο ελέγχου στα δεξιά και επιλέξτε). Και ένα κουμπί Go. Κάντε κλικ.

3. Ανοίγει μια λίστα με τα διαθέσιμα πρόσθετα. Επιλέξτε "Πακέτο ανάλυσης" και κάντε κλικ στο OK.

Μόλις ενεργοποιηθεί, το πρόσθετο θα είναι διαθέσιμο στην καρτέλα Δεδομένα.

Τώρα θα ασχοληθούμε άμεσα με την ανάλυση παλινδρόμησης.

1. Ανοίξτε το μενού του εργαλείου Ανάλυση δεδομένων. Επιλέξτε "Προσβολή".



2. Θα ανοίξει ένα μενού για την επιλογή τιμών εισόδου και επιλογών εξόδου (πού θα εμφανιστεί το αποτέλεσμα). Στα πεδία για τα αρχικά δεδομένα, υποδεικνύουμε το εύρος της περιγραφόμενης παραμέτρου (Y) και τον παράγοντα που την επηρεάζει (X). Τα υπόλοιπα μπορεί να ολοκληρωθούν ή όχι.

3. Αφού κάνετε κλικ στο OK, το πρόγραμμα θα εμφανίσει τους υπολογισμούς σε ένα νέο φύλλο (μπορείτε να επιλέξετε το διάστημα που θα εμφανιστεί στο τρέχον φύλλο ή να αντιστοιχίσετε την έξοδο σε ένα νέο βιβλίο εργασίας).

Πρώτα απ 'όλα, δίνουμε προσοχή στο R-τετράγωνο και τους συντελεστές.

Το R-τετράγωνο είναι ο συντελεστής προσδιορισμού. Στο παράδειγμά μας, είναι 0,755, ή 75,5%. Αυτό σημαίνει ότι οι υπολογισμένες παράμετροι του μοντέλου εξηγούν τη σχέση μεταξύ των παραμέτρων που μελετήθηκαν κατά 75,5%. Όσο υψηλότερος είναι ο συντελεστής προσδιορισμού, τόσο καλύτερο είναι το μοντέλο. Καλό - πάνω από 0,8. Κακή - λιγότερο από 0,5 (μια τέτοια ανάλυση δύσκολα μπορεί να θεωρηθεί λογική). Στο παράδειγμά μας - "όχι κακό".

Ο συντελεστής 64,1428 δείχνει τι θα είναι το Y εάν όλες οι μεταβλητές στο υπό εξέταση μοντέλο είναι ίσες με 0. Δηλαδή, άλλοι παράγοντες που δεν περιγράφονται στο μοντέλο επηρεάζουν επίσης την τιμή της παραμέτρου που αναλύεται.

Ο συντελεστής -0,16285 δείχνει το βάρος της μεταβλητής X στο Y. Δηλαδή, ο μέσος μηνιαίος μισθός σε αυτό το μοντέλο επηρεάζει τον αριθμό των παραιτητών με βάρος -0,16285 (αυτός είναι ένας μικρός βαθμός επιρροής). Το σύμβολο «-» υποδηλώνει αρνητικό αντίκτυπο: όσο υψηλότερος είναι ο μισθός, τόσο λιγότερη παραίτηση. Που είναι δίκαιο.

Η επεξεργασία στατιστικών δεδομένων μπορεί επίσης να πραγματοποιηθεί χρησιμοποιώντας το πρόσθετο ΠΑΚΕΤΟ ΑΝΑΛΥΣΗΣ(Εικ. 62).

Από τα προτεινόμενα στοιχεία, επιλέξτε το στοιχείο " ΟΠΙΣΘΟΔΡΟΜΗΣΗ” και κάντε κλικ πάνω του με το αριστερό κουμπί του ποντικιού. Στη συνέχεια, κάντε κλικ στο OK.

Το παράθυρο που φαίνεται στο Σχ. 63.

Εργαλείο ανάλυσης « ΟΠΙΣΘΟΔΡΟΜΗΣΗ» χρησιμοποιείται για την προσαρμογή ενός γραφήματος σε ένα σύνολο παρατηρήσεων χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων. Η παλινδρόμηση χρησιμοποιείται για την ανάλυση της επίδρασης σε μια μεμονωμένη εξαρτημένη μεταβλητή των τιμών μιας ή περισσότερων ανεξάρτητων μεταβλητών. Για παράδειγμα, η αθλητική απόδοση ενός αθλητή επηρεάζεται από διάφορους παράγοντες, όπως η ηλικία, το ύψος και το βάρος. Είναι δυνατόν να υπολογιστεί ο βαθμός επιρροής καθενός από αυτούς τους τρεις παράγοντες στην απόδοση ενός αθλητή και στη συνέχεια να χρησιμοποιηθούν τα δεδομένα που λαμβάνονται για να προβλέψουμε την απόδοση ενός άλλου αθλητή.

Το εργαλείο παλινδρόμησης χρησιμοποιεί τη συνάρτηση LINEST.

Πλαίσιο διαλόγου REGRESS

Ετικέτες Επιλέξτε το πλαίσιο ελέγχου εάν η πρώτη σειρά ή η πρώτη στήλη του εύρους εισαγωγής περιέχει τίτλους. Καταργήστε την επιλογή αυτού του πλαισίου ελέγχου εάν δεν υπάρχουν κεφαλίδες. Σε αυτήν την περίπτωση, οι κατάλληλες κεφαλίδες για τα δεδομένα του πίνακα εξόδου θα δημιουργηθούν αυτόματα.

Επίπεδο αξιοπιστίας Επιλέξτε το πλαίσιο ελέγχου για να συμπεριλάβετε ένα επιπλέον επίπεδο στον πίνακα συνόλων εξόδου. Στο κατάλληλο πεδίο, εισαγάγετε το επίπεδο εμπιστοσύνης που θέλετε να εφαρμόσετε, εκτός από το προεπιλεγμένο επίπεδο εμπιστοσύνης 95%.

Σταθερά - μηδέν Επιλέξτε το πλαίσιο για να περάσει η γραμμή παλινδρόμησης από την αρχή.

Εύρος εξόδου Εισαγάγετε μια αναφορά στο επάνω αριστερό κελί της περιοχής εξόδου. Εκχωρήστε τουλάχιστον επτά στήλες για τον πίνακα εξόδου των αποτελεσμάτων, ο οποίος θα περιλαμβάνει: αποτελέσματα ανάλυσης διασποράς, συντελεστές, τυπικό σφάλμα υπολογισμού Υ, τυπικές αποκλίσεις, αριθμό παρατηρήσεων, τυπικά σφάλματα για συντελεστές.

Νέο φύλλο εργασίας Επιλέξτε αυτό το πλαίσιο για να ανοίξετε ένα νέο φύλλο εργασίας στο βιβλίο εργασίας και να εισαγάγετε τα αποτελέσματα της ανάλυσης ξεκινώντας από το κελί A1. Εάν είναι απαραίτητο, εισαγάγετε ένα όνομα για το νέο φύλλο στο πεδίο απέναντι από την κατάλληλη θέση του κουμπιού επιλογής.

Νέο βιβλίο εργασίας Επιλέξτε αυτό το πλαίσιο για να δημιουργήσετε ένα νέο βιβλίο εργασίας στο οποίο τα αποτελέσματα θα προστεθούν σε ένα νέο φύλλο.

Υπολείμματα Επιλέξτε το πλαίσιο ελέγχου για να συμπεριλάβετε υπολείμματα στον πίνακα εξόδου.

Τυποποιημένα υπολείμματα Επιλέξτε το πλαίσιο ελέγχου για να συμπεριλάβετε τυποποιημένα υπολείμματα στον πίνακα εξόδου.

Υπολειπόμενη γραφική παράσταση Επιλέξτε το πλαίσιο για να σχεδιάσετε τα υπολείμματα για κάθε ανεξάρτητη μεταβλητή.

Fit Plot Επιλέξτε το πλαίσιο ελέγχου για να σχεδιάσετε τις προβλεπόμενες τιμές έναντι των παρατηρούμενων τιμών.

Οικόπεδο κανονικής πιθανότηταςΕπιλέξτε το πλαίσιο για να σχεδιάσετε την κανονική πιθανότητα.

Λειτουργία LINEST

Για να εκτελέσετε υπολογισμούς, επιλέξτε το κελί στο οποίο θέλουμε να εμφανιστεί η μέση τιμή με τον κέρσορα και πατήστε το πλήκτρο = στο πληκτρολόγιο. Στη συνέχεια, στο πεδίο Όνομα, καθορίστε την επιθυμητή συνάρτηση, για παράδειγμα ΜΕΣΗ ΤΙΜΗ(Εικ. 22).

Λειτουργία LINESTυπολογίζει στατιστικά στοιχεία για μια σειρά χρησιμοποιώντας τη μέθοδο των ελαχίστων τετραγώνων για τον υπολογισμό μιας ευθείας γραμμής που προσεγγίζει καλύτερα τα διαθέσιμα δεδομένα και στη συνέχεια επιστρέφει έναν πίνακα που περιγράφει την ευθεία που προκύπτει. Μπορείτε επίσης να συνδυάσετε τη λειτουργία LINESTμε άλλες συναρτήσεις για τον υπολογισμό άλλων ειδών μοντέλων που είναι γραμμικά σε άγνωστες παραμέτρους (των οποίων οι άγνωστες παράμετροι είναι γραμμικές), συμπεριλαμβανομένων των σειρών πολυωνυμικών, λογαριθμικών, εκθετικών και ισχύος. Επειδή επιστρέφεται ένας πίνακας τιμών, η συνάρτηση πρέπει να καθοριστεί ως τύπος πίνακα.

Η εξίσωση για μια ευθεία γραμμή είναι:

y=m 1 x 1 +m 2 x 2 +…+b (σε περίπτωση πολλών περιοχών τιμών x),

όπου η εξαρτημένη τιμή y είναι συνάρτηση της ανεξάρτητης τιμής x, οι τιμές m είναι οι συντελεστές που αντιστοιχούν σε κάθε ανεξάρτητη μεταβλητή x και το b είναι μια σταθερά. Σημειώστε ότι τα y, x και m μπορούν να είναι διανύσματα. Λειτουργία LINESTεπιστρέφει έναν πίνακα (mn;mn-1;…;m 1 ;b). LINESTμπορεί επίσης να επιστρέψει πρόσθετα στατιστικά παλινδρόμησης.

LINEST(γνωστές_υ-τιμές; γνωστές_χ-τιμές; const; στατιστικά στοιχεία)

Γνωστές_y τιμές - το σύνολο των τιμών y που είναι ήδη γνωστές για τη σχέση y=mx+b.

Εάν ο πίνακας του know_y έχει μία στήλη, τότε κάθε στήλη του πίνακα του known_x ερμηνεύεται ως ξεχωριστή μεταβλητή.

Εάν ο πίνακας του Known_y έχει μία σειρά, τότε κάθε σειρά του πίνακα του Known_x ερμηνεύεται ως ξεχωριστή μεταβλητή.

Γνωστές_x τιμές - ένα προαιρετικό σύνολο τιμών x που είναι ήδη γνωστά για τη σχέση y=mx+b.

Ο πίνακας Known_x μπορεί να περιέχει ένα ή περισσότερα σύνολα μεταβλητών. Εάν χρησιμοποιείται μόνο μία μεταβλητή, τότε οι πίνακες_γνωστές_υ_τιμές και οι γνωστές_χ_τιμές μπορούν να έχουν οποιοδήποτε σχήμα - αρκεί να έχουν την ίδια διάσταση. Εάν χρησιμοποιούνται περισσότερες από μία μεταβλητές, τότε το know_y's πρέπει να είναι διάνυσμα (δηλαδή, σε ύψος μίας γραμμής ή πλάτος μίας στήλης).

Εάν παραληφθεί ο πίνακας_γνωστός_χ, τότε αυτός ο πίνακας (1;2;3;...) θεωρείται ότι έχει το ίδιο μέγεθος με τον πίνακα_γνωστό_y.

Το Const είναι μια δυαδική τιμή που καθορίζει εάν η σταθερά b απαιτείται να είναι 0.

Εάν το όρισμα "const" είναι TRUE ή παραλειφθεί, τότε η σταθερά b αξιολογείται κανονικά.

Εάν το όρισμα "const" είναι FALSE, τότε η τιμή του b θεωρείται ότι είναι 0 και οι τιμές του m επιλέγονται με τέτοιο τρόπο ώστε να ικανοποιείται η σχέση y=mx.

Το Statistics είναι μια Boolean τιμή που υποδεικνύει εάν πρέπει να επιστραφούν πρόσθετα στατιστικά στοιχεία παλινδρόμησης.

Εάν τα στατιστικά στοιχεία είναι TRUE, το LINEST επιστρέφει πρόσθετα στατιστικά στοιχεία παλινδρόμησης. Ο πίνακας που επιστρέφεται θα μοιάζει με αυτό: (mn;mn-1;...;m1;b:sen;sen-1;...;se1;seb:r2;sey:F;df:ssreg;ssresid).

Εάν τα στατιστικά στοιχεία είναι FALSE ή παραλείπονται, το LINEST επιστρέφει μόνο τους συντελεστές m και τη σταθερά b.

Πρόσθετα στατιστικά στοιχεία παλινδρόμησης. (Πίνακας 17)

αξία Περιγραφή
se1,se2,...,sen Τυπικές τιμές σφάλματος για τους συντελεστές m1,m2,...,mn.
seb Το τυπικό σφάλμα για τη σταθερά b (seb = #N/A εάν το 'const' είναι FALSE).
r2 Συντελεστής προσδιορισμού. Οι πραγματικές τιμές του y συγκρίνονται με τις τιμές που λαμβάνονται από την ευθεία εξίσωση. με βάση τα αποτελέσματα της σύγκρισης, υπολογίζεται ο συντελεστής ντετερμινισμού, κανονικοποιημένος από 0 σε 1. Εάν είναι ίσος με 1, τότε υπάρχει πλήρης συσχέτιση με το μοντέλο, δηλαδή δεν υπάρχει διαφορά μεταξύ των πραγματικών και των εκτιμώμενων τιμών ​του υ. Διαφορετικά, εάν ο συντελεστής ντετερμινισμού είναι 0, δεν έχει νόημα η χρήση της εξίσωσης παλινδρόμησης για την πρόβλεψη τιμών y. Για περισσότερες πληροφορίες σχετικά με τον τρόπο υπολογισμού του r2, ανατρέξτε στην ενότητα "Παρατηρήσεις" στο τέλος αυτής της ενότητας.
sey Το τυπικό σφάλμα για την εκτίμηση y.
φά F-statistic ή F-παρατηρούμενη τιμή. Η στατιστική F χρησιμοποιείται για να προσδιοριστεί εάν μια παρατηρούμενη σχέση μεταξύ των εξαρτημένων και ανεξάρτητων μεταβλητών είναι τυχαία.
df Βαθμοί ελευθερίας. Οι βαθμοί ελευθερίας είναι χρήσιμοι για την εύρεση κρίσιμων τιμών F σε έναν στατιστικό πίνακα. Για να προσδιορίσετε το επίπεδο εμπιστοσύνης του μοντέλου, πρέπει να συγκρίνετε τις τιμές στον πίνακα με τη στατιστική F που επιστρέφεται από το LINEST. Δείτε "Παρατηρήσεις" στο τέλος αυτής της ενότητας για περισσότερες πληροφορίες σχετικά με τον υπολογισμό του df. Το Παράδειγμα 4 παρακάτω δείχνει τη χρήση των F και df.
ssreg Παλινδρομικό άθροισμα τετραγώνων.
ssresid Υπολειπόμενο άθροισμα τετραγώνων. Για περισσότερες πληροφορίες σχετικά με τον υπολογισμό του ssreg και του ssresid, ανατρέξτε στην ενότητα "Παρατηρήσεις" στο τέλος αυτής της ενότητας.

Το παρακάτω σχήμα δείχνει τη σειρά με την οποία επιστρέφονται πρόσθετα στατιστικά στοιχεία παλινδρόμησης (Εικόνα 64).

Σημειώσεις:

Οποιαδήποτε ευθεία μπορεί να περιγραφεί από την κλίση και την τομή της με τον άξονα y:

Κλίση (m): για να προσδιορίσετε την κλίση μιας γραμμής, που συνήθως συμβολίζεται με m, πρέπει να λάβετε δύο σημεία στην ευθεία (x 1 ,y 1) και (x 2 ,y 2). η κλίση θα είναι ίση με (y 2 -y 1) / (x 2 -x 1).

Y-τομή (b): Η y-τομή μιας ευθείας, που συνήθως συμβολίζεται με b, είναι η τιμή y για το σημείο όπου η ευθεία τέμνει τον άξονα y.

Η ευθύγραμμη εξίσωση έχει τη μορφή y=mx+b. Εάν οι τιμές των m και b είναι γνωστές, τότε οποιοδήποτε σημείο στη γραμμή μπορεί να υπολογιστεί αντικαθιστώντας τις τιμές του y ή του x στην εξίσωση. Μπορείτε επίσης να χρησιμοποιήσετε τη συνάρτηση TREND.

Εάν υπάρχει μόνο μία ανεξάρτητη μεταβλητή x, μπορείτε να λάβετε την κλίση και την τομή y απευθείας χρησιμοποιώντας τους ακόλουθους τύπους:

Κλίση: INDEX(LINEST(γνωστά_y, γνωστά_x), 1)

Y-τομή: INDEX(LINEST(γνωστά_y, γνωστά_x), 2)

Η ακρίβεια της προσέγγισης χρησιμοποιώντας την ευθεία γραμμή που υπολογίζεται από τη συνάρτηση LINEST εξαρτάται από το βαθμό διασποράς δεδομένων. Όσο πιο κοντά είναι τα δεδομένα σε μια ευθεία γραμμή, τόσο πιο ακριβές είναι το μοντέλο που χρησιμοποιεί η LINEST. Η συνάρτηση LINEST χρησιμοποιεί τη μέθοδο των ελαχίστων τετραγώνων για να καθορίσει την καλύτερη προσαρμογή στα δεδομένα. Όταν υπάρχει μόνο μία ανεξάρτητη μεταβλητή x, τα m και b υπολογίζονται χρησιμοποιώντας τους ακόλουθους τύπους:

όπου x και y είναι τα μέσα του δείγματος, για παράδειγμα x = AVERAGE (γνωστά_x) και y = AVERAGE (γνωστά_y's).

Οι συναρτήσεις προσαρμογής LINEST και LGRFPRIBL μπορούν να υπολογίσουν μια ευθεία ή εκθετική καμπύλη που ταιριάζει καλύτερα στα δεδομένα. Ωστόσο, δεν απαντούν στο ερώτημα ποιο από τα δύο αποτελέσματα είναι καταλληλότερο για την επίλυση του προβλήματος. Μπορείτε επίσης να υπολογίσετε τη συνάρτηση TREND(γνωστές_υ-τιμές; γνωστές_χ-τιμές) για μια ευθεία γραμμή ή τη συνάρτηση GROWTH(γνωστές_υ-τιμές; γνωστές_χ-τιμές) για μια εκθετική καμπύλη. Αυτές οι συναρτήσεις, εάν παραληφθούν από το όρισμα new_x_values, επιστρέφουν έναν πίνακα υπολογισμένων τιμών y για τις πραγματικές τιμές x σύμφωνα με μια ευθεία γραμμή ή καμπύλη. Στη συνέχεια, μπορείτε να συγκρίνετε τις υπολογιζόμενες τιμές με τις πραγματικές τιμές. Μπορείτε επίσης να δημιουργήσετε γραφήματα για οπτική σύγκριση.

Κάνοντας μια ανάλυση παλινδρόμησης, Microsoft Excelυπολογίζει, για κάθε σημείο, το τετράγωνο της διαφοράς μεταξύ της προβλεπόμενης τιμής y και της πραγματικής τιμής y. Το άθροισμα αυτών των τετραγωνικών διαφορών ονομάζεται υπολειπόμενο άθροισμα τετραγώνων (ssresid). Στη συνέχεια, το Microsoft Excel υπολογίζει το συνολικό άθροισμα των τετραγώνων (sstotal). Εάν const = TRUE ή εάν αυτό το όρισμα δεν προσδιορίζεται, το συνολικό άθροισμα των τετραγώνων θα είναι ίσο με το άθροισμα των τετραγωνικών διαφορών των πραγματικών τιμών y και των μέσων τιμών y. Αν const = FALSE, το άθροισμα των τετραγώνων θα είναι ίσο με το άθροισμα των τετραγώνων των πραγματικών τιμών y (χωρίς να αφαιρεθεί ο μέσος όρος y από το πηλίκο y). Μετά από αυτό, το άθροισμα της παλινδρόμησης των τετραγώνων μπορεί να υπολογιστεί ως εξής: ssreg = sstotal - ssresid. Όσο μικρότερο είναι το υπολειπόμενο άθροισμα των τετραγώνων, τόσο μεγαλύτερη είναι η τιμή του συντελεστή ντετερμινισμού r2, που δείχνει πόσο καλή είναι η εξίσωση που προκύπτει χρησιμοποιώντας ανάλυση παλινδρόμησης, εξηγεί τις σχέσεις μεταξύ των μεταβλητών. Ο συντελεστής r2 είναι ίσος με ssreg/sstotal.

Σε ορισμένες περιπτώσεις, μία ή περισσότερες στήλες X (ας είναι οι τιμές Y και X σε στήλες) δεν έχουν πρόσθετη προγνωστική αξία στις άλλες στήλες X. Με άλλα λόγια, η διαγραφή μιας ή περισσότερων στηλών X μπορεί να οδηγήσει σε τιμές Y υπολογίζεται με την ίδια ακρίβεια. Σε αυτήν την περίπτωση, οι πλεονάζουσες στήλες Χ θα εξαιρεθούν από το μοντέλο παλινδρόμησης. Αυτό το φαινόμενο ονομάζεται «συγγραμμικότητα» επειδή οι πλεονάζουσες στήλες του X μπορούν να αναπαρασταθούν ως το άθροισμα πολλών μη περιττών στηλών. Το LINEST ελέγχει για συγγραμμικότητα και αφαιρεί τυχόν περιττές στήλες X από το μοντέλο παλινδρόμησης, εάν βρει. Οι στήλες X που αφαιρέθηκαν μπορούν να αναγνωριστούν στην έξοδο LINEST με συντελεστή 0 και τιμή se 0. Η κατάργηση μιας ή περισσότερων στηλών ως περιττών αλλάζει την τιμή του df επειδή εξαρτάται από τον αριθμό των στηλών X που χρησιμοποιούνται πραγματικά για προγνωστικούς σκοπούς. Δείτε το Παράδειγμα 4 παρακάτω για περισσότερες λεπτομέρειες σχετικά με τον υπολογισμό του df. Όταν το df αλλάζει λόγω της αφαίρεσης περιττών στηλών, αλλάζουν και οι τιμές των sey και F. Συχνά δεν συνιστάται η χρήση συγγραμμικότητας. Ωστόσο, θα πρέπει να χρησιμοποιείται εάν ορισμένες στήλες Χ περιέχουν 0 ή 1 ως δείκτη που υποδεικνύει εάν το θέμα του πειράματος ανήκει σε ξεχωριστή ομάδα. Εάν const = TRUE ή εάν αυτό το όρισμα δεν έχει καθοριστεί, το LINEST εισάγει μια επιπλέον στήλη X για να προσομοιώσει το σημείο τομής. Εάν υπάρχει στήλη με τιμές 1 για άνδρες και 0 για γυναίκες και υπάρχει στήλη με τιμές 1 για γυναίκες και 0 για άνδρες, τότε η τελευταία στήλη αφαιρείται επειδή οι τιμές της μπορούν να ληφθούν από το στήλη "ανδρικός δείκτης".

Ο υπολογισμός του df για περιπτώσεις όπου οι X στήλες δεν αφαιρούνται από το μοντέλο λόγω συγγραμμικότητας έχει ως εξής: εάν υπάρχουν k στήλες γνωστό_x και const = TRUE ή δεν καθορίζεται, τότε df = n - k - 1. Εάν const = FALSE, τότε df = n - k. Και στις δύο περιπτώσεις, η αφαίρεση των στηλών X λόγω συγγραμμικότητας αυξάνει την τιμή του df κατά 1.

Οι τύποι που επιστρέφουν πίνακες πρέπει να εισαχθούν ως τύποι πίνακα.

Όταν εισάγετε έναν πίνακα σταθερών ως όρισμα γνωστό_x_values, για παράδειγμα, χρησιμοποιήστε ένα ερωτηματικό για να διαχωρίσετε τιμές στην ίδια γραμμή και μια άνω τελεία για να διαχωρίσετε γραμμές. Οι διαχωριστικοί χαρακτήρες ενδέχεται να διαφέρουν ανάλογα με τις ρυθμίσεις στο παράθυρο "Γλώσσα και πρότυπα" στον πίνακα ελέγχου.

Σημειώστε ότι οι τιμές y που προβλέπονται από την εξίσωση παλινδρόμησης μπορεί να μην είναι σωστές εάν βρίσκονται εκτός του εύρους των τιμών y που χρησιμοποιήθηκαν για τον ορισμό της εξίσωσης.

Ο κύριος αλγόριθμος που χρησιμοποιείται στη συνάρτηση LINEST, διαφέρει από τον κύριο αλγόριθμο συναρτήσεων ΚΛΙΝΩΚαι ΕΝΟΤΗΤΑ. Οι διαφορές μεταξύ των αλγορίθμων μπορεί να οδηγήσουν σε διαφορετικά αποτελέσματα για αβέβαια και συγγραμμικά δεδομένα. Για παράδειγμα, εάν τα σημεία δεδομένων του ορίσματος του know_y είναι 0 και τα σημεία δεδομένων του ορίσματος του Known_x είναι 1, τότε:

Λειτουργία LINESTεπιστρέφει τιμή ίση με 0. Αλγόριθμος συνάρτησης LINESTχρησιμοποιείται για την επιστροφή κατάλληλων τιμών για συγγραμμικά δεδομένα και in αυτή η υπόθεσημπορεί να βρεθεί τουλάχιστον μία απάντηση.

Οι συναρτήσεις SLOPE και INTERCEPT επιστρέφουν το σφάλμα #DIV/0!. Ο αλγόριθμος των συναρτήσεων SLOPE και INTERCEPT χρησιμοποιείται για την εύρεση μόνο μιας απάντησης και σε αυτή την περίπτωση μπορεί να υπάρχουν πολλές.

Εκτός από τον υπολογισμό στατιστικών στοιχείων για άλλους τύπους παλινδρόμησης, το LINEST μπορεί να χρησιμοποιηθεί για τον υπολογισμό περιοχών για άλλους τύπους παλινδρόμησης, εισάγοντας συναρτήσεις των μεταβλητών x και y ως μια σειρά από μεταβλητές x και y για το LINEST. Για παράδειγμα, ο ακόλουθος τύπος:

LINEST(y-τιμές, x-τιμές^COLUMN($A:$C))

λειτουργεί με μία στήλη τιμών Υ και μία στήλη τιμών Χ για τον υπολογισμό μιας προσέγγισης κύβου (πολυώνυμο 3ου βαθμού) της ακόλουθης μορφής:

y=m 1 x+m 2 x 2 +m 3 x 3 +b

Ο τύπος μπορεί να τροποποιηθεί για τον υπολογισμό άλλων τύπων παλινδρόμησης, αλλά σε ορισμένες περιπτώσεις απαιτούνται προσαρμογές στις τιμές εξόδου και άλλα στατιστικά στοιχεία.

Η γραμμή παλινδρόμησης είναι μια γραφική αντανάκλαση της σχέσης μεταξύ των φαινομένων. Μπορείτε εύκολα να δημιουργήσετε μια γραμμή παλινδρόμησης στο Excel.

Για αυτό χρειάζεστε:

1.Ανοίξτε το πρόγραμμα Excel

2. Δημιουργήστε στήλες με δεδομένα. Στο παράδειγμά μας, θα οικοδομήσουμε μια γραμμή παλινδρόμησης, ή σχέση, μεταξύ επιθετικότητας και αυτοαμφιβολίας στα παιδιά της πρώτης τάξης. Στο πείραμα συμμετείχαν 30 παιδιά, τα δεδομένα παρουσιάζονται στον πίνακα Excel:

1 στήλη - αριθμός του θέματος

2 στήλη - επιθετικότητασε σημεία

3 στήλη - ατολμίασε σημεία

3. Στη συνέχεια, πρέπει να επιλέξετε και τις δύο στήλες (χωρίς το όνομα της στήλης), πατήστε την καρτέλα εισάγετε , επιλέγω σημείο , και από τις προτεινόμενες διατάξεις επιλέξτε την πρώτη τελεία με μαρκαδόρους .

4. Έτσι πήραμε ένα κενό για τη γραμμή παλινδρόμησης - το λεγόμενο - διάγραμμα διασποράς. Για να μεταβείτε στη γραμμή παλινδρόμησης, πρέπει να κάνετε κλικ στο σχήμα που προκύπτει, κάντε κλικ στην καρτέλα κατασκευαστής, βρείτε στον πίνακα διατάξεις γραφημάτων και επιλέξτε Μ αλλά ket9 , λέει επίσης f(x)

5. Άρα, έχουμε μια γραμμή παλινδρόμησης. Το γράφημα δείχνει επίσης την εξίσωσή του και το τετράγωνο του συντελεστή συσχέτισης

6. Απομένει να προσθέσουμε το όνομα του γραφήματος, το όνομα των αξόνων. Επίσης, εάν θέλετε, μπορείτε να αφαιρέσετε το υπόμνημα, να μειώσετε τον αριθμό των οριζόντιων γραμμών πλέγματος (καρτέλα διάταξη , έπειτα πλέγμα ). Οι κύριες αλλαγές και ρυθμίσεις γίνονται στην καρτέλα Διάταξη

Η γραμμή παλινδρόμησης είναι ενσωματωμένη στο MS Excel. Τώρα μπορεί να προστεθεί στο κείμενο της εργασίας.

Η οικοδόμηση μιας γραμμικής παλινδρόμησης, η εκτίμηση των παραμέτρων της και η σημασία τους μπορεί να γίνει πολύ πιο γρήγορα κατά τη χρήση του πακέτου Ανάλυση Excel(Οπισθοδρόμηση). Ας εξετάσουμε την ερμηνεία των ληφθέντων αποτελεσμάτων στη γενική περίπτωση ( κεπεξηγηματικές μεταβλητές) σύμφωνα με το παράδειγμα 3.6.

Τραπέζι στατιστικές παλινδρόμησηςδίνονται τιμές:

Πολλαπλούς R – συντελεστής πολλαπλής συσχέτισης ;

R- τετράγωνο– συντελεστής προσδιορισμού R 2 ;

Κανονικοποιημένο R - τετράγωνο- προσαρμοσμένο R 2 προσαρμοσμένο για τον αριθμό των βαθμών ελευθερίας.

τυπικό σφάλμαείναι το τυπικό σφάλμα της παλινδρόμησης μικρό;

Παρατηρήσεις -αριθμός παρατηρήσεων n.

Τραπέζι Ανάλυση της διακύμανσηςδεδομένος:

1. Στήλη df - ο αριθμός των βαθμών ελευθερίας, ίσος με

για χορδή Οπισθοδρόμηση df = κ;

για χορδή Υπόλοιποdf = nκ – 1;

για χορδή Σύνολοdf = n– 1.

2. Στήλη SS-άθροισμα τετραγωνικών αποκλίσεων, ίσο με

για χορδή Οπισθοδρόμηση ;

για χορδή Υπόλοιπο ;

για χορδή Σύνολο .

3. Στήλη Κυρίααποκλίσεις που καθορίζονται από τον τύπο Κυρία = SS/df:

για χορδή Οπισθοδρόμηση– διακύμανση παραγόντων.

για χορδή Υπόλοιποείναι η υπολειπόμενη διακύμανση.

4. Στήλη φά - υπολογισμένη αξία φά-κριτήρια που υπολογίζονται με τον τύπο

φά = Κυρία(οπισθοδρόμηση)/ Κυρία(υπόλοιπο).

5. Στήλη Σημασία φά είναι η τιμή του επιπέδου σημαντικότητας που αντιστοιχεί στην υπολογιζόμενη φά-στατιστική .

Σημασία φά= ΠΡΩΤΟΣ( ΦΑ-στατιστική, df(οπισθοδρόμηση), df(υπόλοιπο)).

Αν σημασία φά < стандартного уровня значимости, то R 2 είναι στατιστικά σημαντικό.

Συντελεστές τυπικό σφάλμα t-statistics p-τιμή κάτω 95% Κορυφαίο 95%
Υ 65,92 11,74 5,61 0,00080 38,16 93,68
Χ 0,107 0,014 7,32 0,00016 0,0728 0,142

Αυτός ο πίνακας δείχνει:

1. Πιθανότητα– τιμές συντελεστών ένα, σι.

2. Τυπικό σφάλμαείναι τα τυπικά σφάλματα των συντελεστών παλινδρόμησης ΑΝΩΝΥΜΗ ΕΤΑΙΡΙΑ, Sb.



3. t-στατιστική– υπολογισμένες τιμές t -κριτήρια που υπολογίζονται με τον τύπο:

t-statistic = Συντελεστές / Τυπικό σφάλμα.

4.R-αξία (σημασία t) είναι η τιμή του επιπέδου σημαντικότητας που αντιστοιχεί στο υπολογιζόμενο t-στατιστική.

R-αξία = STUDRASP(t-στατιστική, df(υπόλοιπο)).

Αν R-έννοια< стандартного уровня значимости, то соответствующий коэффициент статистически значим.

5. Κάτω 95% και Κορυφαίο 95%είναι τα κάτω και άνω όρια των διαστημάτων εμπιστοσύνης 95% για τους συντελεστές της θεωρητικής γραμμικής εξίσωσης παλινδρόμησης.

ΥΠΟΜΕΝΟΝ ΑΠΟΧΩΡΗΣΗ
Παρατήρηση Προβλεπόμενο y Παραμένει ε
72,70 -29,70
82,91 -20,91
94,53 -4,53
105,72 5,27
117,56 12,44
129,70 19,29
144,22 20,77
166,49 24,50
268,13 -27,13

Τραπέζι ΥΠΟΜΕΝΟΝ ΑΠΟΧΩΡΗΣΗυποδεικνύεται:

σε μια στήλη Παρατήρηση– αριθμός παρατήρησης·

σε μια στήλη προβλεπόταν y είναι οι υπολογισμένες τιμές της εξαρτημένης μεταβλητής·

σε μια στήλη Λείψανα μι είναι η διαφορά μεταξύ των παρατηρούμενων και των υπολογισμένων τιμών της εξαρτημένης μεταβλητής.

Παράδειγμα 3.6.Διαθέσιμα στοιχεία (αρβ. μονάδες) για τις δαπάνες τροφίμων yκαι κατά κεφαλήν εισόδημα Χγια εννέα ομάδες οικογενειών:

Χ
y

Χρησιμοποιώντας τα αποτελέσματα του πακέτου ανάλυσης Excel (Regression), αναλύουμε την εξάρτηση του κόστους των τροφίμων από την αξία του κατά κεφαλήν εισοδήματος.

Τα αποτελέσματα της ανάλυσης παλινδρόμησης συνήθως γράφονται ως:

όπου σε παρένθεση είναι τα τυπικά σφάλματα των συντελεστών παλινδρόμησης.

Συντελεστές παλινδρόμησης αλλά = 65,92 και β= 0,107. Κατεύθυνση επικοινωνίας μεταξύ yΚαι Χκαθορίζει το πρόσημο του συντελεστή παλινδρόμησης σι= 0,107, δηλ. η σχέση είναι άμεση και θετική. Συντελεστής σι= 0,107 δείχνει ότι με αύξηση του κατά κεφαλήν εισοδήματος κατά 1 αρβ. μονάδες Το κόστος των τροφίμων αυξάνεται κατά 0,107 μετατρ. μονάδες

Ας υπολογίσουμε τη σημασία των συντελεστών του ληφθέντος μοντέλου. Η σημασία των συντελεστών ( α, β) ελέγχεται έναντι t- δοκιμή:

p-τιμή ( ένα) = 0,00080 < 0,01 < 0,05

p-τιμή ( σι) = 0,00016 < 0,01 < 0,05,

άρα οι συντελεστές ( α, β) είναι σημαντικές στο επίπεδο 1% και ακόμη περισσότερο στο επίπεδο σημαντικότητας 5%. Έτσι, οι συντελεστές παλινδρόμησης είναι σημαντικοί και το μοντέλο είναι επαρκές με τα αρχικά δεδομένα.

Τα αποτελέσματα της εκτίμησης παλινδρόμησης είναι συμβατά όχι μόνο με τις λαμβανόμενες τιμές των συντελεστών παλινδρόμησης, αλλά και με κάποιο από το σύνολο τους (διάστημα εμπιστοσύνης). Με πιθανότητα 95%, τα διαστήματα εμπιστοσύνης για τους συντελεστές είναι (38,16 - 93,68) για ένακαι (0,0728 - 0,142) για σι.

Η ποιότητα του μοντέλου αξιολογείται από τον συντελεστή προσδιορισμού R 2 .

αξία R 2 = 0,884 σημαίνει ότι ο παράγοντας κατά κεφαλήν εισόδημα μπορεί να εξηγήσει το 88,4% της διακύμανσης (σκέδασης) στη δαπάνη τροφίμων.

Σημασία R 2 ελεγμένο από ΦΑ-τεστ: σημασία φά = 0,00016 < 0,01 < 0,05, следовательно, RΤο 2 είναι σημαντικό σε επίπεδο 1% και ακόμη περισσότερο στο επίπεδο σημαντικότητας 5%.

Στην περίπτωση γραμμικής παλινδρόμησης κατά ζεύγη, ο συντελεστής συσχέτισης μπορεί να οριστεί ως . Η λαμβανόμενη τιμή του συντελεστή συσχέτισης δείχνει ότι η σχέση μεταξύ των δαπανών για τρόφιμα και του κατά κεφαλήν εισοδήματος είναι πολύ στενή.

Συνεχίζοντας το θέμα:
συσκευές

Καλημέρα αγαπητοί ατμιστές! Σήμερα αποφάσισα να κάνω μια ελαφρώς μη τυπική ανασκόπηση μιας από τις πιο δημοφιλείς δεξαμενές. Ας το πούμε μάχη κλώνων ή σύγκριση δύο κλώνων...

Νέα άρθρα
/
Δημοφιλής