Παραδείγματα λύσεων παλινδρόμησης στο Excel. Κατασκευή της εξίσωσης πολλαπλών παλινδρόμησης στο Excel

ΣΕ Προέχω Υπάρχει ακόμη πιο γρήγορος και βολικός τρόπος για να δημιουργήσετε ένα πρόγραμμα. Γραμμικής παλινδρόμησης (και ακόμη και οι κύριοι τύποι μη γραμμικών παλινδρομίων, όπως CM. Επόμενο). Αυτό μπορεί να γίνει ως εξής:

1) Κατανομή των στηλών με δεδομένα Χ. και Y. (θα πρέπει να βρίσκονται σε αυτή τη σειρά!);

2) κλήση Κύριος διάγραμμα και επιλέξτε σε μια ομάδα Ενα είδοςΛαιμός Και πιέστε αμέσως Ετοιμος;

3) Χωρίς να ρίξετε την επιλογή από το διάγραμμα, επιλέξτε το στοιχείο του πρώτου στοιχείου που εμφανίζεται Διάγραμμαστην οποία θα πρέπει να επιλέξετε το στοιχείο Προσθέστε τη γραμμή τάσης;

4) Στο παράθυρο διαλόγου που εμφανίζεται το παράθυρο διαλόγου Γραμμή τάσης Στην καρτέλα Ενα είδοςεπιλέγω Γραμμικός;

5) στην καρτέλα ΠαράμετροιΜπορείτε να ενεργοποιήσετε το διακόπτη Δείχνουν την εξίσωση στο διάγραμμαΑυτό θα επιτρέψει να δείτε την εξίσωση γραμμικής παλινδρόμησης (4.4), στην οποία υπολογίζονται οι συντελεστές (4.5).

6) Στην ίδια καρτέλα, μπορείτε να ενεργοποιήσετε το διακόπτη Τοποθετήστε την αξία της ακρίβειας της προσέγγισης (R ^ 2) στο διάγραμμα (R ^ 2). Αυτό το μέγεθος είναι το τετράγωνο του συντελεστή συσχέτισης (4.3) και δείχνει πόσο καλά η υπολογιζόμενη εξίσωση περιγράφει την πειραματική εξάρτηση. Αν ένα R. 2 είναι κοντά στη μονάδα, τότε η θεωρητική εξίσωση παλινδρόμησης περιγράφει μια καλά πειραματική εξάρτηση (η θεωρία είναι καλά συμφωνημένη με το πείραμα) και αν R. 2 κοντά στο μηδέν, τότε Αυτή η εξίσωση Δεν είναι κατάλληλο για την περιγραφή πειραματικών εξαρτήσεων (η θεωρία δεν είναι σύμφωνη με το πείραμα).

Ως αποτέλεσμα της εκτέλεσης των περιγραφόμενων ενεργειών, θα ληφθεί ένα διάγραμμα με χρονοδιάγραμμα παλινδρόμησης και εξίσωση.

§4.3. Κύριοι τύποι μη γραμμικής παλινδρόμησης

Παραβολική και πολυωνυμική παλινδρόμηση.

Παραβολικός Την εξάρτηση του μεγέθους Y. από το μέγεθος Η. Η εξάρτηση ονομάζεται τετραγωνική λειτουργία (2η παραβολή της σειράς):

Αυτή η εξίσωση καλείται Την εξίσωση της παραβολικής παλινδρόμησης y στο Η.. Παράμετροι αλλά, ΣΙ., από που ονομάζεται Συντελεστές παραβολικής παλινδρόμησης. Ο υπολογισμός των συντελεστών παραβολικής παλινδρόμησης είναι πάντα δυσκίνητος, οπότε συνιστάται η χρήση ενός υπολογιστή για υπολογισμούς.

Η εξίσωση (4.8) της παραβολικής παλινδρόμησης είναι μια ειδική περίπτωση μιας γενικότερης παλινδρόμησης που ονομάζεται πολυώνυμο. Πολυώνυμος Την εξάρτηση του μεγέθους Y. από το μέγεθος Η. ονομάζεται εξάρτηση, εκφρασμένη από πολυώνυμο Ν.Σειρά:

Όπου αριθμοί Ένα i. (ΕΓΩ.=0,1,…, Ν.) Που ονομάζεται Συντελεστές πολυωνυμικής παλινδρόμησης.

Παλινδρόμηση ισχύος.

Εξουσία Την εξάρτηση του μεγέθους Y. από το μέγεθος Η. Η εξάρτηση της φόρμας ονομάζεται:

Αυτή η εξίσωση καλείται Εξίσωση παλινδρόμησης ισχύος Υ στο Η.. Παράμετροι αλλά και ΣΙ. που ονομάζεται συντελεστές παλινδρόμησης ισχύος.

ln \u003d ln. ΕΝΑ.+β ·ln. Χ.. (4.11)

Αυτή η εξίσωση περιγράφει το άμεσο στο αεροπλάνο με τους λογαριθμικούς άξονες συντεταγμένων του LN Χ. και ln. Ως εκ τούτου, το κριτήριο για τη δυνατότητα εφαρμογής της παλινδρόμησης ισχύος είναι η απαίτηση των σημείων των λογαρίθμων εμπειρικών δεδομένων LN x i. και ln. ΕΓΩ. Ήταν πλησιέστερα στη γραμμή (4.11).

Ενδεικτική παλινδρόμηση.

ΕνδεικτικόςΕκθετικός) Την εξάρτηση του μεγέθους Y. από το μέγεθος Η. Η εξάρτηση της φόρμας ονομάζεται:

(ή ). (4.12)

Αυτή η εξίσωση καλείται Η εξίσωση είναι ενδεικτικήΕκθετικός) Παλινδρόμηση Γ. στο Η.. Παράμετροι αλλάΚ.) ΕΓΩ. ΣΙ. που ονομάζεται Συντελεστές ενδεικτικέςΕκθετικός) Οπισθοδρόμηση.

Εάν και τα δύο μέρη της εξίσωσης παλινδρόμησης ισχύος είναι επικαιροποιημένα, τότε η εξίσωση θα είναι

ln \u003d. Χ ·ln. ΕΝΑ.+ Ln. ΣΙ. (ή ln \u003d k · X.+ Ln. ΣΙ.). (4.13)

Αυτή η εξίσωση περιγράφει τη γραμμική εξάρτηση του λογάριθμου μιας ενιαίας τιμής LN από άλλη τιμή. Χ.. Ως εκ τούτου, το κριτήριο για τη δυνατότητα εφαρμογής της παλινδρόμησης ισχύος είναι η απαίτηση των σημείων των εμπειρικών δεδομένων του ίδιου μεγέθους x i. Και οι λογαρίθμοι άλλου μεγέθους LN ΕΓΩ. Ήταν πλησιέστερα για να κατευθύνουν (4.13).

Λογαριθμική παλινδρόμηση.

ΛογαριθμικόςΤην εξάρτηση του μεγέθους Y. από το μέγεθος Η. Η εξάρτηση της φόρμας ονομάζεται:

=ΕΝΑ.+β ·ln. Χ.. (4.14)

Αυτή η εξίσωση καλείται Την εξίσωση της λογαριθμικής παλινδρόμησης y στο Η.. Παράμετροι αλλά και ΣΙ. που ονομάζεται Συντελεστές λογαριθμικής παλινδρόμησης.

Υπερβολική παλινδρόμηση.

Υπερβολικός Την εξάρτηση του μεγέθους Y. από το μέγεθος Η. Η εξάρτηση της φόρμας ονομάζεται:

Αυτή η εξίσωση καλείται Την εξίσωση της υπερβολικής παλινδρόμησης y στο Η.. Παράμετροι αλλά και ΣΙ. που ονομάζεται Τους συντελεστές της υπερβολικής παλινδρόμησης και καθορίζονται με τη μέθοδο των μικρότερων τετραγώνων. Η χρήση αυτής της μεθόδου οδηγεί σε φόρμουλες:

Σε φόρμουλες (4.16-4.17) Η σύνοψη διεξάγεται με δείκτη ΕΓΩ. από τον ένα έως τον αριθμό των παρατηρήσεων Ν..

Δυστυχώς, στο Προέχω Δεν υπάρχουν λειτουργίες που υπολογίζουν τους συντελεστές της υπερβολικής παλινδρόμησης. Σε περιπτώσεις όπου δεν είναι γνωστό ότι οι μετρούμενες τιμές σχετίζονται με αντίστροφη αναλογικότητα, συνιστάται αντί της υπερβολικής εξίσωσης παλινδρόμησης για να αναζητήσει την εξίσωση παλινδρόμησης ισχύος, έτσι Προέχω Υπάρχει μια διαδικασία για την τοποθεσία του. Εάν υποτεθεί υπερβολική εξάρτηση μεταξύ των μετρούμενων τιμών, οι συντελεστές παλινδρόμησης θα πρέπει να υπολογιστούν χρησιμοποιώντας τους βοηθητικούς πίνακες υπολογισμού και τις λειτουργίες άθροισης σύμφωνα με τους τύπους (4.16-4.17).

Η γραμμή παλινδρόμησης είναι μια γραφική αντανάκλαση της σχέσης μεταξύ των φαινομένων. Πολύ σαφώς μπορεί να κατασκευαστεί γραμμή παλινδρόμησης στο Excel.

Για αυτό χρειάζεστε:

1. Εξαγωγή προγράμματος Excel

2. Δημιουργήστε στήλες με δεδομένα. Στο παράδειγμά μας, θα οικοδομήσουμε μια γραμμή παλινδρόμησης, ή μια αλληλεξάρτηση, μεταξύ επιθετικότητας και αβεβαιότητας στους πρώτους-γκρέιντερ τους. Στο πείραμα, συμμετείχαν 30 παιδιά, τα δεδομένα παρουσιάζονται στον ειδικό πίνακα:

1 στήλη - αριθμός δοκιμής

2 Columid - επιθετικότητα σε μπαλκάκια

3 Columid - ατολμία σε μπαλκάκια

3. Στη συνέχεια, πρέπει να επισημάνετε και τις δύο στήλες (χωρίς το όνομα της στήλης), κάντε κλικ στην καρτέλα εισάγετε , επιλέγω Λαιμός και από τις προτεινόμενες διατάξεις για να επιλέξετε το πρώτο Επιλεκτικό με δείκτες .

4. Έτσι πήραμε ένα κενό για τη γραμμή παλινδρόμησης - το λεγόμενο - Διάγραμμα διάσπασης. Για να μεταβείτε στη γραμμή παλινδρόμησης, πρέπει να κάνετε κλικ στο σχέδιο που προκύπτει, κάντε κλικ στην καρτέλα κατασκευαστής, Βρείτε στο πάνελ Διαγράμματα διατάξεων και επιλέξτε Μ. αλλάket9. , εξακολουθεί να είναι γραμμένο σε αυτό f (x)

5. Και έχουμε μια γραμμή παλινδρόμησης. Το γράφημα δείχνει επίσης την εξίσωση και το τετράγωνο του συντελεστή συσχέτισης

6. Υπάρχει ένα όνομα γραφήματος, το όνομα των αξόνων. Επίσης, μπορείτε επίσης να αφαιρέσετε τον θρύλο, να μειώσετε τον αριθμό των οριζόντιων γραμμών ματιών (καρτέλα σχέδιο , έπειτα πλέγμα ). Οι κύριες αλλαγές και οι ρυθμίσεις γίνονται στην καρτέλα. Σχέδιο

Η γραμμή παλινδρόμησης είναι χτισμένη στο MS Excel. Τώρα μπορεί να προστεθεί στο κείμενο της εργασίας.

Ανάλυση παλινδρόμησης Β. Microsoft Excel. - περισσότερο Πλήρη εγχειρίδια Χρησιμοποιώντας το MS Excel για την επίλυση προβλημάτων ανάλυσης παλινδρόμησης στον τομέα της επιχειρηματικής νοημοσύνης. Ο Konrad Carlberg εξηγεί προσβάσιμα θεωρητικά ερωτήματα, η γνώση των οποίων θα σας βοηθήσει να αποφύγετε πολλά σφάλματα τόσο στην ανεξάρτητη ανάλυση παλινδρόμησης όσο και στην αξιολόγηση των αποτελεσμάτων της ανάλυσης που εκτελούνται από άλλους ανθρώπους. Όλα τα υλικά, από απλές συσχετίσεις και δοκιμές Τ σε πολλαπλές ανάλυση της συνδιακύμανσης, με βάση το Πραγματικά παραδείγματα και συνοδεύεται Λεπτομερής περιγραφή σχετικές διαδικασίες βήμα προς βήμα.

Το βιβλίο συζητά τα χαρακτηριστικά και τις αντιφάσεις που σχετίζονται με Χαρακτηριστικά του Excel Για να εργαστείτε με την παλινδρόμηση, οι συνέπειες της χρήσης καθεμιάς από τις επιλογές τους και κάθε επιχείρημα θεωρούνται και εξηγούνται πόσο αξιόπιστα εφαρμόζουν μεθόδους παλινδρόμησης σε διάφορους τομείς, από την ιατρική έρευνα στην οικονομική ανάλυση.

Konrad Carlberg. Ανάλυση παλινδρόμησης στο Microsoft Excel. - M.: Διαλεκτική, 2017. - 400 σελ.

Λήψη σημείωσης σε μορφή ή, παραδείγματα σε μορφή

Κεφάλαιο 1. Αξιολόγηση της μεταβλητότητας των δεδομένων

Στη διάθεση των στατιστικών υπάρχουν πολλοί δείκτες παραλλαγής (μεταβλητότητα). Ένας από αυτούς είναι το άθροισμα των τετραγώνων των αποκλίσεων των μεμονωμένων αξιών από τον μέσο όρο. Στο Excel, η λειτουργία Quadrolc () χρησιμοποιείται για αυτό. Αλλά η διασπορά χρησιμοποιείται συχνότερα. Η διασπορά είναι τα μέσα τετράγωνα των αποκλίσεων. Η διασπορά δεν είναι ευαίσθητη στον αριθμό των τιμών στο σύνολο δεδομένων δοκιμών (ενώ το άθροισμα των τετραγώνων αποκλίσεων αναπτύσσεται με τον αριθμό των μετρήσεων).

Το πρόγραμμα Excel προσφέρει δύο λειτουργίες που επιστρέφουν τη διασπορά: εμφάνιση () και οθόνη ():

  • Χρησιμοποιήστε τη λειτουργία της οθόνης () εάν η τιμή που πρόκειται να επεξεργαστεί από ένα γενικό σετ. Αυτά., Οι τιμές που περιέχονται στην περιοχή είναι οι μόνες τιμές που σας ενδιαφέρει.
  • Χρησιμοποιήστε τη λειτουργία εμφάνισης () εάν η τιμή που πρόκειται να γίνει επεξεργασία σχηματίζει ένα δείγμα από το σύνολο μεγαλύτερου όγκου. Θεωρείται ότι υπάρχουν πρόσθετες αξίες, η διασπορά της οποίας μπορείτε επίσης να αξιολογήσετε.

Εάν αυτή η τιμή ως μέση τιμή ή ο συντελεστής συσχέτισης υπολογίζεται με βάση τον γενικό πληθυσμό, ονομάζεται παράμετρος. Μια παρόμοια αξία, που υπολογίζεται με βάση το δείγμα, ονομάζεται στατιστικά στοιχεία. Μετρώντας αποκλίσεις από το μέσο όρο Σε αυτό το σετ, θα λάβετε το άθροισμα των τετραγώνων των αποκλίσεων μικρότερης τιμής από ότι αν μετρήθηκαν από οποιαδήποτε άλλη τιμή. Παρόμοιος ισχυρισμός είναι αληθινός για διασπορά.

Όσο πιο δειγματοληψία, όσο ακριβέστερα η υπολογιζόμενη τιμή στατιστικών στοιχείων. Αλλά δεν υπάρχει δείγμα με όγκο μικρότερο από τον όγκο του γενικού πληθυσμού, σε σχέση με τον οποίο θα μπορούσατε να είστε βέβαιοι ότι η αξία των στατιστικών συμπίπτει με την τιμή της παραμέτρου.

Ας υποθέσουμε ότι έχετε ένα σύνολο 100 αυξητικών τιμών, οι οποίες διαφέρουν από τον μέσο όρο του γενικού πληθυσμού, ανεξάρτητα από το πόσο μικρή είναι αυτή η διαφορά. Έχοντας υπολογίσει τη διασπορά για το δείγμα, θα λάβετε κάποια από το νόημά της, να πείτε, 4. Αυτή η τιμή είναι μικρότερη από οποιαδήποτε άλλη, η οποία μπορεί να ληφθεί, υπολογίζοντας την απόκλιση καθεμιάς από τις 100 τιμές ανάπτυξης σε σχέση με οποιαδήποτε αξία άλλου από τον μέσο όρο στο δείγμα, στον αριθμό και σχετικά αληθινό μέσο γενικό σύνολο. Ως εκ τούτου, η υπολογιζόμενη διασπορά θα είναι διαφορετική και σε μικρότερη πλευρά, από τη διασπορά που θα πάρετε αν κάπως μάθει και δεν χρησιμοποιήθηκε μη επιλεκτικό μέσο, \u200b\u200bαλλά η παράμετρος του γενικού αδρανούς.

Το μέσο άθροισμα τετραγώνων που ορίζεται για το δείγμα δίδουν τη χαμηλότερη εκτίμηση της διασποράς του γενικού πληθυσμού. Η διασπορά που υπολογίζεται με αυτόν τον τρόπο ονομάζεται εκτοπισμένος εκτίμηση. Αποδεικνύεται ότι αποκλείει την αντιστάθμιση και να πάρει μια αφόρητη αξιολόγηση, αρκεί να διαιρέσετε το άθροισμα των τετραγώνων αποκλίσεων δεν είναι ενεργοποιημένη Ν.όπου Ν. - μέγεθος δείγματος και επάνω n - 1..

αξία n - 1.που ονομάζεται ποσότητα (αριθμός) βαθμών ελευθερίας. Υπάρχει Διαφορετικές μέθοδοι Ο υπολογισμός αυτής της τιμής, αν και όλα περιλαμβάνουν είτε αφαιρώντας κάποιον αριθμό από το μέγεθος του δείγματος ή μετρήστε τον αριθμό των κατηγοριών στις οποίες εμπίπτουν οι παρατηρήσεις.

Η ουσία των διαφορών μεταξύ των λειτουργιών της οθόνης () και της οθόνης () έχει ως εξής:

  • Στη λειτουργία της οθόνης () το άθροισμα των τετραγώνων διαιρείται στον αριθμό των παρατηρήσεων και, ως εκ τούτου, αντιπροσωπεύει την εκτοπισμένη αξιολόγηση της διασποράς, τον πραγματικό μέσο όρο.
  • Στη λειτουργία της οθόνης () το άθροισμα των τετραγώνων χωρίζεται στον αριθμό των παρατηρήσεων του μείον 1, δηλ. Με τον αριθμό των βαθμών ελευθερίας, η οποία δίνει μια ακριβέστερη, ασταθής αξιολόγηση της διασποράς του γενικού πληθυσμού, από την οποία ανακτήθηκε αυτό το δείγμα.

Τυπική απόκλιση (ENG. Τυπική απόκλιση, SD) - υπάρχει μια τετραγωνική ρίζα της διασποράς:

Η κατασκευή των αποκλίσεων στην πλατεία μεταφράζει την κλίμακα μέτρησης σε μια άλλη μετρική, η οποία είναι η πλατεία του αρχικού: μετρητές - σε τετραγωνικά μέτρα, δολάρια σε τετράγωνα δολάρια κλπ. Η τυπική απόκλιση είναι μια τετραγωνική ρίζα από τη διασπορά και επομένως μας επιστρέφει στις αρχικές μονάδες μέτρησης. Πιο βολικό.

Είναι συχνά απαραίτητο να υπολογίσετε την τυπική απόκλιση αφού τα δεδομένα έχουν υποβληθεί σε μερικούς χειρισμούς. Και αν και σε αυτές τις περιπτώσεις τα αποτελέσματα είναι αναμφισβήτητα τυπικές αποκλίσεις, καλούνται τυπικά σφάλματα. Υπάρχουν διάφορες ποικιλίες τυποποιημένων σφαλμάτων, συμπεριλαμβανομένου ενός τυπικού σφάλματος μέτρησης, ένα σφάλμα πρότυπης αναλογίας, ένα τυπικό μέσο σφάλμα.

Ας υποθέσουμε ότι έχετε συλλέξει δεδομένα σχετικά με την ανάπτυξη 25 τυχαία επιλεγμένων ενηλίκων ανδρών σε κάθε μία από τις 50 πολιτείες. Στη συνέχεια, υπολογίζετε τη μέση ανάπτυξη των ενηλίκων σε κάθε κράτος. Οι ληφθείσες 50 μέσες τιμές με τη σειρά τους μπορούν να θεωρηθούν παρατηρήσεις. Με βάση αυτό, θα μπορούσατε να υπολογίσετε την τυπική απόκλιση τους, η οποία είναι Πρότυπο μεσαίο σφάλμα. Σύκο. 1. Σας επιτρέπει να συγκρίνετε τη διανομή μεμονωμένων τιμών 1250 πηγών (δεδομένα σχετικά με την ανάπτυξη 25 ανδρών για κάθε μία από τις 50 πολιτείες) με τη διανομή των μέσων ομάδων των 50 κρατών. Ο τύπος για την εκτίμηση του τυπικού σφάλματος του μέσου όρου (δηλ. Της τυπικής απόκλισης των μέσων τιμών και όχι μεμονωμένων παρατηρήσεων):

όπου είναι το πρότυπο σφάλμα του μέσου όρου. ΜΙΚΡΟ. - τυπική απόκλιση των αρχικών παρατηρήσεων · Ν. - τον αριθμό των παρατηρήσεων στο δείγμα.

Σύκο. 1. Η παραλλαγή των μέσων τιμών από την κατάσταση έως το κράτος είναι σημαντικά μικρότερη μεταβολή των ατομικών αποτελεσμάτων παρατήρησης

Στα στατιστικά στοιχεία υπάρχει συμφωνία σχετικά με τη χρήση ελληνικών και λατινικών επιστολών για τον ορισμό στατιστικών ποσοτήτων. Οι ελληνικές επιστολές γίνονται για να ορίσουν τις παραμέτρους του γενικού πληθυσμού, των λατινικών - επιλεκτικών στατιστικών. Ως εκ τούτου, αν μιλάμε για την τυπική απόκλιση του γενικού πληθυσμού, το γράφουμε ως Σ. Εάν ληφθεί υπόψη η τυπική απόκλιση του δείγματος, τότε χρησιμοποιούμε την ονομασία S. Όσον αφορά τους χαρακτήρες να ορίσει τον μέσο όρο, είναι συνεπείς μεταξύ τους όχι τόσο με επιτυχία. Ο μέσος όρος του γενικού πληθυσμού υποδεικνύεται από το ελληνικό γράμμα Μ. Ωστόσο, το σύμβολο X̅ παραδοσιακά χρησιμοποιείται για να αντιπροσωπεύει το μέσο δείγματος.

z-σκορ Εκφράζει τη θέση παρατήρησης στη διανομή σε μονάδες τυπικής απόκλισης. Για παράδειγμα, το z \u003d 1,5 σημαίνει ότι η παρατήρηση προέρχεται από το μέσο όρο κατά 1,5 τυπικές αποκλίσεις σε μεγάλες τιμές. Ορος z-σκορ Χρησιμοποιείται για μεμονωμένες εκτιμήσεις, δηλ. Για μετρήσεις που αποδίδονται σε μεμονωμένα στοιχεία του δείγματος. Για τέτοιες στατιστικές (για παράδειγμα, το μέσο πρότυπο) χρησιμοποιούν τον όρο z αξία:

Όπου x̅ είναι η μέση τιμή δείγματος, η μ είναι η μέση τιμή του γενικού σετ, το τυπικό σφάλμα του μέσου ρυθμιστή δείγματος:

όπου το Σ είναι το τυποποιημένο σφάλμα του γενικού πληθυσμού (μεμονωμένες μετρήσεις), Ν. - Το μέγεθος του δείγματος.

Ας υποθέσουμε ότι εργάζεστε ως εκπαιδευτής σε ένα κλαμπ γκολφ. Είχατε την ευκαιρία για μεγάλο χρονικό διάστημα να μετρήσετε το φάσμα των σοκ και να γνωρίζετε ότι η μέση τιμή του είναι 205 μέτρα και η τυπική απόκλιση είναι 36 μέτρα. Σας προσφέρθηκε ένα νέο σύλλογο, υποστηρίζοντας ότι θα αυξήσει την απόσταση των 10 ναυπηγείων. Ζητείτε από κάθε ένα από τα ακόλουθα 81 επισκέπτες Club να εκτελέσει μια δοκιμαστική γροθιά με ένα νέο κλειδί και να γράψει το εύρος χτύπησης του. Αποδείχθηκε ότι η μέση σειρά στάγδην με ένα νέο κλειδί είναι 215 μέτρα. Ποια είναι η πιθανότητα ότι η διαφορά των 10 ναυπηγείων (215 - 205) οφείλεται σε ένα εξαιρετικά σφάλμα της δειγματοληψίας; Ή με διαφορετικό τρόπο: Ποια είναι η πιθανότητα ότι με μεγαλύτερη δοκιμή, το νέο κλειδί δεν θα αποδείξει αύξηση της απόστασης του αντίκτυπου σε σχέση με τον υφιστάμενο μακροπρόθεσμο μέσο όρο των 205 ναυπηγείων;

Μπορούμε να το ελέγξουμε σχηματίζοντας την τιμή Ζ. Πρότυπο μεσαίο σφάλμα:

Τότε η τιμή z:

Πρέπει να βρούμε την πιθανότητα ότι ο μέσος όρος του δείγματος θα υπερασπιστεί από τον μέσο όρο του γενικού πληθυσμού κατά 2,5σ. Εάν η πιθανότητα είναι μικρή, τότε οι διαφορές οφείλονται στο ατύχημα, αλλά η ποιότητα του νέου ραβδιού. Στο Excel, δεν υπάρχει τελική λειτουργία για τον προσδιορισμό της πιθανότητας Z-τιμής. Ωστόσο, είναι δυνατό να χρησιμοποιηθεί ένας τύπος \u003d 1-norms.st.sp. (Τιμή z, αλήθεια), όπου η λειτουργία των Norms.st.sp () επιστρέφει την περιοχή κάτω από την κανονική καμπύλη στα αριστερά του Z -Κατάξτε (Εικ. 2).

Σύκο. 2. Η λειτουργία των Norms.st. Το Asp () επιστρέφει την περιοχή κάτω από την καμπύλη προς τα αριστερά της τιμής Ζ. Για μεγέθυνση εικόνας Κάντε κλικ σε αυτό Κάντε δεξί κλικ Ποντίκι και επιλέξτε Ανοίξτε την εικόνα σε μια νέα καρτέλα

Το δεύτερο επιχείρημα της λειτουργίας των Norms.st.sp. () Μπορεί να πάρει δύο αξίες: η αλήθεια - η λειτουργία επιστρέφει την περιοχή κάτω από την καμπύλη στα αριστερά του σημείου που δίνεται από το πρώτο επιχείρημα. Fals - η λειτουργία επιστρέφει το ύψος της καμπύλης στο σημείο που δίνεται από το πρώτο επιχείρημα.

Εάν η μέση τιμή (Μ) και η τυπική απόκλιση (Σ) του γενικού πληθυσμού δεν είναι γνωστή, χρησιμοποιείται η τιμή Τ (βλέπε περισσότερες λεπτομέρειες). Η δομή των τιμών Z- και T διακρίνεται από το γεγονός ότι για την εύρεση της τιμής Τ, η τυπική απόκλιση S, που λαμβάνεται με βάση επιλεκτικά αποτελέσματα και η μη γνωστή τιμή της παραμέτρου του γενικού πληθυσμού σ είναι μεταχειρισμένος. Η κανονική καμπύλη έχει μία ενιαία μορφή και η μορφή κατανομής των Τ-τιμών ποικίλλει ανάλογα με τον αριθμό των βαθμών ελευθερίας του DF (από τα αγγλικά. Βαθμοί ελευθερίας) Δείγμα που αντιπροσωπεύει. Ο αριθμός των βαθμών ελευθερίας του δείγματος είναι ίσος n - 1.όπου Ν. - μέγεθος δείγματος (Εικ. 3).

Σύκο. 3. Η μορφή των διανομών Τ που προκύπτουν σε περιπτώσεις όπου η παράμετρος Σ είναι άγνωστη, διαφέρει από τη μορφή της κανονικής κατανομής

Στο Excel, υπάρχουν δύο λειτουργίες για την διανομή T που ονομάζεται επίσης διανομή φοιτητών: το Student.Rasp () επιστρέφει την τιμή της περιοχής κάτω από την καμπύλη προς τα αριστερά της καθορισμένης τιμής T και το Student.Rasp. PX () - στα δεξιά.

Κεφάλαιο 2. Συσχέτιση

Η συσχέτιση είναι ένα μέτρο της σχέσης μεταξύ των στοιχείων του συνόλου του παραγγελθέντος ατμού. Η συσχέτιση χαρακτηρίζεται Συντελεστές συσχέτισης Pearson- r. Ο συντελεστής μπορεί να πάρει τιμές στην περιοχή από -1,0 έως +1.0.

Οπου S x. και S y. - Τυπικές μεταβλητές αποκλίσεις Η. και Y., S xy. - Covarialce:

Σε αυτόν τον τύπο, η Covariance χωρίζεται σε τυπικές αποκλίσεις των μεταβλητών Η. και Y.Καταργώντας έτσι τα αποτελέσματα κλιμάκωσης που σχετίζονται με τις μονάδες μέτρησης από την Covaria. Το Excel χρησιμοποιεί μια συνάρτηση Correla (). Στον τίτλο αυτής της λειτουργίας, δεν υπάρχουν στοιχεία αποσαφήνισης των G και B, τα οποία χρησιμοποιούνται στα ονόματα λειτουργιών όπως ο τυποποιημένος κλώνος (), το πιάτο () ή η συνδιακύμανση (). Αν και η αναλογία συσχέτισης του δείγματος που παρέχεται από την εκτοπισμένη βαθμολογία, αλλά η αιτία της μετατόπισης είναι διαφορετική από ό, τι στην περίπτωση διασποράς ή τυπικής απόκλισης.

Ανάλογα με το μέγεθος του γενικού συντελεστή συσχέτισης (που συχνά υποδεικνύεται από την ελληνική επιστολή ρ ), συντελεστής συσχέτισης r. Δίνει μια μετατοπική βαθμολογία και το αποτέλεσμα μετατόπισης ενισχύεται με μείωση του μεγέθους του δείγματος. Παρ 'όλα αυτά, δεν προσπαθούμε να προσαρμόσουμε αυτή την μετατόπιση με τον ίδιο τρόπο όπως, για παράδειγμα, έγινε κατά τον υπολογισμό της τυπικής απόκλισης, όταν δεν ήταν ο αριθμός των παρατηρήσεων αντικατασταθεί στον αντίστοιχο τύπο, αλλά ο αριθμός των βαθμών ελευθερίας. Στην πραγματικότητα, ο αριθμός των παρατηρήσεων που χρησιμοποιούνται για τον υπολογισμό της συνδιακύμανσης δεν έχουν καμία επιρροή στο μέγεθος.

Ο τυπικός συντελεστής συσχέτισης προορίζεται για χρήση με μεταβλητές που σχετίζονται με γραμμική αναλογία. Η παρουσία μη γραμμικότητας ή / και σφαλμάτων σε δεδομένα (εκπομπές) οδηγεί σε εσφαλμένο υπολογισμό του συντελεστή συσχέτισης. Για τη διάγνωση προβλημάτων δεδομένων, συνιστάται η δημιουργία σημείων διαγραμμάτων. Αυτός είναι ο μόνος τύπος διαγραμμάτων στο Excel, στην οποία οι οριζόντιοι και οι κατακόρυφοι άξονες αντιμετωπίζονται ως άξονας των τιμών. Το γραμμικό διάγραμμα μία από τις στήλες ορίζει τον τρόπο με τον οποίο ο άξονας κατηγορίας παραμορφώνει την εικόνα δεδομένων (Εικ. 4).

Σύκο. 4. Οι γραμμές παλινδρόμησης φαίνονται τα ίδια, αλλά συγκρίνουν τις εξισώσεις τους μεταξύ τους

Οι παρατηρήσεις που χρησιμοποιούνται για την κατασκευή ενός γραμμικού διαγράμματος βρίσκονται κατά μήκος του οριζόντιου άξονα ισοδύναμου. Οι επιγραφές των διαιρέσεων κατά μήκος αυτού του άξονα είναι μόνο επιγραφές και όχι αριθμητικές τιμές.

Παρά το γεγονός ότι η συσχέτιση συχνά σημαίνει την παρουσία αιτιώδους σχέσης, δεν μπορεί να χρησιμεύσει ως απόδειξη ότι είναι. Οι στατιστικές δεν χρησιμοποιούνται για να αποδείξουν ότι η θεωρία είναι αληθής ή ψευδής. Να εξαλείψει τις ανταγωνιστικές εξηγήσεις των αποτελεσμάτων παρατήρησης Προγραμματισμένα πειράματα. Οι στατιστικές προσελκύονται για να συνοψίσουν τις πληροφορίες που συλλέγονται κατά τη διάρκεια αυτών των πειραμάτων και μια ποσοτική αξιολόγηση της πιθανότητας να ληφθεί η απόφαση μπορεί να είναι εσφαλμένη στην υφιστάμενη βάση αποδεικτικών στοιχείων.

Κεφάλαιο 3. Απλή παλινδρόμηση

Εάν διασυνδεθούν δύο μεταβλητές, οπότε η τιμή του συντελεστή συσχέτισης υπερβαίνει, λέει, 0,5, στη συνέχεια στην περίπτωση αυτή μπορεί να προβλεφθεί (με κάποια ακρίβεια) άγνωστη τιμή μιας μεταβλητής για τη γνωστή τιμή άλλου. Για τις τιμές προγνωστικού τιμών, με βάση τα δεδομένα που φαίνονται στο ΣΧ. 5, μπορείτε να χρησιμοποιήσετε οποιοδήποτε από τα πολλά Πιθανές μεθόδουςΑλλά σχεδόν σίγουρα δεν θα χρησιμοποιήσετε εκείνο που παρουσιάζεται στο Σχ. 5. Και όμως θα πρέπει να εξοικειωθείτε με αυτό, επειδή καμία άλλη μέθοδος δεν μας επιτρέπει να επιδεικνύουμε σαφώς τη σχέση μεταξύ της συσχέτισης και της πρόβλεψης, όπως αυτή. Στο ΣΧ. 5 Στην περιοχή B2: Το C12 είναι ένα τυχαίο δείγμα δέκα σπιτιών και παρέχει δεδομένα στην περιοχή κάθε σπιτιού (σε τετραγωνικά πόδια) και την τιμή πώλησης.

Σύκο. 5. Οι τιμές πώλησης προβλέψεων αποτελούν μια ευθεία γραμμή

Βρείτε τις μέσες τιμές, οι τυπικές αποκλίσεις και συντελεστής συσχέτισης (εύρος Α14: C18). Υπολογίστε τις εκτιμήσεις Z της περιοχής (E2: E12). Για παράδειγμα, το κύτταρο EZ περιέχει έναν τύπο: \u003d (B3- $ στα $ 14) / $ στα $ 15. Υπολογίστε τις εκτιμήσεις Z της τιμής πρόβλεψης (F2: F12). Για παράδειγμα, το κύτταρο F3 περιέχει έναν τύπο: \u003d yez * $ στα $ 18. Μεταφράστε εκτιμήσεις Z σε τιμές σε δολάρια (H2: H22). Στο NZ Cell Formula: \u003d F3 * $ C $ 15 + $ C $ 14.

Σημείωση: Η προβλεπόμενη τιμή επιδιώκει πάντα να μετατοπίζεται προς τον μέσο όρο ίση με το 0. Πρόσφατα στο μηδέν τον συντελεστή συσχέτισης, το πιο κοντά στο μηδέν είναι η προβαλλόμενη εκτίμηση Z. Στο παράδειγμά μας, ο συντελεστής συσχέτισης μεταξύ της περιοχής και της τιμής πώλησης είναι 0,67 και η τιμή πρόβλεψης είναι 1,0 * 0,67, δηλ. 0,67. Αυτό αντιστοιχεί στην υπερβολική τιμή πάνω από τη μέση τιμή ίση με τα δύο τρίτα της τυπικής απόκλισης. Εάν ο συντελεστής συσχέτισης ήταν ίση με 0,5, τότε η τιμή πρόβλεψης θα ήταν 1,0 * 0,5, δηλ. 0,5. Αυτό αντιστοιχεί στην υπερβολική τιμή πάνω από τη μέση τιμή ίση με μόνο το ήμισυ της τυπικής απόκλισης. Κάθε φορά που η τιμή συντελεστή συσχέτισης διαφέρει από το τέλειο, δηλ. Περισσότερα -1,0 και λιγότερο από 1,0, η εκτίμηση της προβλεπόμενης μεταβλητής πρέπει να είναι πιο κοντά στη μέση τιμή του από την εκτίμηση του προβλέπτη (ανεξάρτητη) μεταβλητή. Αυτό το φαινόμενο ονομάζεται μεσαία παλινδρόμηση, ή απλά παλινδρόμηση.

Το Excel έχει πολλές λειτουργίες για να καθορίσει τους συντελεστές της εξίσωσης γραμμής παλινδρόμησης (στο Excel ονομάζεται γραμμή τάσης) y \u003d.kx. + ΣΙ.. Για τον προσδιορισμό Κ. Εξυπηρετεί τη λειτουργία

\u003d Κλίση (γνωστή_name_u, render_stations_x)

Εδώ w. - προβλεπόμενη μεταβλητή, και Η. - Ανεξάρτητη μεταβλητή. Πρέπει να ακολουθήσετε αυστηρά αυτή τη σειρά μεταβλητών. Η κλίση της γραμμής παλινδρόμησης, συντελεστής συσχέτισης, οι τυποποιημένες μεταβλητές και οι αποκλίσεις των συνδρομητών συνδέονται στενά μεταξύ τους (Εικ. 6). Η λειτουργία του τμήματος () επιστρέφει μια τιμή που κόβει τη γραμμή παλινδρόμησης στον κατακόρυφο άξονα:

\u003d Τμήμα (resrent_stations_u, render_stations_x)

Σύκο. 6. Η αναλογία μεταξύ των τυπικών αποκλίσεων μετατρέπει την συνδιακύμανση στον συντελεστή συσχέτισης και την κλίση της γραμμής παλινδρόμησης

Παρακαλείστε να σημειώσετε ότι ο αριθμός των τιμών x και y που παρέχονται από τη λειτουργία κλίσης () και το τμήμα () ως επιχειρήματα πρέπει να είναι τα ίδια.

Σε ανάλυση παλινδρόμησης, χρησιμοποιείται ένας άλλος σημαντικός δείκτης - R2 (R-Square) ή ο συντελεστής προσδιορισμού. Καθορίζει ποια συμβολή στη συνολική μεταβλητότητα των δεδομένων εισάγεται από την εξάρτηση Η. και w.. Στο Excel, υπάρχει μια λειτουργία (), η οποία λαμβάνει ακριβώς τα ίδια επιχειρήματα με τη συνάρτηση Correla ().

Σε δύο μεταβλητές με συντελεστή μη μηδενικής συσχέτισης μεταξύ τους, λένε ότι εξηγούν τη διασπορά ή έχουν επεξηγημένη διασπορά. Συνήθως εξηγείται η διασπορά εκφράζεται ως ποσοστό. Έτσι R. 2 \u003d 0,81 σημαίνει ότι το 81% της διασποράς (διασπορά) εξηγείται δύο μεταβλητές. Το υπόλοιπο 19% οφείλεται σε τυχαίες διακυμάνσεις.

Το Excel έχει μια λειτουργία τάσης που απλοποιεί τους υπολογισμούς. Τάση λειτουργίας ():

  • Αποδέχεται τις γνωστές τιμές Η. και γνωστές τιμές w.;
  • Υπολογίζει την κλίση της γραμμής παλινδρόμησης και της σταθερής (τμήματος) ·
  • Επιστρέφει τις προβλέψεις τιμές w.που ορίζεται με βάση την εφαρμογή της εξίσωσης παλινδρόμησης σε γνωστές τιμές Η. (Εικ. 7).

Η λειτουργία τάσης () είναι η λειτουργία του πίνακα (εάν δεν έχετε προηγουμένως αντιμετωπίσει τέτοιες λειτουργίες, συνιστώ).

Σύκο. 7. Χρήση της λειτουργίας τάσης () σας επιτρέπει να επιταχύνετε και να απλοποιήσετε τους υπολογισμούς σε σύγκριση με τη χρήση ενός ζεύγους λειτουργιών κλίσης () και ενός τμήματος ()

Για να εισαγάγετε τη λειτουργία τάσης () στον τύπο της συστοιχίας στο Cell G3: G12, επιλέξτε την περιοχή G3: G12, εισάγετε τον τύπο τάσης (SZ: C12, VZ: B12), πατήστε και κρατήστε πατημένο τα πλήκτρα Και μόνο πατήστε το πλήκτρο . Παρακαλείστε να σημειώσετε ότι ο τύπος περικλείεται σε σγουρά στη σγουρά: (ες). Έτσι, το Excel σας ενημερώνει ότι αυτή η φόρμουλα γίνεται αντιληπτή ακριβώς ως τύπος συστοιχίας. Μην εισάγετε τις ίδιες τις παρενθέσεις: Αν προσπαθήσετε να τα εισάγετε μόνοι σας ως μέρος του τύπου, το Excel θα αντιληφθεί την είσοδό σας ως κανονική συμβολοσειρά κειμένου.

Η λειτουργία έχει μια τάση () υπάρχουν δύο ακόμη επιχειρήματα: new_name_x.και Εντελώς. Το πρώτο σας επιτρέπει να δημιουργήσετε μια πρόβλεψη για το μέλλον και το δεύτερο μπορεί να αναγκάσει τη γραμμή παλινδρόμησης να περάσει από την προέλευση της συντεταγμένης (η αξία της αλήθειας λέει το Excel για να χρησιμοποιήσετε την υπολογισμένη σταθερά, η τιμή είναι ένα ψέμα - σταθερό \u003d 0). Το Excel σάς επιτρέπει να σχεδιάσετε μια παλινδρόμηση απευθείας στο γράφημα έτσι ώστε να διέρχεται από την προέλευση των συντεταγμένων. Ξεκινήστε με την οικοδόμηση ενός σημείου διάγραμμα και, στη συνέχεια, κάντε δεξί κλικ σε έναν από τους δείκτες σειράς δεδομένων. Επιλέξτε το άνοιγμα κατάλογος συμφραζόμενων παράγραφος Προσθέστε τη γραμμή τάσης; Επιλέξτε Επιλογή Γραμμικός; Εάν είναι απαραίτητο, μετακινηθείτε προς τα κάτω στο πλαίσιο, ελέγξτε το πλαίσιο. Ρυθμίστε τη διέλευση; Βεβαιωθείτε ότι το πεδίο κειμένου έχει οριστεί σε 0,0 στο πεδίο που σχετίζεται με το κείμενο.

Εάν έχετε τρεις μεταβλητές και θέλετε να προσδιορίσετε τη συσχέτιση μεταξύ δύο από αυτά, εξαλείφοντας την επιρροή του τρίτου, μπορείτε να χρησιμοποιήσετε Ιδιωτική συσχέτιση. Ας υποθέσουμε ότι ενδιαφέρεστε για τη σχέση μεταξύ του ποσοστού κατοίκων της πόλης, η οποία ολοκληρώθηκε το κολλέγιο και τον αριθμό των βιβλίων στις αστικές βιβλιοθήκες. Έχετε συλλέξει δεδομένα σε 50 πόλεις, αλλά ... το πρόβλημα είναι ότι και οι δύο αυτές οι παράμετροι μπορεί να εξαρτώνται από την ευημερία των κατοίκων μιας ή άλλης πόλης. Φυσικά, είναι πολύ δύσκολο να επιλέξετε άλλες 50 πόλεις, που χαρακτηρίζονται από το ίδιο επίπεδο ευημερίας των κατοίκων.

Εφαρμόζοντας στατιστικές μεθόδους για την εξάλειψη της επιρροής που παρέχεται από τον παράγοντα καλής διαβίωσης τόσο της οικονομικής στήριξης των βιβλιοθηκών όσο και για τη διαθεσιμότητα της κατάρτισης του κολλεγίου, θα μπορούσατε να πάρετε μια ακριβέστερη ποσοτική αξιολόγηση του βαθμού μεταξύ των μεταβλητών που σας ενδιαφέρουν, δηλαδή: Ο αριθμός των βιβλίων και τον αριθμό των πτυχιούχων. Μια τέτοια υπό όρους συσχέτιση μεταξύ δύο μεταβλητών, όταν σταθεροποιούνται οι τιμές άλλων μεταβλητών και ονομάζεται ιδιωτική συσχέτιση. Μία από τις μεθόδους υπολογισμού είναι η χρήση της εξίσωσης:

Οπου r. CB. . W. - ο συντελεστής συσχέτισης μεταξύ μεταβλητών κολλεγίων (κολλεγίων) και βιβλίων (βιβλία) με το εξαλειφθεί (σταθερή αξία) της μεταβλητής ευημερίας (πλούτος) · r. CB. - συντελεστής συσχέτισης μεταξύ μεταβλητών κολλεγίων και βιβλίων · r. Σιγοβράζω - συντελεστής συσχέτισης μεταξύ μεταβλητών και ευημερίας του Κολλεγίου · r. Βλ - συντελεστής συσχέτισης μεταξύ μεταβλητών βιβλίων και ευεξίας.

Από την άλλη πλευρά, η ιδιωτική συσχέτιση μπορεί να υπολογιστεί με βάση την ανάλυση των υπολειμμάτων, δηλ. Οι διαφορές μεταξύ των προβλεπόμενων τιμών και των συναφών αποτελεσμάτων των πραγματικών παρατηρήσεων (και οι δύο μέθοδοι παρουσιάζονται στο ΣΧ. 8).

Σύκο. 8. Ιδιωτική συσχέτιση με τη συσχέτιση των υπολειμμάτων

Για την απλοποίηση του υπολογισμού της μήτρας συντελεστή συσχέτισης (B16: E19), χρησιμοποιήστε το πακέτο ανάλυσης Excel (μενού Δεδομένα –> Ανάλυση –> Ανάλυση δεδομένων). Από προεπιλογή, αυτό το πακέτο στο Excel δεν είναι ενεργό. Για να το εγκαταστήσετε, περάστε από το μενού Αρχείο –> Παράμετροι –> Εποικοδόμημα. Κάτω από τα παράθυρα ΠαράμετροιΠροέχω Βρείτε το πεδίο Ελεγχος, Επιλέξτε ΕποικοδόμημαΠροέχωΚάντε κλικ Πηγαίνω. Ελέγξτε το σημείο απέναντι από την υπερκατασκευή Πακέτο ανάλυσης. Κάντε κλικ στο Α. Δεδομένα Naliza, Επιλέξτε την επιλογή Συσχέτιση. Ως διάστημα εισόδου, καθορίστε $ 2 $ 2: $ D $ 13, ελέγξτε το πλαίσιο Ετικέτες στην πρώτη συμβολοσειρά, Ως διάστημα εξόδου, καθορίστε $ 16 $ 16: $ E $ 19.

Μια άλλη ευκαιρία είναι να προσδιοριστεί η συσχέτιση του μισού κόμματος. Για παράδειγμα, εξετάζετε τον αντίκτυπο της ανάπτυξης και της ηλικίας κατά βάρος. Έτσι, έχετε δύο μεταβλητές προγνωστικού - αύξηση και ηλικία και ένα προβλεπόμενο μεταβλητό βάρος. Θέλετε να εξαλείψετε την επιρροή μιας μεταβλητής προγνωστικού σε άλλο, αλλά όχι για την προβλεπόμενη μεταβλητή:

όπου n είναι ύψος (ύψος), βάρος (βάρος), και - ηλικία (ηλικία); Στον δείκτη του συντελεστή συσχέτισης του τομέα, χρησιμοποιούνται στρογγυλές βραχίονες, με τις οποίες υποδεικνύεται, η επίδραση της οποίας η μεταβλητή εξαλείφεται από την οποία μεταβλητή. Στην περίπτωση αυτή, η ονομασία W (Ν.Α) υποδεικνύει ότι η επίδραση της μεταβλητής ηλικίας αφαιρείται από τη μεταβλητή ανάπτυξης, αλλά όχι από μεταβλητό βάρος.

Μπορεί να ζητήσει την εντύπωση ότι το ερώτημα δεν ήταν σημαντικά σημαντικό. Εξάλλου, το πιο σημαντικό είναι το πιο σημαντικό είναι το πώς ακριβώς η εξίσωση της γενικής παλινδρόμησης λειτουργεί ακριβώς, ενώ το πρόβλημα των σχετικών συμβολών μεμονωμένων μεταβλητών στη συνολική εξηγούμενη διασπορά φαίνεται δευτερεύουσα. Ωστόσο, αυτό δεν συμβαίνει. Μόλις αρχίσετε να σκέφτεστε αν αξίζει να χρησιμοποιήσετε κάποια μεταβλητή στην εξίσωση πολλαπλών παλινδρόμησης, το πρόβλημα γίνεται σημαντικό. Μπορεί να επηρεάσει την αξιολόγηση της ορθότητας της επιλογής του μοντέλου για ανάλυση.

Κεφάλαιο 4. Λειτουργία Linene ()

Η γραμμική () λειτουργία επιστρέφει 10 στατιστικά στοιχεία παλινδρόμησης. Η γραμμική λειτουργία () είναι η λειτουργία του πίνακα. Για να το εισάγετε, επισημάνετε το εύρος που περιέχει πέντε γραμμές και δύο στήλες, πληκτρολογήστε τον τύπο και κάντε κλικ στο κουμπί (Εικ. 9):

Γραμμική (Β2: Β21, Α2: Α21, Αλήθεια; Αλήθεια)

Σύκο. 9. Linene (): α) Επισημάνετε το εύρος D2: E6, β) Εισάγετε τον τύπο όπως φαίνεται στον τύπο, C)

Η γραμμή γραμμικής () επιστρέφει:

  • συντελεστής παλινδρόμησης (ή κλίση, κυψέλη D2).
  • Κομμένα (ή σταθερά, κυψέλη E3).
  • Σφάλματα και σταθερές συντελεστή παλινδρόμησης και σταθερές (εμβέλεια D3: E3).
  • r 2 Ο συντελεστής προσδιορισμού για την παλινδρόμηση (Cell D4).
  • Πρότυπο σφάλμα εκτίμησης (E4 Cell).
  • F-κριτήριο για πλήρη παλινδρόμηση (Cell D5).
  • Τον αριθμό των βαθμών ελευθερίας για το υπολειμματικό άθροισμα των τετραγώνων (κυττάρων Ε5) ·
  • Ποσότητα παλινδρόμησης των τετραγώνων (Cell D6).
  • Το υπολειμματικό άθροισμα των τετραγώνων (Cell E6).

Εξετάστε καθένα από αυτά τα στατιστικά στοιχεία και την αλληλεπίδρασή τους.

Τυπικό σφάλμα Στην περίπτωσή μας, αυτή είναι μια τυπική απόκλιση που υπολογίζεται για σφάλματα δειγματοληψίας. Εκείνοι., Αυτή είναι μια κατάσταση όπου το γενικό σύνολο έχει ένα στατιστικό χαρακτήρα και το δείγμα είναι ένα άλλο. Κοινή χρήση του συντελεστή παλινδρόμησης σε ένα τυπικό σφάλμα, θα λάβετε μια τιμή 2.092 / 0,818 \u003d 2.559. Με άλλα λόγια, ο συντελεστής παλινδρόμησης, ίσος με 2.092, είναι μηδέν για δύο και μισά τυποποιημένα σφάλματα.

Εάν ο συντελεστής παλινδρόμησης είναι μηδέν, η καλύτερη εκτίμηση της προβλεπόμενης μεταβλητής είναι η μέση τιμή του. Δύο και μισά τυποποιημένα σφάλματα είναι αρκετά μεγάλη αξία και μπορείτε να πιστεύετε με βεβαιότητα ότι ο συντελεστής παλινδρόμησης για τον γενικό πληθυσμό έχει μια μηδενική αξία.

Μπορείτε να προσδιορίσετε την πιθανότητα απόκτησης συντελεστή επιλεκτικής παλινδρόμησης 2.092, εάν η πραγματική τιμή του στο γενικά σετ είναι 0.0 χρησιμοποιώντας τη λειτουργία

Student.Rasp.ph (t-κριτήριο \u003d 2.559; αριθμός βαθμών ελευθερίας \u003d 18)

Γενικά, ο αριθμός των ελευθεριών \u003d n - k - 1, όπου n είναι ο αριθμός των παρατηρήσεων και ο Κ είναι ο αριθμός των μεταβλητών προγνωστικού παράγοντα.

Αυτός ο τύπος επιστρέφει μια τιμή 0,00987 ή, στρογγυλεμένη, 1%. Μας ενημερώνει τα εξής: Εάν ο συντελεστής παλινδρόμησης για τον γενικό πληθυσμό είναι 0%, τότε η πιθανότητα απόκτησης δείγματος 20 ατόμων, για τις οποίες η εκτιμώμενη αξία του συντελεστή παλινδρόμησης είναι 2.092, είναι ένα μέτριο 1%.

Το κριτήριο F (κυττάρων D5 στο σχήμα 9) εκτελεί τις ίδιες λειτουργίες σε σχέση με την πλήρη παλινδρόμηση με το κριτήριο Τ σε σχέση με τον συντελεστή της απλής παλινδρόμησης ζεύγους. Το κριτήριο F χρησιμοποιείται για να επαληθεύσει εάν ο συντελεστής προσδιορισμού R 2 είναι πράγματι αρκετός για την παλινδρόμηση έχει επαρκώς μεγάλο ποσό που σας επιτρέπει να απορρίψετε την υπόθεση ότι στο γενικό σύνολο έχει μια τιμή 0,0, η οποία υποδεικνύει την απουσία διασποράς εξηγείται από τον προγνωστικό και την προβλεπόμενη μεταβλητή. Εάν υπάρχει μόνο ένα μεταβλητό κριτήριο F-Reforctor, ακριβώς ίσο με το τετραγωνικό κριτήριο Τ.

Μέχρι στιγμής, έχουμε εξετάσει μεταβλητές διαστήματος. Εάν έχετε μεταβλητές που μπορούν να πάρουν αρκετές τιμές που είναι απλά ονόματα, για παράδειγμα, έναν άνδρα και μια γυναίκα ή ερπετό, αμφίβιο και ψάρι, φανταστείτε τη μορφή ενός αριθμητικού κώδικα. Τέτοιες μεταβλητές ονομάζονται ονομαστικές.

Στατιστικά στοιχεία R 2. δίνει μια ποσοτική αξιολόγηση του μεριδίου της εξηγούμενης διασποράς.

Πρότυπο σφάλμα αξιολόγησης.Στο ΣΧ. 4.9 Προπληρωμένες τιμές μεταβλητής βάρους που λαμβάνονται με βάση τη σύνδεσή τους με μια μεταβλητή ανάπτυξη. Στην περιοχή E2: Το E21 περιέχει τιμές υπολειμμάτων για μεταβλητό βάρος. Ακριβώς, αυτά τα υπολείμματα καλούν λάθη - από εδώ και ακολουθεί το πρότυπο πρότυπο σφάλμα αξιολόγησης.

Σύκο. 10. Τόσο το R2 όσο και το τυποποιημένο σφάλμα της εκτίμησης εκφράζει την ακρίβεια των προβολών που λαμβάνονται με παλινδρόμηση.

Όσο μικρότερο είναι το τυποποιημένο σφάλμα εκτίμησης, τόσο ακριβέστερη η εξίσωση παλινδρόμησης και η πιο στενή σύμπτωση οποιασδήποτε πρόβλεψης που αποκτήθηκε χρησιμοποιώντας την εξίσωση, με την πραγματική παρατήρηση που περιμένετε. Το τυποποιημένο σφάλμα αξιολόγησης παρέχει μια μέθοδο για την ποσοτικοποίηση αυτών των προσδοκιών. Το βάρος 95% των ατόμων με κάποια ανάπτυξη θα είναι στην περιοχή:

(Ύψος * 2,092 - 3,591) ± 2,092 * 21,118

Στατιστικές F- Αυτή είναι η σχέση της διασποράς Intergroup στην διασπορά Intagroup. Αυτό το όνομα εισήχθη με στατιστικά στοιχεία του George Snedel προς τιμήν του Κύριου, ο οποίος είχε αναπτύξει ανάλυση διασπορά στις αρχές του 20ού αιώνα (ανάλυση της διακύμανσης).

Ο συντελεστής προσδιορισμού R 2 εκφράζει το μερίδιο του συνολικού ποσού των τετραγώνων που σχετίζονται με την παλινδρόμηση. Η τιμή (1 - R 2) εκφράζει το μερίδιο των συνολικών τετραγώνων που σχετίζονται με τα ισορροπία - τα σφάλματα πρόβλεψης. Το κριτήριο F μπορεί να ληφθεί χρησιμοποιώντας μια γραμμική λειτουργία (κυψελίδα F5 στο Σχ. 11), χρησιμοποιώντας τα ποσά των τετραγώνων (εύρος G10: J11), χρησιμοποιώντας ένα κλάσμα διασποράς (G14: J15). Οι φόρμουλες μπορούν να μελετηθούν στο συνοδευτικό αρχείο Excel.

Σύκο. 11. Υπολογισμός των κριτηρίων F

Όταν χρησιμοποιούνται ονομαστικές μεταβλητές, χρησιμοποιείται πλασματική κωδικοποίηση (Εικ. 12). Για να κωδικοποιήσετε τις τιμές, είναι βολικό να χρησιμοποιείτε τιμές 0 και 1. Η πιθανότητα F υπολογίζεται χρησιμοποιώντας τη λειτουργία:

F.resp.ph (k2; i2; i3)

Εδώ, η λειτουργία F.resp.ph () επιστρέφει την πιθανότητα απόκτησης ενός κριτηρίου F υποταγεί την κεντρική κατανομή F (Σχήμα 13) για δύο σύνολα δεδομένων με τις ποσότητες βαθμών ελευθερίας, που δίδονται στα κύτταρα I2 και I3 , η τιμή του οποίου συμπίπτει με την τιμή που δίνεται στο C2 Cell.

Σύκο. 12. Ανάλυση παλινδρόμησης χρησιμοποιώντας πλασματικές μεταβλητές

Σύκο. 13. Κεντρική διανομή F στο λ \u003d 0

Κεφάλαιο 5. Πολλαπλή παλινδρόμηση

Στρέφοντας από μια απλή παλινδρόμηση ζεύγους με μια μεταβλητή προγνωστικού σε πολλαπλή παλινδρόμηση, προσθέτετε μία ή περισσότερες μεταβλητές προγνωστικού παράγοντα. Κρατήστε τις τιμές των μεταβλητών προγνωστικού παράγοντα σε παρακείμενες στήλες, για παράδειγμα, στις στήλες Α και Β στην περίπτωση δύο προβλημάτων ή Α, Β και Γ στην περίπτωση τριών προβλημάτων. Πριν εισέλθετε σε έναν τύπο που περιλαμβάνει τη γραμμική () λειτουργία, επιλέξτε πέντε γραμμές και τόσες πολλές στήλες, καθώς υπάρχουν μεταβλητές προγνωστικού παράγοντα, συν ένα άλλο για τη σταθερά. Στην περίπτωση της παλινδρόμησης με δύο μεταβλητές πρόβλεψης, μπορείτε να χρησιμοποιήσετε την ακόλουθη δομή:

Linene (A2: A41, B2: C41 ;; αλήθεια)

Ομοίως, στην περίπτωση τριών μεταβλητών:

Linene (A2: A61, B2: D61 ;; αλήθεια)

Ας υποθέσουμε ότι θέλετε να μελετήσετε την πιθανή επίδραση της ηλικίας και της διατροφής σχετικά με τη διατήρηση λιποπρωτεϊνών LDL - χαμηλής πυκνότητας, τα οποία θεωρούνται υπεύθυνα για το σχηματισμό αθηροσκληρωτικών πλακών, οι οποίες προκαλούν αθηροτρομορφή (Εικ. 14).

Σύκο. 14. Πολλαπλή παλινδρόμηση

R 2 πολλαπλή παλινδρόμηση (αντανακλάται στο κύτταρο F13), περισσότερο από το R2 οποιασδήποτε απλής παλινδρόμησης (Ε4, Η4). Σε πολλαπλές παλινδρόμηση, χρησιμοποιούνται ταυτόχρονα αρκετές μεταβλητές προγνωστικού παράγοντα. Στην περίπτωση αυτή, το R 2 σχεδόν αυξάνεται.

Για οποιοδήποτε απλό γραμμική εξίσωση Η παλινδρόμηση με μία μεταβλητή προβλέπτη μεταξύ των προβλεπόμενων τιμών και των τιμών της μεταβλητής προγνωστικού παράγοντα θα είναι πάντα η ιδανική συσχέτιση, καθώς σε αυτή την εξίσωση η τιμή του προγνωστικού παράγοντα πολλαπλασιάζεται με μία σταθερή και μια άλλη σταθερά προστίθεται σε κάθε εργασία. Το αποτέλεσμα αυτό δεν διατηρείται σε πολλαπλή παλινδρόμηση.

Εμφανίζει τα αποτελέσματα που επιστρέφονται από τη γραμμή γραμμικής () για πολλαπλή παλινδρόμηση (Εικ. 15). Οι συντελεστές παλινδρόμησης προέρχονται ως μέρος των αποτελεσμάτων που επιστρέφονται από τη λειτουργία του Linene () Με τη σειρά της αντίστροφης θέσης των μεταβλητών (G-h - i αντιστοιχεί στο C-A).

Σύκο. 15. Οι συντελεστές και τα τυποποιημένα σφάλματα τους εμφανίζονται με την αντίστροφη σειρά των παρακάτω στο φύλλο εργασίας.

Οι αρχές και οι διαδικασίες που χρησιμοποιούνται στην ανάλυση παλινδρόμησης με μία μεταβλητή προγνωστικού παράγοντα προσαρμόζονται εύκολα ώστε να λαμβάνουν υπόψη διάφορες μεταβλητές προγνωστικού παράγοντα. Αποδεικνύεται ότι πολλά σε αυτή την προσαρμογή εξαρτάται από την εξάλειψη της επίδρασης των μεταβλητών του προγνωστικού ο ένα στο άλλο. Το τελευταίο συνδέεται με τις ιδιωτικές και ημι-τμήματα συσχετίσεις (Εικ. 16).

Σύκο. 16. Η πολλαπλή παλινδρόμηση μπορεί να εκφραστεί μέσω της ζευγαρωμένης παλινδρόμησης των υπολειμμάτων (φόρμες, βλέπε αρχείο Excel)

Στο Excel, υπάρχουν χαρακτηριστικά που παρέχουν πληροφορίες σχετικά με τις διανομές T- και F. Λειτουργίες των οποίων τα ονόματα περιλαμβάνουν μέρος της παραλαβής, όπως το Student.Rasp () και το F.RASP (), λαμβάνουν ένα κριτήριο T-ή F ως επιχείρημα και επιστρέφουν την πιθανότητα να παρατηρούν την καθορισμένη τιμή. Λειτουργίες των οποίων τα ονόματα περιλαμβάνουν μέρος του ΟΡΡ, όπως φοιτητής. Παραγωγή () και F. Παραγωγή (), λαμβάνουν την τιμή πιθανότητας ως επιχείρημα και επιστρέφουν την αξία του κριτηρίου που αντιστοιχεί στην καθορισμένη πιθανότητα.

Δεδομένου ότι ψάχνουμε για κρίσιμες τιμές διανομής Τ που έκοψαν τις άκρες των ουράς περιοχών, διαβιβάζουμε το 5% ως ένα επιχείρημα μιας από τις λειτουργίες του φοιτητή. Παραγωγή (), η οποία επιστρέφει την τιμή που αντιστοιχεί σε αυτή την πιθανότητα (εικ. . 17, 18).

Σύκο. 17. Διμόνια T-Test

Σύκο. 18. T-test μονής όψης

Καθιέρωση του κανόνα λήψης αποφάσεων σε περίπτωση μίας μονής ωράς περιοχής άλφα, αυξάνετε τη στατιστική δύναμη της δοκιμής. Εάν, ξεκινώντας ένα πείραμα, είστε βέβαιοι ότι έχετε κάθε λόγο να περιμένετε έναν θετικό (ή αρνητικό) συντελεστή παλινδρόμησης, τότε θα πρέπει να εκτελέσετε μια δοκιμή μόνο ώρας. Σε αυτή την περίπτωση, η πιθανότητα να πάρετε σωστή λύση, η απόρριψη της υπόθεσης του συντελεστή μηδενικής παλινδρόμησης στον γενικό πληθυσμό θα είναι υψηλότερο.

Οι στατιστικές προτιμούν να χρησιμοποιούν τον όρο Κατευθυντική δοκιμή Αντί του όρου Μονής δοκιμής και όρος Μη κατευθυντική δοκιμή Αντί του όρου Δύο πολυάσχολες δοκιμές. Οι όροι που απευθύνονται και οι μηδαυρωμένοι είναι προτιμότερο επειδή επικεντρώνονται στον τύπο της υπόθεσης και όχι στη φύση των ουρών διανομής.

Προσέγγιση για την αξιολόγηση του αντίκτυπου των προβλημάτων που βασίζονται στη σύγκριση των μοντέλων.Στο ΣΧ. 19 δείχνει τα αποτελέσματα της ανάλυσης παλινδρόμησης, στην οποία δοκιμάζεται η συμβολή της μεταβλητής διατροφής στην εξίσωση παλινδρόμησης.

Σύκο. 19. Σύγκριση δύο μοντέλων ελέγχοντας τις διαφορές στα αποτελέσματά τους

Τα αποτελέσματα της γραμμικής (εύρους H2: K6) σχετίζονται με αυτό που ονομάζετε το πλήρες μοντέλο στο οποίο πραγματοποιείται η παλινδρόμηση της μεταβλητής LDL σε μεταβλητή διατροφή, ηλικία και HDL. Στην περιοχή του H9: J1z παρουσιάζει υπολογισμούς χωρίς να λαμβάνεται υπόψη η μεταβλητή διατροφή του προγνωστή. Το ονομάζω ένα περιορισμένο μοντέλο. Σε ένα πλήρες μοντέλο, η διασπορά 49,2% της εξαρτώμενης μεταβλητής LDL εξηγείται από τις μεταβλητές προγνωστικού παράγοντα. Σε ένα περιορισμένο μοντέλο, μόνο το 30,8% της LDL εξηγείται από τη μεταβλητή ηλικία και την HDL. Η απώλεια R2, λόγω της εξαίρεσης της μεταβλητής διατροφής από το μοντέλο, είναι 0,183. Στην περιοχή G15: L17, γίνονται υπολογισμοί που δείχνουν ότι μόνο με πιθανότητα 0,0288 η επίδραση μιας μεταβλητής δίαιτας είναι τυχαία. Στην υπόλοιπη διατροφή 97,1% επηρεάζει το LDL.

Κεφάλαιο 6. Υποθέσεις και προσοχή για ανάλυση παλινδρόμησης

Ο όρος "παραδοχή" δεν ορίζεται επαρκώς αυστηρά και ο τρόπος χρήσης του συνεπάγεται ότι εάν η υπόθεση δεν τηρείται, τα αποτελέσματα ολόκληρης της ανάλυσης είναι τουλάχιστον αμφίβολα ή ενδεχομένως δεν έχουν δυνάμεις. Στην πραγματικότητα, αυτό δεν συμβαίνει, αν και, φυσικά, υπάρχουν περιπτώσεις όταν η διαταραχή της παραδοχής στη ρίζα αλλάζει την εικόνα. Κύριες υποθέσεις: α) Τα υπολείμματα της μεταβλητής Υ κατανέμονται κανονικά σε οποιοδήποτε σημείο Χ κατά μήκος της γραμμής παλινδρόμησης. β) Οι τιμές V είναι σε Γραμμική εξάρτηση από τις τιμές x. γ) η διασπορά υπολειμμάτων είναι περίπου η ίδια σε κάθε σημείο Χ · δ) Δεν υπάρχει εξάρτηση μεταξύ των υπολειμμάτων.

Εάν οι υποθέσεις δεν διαδραματίζουν σημαντικό ρόλο, οι στατιστικές μιλάνε για την ευρωστία της ανάλυσης σε σχέση με τις αναπηρίες. Συγκεκριμένα, όταν χρησιμοποιείτε παλινδρόμηση για να δοκιμάσετε τις διαφορές μεταξύ των μέσων όρων των ομάδων, η υπόθεση ότι οι τιμές του Y - και κατά συνέπεια παραμένουν κανονικά κατανέμονται, δεν διαδραματίζει σημαντικό ρόλο: οι δοκιμές ισχυρίζονται σε σχέση με τον απουσία της κανονικότητας. Είναι σημαντικό να αναλύσετε τα δεδομένα χρησιμοποιώντας διαγράμματα. Για παράδειγμα περιλαμβάνεται στην υπερκατασκευή Ανάλυση δεδομένων εργαλείο Οπισθοδρόμηση.

Εάν τα δεδομένα δεν αντιστοιχούν στις παραδοχές γραμμικής παλινδρόμησης, υπάρχουν και άλλες προσεγγίσεις εκτός από το γραμμικό. Ένας από αυτούς είναι μια λογική παλινδρόμηση (εικ. 20). Κοντά στις ανώτερες και χαμηλότερες οριακές τιμές της μεταβλητής του προγνωστικού παράγοντα, η γραμμική παλινδρόμηση οδηγεί σε μη ρεαλιστικές προβλέψεις.

Σύκο. 20. Λογιστική παλινδρόμηση

Στο ΣΧ. 6.8 Εμφάνιση των αποτελεσμάτων δύο μεθόδων για την ανάλυση δεδομένων που αποσκοπούν στη μελέτη της σύνδεσης μεταξύ του ετήσιου εισοδήματος και της πιθανότητας αγοράς ενός σπιτιού. Προφανώς, η πιθανότητα να γίνει μια αγορά θα αυξηθεί με το αυξανόμενο εισόδημα. Τα διαγράμματα απλοποιούν τον προσδιορισμό των διαφορών μεταξύ των αποτελεσμάτων που προβλέπουν την πιθανότητα αγοράς ενός σπιτιού μέσω γραμμικής παλινδρόμησης και τα αποτελέσματα που μπορείτε να χρησιμοποιήσετε μια άλλη προσέγγιση.

Στη γλώσσα των στατιστικών, η απόρριψη της μηδενικής υπόθεσης, όταν στην πραγματικότητα είναι αλήθεια, ονομάζεται λάθος του είδους.

Σε υπερκατασκευή Ανάλυση δεδομένων Ένα βολικό εργαλείο για τη δημιουργία τυχαίων αριθμών προσφέρεται, παρέχοντας στον χρήστη τη δυνατότητα ρύθμισης της επιθυμητής μορφής κατανομής (για παράδειγμα, φυσιολογικό, διωνυμικό ή poisson), καθώς και τη μέση τιμή και την τυπική απόκλιση.

Διαφορές μεταξύ των λειτουργιών της οικογένειας Student.Rasp ().Ξεκινώντας από το Excel 2010 διαθέσιμο τρία Διαφορετικές μορφές Λειτουργίες που επιστρέφουν στην κατανομή του αριστερού ή / και στα δεξιά της καθορισμένης τιμής Τ-κριτηρίου. Λειτουργία φοιτητών. Το RASP () επιστρέφει το ποντάρισμα της περιοχής κάτω από την καμπύλη διανομής στα αριστερά του καθορισμένου κριτηρίου t που καθορίσατε. Ας υποθέσουμε ότι έχετε 36 παρατηρήσεις και συνεπώς ο αριθμός των βαθμών ελευθερίας για ανάλυση είναι ίση με 34 και η αξία του κριτηρίου T \u003d 1,69. Σε αυτή την περίπτωση, ο τύπος

Student.Rasp (+1.69; 34; αλήθεια)

Επιστρέφει μια τιμή 0,05 ή 5% (Εικ. 21). Το τρίτο επιχείρημα της λειτουργίας του Student.RASP () μπορεί να έχει την έννοια της αλήθειας ή της ψευδούς. Εάν έχει καθοριστεί ίση με την αλήθεια, η λειτουργία επιστρέφει τη σωρευτική περιοχή κάτω από την καμπύλη προς τα αριστερά ενός δεδομένου κριτηρίου Τ, εκφρασμένο με τη μορφή μετοχής. Εάν ισούται με ένα ψέμα, η λειτουργία επιστρέφει το σχετικό ύψος της καμπύλης στο σημείο που αντιστοιχεί στο κριτήριο Τ. Άλλες εκδόσεις της λειτουργίας του Student.Rasp () - Student.Rasp. PX () και Student.Rasp 2x () - Λάβετε ως επιχειρήματα Μόνο η αξία του κριτηρίου Τ και ο αριθμός των βαθμών ελευθερίας και δεν απαιτούν το καθήκον του το τρίτο επιχείρημα.

Σύκο. 21. Η πιο σκούρα σκιασμένη περιοχή στην αριστερή ουρά της κατανομής αντιστοιχεί στο ποσοστό της περιοχής κάτω από την καμπύλη προς τα αριστερά της μεγάλης θετικής αξίας του κριτηρίου Τ-

Για να καθορίσετε την περιοχή στα δεξιά του κριτηρίου Τ, χρησιμοποιήστε έναν από τους φόρμουλες:

1 - Shadent.Rasp (1, 69, 34; Αλήθεια)

Student.Rasp.ph (1,69, 34)

Ολόκληρη η περιοχή κάτω από την καμπύλη πρέπει να είναι 100%, οπότε αφαιρείται από 1 μερίδιο της περιοχής προς τα αριστερά της τιμής του Τ-κριτηρίου, η οποία επιστρέφει τη λειτουργία, δίνει το ποντάρισμα της περιοχής, που βρίσκεται στα δεξιά του κριτηρίου Τ αξία. Μπορεί να φανεί πιο προτιμώμενη επιλογή του άμεσου μεριδίου του τομέα ενδιαφέροντος που σας ενδιαφέρει με τη λειτουργία Student.ph (), όπου είναι η σωστή ουρά της κατανομής (Εικ. 22).

Σύκο. 22. 5% άλφα περιοχή για κατευθυντική δοκιμή

Χρησιμοποιώντας τις λειτουργίες του Student.Rasp () ή Student.Rasp. Το PX () υποδηλώνει ότι έχετε επιλέξει κατευθυνόμενη εργασία εργασίας. Η κατευθυντική υπόθεση εργασίας σε συνδυασμό με την εγκατάσταση της τιμής άλφα σε επίπεδο 5% σημαίνει ότι βάζετε το 5% στη δεξιά ουρά της διανομής. Θα χρειαστεί να απορρίψετε τη μηδενική υπόθεση μόνο εάν η πιθανότητα της αξίας του κριτηρίου Τ-κριτηρίου είναι 5% και λιγότερο. Οι κατευθυντήριες υποθέσεις συνήθως οδηγούν σε πιο ευαίσθητες στατιστικές δοκιμές (αυτή η μεγαλύτερη ευαισθησία ονομάζεται επίσης μεγαλύτερη στατιστική ισχύ).

Με μια άπειρη δοκιμή, η τιμή άλφα παραμένει στο ίδιο επίπεδο 5%, αλλά η κατανομή θα είναι διαφορετική. Δεδομένου ότι πρέπει να επιτρέψετε δύο αποτελέσματα, η πιθανότητα ενός ψευδούς θετικού αποτελέσματος πρέπει να κατανεμηθεί μεταξύ δύο ουρών διανομής. Είναι γενικά αποδεκτό να διανέμει την πιθανότητα αυτή εξίσου (Εικ. 23).

Χρησιμοποιώντας την ίδια ληφθείσα αξία του κριτηρίου Τ και τον ίδιο αριθμό βαθμών ελευθερίας, όπως στο προηγούμενο παράδειγμα, χρησιμοποιήστε τον τύπο

Student.RASP 2X (1,69, 34)

Χωρίς ιδιαίτερους λόγους, η λειτουργία Student.Sps () Επιστρέφει τον κωδικό σφάλματος # αριθμός!, Εάν παρέχει μια αρνητική τιμή T-κριτηρίου ως το πρώτο όρισμα.

Εάν τα δείγματα περιέχουν διαφορετικό αριθμό δεδομένων, χρησιμοποιήστε μια δοκιμή t δύο σκάσεων με διάφορες διασπορές που περιλαμβάνονται στη συσκευασία Ανάλυση δεδομένων.

Κεφάλαιο 7. Χρησιμοποιώντας την παλινδρόμηση για τη δοκιμή διαφορών μεταξύ των μέσων όρων των ομάδων

Οι μεταβλητές που εμφανίστηκαν προηγουμένως υπό το όνομα των προβλεπόμενων μεταβλητών, σε αυτό το κεφάλαιο θα κληθούν αποτελεσματικές μεταβλητές και αντί των όρων μεταβλητές προγνωστικού παράγοντα θα χρησιμοποιηθούν οι μεταβλητές του όρου.

Η απλούστερη από τις προσεγγίσεις στην κωδικοποίηση της ονομαστικής μεταβλητής είναι Κωδικοποίηση Fictive (Εικ. 24).

Σύκο. 24. Ανάλυση παλινδρόμησης που βασίζεται σε πλασματική κωδικοποίηση

Όταν χρησιμοποιείτε την πλασματική κωδικοποίηση οποιουδήποτε είδους, πρέπει να ακολουθηθούν οι κανόνες:

  • Ο αριθμός των στηλών που προορίζεται για νέα δεδομένα πρέπει να είναι ίση με τον αριθμό των επιπέδων παράγοντα μείον
  • Κάθε διάνυσμα αντιπροσωπεύει ένα επίπεδο παράγοντα.
  • Θέματα ενός από τα επίπεδα που συχνά είναι η ομάδα ελέγχου λαμβάνει τον κωδικό 0 σε όλους τους φορείς.

Τύπος σε κύτταρα F2: H6 \u003d Linene (Α2: Α22, C2: D22, Αλήθεια) Επιστρέφει στατιστικά στοιχεία της παλινδρόμησης. Για σύγκριση στο ΣΧ. 24 Εμφάνιση των αποτελεσμάτων της παραδοσιακής ανάλυσης διασποράς που επιστρέφονται από το εργαλείο Ανάλυση διασποράς ενός παράγοντα εποικοδόμημα Ανάλυση δεδομένων.

Που κωδικοποιούν αποτελέσματα.Σε έναν άλλο τύπο κωδικοποίησης, που ονομάζεται Κωδικοποιώντας τα αποτελέσματα Ο μέσος όρος κάθε ομάδας συγκρίνεται με τον μέσο μέσο όρο της ομάδας. Αυτή η άποψη των επιδράσεων κωδικοποίησης οφείλεται στη χρήση της τιμής -1 αντί του 0 ως κώδικα για μια ομάδα που λαμβάνει τον ίδιο κώδικα σε όλους τους φορείς κώδικα (Εικ. 25).

Σύκο. 25. Κωδικοποίηση Effect

Όταν χρησιμοποιείται πλασματική κωδικοποίηση, η τιμή της σταθεράς που επιστρέφεται από τη γραμμή γραμμικής () συμπίπτει με τη μέση ομάδα, οι οποίες εκχωρούν μηδέν σε όλους τους φορείς (συνήθως η ομάδα ελέγχου). Στην περίπτωση που κωδικοποιεί τα αποτελέσματα της σταθεράς είναι ίση με τον γενικό μέσο όρο (Cell J2).

Το συνολικό γραμμικό μοντέλο είναι ένας χρήσιμος τρόπος για να εννοήσετε τα συστατικά της αξίας της μεταβλητής που προκύπτουν:

Y ij \u003d μ + α j + ε ij

Η χρήση ελληνικών επιστολών σε αυτόν τον τύπο αντί της Λατινικής δίνει έμφαση στο γεγονός ότι ανήκει στον γενικό πληθυσμό, από το οποίο εξάγονται δείγματα, αλλά μπορεί να ξαναγραφεί υπό τη μορφή που αναφέρεται ότι αναφέρεται στα δείγματα που ανακτώνται από τον δημοσιευμένο γενικό πληθυσμό:

Y ij \u003d y̅ + a j + e ij

Η ιδέα είναι ότι κάθε παρατήρηση y ij μπορεί να θεωρηθεί ως το άθροισμα των ακόλουθων τριών συστατικών: Γενικός μέσος όρος, μ? Αποτέλεσμα της επεξεργασίας J, και J; Η αξία του Ε IJ, η οποία αντιπροσωπεύει την απόκλιση του ατομικού ποσοτικού δείκτη Y IJ από τη συνδυασμένη τιμή του συνολικού μέσου όρου και Αποτέλεσμα j-th Επεξεργασία (Εικ. 26). Ο σκοπός της εξίσωσης παλινδρόμησης είναι η ελαχιστοποίηση του ποσού των τετραγώνων των υπολειμμάτων.

Σύκο. 26. Παρατηρήσεις σχετικά με τα συστατικά του γενικού γραμμικού μοντέλου

Παραγοντική ανάλυση.Εάν η σχέση μεταξύ της αποτελεσματικής μεταβλητής και ταυτόχρονα διερευνήθηκε δύο ή περισσότερους παράγοντες, τότε σε αυτή την περίπτωση μιλούν για τη χρήση ανάλυσης παράγοντα. Η προσθήκη ενός ή περισσοτέρων παραγόντων σε ανάλυση διασποράς ενός παράγοντα μπορεί να αυξήσει τη στατιστική ισχύ. Σε ανάλυση διασποράς ενός παράγοντα, η παραλλαγή μιας αποτελεσματικής μεταβλητής που δεν μπορεί να αποδοθεί στον παράγοντα περιλαμβάνεται στο υπολειμματικό μέσο όρο. Αλλά μπορεί να είναι ότι αυτή η παραλλαγή είναι πλεκτά με έναν άλλο παράγοντα. Στη συνέχεια, αυτή η παραλλαγή μπορεί να αφαιρεθεί από το μέσο τετραγωνικό σφάλμα, τη μείωση της οποίας οδηγεί σε αύξηση των τιμών του κριτηρίου F και επομένως, σε αύξηση της στατιστικής ισχύος της δοκιμής. Εποικοδόμημα Ανάλυση δεδομένων Περιλαμβάνει ένα εργαλείο που παρέχει την επεξεργασία δύο παραγόντων ταυτόχρονα (Εικ. 27).

Σύκο. 27. Ανάλυση διασποράς δύο παραγόντων με επαναλήψεις του πακέτου ανάλυσης

Το εργαλείο ανάλυσης διασποράς που χρησιμοποιείται σε αυτό το σχήμα είναι χρήσιμο στο ότι επιστρέφει τον μέσο όρο και τη διασπορά της αποτελεσματικής μεταβλητής, καθώς και η μετρητή τιμή για κάθε ομάδα που περιλαμβάνεται στο σχέδιο. Τραπέζι Ανάλυση διασποράς Εμφανίζονται δύο παράμετροι που λείπουν στις πληροφορίες εξόδου της έκδοσης ενός παράγοντα του εργαλείου ανάλυσης διασποράς. Δώστε προσοχή στις πηγές παραλλαγών Δείγμα και Στήλες στις γραμμές 27 και 28. Πηγή παραλλαγών Στήλες Αναφέρεται στο πάτωμα. Παραλλαγή πηγής Δείγμα Αναφέρεται σε οποιαδήποτε μεταβλητή, οι τιμές των οποίων καταλαμβάνουν διάφορες γραμμές. Στο ΣΧ. 27 Οι τιμές για την ομάδα των σιτηρών βρίσκονται σε γραμμές 2-6, η ομάδα εγκεφαλικών ομάδων - στις γραμμές 7-11 και η ομάδα των εξημέρωσης - στις γραμμές 12-16.

Το κύριο σημείο είναι ότι και οι δύο παράγοντες, το πάτωμα (η υπογραφή των στηλών στο κύτταρο Ε28) και της θεραπείας (υπογραφή δείγματος στο κύτταρο Ε27) περιλαμβάνονται στην ανάλυση του πίνακα ως πηγές παραλλαγής. Το μέσο για τους άνδρες διαφέρουν από το μέσο για τις γυναίκες, και αυτό δημιουργεί πηγή παραλλαγής. Ο μέσος όρος για τρεις τύπους θεραπείας διακρίνεται επίσης - τώρα έχετε άλλη πηγή παραλλαγής. Υπάρχει επίσης μια τρίτη πηγή - αλληλεπίδραση, η οποία αναφέρεται στη συνδυασμένη επίδραση των μεταβλητών και της θεραπείας σεξ.

ΚΕΦΑΛΑΙΟ 8. ΑΝΑΛΥΣΗ ΣΥΝΑΝΤΗΣΗΣ

Η ανάλυση της συνδιακύμανσης, ή η AncoVA (ανάλυση της επvρώμης) μειώνει τις αντισταθμίσεις και αυξάνει τη στατιστική ισχύ. Επιτρέψτε μου να σας υπενθυμίσω ότι ένας από τους τρόπους αξιολόγησης της αξιοπιστίας Εξίσωση παλινδρόμησης Οι δοκιμές F:

F \u003d καμινάδα κατεύθυνσης / κ. Υπολειπόμενη

Όταν το MS (μέση τετράγωνο) είναι ένα μεσαίο τετράγωνο και η παλινδρόμηση και οι υπολειμματικοί δείκτες δείχνουν την παλινδρόμηση και τα υπολειπόμενα συστατικά, αντίστοιχα. Ο υπολογισμός του υπολείμματος MS πραγματοποιείται από τον τύπο:

MS Residual \u003d SS υπολειπόμενο / DF υπολειμματικό

Όταν το SS (Sum of Squares) είναι το άθροισμα των τετραγώνων, ένα DF είναι ο αριθμός των βαθμών ελευθερίας. Όταν προσθέτετε covarialce στην εξίσωση παλινδρόμησης, κάποιο μερίδιο της συνολικής πλατείας των τετραγώνων δεν περιλαμβάνεται στο SS Residuai, αλλά στην παλινδρόμηση SS. Αυτό οδηγεί σε μείωση της SS Residua L και συνεπώς η MS υπολείμματα. Το μικρότερο κράτος μέλος, τόσο μεγαλύτερο το κριτήριο F και το πιο πιθανό ότι απορρίπτετε τη μηδενική υπόθεση σχετικά με την απουσία διαφορών μεταξύ του μέσου όρου. Ως αποτέλεσμα, ανακατανέμεστε τη μεταβλητότητα της αποτελεσματικής μεταβλητής. Στην ANOVA, όταν δεν λαμβάνεται υπόψη η Covariance, η μεταβλητότητα πηγαίνει σε λάθος. Αλλά στην Ancova μέρος της μεταβλητότητας, που πιστεύεται προηγουμένως στο σφάλμα, αποδίδεται σε ένα συμπαγές και γίνεται μέρος της παλινδρόμησης SS.

Εξετάστε ένα παράδειγμα στο οποίο αναλύεται η ίδια σειρά δεδομένων χρησιμοποιώντας την ANOVA και στη συνέχεια χρησιμοποιώντας την Ancova (Σχήμα 28).

Σύκο. 28. Ανάλυση Anova υποδεικνύει ότι τα αποτελέσματα που προέκυψαν χρησιμοποιώντας την εξίσωση παλινδρόμησης είναι αναξιόπιστα

Η μελέτη συγκρίνει τις σχετικές επιπτώσεις των φυσικών ασκήσεων, την ανάπτυξη μυϊκής αντοχής και των γνωστικών ασκήσεων (Soloing Crosswords), ενεργοποίηση της εγκεφαλικής δραστηριότητας. Τα άτομα κατανεμήθηκαν τυχαία σε δύο ομάδες, έτσι ώστε στην αρχή του πειράματος και οι δύο ομάδες ήταν υπό τους ίδιους όρους. Μετά από τρεις μήνες, μετρήθηκαν τα γνωστικά χαρακτηριστικά των θεμάτων. Τα αποτελέσματα αυτών των μετρήσεων δίδονται στη στήλη V.

Στην περιοχή Α2: C21, τα δεδομένα προέλευσης που μεταδίδονται στις γραμμικές () λειτουργίες για την εκτέλεση της ανάλυσης χρησιμοποιώντας την κωδικοποίηση των αποτελεσμάτων. Τα αποτελέσματα της λειτουργίας της γραμμικής () δίνονται στην περιοχή Ε2: F6, όπου στο κύτταρο Ε2 εμφανίζει τον συντελεστή παλινδρόμησης που σχετίζεται με τον φορέα πρόσκρουσης. Το κύτταρο Ε8 περιέχει ένα κριτήριο Τ \u003d 0,93 και η αξιοπιστία αυτού του κριτηρίου Τ που δοκιμάζεται στο κύτταρο Ε9. Η τιμή που περιέχεται στο κελί Ε9 λέει ότι η πιθανότητα να ικανοποιηθεί η διαφορά μεταξύ των μέσων όρων του ομίλου που παρατηρήθηκε σε αυτό το πείραμα είναι 36%, εάν στον γενικό πληθυσμό, οι μέσοι όροι του Ομίλου είναι ίσοι. Μόνο μερικοί αναγνωρίζουν αυτό το αποτέλεσμα είναι στατιστικά σημαντικό.

Στο ΣΧ. Το 29 δείχνει τι θα συμβεί όταν προσθέτετε την κυριαρχία στην ανάλυση. Στην περίπτωση αυτή, πρόσθεσα την ηλικία κάθε υποκειμένου σε ένα σύνολο δεδομένων. Ο συντελεστής προσδιορισμού R2 για την εξίσωση παλινδρόμησης, η οποία χρησιμοποιεί τα covarortors, είναι 0,80 (κυψέλη F4). Η τιμή του R2 στην περιοχή F15: G19, στην οποία αναπαράγομαι τα αποτελέσματα της ANOVA που ελήφθησαν χωρίς τη χρήση των Covariates είναι μόνο 0,05 (Cell F17). Ως εκ τούτου, η εξίσωση παλινδρόμησης, η οποία περιλαμβάνει το covariate, προβλέπει τις τιμές του μεταβλητού γνωστικού δείκτη πολύ πιο ακριβής από τη χρήση της χρήσης μόνο του φορέα. Για την Ancova, η πιθανότητα τυχαίας απόκτησης της τιμής του κριτηρίου F που εμφανίζεται στο κύτταρο F5 είναι μικρότερο από 0,01%.

Σύκο. 29. Η Ancova επιστρέφει μια εντελώς διαφορετική εικόνα.

Παλινδρόμηση στο πρόγραμμα Excel

Η επεξεργασία στατιστικών δεδομένων μπορεί επίσης να πραγματοποιηθεί χρησιμοποιώντας την υπερκατασκευή του πακέτου ανάλυσης στο μενού "Υπηρεσία". Στο Excel 2003, αν το άνοιγμα ΥΠΗΡΕΣΙΑ, μην βρείτε την καρτέλα ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝκαι, στη συνέχεια, κάντε κλικ στο αριστερό πλήκτρο του ποντικιού Ανοίξτε την καρτέλα Εποικοδόμημα και αντίθετο στοιχείο Πακέτο ανάλυσης Κάνοντας κλικ στο αριστερό πλήκτρο του ποντικιού, βάζουμε ένα τσιμπούρι (Εικ. 17).

Σύκο. 17. Παράθυρο Εποικοδόμημα

Μετά από αυτό στο μενού ΥΠΗΡΕΣΙΑ Εμφανίζεται η καρτέλα ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ.

Στο Excel 2007 για εγκατάσταση Ανάλυση συσκευασίας Πρέπει να κάνετε κλικ στο κουμπί Office στην επάνω αριστερή γωνία του φύλλου (Εικ. 18Α). Επόμενο κάντε κλικ στο κουμπί Ρυθμίσεις Excel. Στο παράθυρο που εμφανίζεται Ρυθμίσεις Excel Κάντε κλικ στο αριστερό κουμπί του ποντικιού στο στοιχείο Εποικοδόμημα και στο δεξιό μέρος της λίστας του καταλόγου επιλέξτε το στοιχείο Πακέτο ανάλυσης.Στη συνέχεια, κάντε κλικ στο Εντάξει.


Ρυθμίσεις Excel Κουμπί "Γραφείο"

Σύκο. 18. ΕΓΚΑΤΑΣΤΑΣΗ Ανάλυση συσκευασίας Στο Excel 2007.

Για να εγκατασταθεί το πακέτο ανάλυσης, κάντε κλικ στο κουμπί ΠηγαίνωΒρίσκεται κάτω από τα ανοιχτά παράθυρα. Θα εμφανιστεί, φαίνεται στο Σχ. 12. Σημειώστε το αντίθετο Ανάλυση συσκευασίας.Στην καρτέλα ΔΕΔΟΜΕΝΑ Θα εμφανιστεί ένα κουμπί ΑΝΑΛΥΣΗ ΔΕΔΟΜΕΝΩΝ(Εικ. 19).

Από τα προτεινόμενα στοιχεία επιλέγει το στοιχείο " ΟΠΙΣΘΟΔΡΟΜΗΣΗ"Και κάντε κλικ σε αυτό με το αριστερό πλήκτρο του ποντικιού. Στη συνέχεια, κάντε κλικ στο OK.

Εμφανίζεται ένα παράθυρο που φαίνεται στο ΣΧ. 21.

Εργαλείο ανάλυσης " ΟΠΙΣΘΟΔΡΟΜΗΣΗ»Χρησιμοποιείται για να επιλέξετε ένα πρόγραμμα για ένα σύνολο παρατηρήσεων χρησιμοποιώντας τη μικρότερη πλατεία μέθοδο. Η ύφεση χρησιμοποιείται για την ανάλυση της πρόσκρουσης σε ξεχωριστές εξαρτημένες μεταβλητές τιμές μιας ή περισσοτέρων ανεξάρτητων μεταβλητών. Για παράδειγμα, ο αθλητισμός του αθλητή επηρεάζει διάφορους παράγοντες, συμπεριλαμβανομένης της ηλικίας, της ανάπτυξης και του βάρους. Μπορείτε να υπολογίσετε τον βαθμό επιρροής καθενός από αυτούς τους τρεις παράγοντες με βάση τα αποτελέσματα της απόδοσης του αθλητή και στη συνέχεια να χρησιμοποιήσετε τα ληφθέντα δεδομένα για να προβλέψετε την απόδοση άλλου αθλητή.

Το εργαλείο ύφεσης χρησιμοποιεί μια λειτουργία Λινήλος.

Κουτί διαλόγου "παλινδρόμηση"

Ετικέτες Ελέγξτε το πλαίσιο εάν η πρώτη γραμμή ή η πρώτη στήλη της περιοχής εισόδου περιέχει τίτλους. Κατάργηση αυτού του πλαισίου ελέγχου εάν λείπουν οι κεφαλίδες. Στην περίπτωση αυτή, οι κατάλληλες κεφαλίδες για τον πίνακα εξόδου δεδομένων θα δημιουργηθούν αυτόματα.

Επίπεδο αξιοπιστίας Ελέγξτε το πλαίσιο ελέγχου για να ενεργοποιήσετε ένα επιπλέον επίπεδο στον πίνακα εξόδου. Στο κατάλληλο πεδίο, εισάγετε το επίπεδο αξιοπιστίας που πρέπει να εφαρμοστεί, εκτός από το επίπεδο του 95% που χρησιμοποιείται από προεπιλογή.

Συνεχής - μηδέν Επιλέξτε το πλαίσιο ελέγχου έτσι ώστε η γραμμή παλινδρόμησης να διέρχεται από την προέλευση των συντεταγμένων.

Διάστημα εξόδου Εισάγετε τη σύνδεση στο αριστερό ανώτερο κύτταρο της περιοχής εξόδου. Πάρτε τουλάχιστον επτά στήλες για τον πίνακα εξόδου των αποτελεσμάτων, τα οποία θα περιλαμβάνουν: αποτελέσματα ανάλυσης διασποράς, συντελεστές, τυποποιημένο σφάλμα υπολογισμού Υ, ακτινικές αποκλίσεις, αριθμός παρατήρησης, τυποποιημένων σφαλμάτων για συντελεστές.

Νέο λίστα εργασιών Ρυθμίστε τη διακόπτη σε αυτή τη θέση για να ανοίξετε ένα νέο φύλλο στο βιβλίο και τοποθετήστε τα αποτελέσματα ανάλυσης ξεκινώντας από το κύτταρο Α1. Εάν είναι απαραίτητο, εισαγάγετε ένα όνομα για ένα νέο φύλλο στο πεδίο που βρίσκεται απέναντι από την αντίστοιχη θέση του διακόπτη.

Νέο βιβλίο εργασίας Ορίστε τη διακόπτη σε αυτή τη θέση για να δημιουργήσετε ένα νέο βιβλίο στο οποίο θα προστεθούν τα αποτελέσματα σε ένα νέο φύλλο.

Ελέγξτε το πλαίσιο ελέγχου για να ενεργοποιήσετε τον πίνακα εξόδου.

Τα τυποποιημένα υπολείμματα ελέγχουν το πλαίσιο για να ενεργοποιήσετε τα τυποποιημένα κατάλοιπα στον πίνακα εξόδου.

Προγραμματίστε το πλαίσιο ελέγχου για να δημιουργήσετε υπολειπόμενα γραφικά για κάθε ανεξάρτητη μεταβλητή.

Επιλέξτε το χρονοδιάγραμμα επιλογής για να δημιουργήσετε την εξάρτηση των προβλεπόμενων τιμών από την παρατηρήσιμη.

Διάγραμμα κανονικής πιθανότητας Ελέγξτε το πλαίσιο για να δημιουργήσετε ένα γράφημα μιας κανονικής πιθανότητας.

Λειτουργία Λινήλος

Για να πραγματοποιήσετε τους υπολογισμούς, διαθέτουμε τον κέρσορα στο κελί στο οποίο θέλουμε να εμφανίσουμε τη μέση τιμή και να κάνετε κλικ στο πλήκτρο πληκτρολογίου \u003d. Στη συνέχεια στο πεδίο Όνομα, καθορίστε την επιθυμητή λειτουργία, για παράδειγμα Srnzoke (Εικ. 22).


Σύκο. 22 Αναζήτηση λειτουργίας στο πρόγραμμα Excel 2003

Αν στο πεδίο ΟΝΟΜΑ Το όνομα λειτουργίας δεν εμφανίστηκε, τότε το αριστερό κουμπί του ποντικιού κάντε κλικ στο τρίγωνο δίπλα στο πεδίο, μετά από αυτό το παράθυρο με τη λίστα των λειτουργιών θα εμφανιστεί. Εάν αυτή η λειτουργία δεν βρίσκεται στη λίστα, τότε πιέζεται το αριστερό πλήκτρο του ποντικιού στο στοιχείο λίστας. Άλλες λειτουργίεςθα εμφανιστεί το παράθυρο διαλόγου Master των λειτουργιών, στην οποία, με τη βοήθεια μιας κάθετης κύλισης, επιλέξτε την επιθυμητή λειτουργία, επισημάνετε το με τον κέρσορα και κάντε κλικ στο Εντάξει (Εικ. 23).

Σύκο. 23. Δάσκαλος λειτουργιών

Για να αναζητήσετε μια λειτουργία στο πρόγραμμα Excel 2007, οποιαδήποτε καρτέλα μπορεί να ανοίξει στο μενού, στη συνέχεια για υπολογισμούς, διαθέτουμε τον κέρσορα στο κελί στο οποίο θέλουμε να εμφανίσουμε τη μέση τιμή και να κάνετε κλικ στο πλήκτρο πληκτρολογίου \u003d. Στη συνέχεια στο πεδίο Όνομα υποδεικνύει τη λειτουργία Srnzoke. Το παράθυρο για τον υπολογισμό της λειτουργίας είναι παρόμοιο με εκείνες που δίνονται στο Excel 2003.

Μπορείτε επίσης να επιλέξετε την καρτέλα Τύπος και κάντε κλικ στο αριστερό πλήκτρο του ποντικιού στο κουμπί " Τοποθετήστε μια λειτουργία"(Εικ. 24), θα εμφανιστεί το παράθυρο Master των λειτουργιών, Ποιος τύπος είναι παρόμοιος με το Excel 2003. Επίσης στο μενού μπορεί να επιλέξει αμέσως μια κατηγορία λειτουργιών (πρόσφατα χρησιμοποιούμενη, οικονομική, λογική, ημερομηνία και ώρα, μαθηματικές, άλλες λειτουργίες), στην οποία θα αναζητήσουμε την επιθυμητή λειτουργία.

Άλλες λειτουργίες Σύνδεσμοι και συστοιχίες Μαθηματικός

Σύκο. 24 Επιλέξτε μια λειτουργία στο Excel 2007

Λειτουργία Λινήλος Υπολογίζει τα στατιστικά στοιχεία για μια σειρά χρησιμοποιώντας τη μέθοδο των ελάχιστων τετραγώνων για τον υπολογισμό της άμεσης γραμμής που προσεγγίζει καλύτερα τα διαθέσιμα δεδομένα και στη συνέχεια επιστρέφει έναν πίνακα που περιγράφει την προκύπτουσα ευθεία. Μπορείτε επίσης να συνδυάσετε τη λειτουργία Λινήλος Με άλλες λειτουργίες για τον υπολογισμό άλλων τύπων μοντέλων που είναι γραμμικές σε άγνωστες παραμέτρους (οι οποίες είναι άγνωστες παραμέτρους των οποίων είναι γραμμικές), συμπεριλαμβανομένων πολυωνυμικών, λογαριθμικών, εκθετικών και γραμμών ισχύος. Δεδομένου ότι η συστοιχία των τιμών επιστρέφεται, η λειτουργία πρέπει να ρυθμιστεί ως τύπος συστοιχίας.

Η εξίσωση για μια ευθεία γραμμή έχει την ακόλουθη φόρμα:

(στην περίπτωση αρκετών ορίων των τιμών x),

Όταν η εξαρτημένη τιμή Υ είναι η λειτουργία μιας ανεξάρτητης τιμής Χ, οι τιμές m είναι συντελεστές που αντιστοιχούν σε κάθε ανεξάρτητη μεταβλητή x και b είναι σταθερή. Παρακαλείστε να σημειώσετε ότι y, x και m μπορεί να είναι φορείς. Λειτουργία Λινήλος Επιστρέφει έναν πίνακα . Λινήλος Μπορεί επίσης να επιστρέψει πρόσθετες στατιστικές παλινδρόμησης.

Λινήλος(γνωστές_stations_y; grenal_stations_x; const; στατιστικά στοιχεία)

Το Restonent_Stations_y είναι ένα σύνολο τιμών y που είναι ήδη γνωστές για τον λόγο.

Εάν η συστοιχία του Resender_Stations_y έχει μία στήλη, τότε κάθε στήλη του συστοιχιού που είναι γνωστόςring_stations_x ερμηνεύεται ως ξεχωριστή μεταβλητή.

Εάν η συστοιχία του Resender_stations_y έχει μια γραμμή, κάθε γραμμή του Array Renited_stations_x ερμηνεύεται ως ξεχωριστή μεταβλητή.

Το Margeten_name_x είναι ένα προαιρετικό σύνολο τιμών Χ που είναι ήδη γνωστές για την αναλογία.

Μια σειρά από γνωστού_nation_x μπορεί να περιέχει ένα ή περισσότερα σύνολα μεταβλητών. Εάν χρησιμοποιείται μόνο μία μεταβλητή, τότε οι Arressers_Night_Date_y και είναι γνωστές_name_x ενδέχεται να έχουν οποιαδήποτε μορφή - υπό την προϋπόθεση ότι έχουν την ίδια διάσταση. Εάν χρησιμοποιούνται περισσότερες από μία μεταβλητές, τότε ξέρεις_stations_y πρέπει να είναι ένας φορέας (δηλ. Ένα διάστημα μιας μονής γραμμής ή ενός πλάτους μιας στήλης).

Εάν παραλείπεται μια σειρά από restress_stations_x, θεωρείται ότι αυτή η συστοιχία (1, 2, 3, ...) έχει το ίδιο μέγεθος με μια σειρά από restraction_y.

Const - μια λογική τιμή που υποδεικνύει αν η σταθερά b είναι ίση με 0.

Εάν το επιχείρημα "const" έχει σημασία αληθεί ή παραλειφθεί, τότε η σταθερά Β υπολογίζεται με τον συνήθη τρόπο.

Εάν το όρισμα "Const" έχει σημασία ένα ψέμα, τότε η τιμή Β συνδέεται ίση με 0 και οι τιμές M επιλέγονται με τέτοιο τρόπο ώστε να εκτελείται ο λόγος.

Στατιστικά στοιχεία - μια λογική αξία που υποδεικνύει εάν θα επιστρέψουν πρόσθετα στατιστικά στοιχεία σχετικά με την παλινδρόμηση.

Εάν το επιχείρημα "στατιστικών στοιχείων" είναι αληθινές, η γραμμική λειτουργία επιστρέφει πρόσθετα στατιστικά στοιχεία παλινδρόμησης. Η επιστρεφόμενη συστοιχία θα έχει την ακόλουθη μορφή: (mn, mn-1, ..., m1, b: sen, sen-1, ...; se1; seb: r2; sey: f; df: ssreg; ssresid) .

Εάν το επιχείρημα "στατιστικών στοιχείων" έχει σημασία ένα ψέμα ή παραλειφθεί, η γραμμική λειτουργία επιστρέφει μόνο τους συντελεστές m και μόνιμο b.

Πρόσθετα στατιστικά στοιχεία παλινδρόμησης.

αξία Περιγραφή SE1, SE2, ..., Sen Τιμές τιμές σφάλματος για συντελεστές M1, M2, ..., MN. Seb. Η τυπική τιμή του σφάλματος για τη σταθερά B (SEB \u003d # n / d, εάν το όρισμα "const" έχει σημασία ένα ψέμα). R2 Τον συντελεστή του προσδιορισμού. Οι πραγματικές τιμές του Υ συγκρίνονται και οι τιμές που λαμβάνονται από την άμεση εξίσωση. Σύμφωνα με τα αποτελέσματα της σύγκρισης, ο συντελεστής του προσδιορισμού υπολογίζεται κανονικοποιημένος από 0 σε 1. εάν είναι 1, τότε υπάρχει πλήρης συσχέτιση με το μοντέλο, δηλαδή τις διαφορές μεταξύ των πραγματικών και εκτιμώμενων τιμών του y δεν υπάρχει. Στην αντίθετη περίπτωση, εάν ο συντελεστής του ντετερμινισμού είναι 0, για να χρησιμοποιήσετε την εξίσωση παλινδρόμησης για την πρόβλεψη των τιμών που δεν έχει νόημα. Για περισσότερες πληροφορίες σχετικά με τις μεθόδους υπολογισμού του R2, ανατρέξτε στην ενότητα "Παρατηρήσεις" στο τέλος αυτής της ενότητας. Άχρηστη. Πρότυπο σφάλμα για την εκτίμηση του Y. ΦΑ. Στατιστικές F ή παρατηρούμενη τιμή F. Οι στατιστικές F χρησιμοποιούνται για να προσδιοριστεί εάν μια τυχαία παρατηρήσιμη σχέση μεταξύ εξαρτημένων και ανεξάρτητων μεταβλητών είναι. df. Βαθμοί ελευθερίας. Οι βαθμοί της ελευθερίας είναι χρήσιμοι για την εξεύρεση κρίσιμων τιμών σε ένα στατιστικό τραπέζι. Για να προσδιορίσετε το επίπεδο αξιοπιστίας του μοντέλου, πρέπει να συγκρίνετε τις τιμές σε έναν πίνακα με τα Στατιστικά F που επιστρέφονται από τη γραμμική λειτουργία. Για περισσότερες πληροφορίες σχετικά με τον υπολογισμό της τιμής του DF, ανατρέξτε στην ενότητα "Παρατηρήσεις" στο τέλος αυτής της ενότητας. Στη συνέχεια, στο Παράδειγμα 4, εμφανίζεται η χρήση τιμών F και DF. ssreg. Ποσότητα παλινδρόμησης των τετραγώνων. Ssresid Υπολειμματικό άθροισμα τετραγώνων. Για περισσότερες πληροφορίες σχετικά με τον υπολογισμό των τιμών του Ssreg και Ssresid, ανατρέξτε στην ενότητα "Παρατηρήσεις" στο τέλος αυτής της ενότητας.

Το παρακάτω σχήμα δείχνει, με ποια σειρά επιστρέφονται πρόσθετα στατιστικά στοιχεία παλινδρόμησης.

Παρατηρήσεις:

Οποιαδήποτε άμεση μπορεί να περιγραφεί από την κλίση και τη διασταύρωση με τον άξονα Υ:

Κλίση (m): για να προσδιορίσετε την κλίση της ευθείας γραμμής, που συνήθως δηλώνεται από το m, πρέπει να λάβετε δύο σημεία άμεση και? Η κλίση θα είναι ίση .

Y-διασταύρωση (b): Y-διασταύρωση απευθείας, συνήθως που συνήθως δηλώνεται από b, είναι η τιμή y για ένα σημείο στο οποίο η άμεση τέμνει τον άξονα Υ.

Η άμεση εξίσωση έχει τη μορφή. Εάν οι τιμές m και b είναι γνωστές, τότε μπορείτε να υπολογίσετε οποιοδήποτε σημείο σε μια ευθεία γραμμή, αντικαθιστώντας τις τιμές του Υ ή Χ στην εξίσωση. Μπορείτε επίσης να χρησιμοποιήσετε τη λειτουργία τάσης.

Εάν υπάρχει μόνο μία ανεξάρτητη μεταβλητή X, μπορείτε να πάρετε μια κλίση και να διασχίζετε απευθείας χρησιμοποιώντας τους ακόλουθους τύπους:

TILT: Δείκτης (γραμμική (γνωστή_Damations_y, world_stations_x); 1)

Y-διασταύρωση: δείκτης (γραμμική (γνωστή_stations_y; render_stations_x); 2)

Η ακρίβεια της προσέγγισης με μια άμεση υπολογισμένη λειτουργία της γραμμικής εξαρτάται από το βαθμό σκέδασης δεδομένων. Όσο πιο κοντά στα δεδομένα στην ευθεία γραμμή, τόσο πιο ακριβές είναι το μοντέλο που χρησιμοποιείται από τη γραμμική λειτουργία. Η γραμμική λειτουργία χρησιμοποιεί τη μέθοδο των ελάχιστων τετραγώνων για να προσδιορίσει την καλύτερη προσέγγιση των δεδομένων. Όταν υπάρχει μόνο μία ανεξάρτητη μεταβλητή x, m και b υπολογίζεται σύμφωνα με τους ακόλουθους τύπους:

Όπου x και y είναι επιλεκτικές μέσες τιμές, για παράδειγμα, x \u003d сраснова (γνωστό_stations_x), και y \u003d srnvov (γνωστό_des_y).

Οι λειτουργίες της προσέγγισης του γραμμικού και του LGRFPRBLB μπορούν να υπολογίσουν την άμεση ή την εκθετική καμπύλη, η οποία περιγράφει καλύτερα τα δεδομένα. Ωστόσο, δεν απαντούν στην ερώτηση του οποίου τα δύο αποτελέσματα είναι πιο κατάλληλα για την επίλυση της εργασίας. Μπορείτε επίσης να υπολογίσετε τη λειτουργία τάσης (consworn_stations_y; render_stations_x) για μια άμεση ή λειτουργία της ανάπτυξης (render_stations_y, consulting_stations_x) για μια εκθετική καμπύλη. Αυτές οι λειτουργίες, αν δεν καθορίσετε το επιχείρημα του New_Nation_X, επιστρέψτε μια σειρά από υπολογιζόμενες τιμές Υ για πραγματικές τιμές Χ σύμφωνα με μια ευθεία ή καμπύλη. Μετά από αυτό, μπορείτε να συγκρίνετε τις υπολογισμένες τιμές με τις πραγματικές τιμές. Μπορείτε επίσης να δημιουργήσετε διαγράμματα για οπτική σύγκριση.

Δίνοντας ανάλυση παλινδρόμησης, το Microsoft Excel υπολογίζει για κάθε τετράγωνο σημείου της διαφοράς μεταξύ της προβλεπόμενης τιμής του y και της πραγματικής τιμής του Y. Το άθροισμα αυτών των τετραγώνων διαφορών ονομάζεται υπολειμματικό άθροισμα των τετραγώνων (ssresid). Το Microsoft Excel υπολογίζει το συνολικό άθροισμα των τετραγώνων (SSTITAL). Εάν η αλήθεια \u003d η αλήθεια ή η αξία αυτού του επιχειρήματος δεν έχει καθοριστεί, το συνολικό άθροισμα των τετραγώνων θα είναι ίσο με το άθροισμα των τετραγώνων της διαφοράς μεταξύ των τιμών των τιμών του y και των μέσων τιμών Του Υ. Με την ανάρτηση \u003d ψέματα, η συνολική ποσότητα τετραγώνων θα είναι ίση με το άθροισμα των τετραγώνων έγκυρων τιμών y (χωρίς να αφαιρέσετε τη μέση τιμή y από την ιδιωτική τιμή y). Μετά από αυτό, η ποσότητα παλινδρόμησης των τετραγώνων μπορεί να υπολογιστεί ως εξής: Ssreg \u003d Ssotal - Ssresid. Όσο μικρότερο είναι το υπολειμματικό άθροισμα των τετραγώνων, τόσο μεγαλύτερη είναι η τιμή του συντελεστή του προσδιορισμού R2, η οποία δείχνει πόσο καλά η εξίσωση που λαμβάνεται με ανάλυση παλινδρόμησης εξηγεί τη σχέση μεταξύ των μεταβλητών. Ο συντελεστής R2 ισούται με το SSREG / SSOTAL.

Σε ορισμένες περιπτώσεις, μία ή περισσότερες στήλες x (αφήστε τις τιμές Υ και Χ είναι σε στήλες) δεν έχουν πρόσθετη πρόβλεψη σε άλλες στήλες X. Με άλλα λόγια, η αφαίρεση μιας ή περισσοτέρων στηλών Χ μπορεί να οδηγήσει στο τιμές Y υπολογιζόμενες με την ίδια ακρίβεια. Σε αυτή την περίπτωση, οι υπερβολικές στήλες X θα αποκλειστούν από το μοντέλο παλινδρόμησης. Αυτό το φαινόμενο ονομάζεται "Collinarity", δεδομένου ότι η περίσσεια στήλη x μπορεί να αντιπροσωπεύεται ως άθροισμα αρκετών μη κενών στηλών. Η γραμμική λειτουργία ελέγχει την κολοκύνιση και αφαιρεί όλες τις υπερβολικές στήλες x από το μοντέλο παλινδρόμησης αν τα ανιχνεύουν. Οι απομακρυσμένες στήλες Χ μπορούν να οριστούν στην έξοδο του γραμμικού από τον συντελεστή 0, και από την τιμή SE του 0. Αφαιρώντας μία ή περισσότερες στήλες, καθώς η υπερβολική αλλαγή της τιμής του DF, δεδομένου ότι εξαρτάται από τον αριθμό των στηλών x, στο πραγματικότητα που χρησιμοποιείται για προδικαστικούς σκοπούς. Για περισσότερες πληροφορίες σχετικά με τον υπολογισμό της τιμής του DF, βλέπε παρακάτω στο Παράδειγμα 4. Όταν αλλάζει η DF, λόγω της αφαίρεσης των περίσσειας στήλης, η τιμή SEY και F αλλάζει επίσης. Συχνά η χρήση της κολλητικότητας δεν συνιστάται. Ωστόσο, θα πρέπει να εφαρμόζεται εάν ορισμένες στήλες Χ περιέχουν 0 ή 1 ως ένδειξη δείκτη αν το πείραμα περιλαμβάνεται σε ξεχωριστή ομάδα. Εάν δεν καθορίζεται η Const \u003d Αλήθεια ή η τιμή αυτού του όρου, η λειτουργία Linene εισάγει μια πρόσθετη στήλη X για την προσομοίωση του σημείου διασταύρωσης. Εάν υπάρχει στήλη με τιμές 1 για να υποδείξει τους άνδρες και 0 - για τις γυναίκες και υπάρχει μια στήλη με τιμές 1 για να υποδείξει τις γυναίκες και 0 - για τους άνδρες, η τελευταία στήλη διαγράφεται, αφού οι τιμές της μπορούν να ληφθεί από μια στήλη με μια "αρσενική ένδειξη".

Υπολογισμός DF για περιπτώσεις που οι στήλες Χ δεν διαγράφονται από το μοντέλο που οφείλεται στην κολοκύθιση εμφανίζεται ως εξής: Εάν υπάρχουν k στήλες known_name_x και της τιμής σύνδεσης \u003d αλήθεια ή μη καθορισμένη, τότε df \u003d n - k - 1. Const \u003d ψέματα, στη συνέχεια df \u003d n - k. Και στις δύο περιπτώσεις, η αφαίρεση των στηλών Χ λόγω της κολλητότητας αυξάνει την τιμή του DF έως 1.

Οι τύποι που οι συστοιχίες επιστροφής πρέπει να εισάγονται ως τύπος συστοιχίας.

Κατά την είσοδο στη σειρά των σταθερών, όπως για παράδειγμα, το όρισμα που είναι γνωστό_name_x θα πρέπει να χρησιμοποιεί ένα σημείο με ένα κόμμα για να διαχωρίσει τις τιμές σε μια σειρά και το κόλον για τη διάσπαση σειρών. Οι διαχωριστές ενδέχεται να είναι διαφορετικοί ανάλογα με τις παραμέτρους που καθορίζονται στο παράθυρο γλώσσας και προτύπων στον πίνακα ελέγχου.

Πρέπει να σημειωθεί ότι οι τιμές του Y που προβλέπονται χρησιμοποιώντας την εξίσωση παλινδρόμησης ενδέχεται να μην είναι σωστές εάν βρίσκονται εκτός των τιμών των τιμών του Υ, οι οποίες χρησιμοποιήθηκαν για τον προσδιορισμό της εξίσωσης.

Ο κύριος αλγόριθμος που χρησιμοποιείται στη λειτουργία ΛινήλοςΔιαφέρει από τον κύριο αλγόριθμο λειτουργιών ΚΛΙΝΩ και ΕΝΟΤΗΤΑ. Η διαφορά μεταξύ των αλγορίθμων μπορεί να οδηγήσει σε διάφορα αποτελέσματα με απροσδιόριστα και κολλάει δεδομένα. Για παράδειγμα, εάν τα σημεία δεδομένων του επιχειρήματος που είναι γνωστά_stations_y είναι ίσες με το 0, και τα σημεία δεδομένων του arrigment_stations_x είναι ίσες με 1, τότε:

Λειτουργία Λινήλος Επιστρέφει την τιμή ίση με 0. Αλγόριθμος λειτουργίας Λινήλος Χρησιμοποιείται για την επιστροφή των κατάλληλων τιμών για τα Collinear Data, και σε αυτή την περίπτωση, μπορεί να βρεθεί τουλάχιστον μία απάντηση.

Λειτουργίες κλίση και κοπεί σφάλμα επιστροφής # υποθέσεις / 0!. Λειτουργίες αλγορίθμου Η κλίση και η περικοπή χρησιμοποιείται για την αναζήτηση μόνο μιας απόκρισης και σε αυτή την περίπτωση μπορεί να υπάρχουν πολλά από αυτά.

Εκτός από τον υπολογισμό των στατιστικών στοιχείων για άλλους τύπους παλινδρόμησης, η γραμμική λειτουργία μπορεί να χρησιμοποιηθεί κατά τον υπολογισμό των ορίων για άλλους τύπους παλινδρόμησης, εισάγοντας τις λειτουργίες των μεταβλητών Χ και Υ ως τις σειρές μεταβλητών Χ και Υ για γραμμική. Για παράδειγμα, ο ακόλουθος τύπος:

Γραμμική (τιμή_y, ralse_x ^ στήλη ($ a: $ c))

Λειτουργεί παρουσία μιας στήλης των τιμών του Υ και μιας στήλης των τιμών Χ για να υπολογίσει την προσέγγιση του κύβου (πολυωνυμικού 3ου βαθμού) της ακόλουθης μορφής:

Ο τύπος μπορεί να αλλάξει για να υπολογίσει άλλους τύπους παλινδρόμησης, αλλά σε ορισμένες περιπτώσεις απαιτείται να ρυθμίσετε τις τιμές εξόδου και άλλα στατιστικά δεδομένα.

Δείχνει την επίδραση ορισμένων τιμών (ανεξάρτητες, ανεξάρτητες) στην εξαρτημένη μεταβλητή. Για παράδειγμα, ως ο αριθμός του οικονομικά ενεργού πληθυσμού στον αριθμό των επιχειρήσεων, οι τιμές των μισθών κλπ. Οι παράμετροι εξαρτώνται. Ή: Πώς να επηρεάζουν τις ξένες επενδύσεις, τις τιμές της ενέργειας και άλλοι. Στο επίπεδο του ΑΕΠ.

Το αποτέλεσμα της ανάλυσης σας επιτρέπει να επισημάνετε τις προτεραιότητες. Και με βάση τους κύριους παράγοντες, προβλέπουν, να σχεδιάσουν την ανάπτυξη τομέων προτεραιότητας, να λαμβάνουν αποφάσεις διαχείρισης.

Η παλινδρόμηση συμβαίνει:

· Γραμμική (y \u003d a + bx);

· Παραβολικό (y \u003d a + bx + cx2).

· Εκθετική (y \u003d a * exp (bx)).

· Ισχύς (y \u003d a * x ^ b);

· Υπερβολική (y \u003d b / x + A);

· Λογαρίδια (y \u003d b * 1n (x) + α);

· Ενδεικτικό (y \u003d a * b ^ x).

Εξετάστε το παράδειγμα, την κατασκευή ενός μοντέλου παλινδρόμησης στο Excel και την ερμηνεία των αποτελεσμάτων. Πάρτε το γραμμικό είδος παλινδρόμησης.

Μια εργασία. Σε 6 επιχειρήσεις, ο μέσος μηνιαίος μισθός και ο αριθμός των καταργούμενων υπαλλήλων αναλύθηκαν. Είναι απαραίτητο να καθοριστεί η εξάρτηση του αριθμού των καταργούμενων υπαλλήλων από τον μέσο μισθό.

Το μοντέλο γραμμικής παλινδρόμησης έχει την ακόλουθη φόρμα:

Y \u003d a 0 + A 1 x 1 + ... + Α στο Χ σε.

Όπου Α είναι οι συντελεστές παλινδρόμησης, οι μεταβλητές που επηρεάζουν το Χ, τον αριθμό των παραγόντων.

Στο παράδειγμά μας, σαν ο δείκτης αυτών που αποστάζονται από αποσταγμένους εργαζόμενους. Επηρεάζοντας τον συντελεστή (x).

Το Excel έχει ενσωματωμένες λειτουργίες με τις οποίες μπορείτε να υπολογίσετε τις παραμέτρους του μοντέλου γραμμικής παλινδρόμησης. Αλλά ταχύτερα θα κάνει ένα πρόσθετο "πακέτο ανάλυσης".

Ενεργοποιήστε ένα ισχυρό αναλυτικό εργαλείο:

1. Πατήστε το κουμπί "Office" και μεταβείτε στην καρτέλα "Ρυθμίσεις Excel". "Προσθέτω".

2. Στο κάτω μέρος, κάτω από την αναπτυσσόμενη λίστα, το πεδίο "Control" θα είναι η επιγραφή "πρόσθετο excel" (εάν δεν υπάρχει, κάντε κλικ στο σωστό πλαίσιο ελέγχου και επιλέξτε). Και το κουμπί "GO". Κάντε κλικ.

3. Ο κατάλογος των διαθέσιμων προσφορών υπερκατασκευής. Επιλέξτε "Πακέτο ανάλυσης" και κάντε κλικ στο OK.

Μετά την ενεργοποίηση, το πρόσθετο θα είναι διαθέσιμο στην καρτέλα Δεδομένων.

Τώρα θα ασχοληθούμε με την άμεση ανάλυση παλινδρόμησης.

1. Ανοίξτε το μενού εργαλείου "Ανάλυση δεδομένων". Επιλέγουμε "παλινδρόμηση".



2. Το μενού ανοίγει για να επιλέξει τις τιμές εισόδου και τις παραμέτρους εξόδου (όπου θα εμφανιστεί το αποτέλεσμα). Στα πεδία για τα δεδομένα προέλευσης, υποδεικνύουμε το εύρος της περιγραφόμενης παραμέτρου (Υ) και το επηρεάζει τον παράγοντα (Χ). Το υπόλοιπο δεν μπορεί να συμπληρώσει.

3. Αφού κάνετε κλικ στο κουμπί OK, το πρόγραμμα εμφανίζει τους υπολογισμούς στο νέο φύλλο (μπορείτε να επιλέξετε το διάστημα για να εμφανιστεί στο τρέχον φύλλο ή να αντιστοιχίσετε μια έξοδο σε ένα νέο βιβλίο).

Πρώτον, δώστε προσοχή στο R-Square και τους συντελεστές.

R-Square - Ο συντελεστής προσδιορισμού. Στο παράδειγμά μας - 0,755, ή 75,5%. Αυτό σημαίνει ότι οι υπολογιζόμενες παραμέτρους του μοντέλου κατά 75,5% εξηγούν τη σχέση μεταξύ των παραμέτρων που μελετήθηκαν. Όσο υψηλότερος είναι ο συντελεστής προσδιορισμού, τόσο καλύτερα το μοντέλο. Καλό - πάνω από 0,8. Κακή - Λιγότερο από 0,5 (μια τέτοια ανάλυση δύσκολα μπορεί να θεωρηθεί λογικό). Στο παράδειγμά μας, "δεν είναι κακό".

Ο συντελεστής 64.1428 δείχνει πώς θα είναι εάν όλες οι μεταβλητές στο υπό εξέταση μοντέλο θα είναι 0. δηλαδή, άλλοι παράγοντες που δεν περιγράφονται στο μοντέλο επηρεάζονται από την τιμή της ανάλυσης της παραμέτρου.

Ο συντελεστής -0,16285 δείχνει το βάρος της μεταβλητής X στο Υ. Δηλαδή, ο μέσος μηνιαίος μισθός μέσα σε αυτό το μοντέλο επηρεάζει την ποσότητα -0,16285 που αναφέρεται με βάρος (αυτό είναι ένας μικρός βαθμός επιρροής). Το σημάδι "-" υποδηλώνει αρνητικό αποτέλεσμα: τόσο περισσότερο μισθό, όσο λιγότερο καταργήθηκε. Τι είναι σωστό.

Συνεχίζοντας το θέμα:
Λινάρι

Ο χρήστης στην ορολογία των προδιαγραφών) είναι ένα λογισμικό στο πλάι του συνδρομητή, το οποίο σας επιτρέπει να λαμβάνετε, να στείλετε, να δείτε και να επεξεργαστείτε ...

Νέα άρθρα
/
Δημοφιλής