Υπολογίστε το άθροισμα των τετραγώνων (SSE)

Συγγραφέας: Charles Brown
Ημερομηνία Δημιουργίας: 9 Φεβρουάριος 2021
Ημερομηνία Ενημέρωσης: 1 Ιούλιος 2024
Anonim
ΠΛΗ10 ΤΕΣΤ 11 - ΑΣΚΗΣΗ 2.1
Βίντεο: ΠΛΗ10 ΤΕΣΤ 11 - ΑΣΚΗΣΗ 2.1

Περιεχόμενο

Το άθροισμα των τετραγώνων, ή SSE, είναι ένας προκαταρκτικός στατιστικός υπολογισμός που οδηγεί σε διαφορετικές τιμές δεδομένων. Όταν έχετε ένα σύνολο τιμών δεδομένων, είναι χρήσιμο να προσδιορίσετε πόσο στενά σχετίζονται αυτές οι τιμές. Πρέπει να οργανώσετε τα δεδομένα σας σε έναν πίνακα και μετά να εκτελέσετε αρκετά απλούς υπολογισμούς. Μόλις βρείτε το SSE για ένα σύνολο δεδομένων, μπορείτε στη συνέχεια να βρείτε τη διακύμανση και την τυπική απόκλιση.

Για να πας

Μέθοδος 1 από 3: Υπολογίστε το SSE με το χέρι

  1. Δημιουργήστε έναν πίνακα τριών στηλών. Ο καθαρότερος τρόπος υπολογισμού του SSE είναι να ξεκινήσετε με έναν πίνακα τριών στηλών. Επισημάνετε τις τρεις στήλες αξία{ displaystyle { text {Value}}}Συμπληρώστε τις λεπτομέρειες. Η πρώτη στήλη περιέχει τις τιμές των μετρήσεών σας. Συμπληρώστε τη στήλη αξία{ displaystyle { text {Value}}}Υπολογίστε το μέσο όρο. Προτού μπορέσετε να υπολογίσετε το σφάλμα για κάθε μέτρηση, πρέπει να υπολογίσετε τη μέση τιμή ολόκληρου του συνόλου δεδομένων.
    • Ο μέσος όρος ενός συνόλου δεδομένων είναι το άθροισμα των τιμών διαιρούμενο με τον αριθμό των τιμών στο σύνολο. Αυτό μπορεί να αναπαρασταθεί συμβολικά, με τη μεταβλητή μ{ displaystyle mu}Υπολογίστε τις μεμονωμένες τιμές σφάλματος. Στη δεύτερη στήλη του πίνακα σας, πρέπει να εισαγάγετε τις τιμές σφάλματος για κάθε τιμή δεδομένων. Το σφάλμα είναι η διαφορά μεταξύ της μέτρησης και του μέσου όρου.
      • Για το δεδομένο σύνολο δεδομένων, αφαιρέστε το μέσο όρο, 98,87, από κάθε μετρούμενη τιμή και συμπληρώστε τη δεύτερη στήλη με τα αποτελέσματα. Αυτοί οι δέκα υπολογισμοί έχουν ως εξής:
        • 99,098,87=0,13{ displaystyle 99.0-98.87 = 0.13}Υπολογίστε το SSE. Στην τρίτη στήλη του πίνακα, βρείτε το τετράγωνο καθεμιάς από τις τιμές που προκύπτουν στη μεσαία στήλη. Αυτά αντιπροσωπεύουν τα τετράγωνα της απόκλισης από το μέσο όρο για κάθε μετρούμενη τιμή δεδομένων.
          • Για κάθε τιμή στη μεσαία στήλη, χρησιμοποιήστε μια αριθμομηχανή για να υπολογίσετε το τετράγωνο. Καταγράψτε τα αποτελέσματα στην τρίτη στήλη, ως εξής:
            • 0,132=0,0169{ displaystyle 0,13 ^ {2} = 0,0169}Προσθέστε τα τετράγωνα των σφαλμάτων. Το τελευταίο βήμα είναι να βρείτε το άθροισμα των τιμών στην τρίτη στήλη. Το επιθυμητό αποτέλεσμα είναι το SSE ή το άθροισμα των τετραγώνων των σφαλμάτων.
              • Για αυτό το σύνολο δεδομένων, το SSE υπολογίζεται προσθέτοντας τις δέκα τιμές στην τρίτη στήλη:
              • ΜΙΚΡΟ.ΜΙΚΡΟ.μι=6,921{ displaystyle SSE = 6.921}Επισημάνετε τις στήλες του υπολογιστικού φύλλου. Δημιουργείτε έναν πίνακα με τρεις στήλες στο Excel, με τις ίδιες τρεις επικεφαλίδες όπως παραπάνω.
                • Στο κελί A1, πληκτρολογήστε "Value" ως επικεφαλίδα.
                • Στο πλαίσιο B1, πληκτρολογήστε "Απόκλιση" ως επικεφαλίδα.
                • Στο πλαίσιο Γ1, πληκτρολογήστε "Απόκλιση τετράγωνο" ως επικεφαλίδα.
              • Εισαγάγετε τα στοιχεία σας. Στην πρώτη στήλη πρέπει να εισαγάγετε τις τιμές των μετρήσεών σας. Εάν το σετ είναι μικρό, μπορείτε εύκολα να το πληκτρολογήσετε με το χέρι. Αν έχετε ένα μεγάλο σύνολο δεδομένων, ίσως χρειαστεί να αντιγράψετε και να επικολλήσετε τα δεδομένα στη στήλη.
              • Προσδιορίστε τον μέσο όρο των σημείων δεδομένων. Το Excel έχει μια συνάρτηση που υπολογίζει τον μέσο όρο για εσάς. Σε ένα κενό κελί κάτω από τον πίνακα δεδομένων σας (δεν έχει σημασία ποιο κελί επιλέγετε), εισαγάγετε τα εξής:
                • = Μέσος όρος (A2: ___)
                • Μην εισάγετε κενό διάστημα. Συμπληρώστε αυτόν τον χώρο με το όνομα κελιού του τελευταίου σημείου δεδομένων σας. Για παράδειγμα, εάν έχετε 100 σημεία δεδομένων, θα χρησιμοποιήσετε τη συνάρτηση:
                  • = Μέσος όρος (A2: A101)
                  • Αυτή η συνάρτηση περιέχει τα δεδομένα από τα κελιά A2 έως A101, επειδή η επάνω σειρά περιέχει τις επικεφαλίδες της στήλης.
                • Όταν πατάτε Enter ή όταν κάνετε κλικ σε άλλο κελί στον πίνακα, το πρόσφατα προγραμματισμένο κελί συμπληρώνεται αυτόματα με τον μέσο όρο των τιμών των δεδομένων σας.
              • Εισαγάγετε τη συνάρτηση για τις μετρήσεις σφαλμάτων. Στο πρώτο κενό κελί στη στήλη "Απόκλιση", εισαγάγετε μια συνάρτηση για να υπολογίσετε τη διαφορά μεταξύ κάθε σημείου δεδομένων και του μέσου όρου. Για να το κάνετε αυτό, χρησιμοποιήστε το όνομα κελιού όπου βρίσκεται ο μέσος όρος. Ας υποθέσουμε ότι έχετε χρησιμοποιήσει το κελί A104 για τώρα.
                • Η συνάρτηση υπολογισμού σφάλματος που εισαγάγετε στο κελί B2 είναι:
                  • = A2- $ A $ 104. Τα σύμβολα του δολαρίου χρειάζονται για να βεβαιωθείτε ότι έχετε κλειδώσει το κουτί A104 για οποιονδήποτε υπολογισμό.
              • Εισαγάγετε τη συνάρτηση για τα τετράγωνα σφάλματα. Στην τρίτη στήλη μπορείτε να δώσετε εντολή στο Excel να υπολογίσει το επιθυμητό τετράγωνο.
                • Στο κελί C2, εισαγάγετε την ακόλουθη συνάρτηση:
                  • = Β2 ^ 2
              • Αντιγράψτε τις λειτουργίες για να γεμίσετε ολόκληρο τον πίνακα. Αφού εισαγάγετε τις συναρτήσεις στο επάνω κελί κάθε στήλης, B2 και C2 αντίστοιχα, πρέπει να συμπληρώσετε ολόκληρο τον πίνακα. Θα μπορούσατε να πληκτρολογήσετε ξανά τη λειτουργία σε οποιαδήποτε γραμμή του πίνακα, αλλά αυτό θα διαρκέσει πάρα πολύ. Χρησιμοποιώντας το ποντίκι σας, επισημάνετε τα κελιά B2 και C2 μαζί και χωρίς να αφήσετε το κουμπί του ποντικιού, σύρετε στο κάτω κελί κάθε στήλης.
                • Υποθέτοντας ότι έχετε 100 σημεία δεδομένων στον πίνακα σας, σύρετε το ποντίκι σας στα κελιά B101 και C101.
                • Όταν απελευθερώνετε το κουμπί του ποντικιού, οι τύποι αντιγράφονται σε όλα τα κελιά του πίνακα. Ο πίνακας πρέπει να συμπληρώνεται αυτόματα με τις υπολογισμένες τιμές.
              • Βρείτε το SSE. Η στήλη C του πίνακα σας περιέχει όλες τις τετραγωνικές τιμές σφαλμάτων. Το τελευταίο βήμα είναι να αφήσετε το Excel να υπολογίσει το άθροισμα αυτών των τιμών.
                • Σε ένα κελί κάτω από τον πίνακα, πιθανώς C102 σε αυτό το παράδειγμα, εισαγάγετε την ακόλουθη συνάρτηση:
                  • = Άθροισμα (C2: C101)
                • Εάν κάνετε κλικ στο Enter ή κάνετε κλικ σε άλλο κελί του πίνακα, θα λάβετε την τιμή SSE των δεδομένων σας.

Μέθοδος 3 από 3: Συσχετίστε το SSE με άλλα στατιστικά

  1. Υπολογίστε την απόκλιση από το SSE. Η εύρεση του SSE για ένα σύνολο δεδομένων είναι γενικά ένα δομικό στοιχείο για την εύρεση άλλων, πιο χρήσιμων, τιμών. Το πρώτο από αυτά είναι η διακύμανση. Η διακύμανση είναι ένα μέτρο του πόσο τα μετρούμενα δεδομένα αποκλίνουν από το μέσο όρο. Είναι στην πραγματικότητα ο μέσος όρος των τετραγώνων διαφορών από τον μέσο όρο.
    • Δεδομένου ότι το SSE είναι το άθροισμα των τετραγώνων σφαλμάτων, μπορείτε να βρείτε τον μέσο όρο (δηλαδή τη διακύμανση) διαιρώντας τον αριθμό των τιμών. Ωστόσο, εάν υπολογίσετε τη διακύμανση μιας σειράς δειγμάτων και όχι ολόκληρου του πληθυσμού, διαιρέστε τη διακύμανση με (n-1) αντί με n. Ετσι:
      • Variance = SSE / n, εάν υπολογίσετε τη διακύμανση ενός ολόκληρου πληθυσμού.
      • Variance = SSE / (n-1), κατά τον υπολογισμό της διακύμανσης ενός δείγματος δεδομένων.
    • Για το δειγματοληπτικό πρόβλημα της θερμοκρασίας των ασθενών, μπορούμε να υποθέσουμε ότι 10 ασθενείς είναι μόνο ένα δείγμα. Επομένως, η διακύμανση υπολογίζεται ως εξής:
      • Διαφορά=SSE(ν1){ displaystyle { text {Variance}} = { frac { text {SSE}} {(n-1)}}}Υπολογίστε την τυπική απόκλιση του SSE. Η τυπική απόκλιση είναι μια συνήθως χρησιμοποιούμενη τιμή που δείχνει πόσο μακριά οι τιμές ενός συνόλου δεδομένων αποκλίνουν από τον μέσο όρο. Η τυπική απόκλιση είναι η τετραγωνική ρίζα της διακύμανσης. Να θυμάστε ότι η διακύμανση είναι ο μέσος όρος των τετραγώνων μετρήσεων σφάλματος.
        • Επομένως, μετά τον υπολογισμό του SSE, μπορείτε να βρείτε την τυπική απόκλιση ως εξής:
          • Τυπική απόκλιση=SSEν1{ displaystyle { text {Τυπική απόκλιση}} = { sqrt { frac { text {SSE}} {n-1}}}}Χρησιμοποιήστε το SSE για να προσδιορίσετε τη συνδιακύμανση. Αυτό το άρθρο έχει επικεντρωθεί σε σύνολα δεδομένων που μετρούν μόνο μία τιμή κάθε φορά. Ωστόσο, σε πολλές μελέτες μπορείτε να συγκρίνετε δύο ξεχωριστές τιμές. Για παράδειγμα, θέλετε να μάθετε πώς αυτές οι δύο τιμές σχετίζονται μεταξύ τους, όχι μόνο με τον μέσο όρο του συνόλου δεδομένων. Αυτή η τιμή είναι η συνδιακύμανση.
            • Οι υπολογισμοί για συνδιακύμανση είναι πολύ λεπτομερείς για να περιγραφούν εδώ, εκτός από το να σημειωθεί ότι θα χρησιμοποιήσετε το SSE για κάθε τύπο δεδομένων και στη συνέχεια να τον συγκρίνετε. Για μια πιο λεπτομερή περιγραφή της συνδιακύμανσης και των σχετικών υπολογισμών, μπορείτε να βρείτε άρθρα σχετικά με αυτό το θέμα στο wikiHow.
            • Ως παράδειγμα της χρήσης συνδιακύμανσης, θα μπορούσατε να συγκρίνετε την ηλικία των ασθενών σε μια ιατρική μελέτη με την αποτελεσματικότητα ενός φαρμάκου στη μείωση της θερμοκρασίας του πυρετού. Στη συνέχεια, έχετε ένα σύνολο δεδομένων ηλικιών και ένα δεύτερο σύνολο θερμοκρασιών. Στη συνέχεια, θα βρείτε το SSE για κάθε σύνολο δεδομένων, και από εκεί τη διακύμανση, τις τυπικές αποκλίσεις και τη συνδιακύμανση.