Πώς να υπολογίσετε τις εκπομπές

Συγγραφέας: Janice Evans
Ημερομηνία Δημιουργίας: 23 Ιούλιος 2021
Ημερομηνία Ενημέρωσης: 1 Ιούλιος 2024
Anonim
Υποδικτύωση-Δραστηριότητα 3η
Βίντεο: Υποδικτύωση-Δραστηριότητα 3η

Περιεχόμενο

Στα στατιστικά στοιχεία, οι υπερβολικές τιμές είναι τιμές που διαφέρουν σημαντικά από άλλες τιμές στο σύνολο δεδομένων που συλλέγονται. Ένα υπερβολικό σημείο μπορεί να υποδηλώνει ανωμαλίες στη διανομή δεδομένων ή τα σφάλματα μέτρησης, οπότε τα υπερβολικά συχνά αποκλείονται από το σύνολο δεδομένων. Καταργώντας τις υπερβολικές τιμές από το σύνολο δεδομένων, μπορείτε να καταλήξετε σε απροσδόκητα ή πιο ακριβή συμπεράσματα. Ως εκ τούτου, είναι απαραίτητο να μπορούμε να υπολογίζουμε και να εκτιμούμε τις ακραίες τιμές για να διασφαλίσουμε την ορθή κατανόηση των στατιστικών.

Βήματα

  1. 1 Μάθετε να αναγνωρίζετε πιθανές υπερβολικές τιμές. Οι πιθανές υπερβολικές τιμές πρέπει να προσδιοριστούν πριν εξαιρέσετε τις υπερβολικές τιμές από το σύνολο δεδομένων. Οι ακραίες τιμές είναι πολύ διαφορετικές από τις περισσότερες τιμές του συνόλου δεδομένων. Με άλλα λόγια, οι υπερβολικές τιμές είναι έξω από την τάση των περισσότερων αξιών. Αυτό είναι εύκολο να βρεθεί σε πίνακες τιμών ή (ειδικά) σε γραφήματα. Εάν οι τιμές στο σύνολο δεδομένων είναι γραφικές, οι ακραίες τιμές θα απέχουν πολύ από τις περισσότερες άλλες τιμές. Εάν, για παράδειγμα, οι περισσότερες από τις τιμές πέφτουν σε ευθεία γραμμή, τότε οι ακραίες τιμές βρίσκονται και στις δύο πλευρές μιας τέτοιας ευθείας.
    • Για παράδειγμα, σκεφτείτε ένα σύνολο δεδομένων που αντιπροσωπεύει τις θερμοκρασίες 12 διαφορετικών αντικειμένων σε ένα δωμάτιο. Εάν 11 αντικείμενα είναι περίπου 70 μοίρες, αλλά το δωδέκατο αντικείμενο (πιθανώς φούρνος) είναι 300 μοίρες, τότε μια γρήγορη ματιά στις τιμές μπορεί να δείξει ότι ο κλίβανος είναι πιθανό να εκραγεί.
  2. 2 Ταξινόμηση των δεδομένων με αύξουσα σειρά. Το πρώτο βήμα για τον προσδιορισμό των ακραίων τιμών είναι ο υπολογισμός του μέσου όρου του συνόλου δεδομένων. Αυτή η εργασία απλοποιείται σε μεγάλο βαθμό εάν οι τιμές στο σύνολο δεδομένων είναι διατεταγμένες σε αύξουσα σειρά (από τη μικρότερη στη μεγαλύτερη).
    • Συνεχίζοντας με το παραπάνω παράδειγμα, εξετάστε το ακόλουθο σύνολο δεδομένων που αντιπροσωπεύει τις θερμοκρασίες πολλαπλών αντικειμένων: {71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}. Αυτό το σετ πρέπει να παραγγελθεί ως εξής: {69, 69, 70, 70, 70, 70, 71, 71, 71, 72, 73, 300}.
  3. 3 Υπολογίστε το μέσο όρο του συνόλου δεδομένων. Η μέση τιμή ενός συνόλου δεδομένων είναι η τιμή στη μέση του συνόλου δεδομένων. Εάν το σύνολο δεδομένων περιέχει έναν περιττό αριθμό τιμών, ο διάμεσος είναι η τιμή πριν και μετά την οποία υπάρχουν ο ίδιος αριθμός τιμών στο σύνολο δεδομένων. Αλλά αν το σύνολο δεδομένων περιέχει ζυγό αριθμό τιμών, τότε πρέπει να βρείτε τον αριθμητικό μέσο των δύο μέσων. Σημειώστε ότι κατά τον υπολογισμό των ακραίων τιμών, ο διάμεσος συνήθως αναφέρεται ως Q2, καθώς βρίσκεται μεταξύ Q1 και Q3, του κάτω και του άνω τεταρτημορίου, τα οποία θα ορίσουμε αργότερα.
    • Μην φοβάστε να εργαστείτε με σύνολα δεδομένων που έχουν ζυγό αριθμό τιμών- ο αριθμητικός μέσος όρος των δύο μέσων θα είναι ένας αριθμός που δεν υπάρχει στο σύνολο δεδομένων. αυτό είναι φυσιολογικό. Αν όμως οι δύο μέσες τιμές είναι ο ίδιος αριθμός, τότε ο αριθμητικός μέσος όρος είναι ίσος με αυτόν τον αριθμό. αυτό είναι επίσης με τη σειρά των πραγμάτων.
    • Στο παραπάνω παράδειγμα, οι μέσες τιμές 2 είναι 70 και 71, οπότε η διάμεση τιμή είναι ((70 + 71) / 2) = 70,5.
  4. 4 Υπολογίστε το κάτω τεταρτημόριο. Αυτή η τιμή, που αναφέρεται ως Q1, είναι κάτω από την οποία βρίσκεται το 25% των τιμών συνόλου δεδομένων. Με άλλα λόγια, είναι το ήμισυ των τιμών μέχρι τη διάμεσο. Εάν υπάρχει ζυγός αριθμός τιμών από το σύνολο δεδομένων πριν από τον διάμεσο, πρέπει να βρείτε τον αριθμητικό μέσο των δύο μέσων για να υπολογίσετε το Q1 (αυτό είναι παρόμοιο με τον υπολογισμό του μέσου όρου).
    • Στο παράδειγμά μας, 6 τιμές βρίσκονται μετά τη διάμεσο και 6 τιμές- πριν από αυτήν. Αυτό σημαίνει ότι για να υπολογίσουμε το κατώτερο τεταρτημόριο, πρέπει να βρούμε τον αριθμητικό μέσο των δύο μέσων των έξι τιμών που βρίσκονται πριν από τον διάμεσο. Εδώ οι μέσες τιμές είναι 70 και 70. Έτσι, Q1 = ((70 + 70) / 2) = 70.
  5. 5 Να υπολογίσετε το ανώτερο τεταρτημόριο. Αυτή η τιμή, που αναφέρεται ως Q3, είναι πάνω από την οποία βρίσκεται το 25% των τιμών συνόλου δεδομένων. Η διαδικασία υπολογισμού του Q3 είναι παρόμοια με τη διαδικασία υπολογισμού του Q1, αλλά εδώ εξετάζονται οι τιμές μετά το διάμεσο.
    • Στο παραπάνω παράδειγμα, οι δύο μέσοι όροι των έξι μετά τον διάμεσο είναι 71 και 72. Άρα Q3 = ((71 + 72) / 2) = 71.5.
  6. 6 Υπολογίστε το διατεταρτημοριακό εύρος. Έχοντας υπολογίσει το Q1 και το Q3, είναι απαραίτητο να βρούμε την απόσταση μεταξύ αυτών των τιμών. Για να το κάνετε αυτό, αφαιρέστε το Q1 από το Q3. Η τιμή του διατεταρτογενούς εύρους είναι εξαιρετικά σημαντική για τον προσδιορισμό των ορίων των τιμών που δεν είναι υπερβολικές.
    • Στο παράδειγμά μας, Q1 = 70 και Q3 = 71,5. Το εύρος των τεταρτημορίων είναι 71,5 - 70 = 1,5.
    • Σημειώστε ότι αυτό ισχύει επίσης για αρνητικές τιμές Q1 και Q3. Για παράδειγμα, αν Q1 = -70, τότε το τεταρτημόριο είναι 71,5 -(-70) = 141,5.
  7. 7 Βρείτε τα "εσωτερικά όρια" των τιμών στο σύνολο δεδομένων. Οι ακραίες τιμές καθορίζονται με ανάλυση των τιμών- είτε εμπίπτουν είτε όχι στα λεγόμενα «εσωτερικά όρια» και «εξωτερικά όρια». Μια τιμή εκτός των "εσωτερικών ορίων" ταξινομείται ως "μικρότερο ανώτερο", ενώ μια τιμή εκτός των "εξωτερικών ορίων" ταξινομείται ως "σημαντική υπερβολή". Για να βρείτε τα εσωτερικά όρια, πρέπει να πολλαπλασιάσετε το εύρος των τεταρτημορίων με 1,5. το αποτέλεσμα πρέπει να προστεθεί στο Q3 και να αφαιρεθεί από το Q1. Οι δύο αριθμοί που βρέθηκαν είναι τα εσωτερικά όρια του συνόλου δεδομένων.
    • Στο παράδειγμά μας, το τεταρτημόριο είναι (71,5 - 70) = 1,5. Περαιτέρω: 1,5 * 1,5 = 2,25. Αυτός ο αριθμός πρέπει να προστεθεί στο Q3 και να αφαιρεθεί από το Q1 για να βρείτε τα εσωτερικά όρια:
      • 71,5 + 2,25 = 73,75
      • 70 - 2,25 = 67,75
      • Έτσι, τα εσωτερικά όρια είναι 67,75 και 73,75.
    • Στο παράδειγμά μας, μόνο η θερμοκρασία του κλιβάνου - 300 μοίρες - βρίσκεται εκτός αυτών των ορίων και μπορεί να θεωρηθεί ασήμαντη εκπομπή. Αλλά μην βιαστείτε να καταλήξετε σε συμπεράσματα - πρέπει να καθορίσουμε εάν αυτή η θερμοκρασία είναι μια σημαντική ακραία τιμή.
  8. 8 Βρείτε τα "εξωτερικά όρια" του συνόλου δεδομένων. Αυτό γίνεται με τον ίδιο τρόπο όπως για τα εσωτερικά όρια, εκτός από το ότι το εύρος των τεταρτημορίων πολλαπλασιάζεται με 3 αντί για 1,5. Το αποτέλεσμα πρέπει να προστεθεί στο Q3 και να αφαιρεθεί από το Q1. Οι δύο αριθμοί που βρέθηκαν είναι τα εξωτερικά όρια του συνόλου δεδομένων.
    • Στο παράδειγμά μας, πολλαπλασιάστε το εύρος των τεταρτημορίων με 3: 1,5 * 3 = 4,5. Υπολογίστε τα εξωτερικά όρια:
      • 71,5 + 4,5 = 76
      • 70 - 4,5 = 65,5
      • Άρα τα εξωτερικά όρια είναι 65,5 και 76.
    • Οποιεσδήποτε τιμές δεν εμπίπτουν στα εξωτερικά όρια θεωρούνται σημαντικές εκπομπές. Στο παράδειγμά μας, μια θερμοκρασία φούρνου 300 μοίρες θεωρείται σημαντική έκρηξη.
  9. 9 Χρησιμοποιήστε μια ποιοτική εκτίμηση για να προσδιορίσετε εάν οι υπερβολικές τιμές πρέπει να εξαιρεθούν από το σύνολο δεδομένων. Η μέθοδος που περιγράφεται παραπάνω σάς επιτρέπει να προσδιορίσετε εάν ορισμένες τιμές είναι υπερβολικές (μικρές ή σημαντικές). Μην κάνετε λάθος, όμως - μια τιμή που έχει ταξινομηθεί ως υπερβολική είναι μόνο "υποψήφια" για εξαίρεση, πράγμα που σημαίνει ότι δεν χρειάζεται να την αποκλείσετε. Η αιτία του υπερβολικού είναι ο κύριος παράγοντας που επηρεάζει την απόφαση αποκλεισμού του υπερβολικού. Κατά κανόνα, εξαιρούνται οι υπερβολικές τιμές που εμφανίζονται λόγω σφαλμάτων (σε μετρήσεις, ηχογραφήσεις κ.λπ.). Από την άλλη πλευρά, οι υπερβολικές τιμές που δεν σχετίζονται με σφάλματα αλλά με νέες πληροφορίες ή τάσεις συνήθως αφήνονται στο σύνολο δεδομένων.
    • Είναι εξίσου σημαντικό να εκτιμηθεί η επίδραση των υπερβολικών τιμών στη διάμεσο του συνόλου δεδομένων (είτε το παραμορφώνουν είτε όχι). Αυτό είναι ιδιαίτερα σημαντικό όταν βγάζετε συμπεράσματα από τον μέσο όρο ενός συνόλου δεδομένων.
    • Στο παράδειγμά μας, είναι εξαιρετικά απίθανο ο φούρνος να θερμανθεί σε θερμοκρασία 300 μοίρες (εκτός αν λάβουμε υπόψη τις φυσικές ανωμαλίες). Ως εκ τούτου, μπορεί να συναχθεί το συμπέρασμα (με υψηλό βαθμό βεβαιότητας) ότι μια τέτοια θερμοκρασία είναι ένα σφάλμα μέτρησης που πρέπει να αποκλειστεί από το σύνολο δεδομένων. Επιπλέον, εάν δεν αποκλείσετε το υπερβολικό, ο διάμεσος αριθμός δεδομένων θα είναι (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 71 + 72 + 73 + 300) / 12 = 89,67 μοίρες, αλλά αν εξαιρέσετε το ακραίο, ο διάμεσος θα είναι (69 + 69 + 70 + 70 + 70 + 70 + 71 + 71 + 71 + 72 + 73) / 11 = 70,55 μοίρες.
      • Οι υπερβολικές τιμές είναι συνήθως αποτέλεσμα ανθρώπινου λάθους, επομένως οι υπερβολικές τιμές πρέπει να εξαιρεθούν από τα σύνολα δεδομένων.
  10. 10 Κατανοήστε τη σημασία των (μερικές φορές) ακραίων τιμών που απομένουν στο σύνολο δεδομένων. Ορισμένες υπερβολικές τιμές πρέπει να αποκλειστούν από το σύνολο δεδομένων, καθώς οφείλονται σε σφάλματα και τεχνικά προβλήματα. άλλες ακραίες τιμές πρέπει να αφεθούν στο σύνολο δεδομένων. Εάν, για παράδειγμα, μια ακραία τιμή δεν είναι αποτέλεσμα σφάλματος και / ή παρέχει νέα κατανόηση του υπό δοκιμή φαινομένου, τότε θα πρέπει να αφεθεί στο σύνολο δεδομένων. Τα επιστημονικά πειράματα είναι ιδιαίτερα ευαίσθητα σε ακραίες τιμές - εξαλείφοντας κατά λάθος ένα υπερβολικό, μπορεί να χάσετε κάποια νέα τάση ή ανακάλυψη.
    • Για παράδειγμα, αναπτύσσουμε ένα νέο φάρμακο για την αύξηση του μεγέθους των ψαριών στην αλιεία. Θα χρησιμοποιήσουμε το παλιό σύνολο δεδομένων ({71, 70, 73, 70, 70, 69, 70, 72, 71, 300, 71, 69}), αλλά αυτή τη φορά κάθε τιμή θα αντιπροσωπεύει το βάρος του ψαριού (σε γραμμάρια) πειραματικό φάρμακο μετά την κατάποση. Με άλλα λόγια, το πρώτο φάρμακο οδηγεί σε αύξηση του βάρους των ψαριών έως 71 g, το δεύτερο φάρμακο - έως 70 g, και ούτω καθεξής. Σε αυτήν την κατάσταση, το 300 είναι ένα σημαντικό outlier, αλλά δεν πρέπει να το αποκλείσουμε. αν υποθέσουμε ότι δεν υπήρχαν σφάλματα μέτρησης, τότε ένα τέτοιο υπερβολικό είναι μια σημαντική επιτυχία στο πείραμα. Το φάρμακο, το οποίο αύξησε το βάρος του ψαριού στα 300 γραμμάρια, λειτουργεί πολύ καλύτερα από άλλα φάρμακα. έτσι 300 είναι η πιο σημαντική τιμή στο σύνολο δεδομένων.

Συμβουλές

  • Όταν εντοπιστούν ακραίες τιμές, προσπαθήστε να εξηγήσετε την παρουσία τους πριν τους εξαιρέσετε από το σύνολο δεδομένων. Μπορούν να υποδείξουν σφάλματα μέτρησης ή ανωμαλίες κατανομής.

Τι χρειάζεσαι

  • Αριθμομηχανή