Εκμάθηση Στατιστικών, από Παρουσίαση έως Μέτρα Διανομής Δεδομένων

Η Στατιστική είναι μια μαθηματική επιστήμη που μελετά τη συλλογή δεδομένων, την επεξεργασία, την ανάλυση και την παρουσίαση. Οι στατιστικές χρησιμοποιούνται ευρέως στις ασφαλιστικές εταιρείες, μία από τις οποίες είναι να προσδιοριστεί το ποσό των ασφαλίστρων σε ένα ασφαλιστήριο συμβόλαιο. Κάθε κάτοχος ασφάλισης υποχρεούται να καταβάλει εισφορά που ονομάζεται ασφάλιστρο. Το ασφάλιστρο που καταβάλλεται είναι σύμφωνο με την ασφαλιστική κάλυψη που λαμβάνει.

Εδώ, η ασφαλιστική εταιρεία χρησιμοποιεί στατιστικά στοιχεία έτσι ώστε το ποσό των ασφαλίστρων να είναι σύμφωνο με το ποσό κάλυψης που μπορεί να παρασχεθεί στον κάτοχο της ασφάλισης. Με αυτόν τον τρόπο, και τα δύο μέρη επωφελούνται από αυτό.

Όπως αναφέρθηκε προηγουμένως, οι στατιστικές όχι μόνο συλλέγουν και επεξεργάζονται, αλλά παρουσιάζουν επίσης δεδομένα. Η Στατιστική χρησιμοποιεί επίσης διάφορα μέτρα κατανομής δεδομένων στην επεξεργασία δεδομένων. Σήμερα, θα συζητήσουμε τους τύπους παρουσίασης καθώς και το μέγεθος της διάδοσης των δεδομένων στα στατιστικά.

Τύποι παρουσίασης δεδομένων

Οι τύποι παρουσίασης δεδομένων στα στατιστικά περιλαμβάνουν πίνακες διανομής συχνοτήτων, ιστογράμματα, πολύγωνα και στόχους.

Η πρώτη μορφή παρουσίασης δεδομένων είναι να χρησιμοποιήσετε έναν πίνακα διανομής συχνότητας. Όπως υποδηλώνει το όνομα, χρησιμοποιούμε πίνακες για να εμφανίσουμε τον τύπο και την ποσότητα των δεδομένων που λαμβάνονται. Ο πίνακας διανομής συχνότητας έχει επίσης διάφορους τύπους, δηλαδή τον πίνακα διανομής συχνότητας για μεμονωμένα δεδομένα και δεδομένα ομάδας.

(Διαβάστε επίσης: Δύο δεδομένα μέτρησης στα στατιστικά)

Ένας μεμονωμένος πίνακας διανομής συχνότητας δεδομένων χρησιμοποιείται για την παρουσίαση μικρών ποσοτήτων δεδομένων, τουλάχιστον λιγότερων από 30 δεδομένων. Ένα παράδειγμα παρουσίασης δεδομένων χρησιμοποιώντας έναν πίνακα διανομής συχνότητας δεδομένων είναι το ακόλουθο.

Τα παρακάτω δεδομένα είναι οι βαθμολογίες των 30 μαθητών. Σερβίρετε σε έναν μόνο πίνακα διανομής συχνότητας δεδομένων!

4 8 7 9 10 3 4 6 7 6 5 7 7 8 9 6 6 8 7 9 4 5 6 7 8 10 4 5 6 7

Εάν προσέξουμε, το χαμηλότερο σκορ δοκιμής που αποκτήθηκε είναι 3, ενώ το υψηλότερο σκορ είναι 10. Στη συνέχεια, από αυτά τα αποτελέσματα, υπολογίζεται ο αριθμός των μαθητών που το λαμβάνουν. Για βαθμό 3, για παράδειγμα, μόνο 1 μαθητής. Για την τάξη 4, υπάρχουν 4 μαθητές και ούτω καθεξής. Αυτός ο αριθμός παρουσιάζεται στη συνέχεια σε έναν πίνακα όπως ο παρακάτω.

ανεμογεννήτριες στο έδαφος του υπεράκτιου αιολικού πάρκου

Ο επόμενος τύπος πίνακα διανομής συχνότητας είναι ο πίνακας διανομής συχνότητας δεδομένων ομάδας. Αυτός ο πίνακας χρησιμοποιείται για να παρουσιάσει πολλά δεδομένα, τα οποία είναι πάνω από 30 δεδομένα. Ας δούμε το παρακάτω παράδειγμα.

Το παρακάτω είναι το ύψος των φυτών τσίλι (σε ​​χιλιοστά) σε μια φυτεία τσίλι. Παρουσιάστε τα δεδομένα σε έναν πίνακα ομαδοποίησης δεδομένων!

123 131 120 128 126 124 125 122

121 126 124 123 122 120 125 126

123 123 134 125 125 126 128 135

120 126 124 133 126 127 123 126

122 125 123 132 124 132 128 124

Σε αντίθεση με τα μεμονωμένα δεδομένα, εδώ πρέπει να υπολογίσουμε τον αριθμό τάξεων και μήκους τάξεων που θα εμφανίζονται στον πίνακα. Χρησιμοποιώντας τα παραπάνω δεδομένα, ακολουθούν οι υπολογισμοί.

Πολλά δεδομένα (n) = 40

Μέγιστο ύψος (x max ) = 135

Ελάχιστο ύψος (x min ) = 120

Εύρος (J) = x max  - x min = 135 - 120 = 15

Αριθμός τάξεων (k) = 1 + 3,3logn = 1 + 3,3 log40 = 6,2868… ≈ k = 6

Μήκος τάξης (c) = J / k = 15/6 = 2,5 ≈ c = 3

Από αυτά τα αποτελέσματα, μπορούμε να εμφανίσουμε τον πίνακα διανομής δεδομένων ομάδας ως εξής.

ανεμογεννήτριες στο έδαφος του υπεράκτιου αιολικού πάρκου

Στη συνέχεια, θα συζητήσουμε άλλους τύπους ομαδοποιημένης παρουσίασης δεδομένων, συγκεκριμένα με τη μορφή ιστογραμμάτων, πολυγώνων συχνότητας και ωγών. Ρίξτε μια ματιά στον παρακάτω πίνακα συχνοτήτων, ο οποίος περιέχει πληροφορίες βάρους για 80 μέλη του αθλητικού συλλόγου.

ανεμογεννήτριες στο έδαφος του υπεράκτιου αιολικού πάρκου

Για να παρουσιάσουμε τα δεδομένα χρησιμοποιώντας ένα γράφημα ιστογράμματος, κατασκευάζουμε πρώτα ένα καρτεσιανό γράφημα. Ο άξονας x δείχνει τα άνω και κάτω όρια κάθε κλάσης, ενώ ο άξονας y δείχνει τη συχνότητα.

στατιστικά4 (1)

Σε αντίθεση με ένα ιστόγραμμα, ένα γράφημα πολυγώνου συχνότητας λαμβάνει τη μέση τιμή του διαστήματος τάξης και το εμφανίζει με γραμμές ανάλογα με τη συχνότητα.

στατιστικές5 (1)

Τέλος, παρουσιάζοντας τα δεδομένα χρησιμοποιώντας μια θετική αθροιστική ή αρνητική καμπύλη συχνότητας. Αρχικά, σημειώστε τις αθροιστικές τιμές συχνότητας κάθε κλάσης διαστήματος στον άξονα y. Στη συνέχεια, σημειώστε τις συντεταγμένες των σημείων σύμφωνα με τα ζεύγη του άνω ορίου της τάξης διαστήματος και τη σωρευτική συχνότητα. Συνδέστε τις τελείες σε μια ομαλή καμπύλη.

Μέγεθος διάδοσης δεδομένων

Στα στατιστικά στοιχεία, υπάρχουν δύο τύποι μέτρησης δεδομένων, δηλαδή το μέγεθος της συγκέντρωσης δεδομένων και το μέγεθος της διανομής δεδομένων. Ποια είναι η εξήγηση και η διαφορά;

Το μέγεθος του κέντρου δεδομένων είναι μια τιμή που αντιπροσωπεύει τη θέση των δεδομένων. Στη μέτρηση με κέντρο δεδομένα, υπάρχουν μέσες τιμές, λειτουργία και διάμεσος.

Ο μέσος όρος ή ο μέσος όρος είναι το πηλίκο μεταξύ του αθροίσματος όλων των παρατηρούμενων δεδομένων με μεγάλο αριθμό δεδομένων. Μπορούμε να διατυπώσουμε τον μέσο όρο ως εξής.

Μέση = (Άθροισμα όλων των δεδομένων) / (Πολλά δεδομένα)

Για να καταλάβουμε καλύτερα, ας δούμε το ακόλουθο πρόβλημα. Ο αριθμός των ωρών που χρειάζονται 5 άτομα την εβδομάδα για κοινωνικές δραστηριότητες στο περιβάλλον τους είναι 10, 7, 13, 20 και 15 ώρες. Προσδιορίστε τον μέσο αριθμό ωρών την εβδομάδα που περνούν σε κοινωνικές δραστηριότητες!

Με βάση τα παραπάνω προβλήματα, μπορούμε να εισάγουμε τους αριθμούς στον τύπο ως εξής.

Μέση = (10 + 7 + 13 + 20 + 15) / 5 = 65/5 = 13

Αυτό σημαίνει ότι ο μέσος αριθμός ωρών που ξοδεύουν σε κοινωνικές δραστηριότητες είναι 13 ώρες.

Εκτός από το μέσο ή το μέσο, ​​υπάρχουν επίσης τρόποι. Η λειτουργία είναι η τιμή που εμφανίζεται πιο συχνά σε δεδομένα. Ας δούμε ένα παράδειγμα του ακόλουθου προβλήματος.

Ακολουθούν τα δεδομένα βάρους (σε χιλιόγραμμα) μερικών μαθητών βαθμού 7. Καθορίστε τη λειτουργία των δεδομένων!

32, 35, 33, 32, 34, 31, 35, 35, 31, 34, 35, 3

Πρώτα απ 'όλα, πρέπει να μετρήσουμε τον αριθμό των φορών που κάθε τιμή εμφανίζεται στα δεδομένα. Με βάση αυτά τα δεδομένα, λαμβάνουμε 31 (x3), 32 (x2), 33 (x1), 34 (x2) και 35 (x4). Δεδομένου ότι το 35 εμφανίζεται συχνότερα, η λειτουργία των παραπάνω δεδομένων είναι 35.

Ο τελευταίος τύπος μέτρησης κεντραρίσματος είναι ο διάμεσος. Ο διάμεσος διαιρεί τα δεδομένα σε δύο ίσα μέρη, έτσι η διάμεση τιμή είναι η μέση τιμή των ταξινομημένων δεδομένων.

Για να προσδιορίσουμε τη διάμεση τιμή, πρέπει πρώτα να ταξινομήσουμε όλα τα δεδομένα με αύξουσα ή φθίνουσα σειρά. Δεύτερον, ορίστε πολλά δεδομένα και συμβολίστε τα ως "n". Εάν το n είναι περίεργο, ο τύπος που χρησιμοποιούμε έχει ως εξής.

Διάμεσος = αριθμός δεδομένων - ((n + 1) / 2)

Εν τω μεταξύ, εάν το n είναι ομοιόμορφο, χρησιμοποιούμε τον παρακάτω τύπο.

Διάμεσος = (δεδομένα ith (n / 2) + δεδομένα ith (n / 2 + 1)) / 2

Η δεύτερη μέτρηση των δεδομένων στις στατιστικές είναι ένα μέτρο της διάδοσης των δεδομένων. Το μέγεθος της εξάπλωσης δεδομένων είναι μια τιμή που δηλώνει πόσο μακριά βρίσκονται τα δεδομένα από το κέντρο δεδομένων. Το μέγεθος της κατανομής δεδομένων αποτελείται από το εύρος, το τεταρτημόριο και το εύρος μεταξύ των τεμαχίων.

Το εύρος είναι η διαφορά μεταξύ της μεγαλύτερης τιμής δεδομένων και της μικρότερης τιμής δεδομένων. Μπορούμε να προσεγγίσουμε αφαιρώντας τα μεγαλύτερα δεδομένα από τα μικρότερα δεδομένα. Για παράδειγμα, εάν σε μια τάξη, ο ψηλότερος μαθητής έχει ύψος 160 cm και ο κοντινότερος μαθητής έχει ύψος 143 cm, θα φτάσουμε στα 23 cm.

Εν τω μεταξύ, το τεταρτημόριο είναι η ομαδοποίηση στατιστικών δεδομένων σε τέσσερα ίσα μέρη. Το τεταρτημόριο χωρίζεται σε 3, δηλαδή το κατώτερο τεταρτημόριο (Q 1 ), το μεσαίο τεταρτημόριο (Q 2 ή διάμεσος) και το άνω τεταρτημόριο (Q 3 ) Για να προσδιορίσουμε κάθε τεταρτημόριο, υπάρχουν πολλά βήματα που πρέπει να κάνουμε.

Αρχικά, ταξινομήστε τα δεδομένα με αύξουσα ή φθίνουσα σειρά. Δεύτερον, προσδιορίστε τη μέση ή τη μέση τιμή των δεδομένων. Τρίτον, προσδιορίστε το κατώτερο τεταρτημόριο (Q 1 ), που είναι η μέση τιμή της ομάδας δεδομένων κάτω από τη διάμεση τιμή (Q 2) . Τέλος, προσδιορίστε το ανώτερο τεταρτημόριο (Q 3 ), που είναι η μέση τιμή του συνόλου δεδομένων πάνω από τη διάμεση τιμή (Q 2) .

Ο τελευταίος τύπος μέτρου κατανομής δεδομένων είναι το εύρος μεταξύ των τεταρτημορίων. Το εύρος μεταξύ των τεταρτημορίων είναι η διαφορά μεταξύ των άνω και κάτω τεταρτημορίων. Ο τύπος έχει ως εξής.

Q d = Q 3 - Q 1