Spearman, συντελεστές συσχέτισης κατάταξης Kendall, συντελεστής Fechner. Παράδειγμα συντελεστών συσχέτισης κατάταξης Kendall και Spearman

Ενότητες του ιστότοπου

Η επιλογή των συντακτών:

Διαφήμιση

Σπίτι - Υπηρεσία

Παρουσίαση και προεπεξεργασία αξιολογήσεων εμπειρογνωμόνων

Στην πράξη χρησιμοποιούνται διάφοροι τύποι αξιολογήσεων:

- ποιοτική (συχνά-σπάνια, χειρότερα-καλύτερα, ναι-όχι),

- βαθμολογίες κλίμακας (διαστήματα τιμών 50-75, 76-90, 91-120, κ.λπ.),

Πόντοι από ένα δεδομένο διάστημα (από 2 έως 5, 1 -10), αμοιβαία ανεξάρτητα,

Κατάταξη (τα αντικείμενα τακτοποιούνται από τον εμπειρογνώμονα με συγκεκριμένη σειρά και σε καθένα εκχωρείται σειριακός αριθμός - τάξη),

Συγκριτική, που λαμβάνεται με μία από τις μεθόδους σύγκρισης

μέθοδος διαδοχικής σύγκρισης

μέθοδος σύγκρισης παραγόντων κατά ζεύγη.

Στο επόμενο βήμα της επεξεργασίας των γνωμοδοτήσεων των ειδικών, είναι απαραίτητο να γίνει αξιολόγηση ο βαθμός συμφωνίας μεταξύ αυτών των απόψεων.

Οι βαθμολογίες που λαμβάνονται από ειδικούς μπορούν να θεωρηθούν ως μια τυχαία μεταβλητή, η κατανομή της οποίας αντανακλά τις απόψεις των ειδικών σχετικά με την πιθανότητα μιας συγκεκριμένης επιλογής γεγονότος (παράγοντας). Ως εκ τούτου, για την ανάλυση της εξάπλωσης και της συνέπειας των αξιολογήσεων εμπειρογνωμόνων, χρησιμοποιούνται γενικευμένα στατιστικά χαρακτηριστικά - μέσοι όροι και μέτρα διασποράς:

Μέσο τετράγωνο σφάλμα,

Εύρος διακύμανσης min – max,

- συντελεστής διακύμανσης V = μέση τετραγωνική απόκλιση / μέσος όρος αριθμών (κατάλληλο για κάθε είδους αξιολόγηση)

V i = σ i / x i μ.ο

Για ποσοστό μέτρα ομοιότηταςκαι απόψεις κάθε ζευγάρι ειδικώνΜπορεί να χρησιμοποιηθεί μια ποικιλία μεθόδων:

συντελεστές συσχέτισης, με τη βοήθεια του οποίου λαμβάνεται υπόψη ο αριθμός των αντίστοιχων και μη απαντήσεων,

συντελεστές ασυνέπειαςγνώμες ειδικών,

Όλα αυτά τα μέτρα μπορούν να χρησιμοποιηθούν είτε για τη σύγκριση των απόψεων δύο ειδικών είτε για την ανάλυση της σχέσης μεταξύ μιας σειράς αξιολογήσεων σε δύο χαρακτηριστικά.

Συντελεστής συσχέτισης ζευγαρωμένης κατάταξης Spearman:

όπου n είναι ο αριθμός των ειδικών,

c k – η διαφορά μεταξύ των εκτιμήσεων του i-ου και του j-ου ειδικού για όλους τους παράγοντες T

Ο συντελεστής συσχέτισης κατάταξης Kendall (συντελεστής συμφωνίας) δίνει μια συνολική αξιολόγηση της συνέπειας των απόψεων όλων των ειδικών για όλους τους παράγοντες, αλλά μόνο για τις περιπτώσεις όπου χρησιμοποιήθηκαν εκτιμήσεις κατάταξης.

Έχει αποδειχθεί ότι η τιμή του S, όταν όλοι οι ειδικοί δίνουν τις ίδιες εκτιμήσεις για όλους τους παράγοντες, έχει μέγιστη τιμή ίση με

όπου n είναι ο αριθμός των παραγόντων,

m – αριθμός εμπειρογνωμόνων.

Ο συντελεστής συμφωνίας είναι ίσος με τον λόγο

Επιπλέον, εάν το W είναι κοντά στο 1, τότε όλοι οι ειδικοί έδωσαν αρκετά συνεπείς εκτιμήσεις, διαφορετικά οι απόψεις τους δεν είναι συνεπείς.

Ο τύπος για τον υπολογισμό του S δίνεται παρακάτω:

όπου r ij είναι οι εκτιμήσεις κατάταξης του i-ου παράγοντα από τον j-ο ειδικό,

r μέσος όρος είναι η μέση κατάταξη σε ολόκληρο τον πίνακα αξιολόγησης και ισούται με

Και επομένως ο τύπος για τον υπολογισμό του S μπορεί να έχει τη μορφή:

Εάν συμπίπτουν μεμονωμένες αξιολογήσεις από έναν ειδικό και τυποποιήθηκαν κατά τη διάρκεια της επεξεργασίας, τότε χρησιμοποιείται ένας άλλος τύπος για τον υπολογισμό του συντελεστή συμφωνίας:

όπου το T j υπολογίζεται για κάθε ειδικό (αν οι αξιολογήσεις του επαναλήφθηκαν για διαφορετικά αντικείμενα) λαμβάνοντας υπόψη τις επαναλήψεις σύμφωνα με τους ακόλουθους κανόνες:

όπου t j είναι ο αριθμός των ομάδων ίσων βαθμών για τον j-ο ειδικό, και

h k είναι ο αριθμός των ίσων βαθμών στην k-η ομάδα των σχετικών βαθμών του j-ου ειδικού.

ΠΑΡΑΔΕΙΓΜΑ. Αφήστε 5 ειδικούς σε έξι παράγοντες να απαντήσουν στην κατάταξη όπως φαίνεται στον Πίνακα 3:

Πίνακας 3 - Απαντήσεις ειδικών

Ειδικοί	Ο1	Ο2	Ο3	Ο4	Ο5	Ο6	Άθροισμα βαθμών ανά εμπειρογνώμονα
Ε1
Ε2
Ε3
Ε4
Ε5

Λόγω του γεγονότος ότι δεν λάβαμε μια αυστηρή κατάταξη (οι αξιολογήσεις των εμπειρογνωμόνων επαναλαμβάνονται και τα αθροίσματα των βαθμών δεν είναι ίσα), θα μετατρέψουμε τις αξιολογήσεις και θα λάβουμε τις σχετικές βαθμολογίες (Πίνακας 4):

Πίνακας 4 – Συναφείς βαθμοί αξιολογήσεων εμπειρογνωμόνων

Ειδικοί	Ο1	Ο2	Ο3	Ο4	Ο5	Ο6	Άθροισμα βαθμών ανά εμπειρογνώμονα
Ε1		2,5	2,5
Ε2
Ε3	1,5	1,5		4,5	4,5
Ε4		2,5	2,5	4,5	4,5
Ε5					5,5	5,5
Άθροισμα βαθμών για ένα αντικείμενο	7,5	9,5			23,5	29,5

Τώρα ας προσδιορίσουμε τον βαθμό συμφωνίας μεταξύ των απόψεων των ειδικών χρησιμοποιώντας τον συντελεστή συμφωνίας. Δεδομένου ότι οι τάξεις σχετίζονται, θα υπολογίσουμε το W χρησιμοποιώντας τον τύπο (**).

Τότε r av =7*5/2=17,5

S = 10 2 +8 2 +4,5 2 +4,5 2 +6 2 +12 2 = 384,5

Ας προχωρήσουμε στους υπολογισμούς του W. Για να γίνει αυτό, ας υπολογίσουμε τις τιμές του T j ξεχωριστά. Στο παράδειγμα, οι αξιολογήσεις επιλέγονται ειδικά με τέτοιο τρόπο ώστε κάθε ειδικός να έχει επαναλαμβανόμενες αξιολογήσεις: ο 1ος έχει δύο, ο δεύτερος τρεις, ο τρίτος δύο ομάδες των δύο αξιολογήσεων και ο τέταρτος και ο πέμπτος έχουν δύο ίδιες αξιολογήσεις. Από εδώ:

T 1 = 2 3 – 2 = 6 T 5 = 6

T 2 = 3 3 – 3 = 24

T 3 = 2 3 –2+ 2 3 –2 = 12 T 4 = 12

Βλέπουμε ότι η συνέπεια των γνωμοδοτήσεων των ειδικών είναι αρκετά υψηλή και μπορούμε να περάσουμε στο επόμενο στάδιο της μελέτης - αιτιολόγηση και υιοθέτηση της εναλλακτικής λύσης που προτείνουν οι ειδικοί.

Διαφορετικά, πρέπει να επιστρέψετε στα βήματα 4-8.

Ο συντελεστής συσχέτισης Kendall χρησιμοποιείται όταν οι μεταβλητές αντιπροσωπεύονται σε δύο τακτικές κλίμακες, υπό την προϋπόθεση ότι δεν υπάρχουν συσχετισμένες βαθμίδες. Ο υπολογισμός του συντελεστή Kendall περιλαμβάνει την καταμέτρηση του αριθμού των αντιστοιχιών και των αναστροφών. Ας εξετάσουμε αυτή τη διαδικασία χρησιμοποιώντας το παράδειγμα του προηγούμενου προβλήματος.

Ο αλγόριθμος για την επίλυση του προβλήματος είναι ο εξής:

Αναδιατάσσουμε τα δεδομένα στον πίνακα. 8.5 έτσι ώστε μία από τις σειρές (στην περίπτωση αυτή η σειρά Χ i) αποδείχθηκε ότι είναι κατάταξη. Με άλλα λόγια, αναδιατάσσουμε τα ζευγάρια ΧΚαι y με τη σωστή σειρά και Εισάγουμε τα δεδομένα στις στήλες 1 και 2 του πίνακα. 8.6.

Πίνακας 8.6

Χ Εγώ	y Εγώ

2. Προσδιορίστε τον «βαθμό κατάταξης» της 2ης σειράς ( yΕγώ). Αυτή η διαδικασία εκτελείται με την ακόλουθη σειρά:

α) πάρτε την πρώτη τιμή της μη κατάταξης σειράς "3". Μετρώντας τον αριθμό των βαθμών παρακάτωδεδομένου αριθμού, ο οποίος περισσότεροσυγκριτική αξία. Υπάρχουν 9 τέτοιες τιμές (αριθμοί 6, 7, 4, 9, 5, 11, 8, 12 και 10). Εισαγάγετε τον αριθμό 9 στη στήλη "αντιστοιχίσεις". Στη συνέχεια μετράμε τον αριθμό των τιμών που πιο λιγοτρία. Υπάρχουν 2 τέτοιες τιμές (τάξεις 1 και 2). Εισάγουμε τον αριθμό 2 στη στήλη "αντιστροφή".

β) απορρίψτε τον αριθμό 3 (έχουμε ήδη δουλέψει μαζί του) και επαναλάβετε τη διαδικασία για την επόμενη τιμή "6": ο αριθμός των αντιστοιχιών είναι 6 (τάξεις 7, 9, 11, 8, 12 και 10), ο αριθμός των οι αντιστροφές είναι 4 (τάξεις 1, 2, 4 και 5). Εισάγουμε τον αριθμό 6 στη στήλη «σύμπτωση» και τον αριθμό 4 στη στήλη «αντιστροφή».

γ) η διαδικασία επαναλαμβάνεται με παρόμοιο τρόπο μέχρι το τέλος της σειράς. θα πρέπει να θυμόμαστε ότι κάθε τιμή "επεξεργασμένη" αποκλείεται από περαιτέρω εξέταση (υπολογίζονται μόνο οι βαθμολογίες που βρίσκονται κάτω από αυτόν τον αριθμό).

Σημείωση

Για να μην κάνουμε λάθη στους υπολογισμούς, θα πρέπει να ληφθεί υπόψη ότι με κάθε "βήμα" το άθροισμα των συμπτώσεων και των αντιστροφών μειώνεται κατά μία. Αυτό είναι κατανοητό δεδομένου ότι κάθε φορά μια τιμή εξαιρείται από την εξέταση.

3. Υπολογίζεται το άθροισμα των αγώνων (R)και το άθροισμα των αντιστροφών (Ε); Τα δεδομένα εισάγονται σε έναν και τρεις εναλλάξιμους τύπους για τον συντελεστή Kendall (8.10). Γίνονται οι αντίστοιχοι υπολογισμοί.

t (8.10)

Στην περίπτωσή μας:

Στον πίνακα Το XIV Παράρτημα περιέχει τις κρίσιμες τιμές του συντελεστή για αυτό το δείγμα: τ cr. = 0,45; 0,59. Η εμπειρικά ληφθείσα τιμή συγκρίνεται με την πινακοποιημένη.

συμπέρασμα

τ = 0,55 > τ cr. = 0,45. Η συσχέτιση είναι στατιστικά σημαντική στο επίπεδο 1.

Σημείωση:

Εάν είναι απαραίτητο (για παράδειγμα, εάν δεν υπάρχει πίνακας κρίσιμων τιμών), στατιστική σημασία tΤο Kendall μπορεί να προσδιοριστεί με τον ακόλουθο τύπο:

(8.11)

Οπου S* = P – Q+ 1 αν Π< Q , Και S* = P – Q – 1 αν P>Q.

Αξίες zγια το αντίστοιχο επίπεδο σημαντικότητας αντιστοιχούν στο μέτρο Pearson και βρίσκονται στους αντίστοιχους πίνακες (δεν περιλαμβάνονται στο παράρτημα. Για τυπικά επίπεδα σημασίας z kr = 1,96 (για β 1 = 0,95) και 2,58 (για β 2 = 0,99). Ο συντελεστής συσχέτισης Kendall είναι στατιστικά σημαντικός αν z > z cr

Στην περίπτωσή μας S* = P – Q– 1 = 35 και z= 2,40, δηλαδή επιβεβαιώνεται το αρχικό συμπέρασμα: η συσχέτιση μεταξύ των χαρακτηριστικών είναι στατιστικά σημαντική για το 1ο επίπεδο σημαντικότητας.

Ένας παράγοντας που περιορίζει τη χρήση δοκιμών που βασίζονται στην υπόθεση της κανονικότητας είναι το μέγεθος του δείγματος. Εφόσον το δείγμα είναι αρκετά μεγάλο (για παράδειγμα, 100 ή περισσότερες παρατηρήσεις), μπορείτε να υποθέσετε ότι η κατανομή δειγματοληψίας είναι κανονική, ακόμα κι αν δεν είστε σίγουροι ότι η κατανομή της μεταβλητής στον πληθυσμό είναι κανονική. Ωστόσο, εάν το δείγμα είναι μικρό, αυτές οι δοκιμές θα πρέπει να χρησιμοποιούνται μόνο εάν είστε βέβαιοι ότι η μεταβλητή έχει πράγματι κανονική κατανομή. Ωστόσο, δεν υπάρχει τρόπος να δοκιμαστεί αυτή η υπόθεση σε ένα μικρό δείγμα.

Η χρήση κριτηρίων που βασίζονται στην υπόθεση της κανονικότητας περιορίζεται επίσης από την κλίμακα μέτρησης (βλ. κεφάλαιο Στοιχειώδεις έννοιες της ανάλυσης δεδομένων). Οι στατιστικές μέθοδοι όπως το t-test, η παλινδρόμηση κ.λπ. υποθέτουν ότι τα αρχικά δεδομένα είναι συνεχή. Ωστόσο, υπάρχουν περιπτώσεις όπου τα δεδομένα απλώς ταξινομούνται (μετρούνται σε μια τακτική κλίμακα) αντί να μετρώνται με ακρίβεια.

Χαρακτηριστικό παράδειγμα δίνεται από αξιολογήσεις ιστότοπων στο Διαδίκτυο: η πρώτη θέση καταλαμβάνεται από τον ιστότοπο με τον μέγιστο αριθμό επισκεπτών, τη δεύτερη θέση καταλαμβάνει ο ιστότοπος με τον μέγιστο αριθμό επισκεπτών μεταξύ των υπολοίπων ιστότοπων (μεταξύ των τοποθεσιών από το οποίο διαγράφηκε ο πρώτος ιστότοπος) κ.λπ. Γνωρίζοντας τις βαθμολογίες, μπορούμε να πούμε ότι ο αριθμός των επισκεπτών σε έναν ιστότοπο είναι μεγαλύτερος από τον αριθμό των επισκεπτών σε έναν άλλο, αλλά πόσα περισσότερα δεν μπορούμε να πούμε. Φανταστείτε ότι έχετε 5 ιστότοπους: A, B, C, D, E, οι οποίοι κατατάσσονται στις πρώτες 5 θέσεις. Ας υποθέσουμε ότι τον τρέχοντα μήνα είχαμε την εξής διάταξη: A, B, C, D, E, και τον προηγούμενο μήνα: D, E, A, B, C. Το ερώτημα είναι αν υπήρξαν σημαντικές αλλαγές στην κατάταξη των τοποθεσιών ή όχι; Σε αυτήν την περίπτωση, προφανώς, δεν μπορούμε να χρησιμοποιήσουμε το t-test για να συγκρίνουμε αυτές τις δύο ομάδες δεδομένων και περνάμε στο πεδίο των συγκεκριμένων πιθανοτικών υπολογισμών (και κάθε στατιστική δοκιμή περιέχει πιθανολογικούς υπολογισμούς!). Συλλογίζουμε περίπου ως εξής: πόσο πιθανό είναι η διαφορά στις δύο διευθετήσεις τοποθεσιών να οφείλεται σε καθαρά τυχαίους λόγους ή αν αυτή η διαφορά είναι πολύ μεγάλη και δεν μπορεί να εξηγηθεί από καθαρή τύχη. Σε αυτές τις συζητήσεις, χρησιμοποιούμε μόνο τάξεις ή μεταθέσεις ιστότοπων και δεν χρησιμοποιούμε σε καμία περίπτωση συγκεκριμένο τύπο κατανομής του αριθμού των επισκεπτών σε αυτούς.

Μη παραμετρικές μέθοδοι χρησιμοποιούνται για την ανάλυση μικρών δειγμάτων και για δεδομένα που μετρώνται σε κακές κλίμακες.

Μια σύντομη επισκόπηση των μη παραμετρικών διαδικασιών

Ουσιαστικά, για κάθε παραμετρικό κριτήριο υπάρχει τουλάχιστον μία μη παραμετρική εναλλακτική.

Γενικά, αυτές οι διαδικασίες εμπίπτουν σε μία από τις ακόλουθες κατηγορίες:

Δοκιμές διαφοράς για ανεξάρτητα δείγματα.
Δοκιμές διαφοράς για εξαρτημένα δείγματα.
αξιολόγηση του βαθμού εξάρτησης μεταξύ των μεταβλητών.

Γενικά, η προσέγγιση των στατιστικών κριτηρίων στην ανάλυση δεδομένων θα πρέπει να είναι ρεαλιστική και να μην επιβαρύνεται με περιττούς θεωρητικούς συλλογισμούς. Με έναν υπολογιστή που εκτελεί το STATISTICA, μπορείτε εύκολα να εφαρμόσετε πολλά κριτήρια στα δεδομένα σας. Γνωρίζοντας μερικές από τις παγίδες των μεθόδων, θα επιλέξετε τη σωστή λύση μέσω πειραματισμού. Η ανάπτυξη της γραφικής παράστασης είναι αρκετά φυσική: εάν θέλετε να συγκρίνετε τις τιμές δύο μεταβλητών, τότε χρησιμοποιείτε ένα τεστ t. Ωστόσο, πρέπει να θυμόμαστε ότι βασίζεται στην υπόθεση της κανονικότητας και της ισότητας των διακυμάνσεων σε κάθε ομάδα. Η κατάργηση αυτών των υποθέσεων οδηγεί σε μη παραμετρικές δοκιμές, οι οποίες είναι ιδιαίτερα χρήσιμες για μικρά δείγματα.

Η ανάπτυξη του τεστ t οδηγεί σε ανάλυση διακύμανσης, η οποία χρησιμοποιείται όταν ο αριθμός των ομάδων που συγκρίνονται είναι μεγαλύτερος από δύο. Η αντίστοιχη ανάπτυξη μη παραμετρικών διαδικασιών οδηγεί σε μη παραμετρική ανάλυση διασποράς, αν και είναι σημαντικά φτωχότερη από την κλασική ανάλυση διασποράς.

Για να εκτιμηθεί η εξάρτηση, ή, για να το θέσω κάπως πομπωδώς, ο βαθμός εγγύτητας της σύνδεσης, υπολογίζεται ο συντελεστής συσχέτισης Pearson. Αυστηρά μιλώντας, η χρήση του έχει περιορισμούς που σχετίζονται, για παράδειγμα, με τον τύπο της κλίμακας στην οποία μετρώνται τα δεδομένα και τη μη γραμμικότητα της σχέσης, επομένως χρησιμοποιούνται μη παραμετρικοί ή λεγόμενοι συντελεστές συσχέτισης κατάταξης, για παράδειγμα , για τα ταξινομημένα δεδομένα, χρησιμοποιούνται επίσης ως εναλλακτική λύση. Εάν τα δεδομένα μετρώνται σε ονομαστική κλίμακα, τότε είναι φυσικό να παρουσιάζονται σε πίνακες έκτακτης ανάγκης, οι οποίοι χρησιμοποιούν το Pearson chi-square test με διάφορες παραλλαγές και προσαρμογές για ακρίβεια.

Έτσι, ουσιαστικά υπάρχουν μόνο μερικά είδη κριτηρίων και διαδικασιών που πρέπει να γνωρίζετε και να μπορείτε να χρησιμοποιήσετε, ανάλογα με τις ιδιαιτερότητες των δεδομένων. Πρέπει να καθορίσετε ποιο κριτήριο θα πρέπει να εφαρμοστεί σε μια συγκεκριμένη κατάσταση.

Οι μη παραμετρικές μέθοδοι είναι πιο κατάλληλες όταν τα μεγέθη του δείγματος είναι μικρά. Εάν υπάρχουν πολλά δεδομένα (για παράδειγμα, n >100), συχνά δεν έχει νόημα η χρήση μη παραμετρικών στατιστικών.

Εάν το μέγεθος του δείγματος είναι πολύ μικρό (για παράδειγμα, n = 10 ή λιγότερο), τότε τα επίπεδα σημαντικότητας για εκείνα τα μη παραμετρικά τεστ που χρησιμοποιούν την κανονική προσέγγιση μπορούν να θεωρηθούν μόνο πρόχειρες εκτιμήσεις.

Διαφορές μεταξύ ανεξάρτητων ομάδων. Εάν έχετε δύο δείγματα (για παράδειγμα, άνδρες και γυναίκες) που θέλετε να συγκρίνετε σχετικά με κάποια μέση τιμή, όπως η μέση αρτηριακή πίεση ή ο αριθμός των λευκών αιμοσφαιρίων, τότε μπορείτε να χρησιμοποιήσετε τη δοκιμή ανεξάρτητων δειγμάτων t.

Μη παραμετρικές εναλλακτικές σε αυτή τη δοκιμή είναι η δοκιμή της σειράς Wald-Wolfowitz, Mann-Whitney)/n, όπου x i είναι η i-η τιμή, n είναι ο αριθμός των παρατηρήσεων. Εάν μια μεταβλητή περιέχει αρνητικές τιμές ή μηδέν (0), ο γεωμετρικός μέσος όρος δεν μπορεί να υπολογιστεί.

Αρμονική μέση

Ο αρμονικός μέσος όρος χρησιμοποιείται μερικές φορές για τον μέσο όρο των συχνοτήτων. Ο αρμονικός μέσος όρος υπολογίζεται με τον τύπο: GS = n/S(1/x i) όπου GS είναι ο αρμονικός μέσος, n είναι ο αριθμός των παρατηρήσεων, x i είναι η τιμή του αριθμού παρατήρησης i. Εάν μια μεταβλητή περιέχει μηδέν (0), ο αρμονικός μέσος όρος δεν μπορεί να υπολογιστεί.

Διακύμανση και τυπική απόκλιση

Η διακύμανση δείγματος και η τυπική απόκλιση είναι τα πιο συχνά χρησιμοποιούμενα μέτρα μεταβλητότητας (παραλλαγή) στα δεδομένα. Η διασπορά υπολογίζεται ως το άθροισμα των τετραγωνικών αποκλίσεων των μεταβλητών τιμών από τη μέση τιμή του δείγματος, διαιρούμενο με n-1 (αλλά όχι με n). Η τυπική απόκλιση υπολογίζεται ως η τετραγωνική ρίζα της εκτίμησης της διακύμανσης.

Πεδίο εφαρμογής

Το εύρος μιας μεταβλητής είναι ένας δείκτης μεταβλητότητας, που υπολογίζεται ως το μέγιστο μείον το ελάχιστο.

Εύρος τεταρτημορίου

Το τριμηνιαίο εύρος, εξ ορισμού, είναι το ανώτερο τεταρτημόριο μείον το κατώτατο τεταρτημόριο (75% εκατοστημόριο μείον 25% εκατοστημόριο). Δεδομένου ότι το 75% εκατοστημόριο (ανώτερο τεταρτημόριο) είναι η τιμή στα αριστερά από την οποία είναι το 75% των παρατηρήσεων, και το 25% εκατοστημόριο (κάτω τεταρτημόριο) είναι η τιμή στα αριστερά της οποίας το 25% των παρατηρήσεων είναι, το τεταρτημόριο εύρος είναι το διάστημα γύρω από τη διάμεσο.που περιέχει το 50% των παρατηρήσεων (μεταβλητές τιμές).

Ασυμμετρία

Η λοξότητα είναι ένα χαρακτηριστικό του σχήματος μιας κατανομής. Η κατανομή είναι λοξή προς τα αριστερά εάν η τιμή λοξότητας είναι αρνητική. Η κατανομή είναι λοξή προς τα δεξιά εάν η λοξότητα είναι θετική. Η λοξότητα της τυπικής κανονικής κατανομής είναι 0. Η λοξότητα σχετίζεται με την τρίτη ροπή και ορίζεται ως: λοξότητα = n × M 3 /[(n-1) × (n-2) × s 3 ], όπου M 3 είναι ίσο με: (x i -xaverage x) 3, s 3 - τυπική απόκλιση αυξημένη στην τρίτη δύναμη, n - αριθμός παρατηρήσεων.

Υπέρβαση

Η κύρτωση είναι ένα χαρακτηριστικό του σχήματος μιας κατανομής, δηλαδή ένα μέτρο της ευκρίνειας της κορυφής της (σε σχέση με μια κανονική κατανομή, η κύρτωση της οποίας είναι 0). Τυπικά, οι κατανομές με πιο έντονη κορυφή από την κανονική έχουν θετική κύρτωση. Κατανομές των οποίων η κορυφή είναι λιγότερο έντονη από την κορυφή μιας κανονικής κατανομής έχουν αρνητική κύρτωση. Η κούρτωση συνδέεται με την τέταρτη στιγμή και καθορίζεται από τον τύπο:

κύρτωση = /[(n-1) × (n-2) × (n-3) × s 4 ], όπου M j ισούται με: (x-μέσος όρος x, s 4 - τυπική απόκλιση στην τέταρτη δύναμη, n - αριθμός παρατηρήσεων.

ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ ΚΑΤΑΤΑΞΗΣ KENDALL

Ένα από τα δείγματα μετρήσεων εξάρτησης δύο τυχαίων μεταβλητών (χαρακτηριστικά) Xi Υ,με βάση την κατάταξη των στοιχείων του δείγματος (X 1, Υ x), .. ., (X n, Y n). K. k. r. αναφέρεται έτσι σε κατάταξης στατιστικώνκαι καθορίζεται από τον τύπο

Οπου r i- U, που ανήκεις σε αυτό το ζευγάρι ( Χ, Υ), για κομμένο Xequal i, S = 2N-(n-1)/2, N είναι ο αριθμός των δειγματοληπτικών στοιχείων, για τα οποία τόσο j>i όσο και r j >r i. Πάντα Ως επιλεκτικό μέτρο της εξάρτησης του Κ. κ.ρ. Το K. χρησιμοποιήθηκε ευρέως από τον M. Kendall (M. Kendall, βλ.).

K. k. r. Το κ. χρησιμοποιείται για τον έλεγχο της υπόθεσης της ανεξαρτησίας των τυχαίων μεταβλητών. Εάν η υπόθεση της ανεξαρτησίας είναι αληθής, τότε E t =0 και D t =2(2n+5)/9n(n-1). Με μικρό μέγεθος δείγματος, έλεγχος των στατιστικών Οι υποθέσεις ανεξαρτησίας γίνονται χρησιμοποιώντας ειδικούς πίνακες (βλ.). Για n>10, χρησιμοποιήστε την κανονική προσέγγιση για την κατανομή m: αν

τότε η υπόθεση της ανεξαρτησίας απορρίπτεται, διαφορετικά γίνεται αποδεκτή. Εδω ενα . - επίπεδο σημαντικότητας, u a /2 είναι η ποσοστιαία μονάδα της κανονικής κατανομής. K. k. r. Το k., όπως κάθε, μπορεί να χρησιμοποιηθεί για την ανίχνευση της εξάρτησης δύο ποιοτικών χαρακτηριστικών, εάν μόνο τα στοιχεία του δείγματος μπορούν να ταξινομηθούν σε σχέση με αυτά τα χαρακτηριστικά. Αν Χ, Υέχουν κοινή κανονική με τον συντελεστή συσχέτισης p, τότε η σχέση μεταξύ Κ. κ.ρ. κ. και έχει τη μορφή:

δείτε επίσης Συσχέτιση βαθμού Spearman, δοκιμή κατάταξης.

Αναμμένο.: Kendal M., Rank correlations, μτφρ. from English, Μ., 1975; Van der Waerden B. L., Μαθηματικά, μετάφρ. from German, Μ., 1960; Bolshev L. N., Smirnov N. V., Tables of mathematical statistics, M., 1965.

A. V. Prokhorov.

Μαθηματική εγκυκλοπαίδεια. - Μ.: Σοβιετική Εγκυκλοπαίδεια. I. M. Vinogradov. 1977-1985.

Δείτε τι είναι ο "ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ ΚΑΤΑΤΑΞΗΣ KENDALL" σε άλλα λεξικά:

Αγγλικά με αποτελεσματική, κατάταξη συσχέτιση Kendall? Γερμανός Kendalls Rangkorrelationskoeffizient. Ένας συντελεστής συσχέτισης που καθορίζει τον βαθμό συμφωνίας μεταξύ της σειράς όλων των ζευγών αντικειμένων σύμφωνα με δύο μεταβλητές. Αντινάζι. Εγκυκλοπαίδεια Κοινωνιολογίας, 2009 ... Εγκυκλοπαίδεια Κοινωνιολογίας

ΣΥΝΤΕΛΕΣΤΗΣ ΣΥΣΧΕΤΙΣΗΣ ΚΑΤΑΤΑΞΗΣ KENDALL- Αγγλικά συντελεστής, συσχέτιση κατάταξης Kendall; Γερμανός Kendalls Rangkorrelationskoeffizient. Ο συντελεστής συσχέτισης, ο οποίος καθορίζει τον βαθμό αντιστοιχίας της σειράς όλων των ζευγών αντικειμένων σύμφωνα με δύο μεταβλητές... Επεξηγηματικό λεξικό κοινωνιολογίας

Ένα μέτρο της εξάρτησης δύο τυχαίων μεταβλητών (χαρακτηριστικά) X και Y, με βάση την κατάταξη των αποτελεσμάτων ανεξάρτητης παρατήρησης (X1, Y1), . . ., (Xn,Yn). Εάν οι τάξεις των τιμών Χ είναι σε φυσική σειρά i=1, . . ., n,a Ri rank Y, που αντιστοιχεί σε... ... Μαθηματική Εγκυκλοπαίδεια

Συντελεστής συσχέτισης- (Συντελεστής συσχέτισης) Ο συντελεστής συσχέτισης είναι ένας στατιστικός δείκτης της εξάρτησης δύο τυχαίων μεταβλητών Ορισμός του συντελεστή συσχέτισης, τύποι συντελεστών συσχέτισης, ιδιότητες του συντελεστή συσχέτισης, υπολογισμός και εφαρμογή... ... Εγκυκλοπαίδεια Επενδυτών

Μια εξάρτηση μεταξύ τυχαίων μεταβλητών που, σε γενικές γραμμές, δεν έχει αυστηρά λειτουργικό χαρακτήρα. Σε αντίθεση με τη λειτουργική εξάρτηση, το Κ., κατά κανόνα, θεωρείται όταν μία από τις ποσότητες εξαρτάται όχι μόνο από την άλλη, αλλά και... ... Μαθηματική Εγκυκλοπαίδεια

Η συσχέτιση (εξάρτηση συσχέτισης) είναι μια στατιστική σχέση μεταξύ δύο ή περισσότερων τυχαίων μεταβλητών (ή μεταβλητών που μπορούν να θεωρηθούν ως τέτοιες με κάποιο αποδεκτό βαθμό ακρίβειας). Σε αυτήν την περίπτωση, αλλαγές στις τιμές ενός ή ... ... Wikipedia

Συσχέτιση- (Συσχέτιση) Η συσχέτιση είναι μια στατιστική σχέση μεταξύ δύο ή περισσότερων τυχαίων μεταβλητών Η έννοια της συσχέτισης, οι τύποι συσχέτισης, ο συντελεστής συσχέτισης, η ανάλυση συσχέτισης, η συσχέτιση τιμών, η συσχέτιση των ζευγών νομισμάτων σε Περιεχόμενα Forex... ... Εγκυκλοπαίδεια Επενδυτών

Είναι γενικά αποδεκτό ότι η έναρξη του S. m.v. ή, όπως συχνά αποκαλείται, στατιστική του «μικρού ν», ιδρύθηκε την πρώτη δεκαετία του 20ου αιώνα με τη δημοσίευση του έργου του W. Gosset, στο οποίο τοποθέτησε την κατανομή t, σύμφωνα με αυτήν που έλαβε. λίγο αργότερα παγκοσμίως...... Ψυχολογική Εγκυκλοπαίδεια

Maurice Kendall Sir Maurice George Kendall Ημερομηνία γέννησης: 6 Σεπτεμβρίου 1907 (1907 09 06) Τόπος γέννησης: Kettering, UK Ημερομηνία θανάτου ... Wikipedia

Πρόβλεψη- (Πρόβλεψη) Ορισμός της πρόβλεψης, των εργασιών και των αρχών της πρόβλεψης Ορισμός της πρόβλεψης, των εργασιών και των αρχών της πρόβλεψης, των μεθόδων πρόβλεψης Περιεχόμενα Περιεχόμενα Ορισμός Βασικές έννοιες της πρόβλεψης Εργασίες και αρχές της πρόβλεψης... ... Εγκυκλοπαίδεια Επενδυτών

Να υπολογίσω Συντελεστής Kendallοι τιμές των χαρακτηριστικών του παράγοντα είναι προκαταλεγμένες, δηλαδή, οι τάξεις κατά X γράφονται αυστηρά με αύξουσα σειρά ποσοτικών τιμών.

1) Για κάθε κατάταξη στο Y, βρείτε τον συνολικό αριθμό των επόμενων βαθμών που είναι μεγαλύτερες σε αξία από τη δεδομένη κατάταξη. Ο συνολικός αριθμός τέτοιων περιπτώσεων λαμβάνεται υπόψη με σύμβολο «+» και συμβολίζεται με P.

2) Για κάθε κατάταξη στο Y, προσδιορίστε τον αριθμό των επόμενων βαθμών που είναι μικρότερες σε αξία από τη δεδομένη κατάταξη. Ο συνολικός αριθμός τέτοιων περιπτώσεων λαμβάνεται υπόψη με σύμβολο «-» και συμβολίζεται με Q.

3) Υπολογίστε S=P+Q=9+(-1)=8

4) Ο συντελεστής Kendell υπολογίζεται χρησιμοποιώντας τον τύπο:

Ο συντελεστής Kendell μπορεί να πάρει τιμές από -1 έως +1 και όσο πιο κοντά στο , τόσο ισχυρότερη είναι η σχέση μεταξύ των χαρακτηριστικών.

Σε ορισμένες περιπτώσεις, για να καθορίσουν την κατεύθυνση της σχέσης μεταξύ δύο χαρακτηριστικών, υπολογίζουν Συντελεστής Fechner. Αυτός ο συντελεστής βασίζεται σε σύγκριση της συμπεριφοράς των αποκλίσεων των μεμονωμένων τιμών του παράγοντα και των προκύπτοντων χαρακτηριστικών από τη μέση τιμή τους. Ο συντελεστής Fechner υπολογίζεται με τον τύπο:

; όπου το άθροισμα C είναι ο συνολικός αριθμός των συμπτώσεων των σημείων των αποκλίσεων, το άθροισμα H είναι ο συνολικός αριθμός αναντιστοιχιών των σημείων των αποκλίσεων.

1) Υπολογίστε τη μέση τιμή του χαρακτηριστικού παράγοντα:

2) Προσδιορίστε τα σημάδια των αποκλίσεων των μεμονωμένων τιμών του χαρακτηριστικού παράγοντα από τη μέση τιμή.

3) Υπολογίστε τη μέση τιμή του χαρακτηριστικού που προκύπτει: .

4) Βρείτε τα σημάδια των αποκλίσεων των μεμονωμένων τιμών του προκύπτοντος χαρακτηριστικού από τη μέση τιμή:

συμπέρασμα: η σύνδεση είναι άμεση, ο συντελεστής δεν δείχνει την εγγύτητα της σύνδεσης.

Για να προσδιορίσετε τον βαθμό εγγύτητας της σύνδεσης μεταξύ των τριών ταξινομημένων χαρακτηριστικών, υπολογίστε τον συντελεστή συμφωνία.Υπολογίζεται με τον τύπο:

, όπου m είναι ο αριθμός των ταξινομημένων χαρακτηριστικών. n είναι ο αριθμός των ταξινομημένων μονάδων παρατήρησης.

Βιομηχανίες	Χ1	X2	X3	R1	R2	R3
Βιομηχανία ηλεκτρικής ενέργειας			7,49
Καύσιμα			12,70
Τσερνάγια Μ.			5,92
Τσβέτναγια Μ.			9,48
Μηχανολογία			4,18
Αποτέλεσμα:

Χ1- αριθμός εργαζομένων (χιλιάδες άτομα). X2- όγκος βιομηχανικών πωλήσεων (δισεκατομμύρια ρούβλια). X3- μέσος μηνιαίος μισθός.

1) Κατατάσσουμε τις τιμές όλων των χαρακτηριστικών και ορίζουμε τις τάξεις αυστηρά κατά σειρά αύξησης των ποσοτικών τιμών.

2) Για κάθε γραμμή, προσδιορίστε το άθροισμα των βαθμών. Η συνολική σειρά υπολογίζεται από αυτήν τη στήλη.

3) Υπολογίστε .

4) Για κάθε σειρά να βρείτε τις τετραγωνικές αποκλίσεις των αθροισμάτων των βαθμών και των τιμών Τ. Με την ίδια στήλη υπολογίζουμε την τελική σειρά, την οποία συμβολίζουμε με S. Ο συντελεστής συμφωνίας μπορεί να πάρει τιμές από 0 έως 1 και όσο πιο κοντά είναι στο 1, τόσο ισχυρότερη είναι η σχέση μεταξύ των χαρακτηριστικών.

Ανάγνωση:

Ωραία ονόματα για τον Gosha στην Odnoklassniki Δακτυλογραφημένη γλώσσα προγραμματισμού Τύπος ή προσδιοριστής μορφής ή χαρακτήρες μετατροπής ή χαρακτήρες ελέγχου Πρόγραμμα εργασίας των Russian Post στις διακοπές της Πρωτοχρονιάς Ταχυδρομικές εργασίες στις διακοπές της Πρωτοχρονιάς Tass: αποκωδικοποίηση συντομογραφίας Πρότυπα πιστοποιητικών κενή λήψη του προτύπου Πιστοποιητικού Τιμής για εκτύπωση

Ανάγνωση: