heim - Service
Rangkorrelationskoeffizienten nach Spearman, Kendall, Fechner-Koeffizient. Kendall- und Spearman-Rangkorrelationskoeffizienten Beispiel für einen Kendall-Rangkorrelationskoeffizienten

Präsentation und Vorbearbeitung von Gutachten

In der Praxis kommen verschiedene Arten von Beurteilungen zum Einsatz:

- qualitativ (oft-selten, schlechter-besser, ja-nein),

- Skalenbewertungen (Wertebereiche 50-75, 76-90, 91-120 usw.),

Punkte aus einem bestimmten Intervall (von 2 bis 5, 1 -10), voneinander unabhängig,

Rangfolge (Objekte werden vom Experten in einer bestimmten Reihenfolge angeordnet und jedem wird eine Seriennummer zugewiesen – Rang),

Vergleich, erhalten durch eine der Vergleichsmethoden

sequentielle Vergleichsmethode

Methode des paarweisen Vergleichs von Faktoren.

Im nächsten Schritt der Gutachtenbearbeitung steht die Bewertung an der Grad der Übereinstimmung zwischen diesen Meinungen.

Von Experten erhaltene Bewertungen können als Zufallsvariable betrachtet werden, deren Verteilung die Meinung von Experten über die Wahrscheinlichkeit einer bestimmten Ereigniswahl (Faktor) widerspiegelt. Um die Streuung und Konsistenz von Experteneinschätzungen zu analysieren, werden daher verallgemeinerte statistische Merkmale verwendet – Durchschnittswerte und Streumaße:

Mittlerer quadratischer Fehler,

Variationsbereich min – max,

- Variationskoeffizient V = durchschnittliche quadratische Abweichung / arithmischer Durchschnitt (für jede Art von Beurteilung geeignet)

V i = σ i / x i durchschn

Zum Preis Ähnlichkeitsmaße und Meinungen jedes Expertenpaar Dabei können verschiedene Methoden zum Einsatz kommen:

Assoziationskoeffizienten, mit dessen Hilfe die Anzahl der passenden und nicht passenden Antworten berücksichtigt wird,

Inkonsistenzkoeffizienten Gutachten,

Alle diese Maßnahmen können entweder zum Vergleich der Meinungen zweier Experten oder zur Analyse des Zusammenhangs zwischen einer Reihe von Bewertungen zu zwei Merkmalen verwendet werden.

Spearmans gepaarter Rangkorrelationskoeffizient:

wobei n die Anzahl der Experten ist,

c k – die Differenz zwischen den Schätzungen des i-ten und j-ten Experten für alle T-Faktoren

Der Rangkorrelationskoeffizient (Konkordanzkoeffizient) von Kendall liefert eine Gesamtbewertung der Konsistenz der Meinungen aller Experten zu allen Faktoren, jedoch nur für Fälle, in denen Rangschätzungen verwendet wurden.

Es ist erwiesen, dass der Wert von S, wenn alle Experten alle Faktoren gleich einschätzen, einen Maximalwert von gleich hat

wobei n die Anzahl der Faktoren ist,

m – Anzahl der Experten.

Der Konkordanzkoeffizient ist gleich dem Verhältnis

Wenn W außerdem nahe bei 1 liegt, haben alle Experten ziemlich konsistente Schätzungen abgegeben, andernfalls sind ihre Meinungen nicht konsistent.

Die Formel zur Berechnung von S ist unten angegeben:

wobei r ij die Rangschätzungen des i-ten Faktors durch den j-ten Experten sind,

r avg ist der durchschnittliche Rang über die gesamte Bewertungsmatrix und entspricht

Und daher kann die Formel zur Berechnung von S die Form annehmen:

Stimmen einzelne Einschätzungen eines Gutachters überein und wurden diese bei der Bearbeitung vereinheitlicht, so wird zur Berechnung des Konkordanzkoeffizienten eine andere Formel verwendet:



wobei T j für jeden Experten berechnet wird (wenn seine Bewertungen für verschiedene Objekte wiederholt wurden) unter Berücksichtigung von Wiederholungen nach den folgenden Regeln:

wobei t j die Anzahl der gleichrangigen Gruppen für den j-ten Experten ist, und

h k ist die Anzahl gleicher Ränge in der k-ten Gruppe verwandter Ränge des j-ten Experten.

BEISPIEL. Lassen Sie 5 Experten zu sechs Faktoren die in Tabelle 3 gezeigte Rangfolge beantworten:

Tabelle 3 – Antworten der Experten

Experten O1 O2 O3 O4 O5 O6 Summe der Ränge nach Experten
E1
E2
E3
E4
E5

Aufgrund der Tatsache, dass wir keine strenge Rangfolge erhalten haben (die Bewertungen der Experten wiederholen sich und die Summen der Ränge sind nicht gleich), werden wir die Bewertungen transformieren und die zugehörigen Ränge erhalten (Tabelle 4):

Tabelle 4 – Zugehörige Ränge der Expertenbewertungen

Experten O1 O2 O3 O4 O5 O6 Summe der Ränge nach Experten
E1 2,5 2,5
E2
E3 1,5 1,5 4,5 4,5
E4 2,5 2,5 4,5 4,5
E5 5,5 5,5
Summe der Ränge für ein Objekt 7,5 9,5 23,5 29,5

Bestimmen wir nun den Grad der Übereinstimmung zwischen Expertenmeinungen mithilfe des Konkordanzkoeffizienten. Da die Ränge zusammenhängen, berechnen wir W mithilfe der Formel (**).

Dann ist r av =7*5/2=17,5

S = 10 2 +8 2 +4,5 2 +4,5 2 +6 2 +12 2 = 384,5

Fahren wir mit den Berechnungen von W fort. Dazu berechnen wir die Werte von T j separat. Im Beispiel werden die Bewertungen speziell so ausgewählt, dass jeder Experte sich wiederholende Bewertungen hat: Der 1. hat zwei, der zweite hat drei, der dritte hat zwei Gruppen von zwei Bewertungen und der vierte und fünfte haben zwei identische Bewertungen. Von hier:

T 1 = 2 3 – 2 = 6 T 5 = 6

T 2 = 3 · 3 – 3 = 24

T 3 = 2 3 –2+ 2 3 –2 = 12 T 4 = 12

Wir sehen, dass die Konsistenz der Expertenmeinungen recht hoch ist, und können mit der nächsten Phase der Studie fortfahren – der Begründung und Übernahme der von den Experten empfohlenen Lösungsalternative.

Andernfalls müssen Sie zu den Schritten 4–8 zurückkehren.

Der Kendall-Korrelationskoeffizient wird verwendet, wenn Variablen auf zwei Ordinalskalen dargestellt werden, sofern keine zugeordneten Ränge vorhanden sind. Bei der Berechnung des Kendall-Koeffizienten wird die Anzahl der Übereinstimmungen und Inversionen gezählt. Betrachten wir dieses Vorgehen am Beispiel des vorherigen Problems.

Der Algorithmus zur Lösung des Problems lautet wie folgt:

    Wir ordnen die Daten in der Tabelle neu. 8,5, sodass eine der Reihen (in diesem Fall die Reihe X i) stellte sich als rangiert heraus. Mit anderen Worten: Wir ordnen die Paare neu X Und j in der richtigen Reihenfolge und Wir tragen die Daten in die Spalten 1 und 2 der Tabelle ein. 8.6.

Tabelle 8.6

X ich

j ich

2. Bestimmen Sie den „Ranggrad“ der 2. Zeile ( j ich). Dieser Vorgang wird in der folgenden Reihenfolge durchgeführt:

a) Nehmen Sie den ersten Wert der unbewerteten Reihe „3“. Zählen der Anzahl der Ränge unten gegebene Zahl, die mehr verglichener Wert. Es gibt 9 solcher Werte (Zahlen 6, 7, 4, 9, 5, 11, 8, 12 und 10). Geben Sie in der Spalte „Übereinstimmungen“ die Zahl 9 ein. Dann zählen wir die Anzahl der Werte weniger drei. Es gibt 2 solcher Werte (Rang 1 und 2); In der Spalte „Inversion“ tragen wir die Zahl 2 ein.

b) Verwerfen Sie die Zahl 3 (wir haben bereits damit gearbeitet) und wiederholen Sie den Vorgang für den nächsten Wert „6“: Die Anzahl der Übereinstimmungen beträgt 6 (Ränge 7, 9, 11, 8, 12 und 10), die Anzahl der Inversionen sind 4 (Ränge 1, 2, 4 und 5). In die Spalte „Zufall“ tragen wir die Zahl 6 und in die Spalte „Inversion“ die Zahl 4 ein.

c) der Vorgang wird in ähnlicher Weise bis zum Ende der Reihe wiederholt; Dabei ist zu beachten, dass jeder „errechnete“ Wert von der weiteren Betrachtung ausgeschlossen wird (es werden nur Ränge berechnet, die unterhalb dieser Zahl liegen).

Notiz

Um bei den Berechnungen keine Fehler zu machen, ist zu bedenken, dass mit jedem „Schritt“ die Summe der Zufälle und Inversionen um eins abnimmt; Dies ist verständlich, da jeweils ein Wert von der Berücksichtigung ausgeschlossen wird.

3. Die Summe der Treffer wird berechnet (R) und die Summe der Inversionen (Q); Die Daten werden in eine und drei austauschbare Formeln für den Kendall-Koeffizienten (8.10) eingegeben. Die entsprechenden Berechnungen werden durchgeführt.

T (8.10)

In unserem Fall:

In der Tabelle Anhang XIV enthält die kritischen Werte des Koeffizienten für diese Stichprobe: τ cr. = 0,45; 0,59. Der empirisch ermittelte Wert wird mit dem tabellierten Wert verglichen.

Abschluss

τ = 0,55 > τ cr. = 0,45. Die Korrelation ist auf Ebene 1 statistisch signifikant.

Notiz:

Falls erforderlich (z. B. wenn keine Tabelle mit kritischen Werten vorhanden ist), statistische Signifikanz T Kendall kann durch die folgende Formel bestimmt werden:

(8.11)

Wo S* = P – Q+ 1 wenn P< Q , Und S* = P – Q – 1 wenn P>Q.

Werte z für das entsprechende Signifikanzniveau entsprechen dem Pearson-Maß und sind in den entsprechenden Tabellen zu finden (nicht im Anhang enthalten). Für Standard-Signifikanzniveaus z kr = 1,96 (für β 1 = 0,95) und 2,58 (für β 2 = 0,99). Der Kendall-Korrelationskoeffizient ist statistisch signifikant, wenn z > z cr

In unserem Fall S* = P – Q– 1 = 35 und z= 2,40, d. h. die erste Schlussfolgerung bestätigt sich: Die Korrelation zwischen den Merkmalen ist für die 1. Signifikanzebene statistisch signifikant.

Ein Faktor, der die Verwendung von Tests auf der Grundlage der Normalitätsannahme einschränkt, ist die Stichprobengröße. Solange die Stichprobe groß genug ist (z. B. 100 oder mehr Beobachtungen), können Sie davon ausgehen, dass die Stichprobenverteilung normal ist, auch wenn Sie nicht sicher sind, ob die Verteilung der Variablen in der Grundgesamtheit normal ist. Wenn die Stichprobe jedoch klein ist, sollten diese Tests nur dann verwendet werden, wenn Sie sicher sind, dass die Variable tatsächlich eine Normalverteilung aufweist. Allerdings gibt es keine Möglichkeit, diese Annahme in einer kleinen Stichprobe zu überprüfen.

Die Verwendung von Kriterien, die auf der Normalitätsannahme basieren, wird auch durch die Messskala begrenzt (siehe Kapitel Elementare Konzepte der Datenanalyse). Statistische Methoden wie T-Test, Regression usw. gehen davon aus, dass die Originaldaten kontinuierlich sind. Es gibt jedoch Situationen, in denen Daten einfach in eine Rangfolge gebracht (auf einer Ordinalskala gemessen) und nicht genau gemessen werden.

Ein typisches Beispiel sind Bewertungen von Seiten im Internet: Den ersten Platz belegt die Seite mit der maximalen Besucherzahl, den zweiten Platz belegt die Seite mit der maximalen Besucherzahl unter den übrigen Seiten (unter den Seiten). von der die erste Website gelöscht wurde) usw. Wenn wir die Bewertungen kennen, können wir sagen, dass die Anzahl der Besucher auf einer Website größer ist als die Anzahl der Besucher auf einer anderen, aber um wie viel mehr lässt sich nicht sagen. Stellen Sie sich vor, Sie haben 5 Websites: A, B, C, D, E, die auf den ersten 5 Plätzen platziert sind. Nehmen wir an, dass wir im aktuellen Monat die folgende Anordnung hatten: A, B, C, D, E und im Vormonat: D, E, A, B, C. Die Frage ist, ob es signifikante Änderungen in der Rangliste gegeben hat von Websites oder nicht? In dieser Situation können wir den t-Test natürlich nicht zum Vergleich dieser beiden Datengruppen verwenden und bewegen uns in den Bereich spezifischer probabilistischer Berechnungen (und jeder statistische Test enthält probabilistische Berechnungen!). Wir argumentieren ungefähr wie folgt: Wie wahrscheinlich ist es, dass der Unterschied in den beiden Standortanordnungen auf rein zufälligen Gründen beruht, oder ob dieser Unterschied zu groß ist und nicht durch reinen Zufall erklärt werden kann? In diesen Diskussionen verwenden wir nur Rangfolgen oder Permutationen von Websites und verwenden in keiner Weise eine bestimmte Art der Verteilung der Anzahl der Besucher dieser Websites.

Nichtparametrische Methoden werden zur Analyse kleiner Stichproben und für Daten verwendet, die in schlechten Maßstäben gemessen werden.

Ein kurzer Überblick über nichtparametrische Verfahren

Im Wesentlichen gibt es für jedes parametrische Kriterium mindestens eine nichtparametrische Alternative.

Im Allgemeinen fallen diese Verfahren in eine der folgenden Kategorien:

  • Differenztests für unabhängige Stichproben;
  • Differenztests für abhängige Stichproben;
  • Einschätzung des Grades der Abhängigkeit zwischen Variablen.

Im Allgemeinen sollte die Herangehensweise an statistische Kriterien bei der Datenanalyse pragmatisch sein und nicht mit unnötigen theoretischen Überlegungen belastet werden. Mit einem Computer, auf dem STATISTICA läuft, können Sie ganz einfach mehrere Kriterien auf Ihre Daten anwenden. Wenn Sie einige der Fallstricke der Methoden kennen, können Sie durch Experimentieren die richtige Lösung auswählen. Der Plotverlauf ist ganz natürlich: Will man die Werte zweier Variablen vergleichen, dann nutzt man einen t-Test. Es sollte jedoch beachtet werden, dass es auf der Annahme von Normalität und Gleichheit der Varianzen in jeder Gruppe basiert. Das Entfernen dieser Annahmen führt zu nichtparametrischen Tests, die besonders für kleine Stichproben nützlich sind.

Die Entwicklung des t-Tests führt zur Varianzanalyse, die verwendet wird, wenn die Anzahl der verglichenen Gruppen mehr als zwei beträgt. Die entsprechende Entwicklung nichtparametrischer Verfahren führt zu einer nichtparametrischen Varianzanalyse, die jedoch deutlich schlechter ist als die klassische Varianzanalyse.

Um die Abhängigkeit oder, etwas pompös ausgedrückt, den Grad der Nähe des Zusammenhangs zu beurteilen, wird der Pearson-Korrelationskoeffizient berechnet. Streng genommen weist seine Verwendung Einschränkungen auf, die beispielsweise mit der Art der Skala, in der die Daten gemessen werden, und der Nichtlinearität der Beziehung, also beispielsweise der verwendeten nichtparametrischen oder sogenannten Rangkorrelationskoeffizienten, zusammenhängen Alternativ werden auch Rank-Daten verwendet. Wenn Daten auf einer nominalen Skala gemessen werden, ist es selbstverständlich, sie in Kontingenztabellen darzustellen, die den Pearson-Chi-Quadrat-Test mit verschiedenen Variationen und Anpassungen für die Präzision verwenden.

Im Wesentlichen gibt es also nur wenige Arten von Kriterien und Verfahren, die Sie je nach den Besonderheiten der Daten kennen und anwenden können müssen. Sie müssen festlegen, welches Kriterium in einer bestimmten Situation angewendet werden soll.

Nichtparametrische Methoden eignen sich am besten für kleine Stichprobengrößen. Bei vielen Daten (z. B. n > 100) ist die Verwendung nichtparametrischer Statistiken oft nicht sinnvoll.

Wenn die Stichprobengröße sehr klein ist (z. B. n = 10 oder weniger), können die Signifikanzniveaus für die nichtparametrischen Tests, die die Normalnäherung verwenden, nur als grobe Schätzungen betrachtet werden.

Unterschiede zwischen unabhängigen Gruppen. Wenn Sie zwei Stichproben haben (z. B. Männer und Frauen), die Sie hinsichtlich eines Mittelwerts vergleichen möchten, z. B. des mittleren Blutdrucks oder der Anzahl weißer Blutkörperchen, können Sie den t-Test für unabhängige Stichproben verwenden.

Nichtparametrische Alternativen zu diesem Test sind der Wald-Wolfowitz-, Mann-Whitney-Reihentest)/n, wobei x i der i-te Wert und n die Anzahl der Beobachtungen ist. Wenn eine Variable negative Werte oder Null (0) enthält, kann das geometrische Mittel nicht berechnet werden.

Harmonische Mittel

Das harmonische Mittel wird manchmal zum Mitteln von Frequenzen verwendet. Der harmonische Mittelwert wird nach folgender Formel berechnet: GS = n/S(1/x i) wobei GS der harmonische Mittelwert, n die Anzahl der Beobachtungen und x i der Wert der Beobachtungszahl i ist. Wenn eine Variable Null (0) enthält, kann das harmonische Mittel nicht berechnet werden.

Varianz und Standardabweichung

Stichprobenvarianz und Standardabweichung sind die am häufigsten verwendeten Maße für die Variabilität (Variation) von Daten. Die Streuung wird als Summe der quadratischen Abweichungen der Variablenwerte vom Stichprobenmittelwert dividiert durch n-1 (jedoch nicht durch n) berechnet. Die Standardabweichung wird als Quadratwurzel der Varianzschätzung berechnet.

Umfang

Der Bereich einer Variablen ist ein Indikator für die Variabilität und wird als Maximum minus Minimum berechnet.

Quartilbereich

Der vierteljährliche Bereich ist per Definition das oberste Quartil minus dem untersten Quartil (75 %-Perzentil minus 25 %-Perzentil). Da das 75 %-Perzentil (oberes Quartil) der Wert ist, links davon 75 % der Beobachtungen liegen, und das 25 %-Perzentil (unteres Quartil) der Wert ist, links davon 25 % der Beobachtungen liegen, das Quartil Bereich ist das Intervall um den Median, der 50 % der Beobachtungen (Variablenwerte) enthält.

Asymmetrie

Schiefe ist ein Merkmal der Form einer Verteilung. Die Verteilung ist linksschief, wenn der Schiefewert negativ ist. Die Verteilung ist rechtsschief, wenn die Schiefe positiv ist. Die Schiefe der Standardnormalverteilung beträgt 0. Die Schiefe ist mit dem dritten Moment verbunden und ist definiert als: Schiefe = n × M 3 /[(n-1) × (n-2) × s 3 ], wobei M 3 ist gleich: (x i -xdurchschnittlich x) 3, s 3 - Standardabweichung erhöht auf die dritte Potenz, n - Anzahl der Beobachtungen.

Überschuss

Kurtosis ist ein Merkmal der Form einer Verteilung, nämlich ein Maß für die Schärfe ihres Peaks (relativ zu einer Normalverteilung, deren Kurtosis 0 ist). Typischerweise weisen Verteilungen mit einem schärferen Peak als dem Normalwert eine positive Kurtosis auf; Verteilungen, deren Spitze weniger scharf ist als die Spitze einer Normalverteilung, weisen eine negative Kurtosis auf. Kurtosis ist mit dem vierten Moment verbunden und wird durch die Formel bestimmt:

Kurtosis = /[(n-1) × (n-2) × (n-3) × s 4 ], wobei M j gleich ist: (x-Mittelwert x, s 4 – Standardabweichung zur vierten Potenz, n - Anzahl der Beobachtungen.

KENDALLS RANGKORRELATIONSKOEFFIZIENT

Eines der Stichprobenmaße der Abhängigkeit zweier Zufallsvariablen (Merkmale) Xi Y, basierend auf der Rangfolge der Stichprobenelemente (X 1, Y x), .. ., (X n, Y n). K. k. r. bezieht sich also auf Ranking-Statistiker und wird durch die Formel bestimmt

Wo r i- Du gehörst zu diesem Paar ( X, Y), für Schnitt Xgleich ich, S = 2N-(n-1)/2, N ist die Anzahl der Stichprobenelemente, für die sowohl j>i als auch r j >r i. Stets Als selektives Maß für die Abhängigkeit von K. k.r. K. wurde von M. Kendall häufig verwendet (M. Kendall, siehe).

K. k. r. k. wird verwendet, um die Hypothese der Unabhängigkeit von Zufallsvariablen zu testen. Wenn die Unabhängigkeitshypothese wahr ist, dann ist E t =0 und D t =2(2n+5)/9n(n-1). Bei einer kleinen Stichprobe die statistische Überprüfung durchführen Unabhängigkeitshypothesen werden mithilfe spezieller Tabellen erstellt (siehe). Für n>10 verwenden Sie die Normalnäherung für die Verteilung m: if

dann wird die Hypothese der Unabhängigkeit abgelehnt, andernfalls wird sie akzeptiert. Hier ein . - Signifikanzniveau, u a /2 ist der Prozentpunkt der Normalverteilung. K. k. r. k. kann wie jedes andere verwendet werden, um die Abhängigkeit zweier qualitativer Merkmale zu erkennen, wenn nur die Stichprobenelemente relativ zu diesen Merkmalen geordnet werden können. Wenn X, Y eine gemeinsame Normale mit dem Korrelationskoeffizienten p haben, dann ist die Beziehung zwischen K. k.r. k. und hat die Form:

siehe auch Spearman-Rangkorrelation, Rangtest.

Zündete.: Kendal M., Rangkorrelationen, trans. aus Englisch, M., 1975; Van der Waerden B. L., Mathematical, trans. aus Deutsch, M., 1960; Bolshev L. N., Smirnov N. V., Tabellen der mathematischen Statistik, M., 1965.

A. V. Prochorow.


Mathematische Enzyklopädie. - M.: Sowjetische Enzyklopädie. I. M. Winogradow. 1977-1985.

Sehen Sie, was „KENDALLS RANK-KORRELATIONSKOEFFIZIENT“ in anderen Wörterbüchern ist:

    Englisch mit effizienter Rangkorrelation Kendall; Deutsch Kendalls Rangkorrelationskoeffizient. Ein Korrelationskoeffizient, der den Grad der Übereinstimmung zwischen der Reihenfolge aller Objektpaare nach zwei Variablen bestimmt. Antinazi. Enzyklopädie der Soziologie, 2009 ... Enzyklopädie der Soziologie

    KENDALLS RANGKORRELATIONSKOEFFIZIENT- Englisch Koeffizient, Rangkorrelation Kendall; Deutsch Kendalls Rangkorrelationskoeffizient. Der Korrelationskoeffizient, der den Grad der Übereinstimmung der Reihenfolge aller Objektpaare nach zwei Variablen bestimmt... Erklärendes Wörterbuch der Soziologie

    Ein Maß für die Abhängigkeit zweier Zufallsvariablen (Merkmale) X und Y, basierend auf der Rangfolge unabhängiger Beobachtungsergebnisse (X1, Y1), . . ., (Xn,Yn). Wenn die Ränge der X-Werte in natürlicher Reihenfolge sind, ist i=1, . . ., n,a Ri Rang Y, entsprechend... ... Mathematische Enzyklopädie

    Korrelationskoeffizient- (Korrelationskoeffizient) Der Korrelationskoeffizient ist ein statistischer Indikator für die Abhängigkeit zweier Zufallsvariablen. Definition des Korrelationskoeffizienten, Arten von Korrelationskoeffizienten, Eigenschaften des Korrelationskoeffizienten, Berechnung und Anwendung... ... Investoren-Enzyklopädie

    Eine Abhängigkeit zwischen Zufallsvariablen, die im Allgemeinen keinen streng funktionalen Charakter hat. Im Gegensatz zur funktionalen Abhängigkeit wird K. in der Regel berücksichtigt, wenn eine der Größen nicht nur von der anderen abhängt, sondern auch... ... Mathematische Enzyklopädie

    Korrelation (Korrelationsabhängigkeit) ist eine statistische Beziehung zwischen zwei oder mehr Zufallsvariablen (oder Variablen, die mit einem akzeptablen Grad an Genauigkeit als solche betrachtet werden können). In diesem Fall sind Änderungen der Werte einer oder ... ... Wikipedia

    Korrelation- (Korrelation) Korrelation ist eine statistische Beziehung zwischen zwei oder mehr Zufallsvariablen. Das Konzept der Korrelation, Korrelationsarten, Korrelationskoeffizient, Korrelationsanalyse, Preiskorrelation, Korrelation von Währungspaaren auf Forex-Inhalten... ... Investoren-Enzyklopädie

    Es ist allgemein anerkannt, dass der Beginn von S. m.v. oder, wie es oft genannt wird, die Statistik des „kleinen n“, wurde im ersten Jahrzehnt des 20. Jahrhunderts mit der Veröffentlichung der Arbeit von W. Gosset gegründet, in der er die von ihm postulierte t-Verteilung postulierte etwas später weltweit... ... Psychologische Enzyklopädie

    Maurice Kendall Sir Maurice George Kendall Geburtsdatum: 6. September 1907 (1907 09 06) Geburtsort: Kettering, Großbritannien Sterbedatum ... Wikipedia

    Vorhersage- (Prognose) Definition der Prognose, Aufgaben und Prinzipien der Prognose Definition der Prognose, Aufgaben und Prinzipien der Prognose, Prognosemethoden Inhalt Inhalt Definition Grundkonzepte der Prognose Aufgaben und Prinzipien der Prognose... ... Investoren-Enzyklopädie

Berechnen Kendall-Koeffizient Die Werte des Faktormerkmals sind vorrangig, das heißt, die Ränge nach X werden streng in aufsteigender Reihenfolge der quantitativen Werte geschrieben.

1) Ermitteln Sie für jeden Rang in Y die Gesamtzahl der nachfolgenden Ränge, deren Wert größer ist als der angegebene Rang. Die Gesamtzahl solcher Fälle wird mit einem „+“-Zeichen berücksichtigt und mit P bezeichnet.

2) Bestimmen Sie für jeden Rang in Y die Anzahl der nachfolgenden Ränge, deren Wert kleiner ist als der angegebene Rang. Die Gesamtzahl dieser Fälle wird mit einem „-“-Zeichen berücksichtigt und mit Q bezeichnet.

3) Berechnen Sie S=P+Q=9+(-1)=8

4) Der Kendell-Koeffizient wird nach folgender Formel berechnet:

Der Kendell-Koeffizient kann Werte von -1 bis +1 annehmen, und je näher an , desto stärker ist der Zusammenhang zwischen den Merkmalen.

Um die Richtung der Beziehung zwischen zwei Merkmalen zu bestimmen, berechnen sie in manchen Fällen Fechner-Koeffizient. Dieser Koeffizient basiert auf einem Vergleich des Verhaltens von Abweichungen einzelner Faktorwerte und resultierender Merkmale von ihrem Durchschnittswert. Der Fechner-Koeffizient wird nach folgender Formel berechnet:

; wobei die Summe C die Gesamtzahl der Übereinstimmungen der Abweichungszeichen ist, die Summe H die Gesamtzahl der Nichtübereinstimmungen der Abweichungszeichen.

1) Berechnen Sie den Durchschnittswert des Faktormerkmals:

2) Bestimmen Sie die Vorzeichen der Abweichungen einzelner Werte des Faktormerkmals vom Durchschnittswert.

3) Berechnen Sie den Durchschnittswert des resultierenden Merkmals: .

4) Finden Sie die Anzeichen für Abweichungen einzelner Werte des resultierenden Merkmals vom Durchschnittswert:

Abschluss: Die Verbindung ist direkt, der Koeffizient gibt nicht die Nähe der Verbindung an.

Um den Grad der engen Verbindung zwischen den drei Rangmerkmalen zu bestimmen, berechnen Sie den Koeffizienten Konkordanz. Es wird nach der Formel berechnet:

, wobei m die Anzahl der geordneten Features ist; n ist die Anzahl der geordneten Beobachtungseinheiten.

Branchen X1 X2 X3 R1 R2 R3
Elektrizitätswirtschaft 7,49
Kraftstoff 12,70
Chernaya M. 5,92
Tsvetnaya M. 9,48
Maschinenbau 4,18
Ergebnis:

X1- Anzahl der Mitarbeiter (Tausend Personen); X2- Volumen des Industrieumsatzes (Milliarden Rubel); X3- durchschnittliches Monatsgehalt.

1) Wir ordnen die Werte aller Merkmale und legen die Ränge streng in der Reihenfolge steigender quantitativer Werte fest.

2) Bestimmen Sie für jede Zeile die Summe der Ränge. Aus dieser Spalte wird die Gesamtzeile berechnet.

3) Berechnen .

4) Ermitteln Sie für jede Zeile die quadratischen Abweichungen der Summen der Ränge und T-Werte. Unter Verwendung derselben Spalte berechnen wir die letzte Zeile, die wir mit S bezeichnen. Der Konkordanzkoeffizient kann Werte von 0 bis 1 annehmen, und je näher er an 1 liegt, desto stärker ist der Zusammenhang zwischen den Merkmalen.



 


Lesen:



Wie stelle ich RAM-Timings richtig ein?

Wie stelle ich RAM-Timings richtig ein?

RAM arbeitet basierend auf Steuersignalen vom Speichercontroller, der sich in der Northbridge des Chipsatzes (Intel) oder direkt befindet...

Installieren von Navitel auf einem Navigator und Computer

Installieren von Navitel auf einem Navigator und Computer

Wenn Sie Karten auf Ihrem Garmin-Navigationsgerät installieren müssen, sind Sie hier genau richtig. Im Folgenden werden wir uns verschiedene Möglichkeiten ansehen, dies zu tun. Also...

Ändern Sie das Passwort auf dem Minecraft-Server über Ihr persönliches Konto und im Client

Ändern Sie das Passwort auf dem Minecraft-Server über Ihr persönliches Konto und im Client

Das Minecraft-Spiel kann absolut jeden Spieler interessieren, denn darin können Sie Ihr ganz individuelles Märchen erschaffen und...

Was ist ein Lautsprecherkabel?

Was ist ein Lautsprecherkabel?

Bei der professionellen Arbeit mit Ton ist es sehr wichtig, die Grundprinzipien des Wechsels verschiedener Gerätetypen zu verstehen, das macht es einfacher und schneller...

Feed-Bild RSS