So berechnen Sie den Rangkorrelationskoeffizienten nach Spearman

Autor: Virginia Floyd
Erstelldatum: 8 August 2021
Aktualisierungsdatum: 20 Juni 2024
Anonim
Spearman Rangkorrelationskoeffizient in Excel berechnen - Analyiseren von Daten in Excel(45)
Video: Spearman Rangkorrelationskoeffizient in Excel berechnen - Analyiseren von Daten in Excel(45)

Inhalt

Mit dem Korrelationskoeffizienten des Spearman-Rangs können Sie bestimmen, ob eine Abhängigkeit zwischen zwei Variablen besteht, ausgedrückt durch eine monotone Funktion (dh mit dem Wachstum einer Variablen nimmt die zweite zu und umgekehrt). Mit den einfachen Schritten im Artikel können Sie Berechnungen manuell durchführen und den Korrelationskoeffizienten mit Excel und R berechnen.

Schritte

Methode 1 von 3: Manuell berechnen

  1. 1 Erstellen Sie eine Datentabelle. Dadurch werden die Informationen organisiert, die Sie zur Berechnung des Spearman-Rangkorrelationskoeffizienten benötigen. In diesem Fall benötigen Sie:
    • 6 Spalten, Überschrift wie oben.
    • Die Anzahl der Zeilen, die der Anzahl der Variablenpaare entspricht.
  2. 2 Füllen Sie die ersten beiden Spalten mit Variablenpaaren aus.
  3. 3 Notieren Sie in der dritten Spalte die Nummern (Ränge) der Variablenpaare von 1 bis n (Gesamtzahl der Paare). Weisen Sie dem Paar mit dem niedrigsten Wert in der ersten Spalte die Zahl 1 zu, dem nächstfolgenden Wert 2 usw. in aufsteigender Reihenfolge der Werte der Variablen aus der ersten Spalte.
  4. 4 In der vierten Spalte machen Sie dasselbe wie in der dritten, aber nummerieren Sie diesmal die Variablenpaare entsprechend der zweiten Spalte der Tabelle.
    • Wenn zwei (oder mehr) Werte einer Variablen in einer Spalte gleich sind, ordnen Sie sie nacheinander an und finden Sie den Durchschnitt ihrer Zahlen, dann nummerieren Sie sie mit diesem Durchschnitt.
      Im Beispiel rechts sind die beiden Werte der Variablen gleich und gleich 5; bei normaler Nummerierung würden diese Daten die Ränge 2 und 3 erhalten. Da die Werte gleich sind, finden wir den Durchschnittswert ihrer Ränge.Der Mittelwert von 2 und 3 ist 2,5, daher weisen wir beiden den Rang 2,5 zu.
  5. 5 Berechnen Sie in Spalte "d" die Differenz zwischen den beiden Rängen aus den beiden vorherigen Spalten. Wenn zum Beispiel der Rang in der dritten Spalte 1 ist und in der vierten 3, dann beträgt der Unterschied zwischen ihnen 2. Das Vorzeichen spielt keine Rolle, da diese Zahlen im nächsten Schritt quadriert werden.
  6. 6 Quadrieren Sie jeden Wert in Spalte "d" und schreiben Sie die resultierenden Werte in Spalte "d".
  7. 7Fügen Sie alle Werte in Spalte "d" hinzu. Sie bestimmen die Summe Σd.
  8. 8 Verwenden Sie eine der folgenden Formeln:
    • Wenn in den vorherigen Schritten nicht dieselben Werte erreicht wurden, setzen Sie einfach die resultierende Summe in die vereinfachte Formel ein, um den Rangkorrelationskoeffizienten nach Spearman zu berechnen:

      und ersetzen Sie "n" durch die Anzahl der Datenpaare, die Sie zuvor in die Tabelle eingegeben haben.
    • Wenn Sie in den vorherigen Schritten auf dieselben Werte stoßen, verwenden Sie die Standardformel, um den Rangkorrelationskoeffizienten von Spearman zu berechnen:
  9. 9 Analysieren Sie das Ergebnis. Der resultierende Wert liegt zwischen -1 und 1.
    • Liegt er nahe -1, ist die Korrelation negativ.
    • Wenn nahe 0, gibt es keine Korrelation.
    • Wenn nahe 1 liegt eine positive Korrelation vor.
    • Denken Sie daran, durch die Summe der Variablen zu dividieren und die Wurzel zu ziehen. Dann dividiere durch d.

Methode 2 von 3: In Excel berechnen

  1. 1 Erstellen Sie neue Spalten mit Rängen, die den Datenspalten entsprechen. Wenn beispielsweise Daten in Spalte A2: A11 eingegeben werden, verwenden Sie die Funktion "= RANK (A2, A $ 2: A $ 11)" und geben Sie die Ergebnisse für alle Zeilen in eine neue Spalte ein.
  2. 2Finden Sie die Ränge für dieselben Mengen wie in den Schritten 3 und 4 von Methode 1 beschrieben.
  3. 3 Bestimmen Sie in einer neuen Zelle die Korrelation zwischen den beiden Rangspalten mit der Funktion "= KORREL (C2: C11, D2: D11)". In diesem Fall sind C und D Spalten mit Rängen. Somit erhalten Sie in dieser Zelle den Rangkorrelationskoeffizienten von Spearman.

Methode 3 von 3: Berechnung in R

  1. 1 Wenn Sie noch nicht über die R-Software zur Verarbeitung von Statistiken verfügen, erwerben Sie eine (siehe. http://www.r-project.org).
  2. 2 Speichern Sie die Daten im CSV-Format, indem Sie sie in zwei Spalten anordnen, deren Korrelation Sie untersuchen möchten. Es ist einfach, die Datei in diesem Format mit der Option "Speichern unter" zu speichern.
  3. 3 Öffnen Sie den R-Editor. Wenn Sie noch nicht beim R-Programm angemeldet sind, starten Sie es einfach. Klicken Sie dazu einfach auf das R-Symbol auf dem Desktop.
  4. 4 Geben Sie die Befehle ein:
    • d - lese.csv ("NAME_OF_YOUR_CSV.csv") und drücke die Eingabetaste
    • cor (Rang (d [, 1]), Rang (d [, 2]))

Tipps

  • In der Regel sollte der Datensatz mindestens 5 Paare umfassen, um eine Korrelation zuverlässig herstellen zu können (im obigen Beispiel wurden der Einfachheit halber 3 Paare verwendet).

Warnungen

  • Mit dem Rangkorrelationskoeffizienten nach Spearman lässt sich nur feststellen, ob beide Variablen gleichzeitig steigen oder fallen. Wenn die Datenstreuung zu groß ist, wird dieser Koeffizient nicht gibt den genauen Korrelationswert an.
  • Die angegebene Funktion liefert das richtige Ergebnis, wenn keine identischen Werte im Datenarray vorhanden sind. Existieren solche Werte, wie in unserem Beispiel, sollte folgende Definition verwendet werden: Rangbasierter Korrelationskoeffizient.