Bestimmen Sie den Korrelationskoeffizienten

Autor: Morris Wright
Erstelldatum: 28 April 2021
Aktualisierungsdatum: 19 Juni 2024
Anonim
Pearson Korrelationskoeffizient berechnen - Statistik einfach erklärt!
Video: Pearson Korrelationskoeffizient berechnen - Statistik einfach erklärt!

Inhalt

Der mit r oder ρ bezeichnete Korrelationskoeffizient ist das Maß für die lineare Korrelation (die Beziehung sowohl in Stärke als auch in Richtung) zwischen zwei Variablen. Sie reicht von -1 bis +1, wobei Plus- und Minuszeichen verwendet werden, um die positive und negative Korrelation darzustellen. Wenn der Korrelationskoeffizient genau -1 ist, ist die Beziehung zwischen den beiden Variablen vollständig negativ; Wenn der Korrelationskoeffizient genau +1 ist, ist die Beziehung vollständig positiv. Zwei Variablen können eine positive Korrelation, eine negative Korrelation oder überhaupt keine Korrelation aufweisen. Sie können die Korrelation von Hand berechnen, indem Sie einige der online verfügbaren kostenlosen Korrelationsberechnungen verwenden oder die statistischen Funktionen eines guten Grafikrechners verwenden.

Schreiten

Methode 1 von 4: Berechnen Sie den Korrelationskoeffizienten von Hand

  1. Sammeln Sie zuerst Ihre Daten. Um eine effiziente Korrelation zu berechnen, untersuchen Sie zunächst die Datenpaare. Es ist nützlich, sie vertikal und horizontal in eine Tabelle zu legen. Beschriften Sie jede Zeile oder Spalte mit x und y.
    • Angenommen, Sie haben vier Datenpaare für X. und y. Die Tabelle kann dann folgendermaßen aussehen:
      • x || y
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  2. Berechnen Sie den Mittelwert von X.. Um den Mittelwert zu berechnen, benötigen Sie alle Werte von X. addiere und dividiere dann durch die Anzahl der Werte.
    • Beachten Sie anhand des obigen Beispiels, dass Sie vier Werte für haben X.. Um den Mittelwert zu berechnen, addieren Sie alle Werte X. und dividiere es durch 4. Die Berechnung sieht folgendermaßen aus:
    • μX.=(1+2+4+5)/4{ displaystyle mu _ {x} = (1 + 2 + 4 + 5) / 4}Finden Sie den Mittelwert von y. Zum Durchschnitt von y Um es zu finden, führen Sie die gleichen Schritte aus, indem Sie alle Werte von y addieren und dann durch die Anzahl der Werte dividieren.
      • Im obigen Beispiel haben Sie auch vier Werte für y. Addieren Sie alle diese Werte und teilen Sie sie durch 4. Die Berechnungen sehen folgendermaßen aus:
      • μy=(1+3+5+7)/4{ displaystyle mu _ {y} = (1 + 3 + 5 + 7) / 4}Bestimmen Sie die Standardabweichung von X.. Sobald Sie Ihre Mittelwerte haben, können Sie die Standardabweichung berechnen. Verwenden Sie dazu die Formel:
        • σX.=1n1Σ(X.μX.)2{ displaystyle sigma _ {x} = { sqrt {{ frac {1} {n-1}} Sigma (x- mu _ {x}) ^ {2}}}}Berechnen Sie die Standardabweichung von y. Ermitteln Sie mit denselben grundlegenden Schritten die Standardabweichung von y. Sie werden dieselbe Formel verwenden und die Datenpunkte für y verwenden.
          • Mit den Beispieldaten sehen Ihre Berechnungen folgendermaßen aus:
          • σy=141((14)2+(34)2+(54)2+(74)2){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {4-1}} * ((1-4) ^ {2} + (3-4) ^ {2} + ( 5-4) ^ {2} + (7-4) ^ {2})}}Überprüfen Sie die Grundformel zur Bestimmung eines Korrelationskoeffizienten. Die Formel zur Berechnung eines Korrelationskoeffizienten verwendet Mittelwerte, Standardabweichungen und die Anzahl der Paare in einem Datensatz (dargestellt durch n). Der Korrelationskoeffizient selbst wird durch den Kleinbuchstaben r oder den griechischen Buchstaben ρ (rho) dargestellt. Für diesen Artikel verwenden wir die Formel, die als Pearson-Korrelationskoeffizient bekannt ist (siehe unten):
            • ρ=(1n1)Σ(X.μX.σX.)(yμyσy){ displaystyle rho = left ({ frac {1} {n-1}} right) Sigma left ({ frac {x- mu _ {x}} { sigma _ {x}} } right) * left ({ frac {y- mu _ {y}} { sigma _ {y}}} right)}Bestimmen Sie den Korrelationskoeffizienten. Sie haben jetzt die Mittelwerte und Standardabweichungen für Ihre Variablen, sodass Sie mit der Korrelationskoeffizientenformel fortfahren können. Erinnere dich daran n repräsentiert die Anzahl der Werte, die Sie haben. Die anderen relevanten Informationen haben Sie bereits in den obigen Schritten ausgearbeitet.
              • Mit den Beispieldaten können Sie die Daten in die Korrelationskoeffizientenformel eingeben und wie folgt berechnen:
              • ρ=(1n1)Σ(X.μX.σX.)(yμyσy){ displaystyle rho = left ({ frac {1} {n-1}} right) Sigma left ({ frac {x- mu _ {x}} { sigma _ {x}} } right) * left ({ frac {y- mu _ {y}} { sigma _ {y}}} right)}Interpretieren Sie das Ergebnis. Für diesen Datensatz beträgt der Korrelationskoeffizient 0,988. Diese Nummer sagt Ihnen zwei Dinge über die Daten. Schauen Sie sich das Vorzeichen der Nummer und die Größe der Nummer an.
                • Da der Korrelationskoeffizient positiv ist, kann man sagen, dass zwischen den x-Daten und den y-Daten eine positive Korrelation besteht. Das heißt, wenn die x-Werte zunehmen, erwarten Sie, dass auch die y-Werte zunehmen.
                • Da der Korrelationskoeffizient sehr nahe bei +1 liegt, sind die x- und y-Daten sehr eng miteinander verbunden. Wenn Sie diese Punkte grafisch darstellen würden, würden Sie sehen, dass sie eine sehr gute Annäherung an eine gerade Linie darstellen.

Methode 2 von 4: Verwenden von Online-Korrelationsrechnern

  1. Suchen Sie online nach Korrelationsrechnern. Die Messung der Korrelation ist für Statistiker eine ziemlich Standardberechnung. Die Berechnung kann für große Datenmengen sehr mühsam werden, wenn sie von Hand durchgeführt wird. Daher haben viele Quellen gemeinsame Korrelationsberechnungen online verfügbar gemacht. Verwenden Sie eine beliebige Suchmaschine und geben Sie den Suchbegriff "Korrelationsrechner" ein.
  2. Geben Sie die Daten ein. Lesen Sie die Anweisungen auf der Website sorgfältig durch, damit Sie die Daten korrekt eingeben können. Es ist wichtig, dass die Datenpaare in Ordnung gehalten werden, sonst erhalten Sie ein falsches Korrelationsergebnis. Verschiedene Websites verwenden unterschiedliche Formate zur Dateneingabe.
    • Auf der Website http://ncalculators.com/statistics/correlation-coefficient-calculator.htm finden Sie beispielsweise ein horizontales Feld zur Eingabe von x-Werten und ein zweites horizontales Feld zur Eingabe von y-Werten. Sie geben die Begriffe ein, die nur durch Kommas getrennt sind. Daher sollte der zuvor in diesem Artikel berechnete x-Datensatz als 1,2,4,5 eingegeben werden. Der y-Datensatz wird als 1,3,5,7 eingegeben.
    • Auf einer anderen Site, http://www.alcula.com/calculators/statistics/correlation-coefficient/, können Sie Daten horizontal oder vertikal eingeben, solange Sie die Datenpunkte in Ordnung halten.
  3. Berechnen Sie die Ergebnisse. Diese Berechnungsseiten sind beliebt, da Sie nach Eingabe der Daten in der Regel nur auf die Schaltfläche "Berechnen" klicken müssen - das Ergebnis wird automatisch angezeigt.

Methode 3 von 4: Verwenden eines Grafikrechners

  1. Geben Sie ihre Details ein. Aktivieren Sie auf Ihrem Grafikrechner die Statistikfunktion und wählen Sie den Befehl "Bearbeiten".
    • Jeder Rechner hat leicht unterschiedliche Tastenbefehle. Dieser Artikel enthält die spezifischen Anweisungen für den Texas Instruments TI-86.
    • Um auf die Stat-Funktion zuzugreifen, drücken Sie [2nd] -Stat (über der Taste "+") und dann F2-Edit.
  2. Löschen Sie alle alten gespeicherten Daten. Die meisten Taschenrechner behalten die statistischen Daten, bis sie gelöscht werden. Um sicherzustellen, dass Sie alte Daten nicht mit neuen Daten verwechseln, sollten Sie zuerst alle zuvor gespeicherten Informationen löschen.
    • Bewegen Sie den Cursor mit den Pfeiltasten, um die Kategorie "xStat" hervorzuheben. Drücken Sie dann "Löschen" und "Enter". Dies sollte alle Werte in der xStat-Spalte löschen.
    • Verwenden Sie die Pfeiltasten, um die Kategorie "yStat" hervorzuheben. Drücken Sie "Löschen" und "Eingabetaste", um auch die Daten für diese Spalte zu löschen.
  3. Geben Sie Ihre Datenwerte ein. Bewegen Sie den Cursor mit den Pfeiltasten an die erste Stelle unter der xStat-Kopfzeile. Geben Sie Ihren ersten Datenwert ein und drücken Sie die Eingabetaste. Sie sollten den Bereich am unteren Rand des Bildschirms "xStat (1) = __" sehen, in dem Ihr Wert den leeren Bereich ausfüllt. Wenn Sie die Eingabetaste drücken, füllen die Daten die Tabelle, der Cursor bewegt sich zur nächsten Zeile und die Zeile am unteren Bildschirmrand sollte jetzt "xStat (2) = __" lauten.
    • Geben Sie alle x-Werte ein.
    • Wenn Sie die x-Werte eingegeben haben, wechseln Sie mit den Pfeiltasten zur Spalte yStat und geben Sie die y-Werte ein.
    • Wenn alle Daten eingegeben wurden, drücken Sie Beenden, um den Bildschirm zu löschen und das Menü Statistik zu verlassen.
  4. Berechnen Sie die lineare Regressionsstatistik. Der Korrelationskoeffizient ist ein Maß dafür, wie genau sich die Daten einer geraden Linie annähern. Ein Grafikrechner mit statistischen Funktionen kann die Best-Fit-Linie und den Korrelationskoeffizienten sehr schnell berechnen.
    • Rufen Sie die Stat-Funktion auf und drücken Sie die Calc-Taste. Auf dem TI-86 ist dies [2nd] [Stat] [F1].
    • Wählen Sie die linearen Regressionsberechnungen. Auf dem TI-86 ist dies [F3] mit der Bezeichnung "LinR". Die Grafikanzeige zeigt dann die Zeile "LinR _" mit einem blinkenden Cursor an.
    • Sie müssen nun die Namen der beiden Variablen eingeben, die Sie berechnen möchten. Dies sind xStat und yStat.
      • Wählen Sie auf dem TI-86 die Namensliste ("Namen") aus, indem Sie [2.] [Liste] [F3] drücken.
      • In der unteren Zeile Ihres Bildschirms sollten nun die verfügbaren Variablen angezeigt werden. Wählen Sie [xStat] (dies ist wahrscheinlich die Taste F1 oder F2), geben Sie ein Komma und dann [yStat] ein.
      • Drücken Sie die Eingabetaste, um die Daten zu berechnen
  5. Interpretieren Sie die Ergebnisse. Wenn Sie die Eingabetaste drücken, berechnet der Rechner sofort die folgenden Informationen für die von Ihnen eingegebenen Daten:
    • y=ein+bX.{ displaystyle y = a + bx}Verstehe das Konzept der Korrelation. Die Korrelation bezieht sich auf die statistische Beziehung zwischen zwei Größen. Der Korrelationskoeffizient ist eine einzelne Zahl, die Sie für zwei Sätze von Datenpunkten berechnen können. Die Zahl liegt immer zwischen -1 und +1 und gibt an, wie eng die beiden Datensätze sind.
      • Wenn Sie beispielsweise die Größe und das Alter von Kindern bis zu einem Alter von etwa 12 Jahren messen, erwarten Sie eine starke positive Korrelation. Wenn Kinder älter werden, werden sie tendenziell größer.
      • Ein Beispiel für eine negative Korrelation ist der Vergleich der Zeit, die jemand mit dem Golfspielen verbringt, mit dem Golf-Score dieser Person. Im Verlauf des Trainings sollte die Punktzahl sinken.
      • Letztendlich würde man wenig positive oder negative Korrelation zwischen der Schuhgröße einer Person und ihren Prüfungsnoten erwarten.
    • Berechnen Sie den Mittelwert. Das arithmetische Mittel oder "Mittel" eines Datensatzes wird berechnet, indem alle Werte des Datensatzes addiert und dann durch die Anzahl der Werte im Satz dividiert werden. Um den Korrelationskoeffizienten für Ihre Daten zu bestimmen, müssen Sie den Durchschnitt jedes Datensatzes berechnen.
      • Der Mittelwert einer Variablen wird durch die Variable mit einer horizontalen Linie darüber angezeigt. Dies wird häufig als "x-Balken" oder "y-Balken" für die Datensätze von x und y bezeichnet. Alternativ kann der Mittelwert durch den griechischen Kleinbuchstaben μ (mu) angegeben werden. Um beispielsweise den Mittelwert der Datenpunkte von x anzugeben, können Sie μ verwendenX. oder μ (x).
      • Wenn Sie beispielsweise eine Menge von x (1,2,5,6,9,10) haben, wird der Durchschnitt dieser Daten wie folgt berechnet:
        • μX.=(1+2+5+6+9+10)/6{ displaystyle mu _ {x} = (1 + 2 + 5 + 6 + 9 + 10) / 6}Kennen Sie die Bedeutung der Standardabweichung. In der Statistik misst die Standardabweichung die Abweichung und zeigt die Streuung der Zahlen vom Mittelwert. Eine Gruppe von Zahlen mit einer geringen Standardabweichung liegt ziemlich nahe beieinander. Eine Gruppe von Zahlen mit einer hohen Standardabweichung ist stärker gestreut.
          • Als Symbol wird die Standardabweichung mit dem Kleinbuchstaben s oder dem griechischen Buchstaben σ (Sigma) ausgedrückt. Somit wird die Standardabweichung der x-Daten als geschrieben sX. oder σX..
        • Erkennen Sie die Summationsnotation. Der Summationsoperator ist einer der häufigsten Operatoren in der Mathematik und gibt eine Summe von Werten an. Es wird durch den griechischen Großbuchstaben Sigma oder ∑ dargestellt.
          • Wenn Sie beispielsweise eine Sammlung von Datenpunkten x (1,2,5,6,9,10) haben, bedeutet ∑x:
            • 1+2+5+6+9+10 = 33

Tipps

  • Der Korrelationskoeffizient wird manchmal zu Ehren von Karl Pearson, seinem Entwickler, als "Pearson-Produkt-Moment-Korrelationskoeffizient" bezeichnet.
  • Im Allgemeinen stellt ein Korrelationskoeffizient von mehr als 0,8 (positiv oder negativ) eine starke Korrelation dar; Ein Korrelationskoeffizient von weniger als 0,5 (wieder positiv oder negativ) repräsentiert einen schwachen Korrelationskoeffizienten.

Warnungen

  • Die Korrelation zeigt, dass zwei Datensätze auf irgendeine Weise verbunden sind. Achten Sie jedoch darauf, dies nicht als Kausalzusammenhang zu interpretieren. Wenn Sie beispielsweise die Schuhgrößen und die Körpergröße von Personen vergleichen, werden Sie wahrscheinlich eine starke positive Korrelation feststellen. Größere Menschen haben im Allgemeinen größere Füße. Dies bedeutet jedoch nicht, dass Sie Ihre Füße wachsen lassen, wenn Sie groß werden, oder dass große Füße Sie groß werden lassen. Sie passieren einfach zusammen.