Berechnen Sie die Kovarianz

Autor: Judy Howell
Erstelldatum: 2 Juli 2021
Aktualisierungsdatum: 1 Juli 2024
Anonim
Statistik: Kovarianz und Korrelation: Grundlagen - FernUni Hagen - Wiwi
Video: Statistik: Kovarianz und Korrelation: Grundlagen - FernUni Hagen - Wiwi

Inhalt

Die Kovarianz ist eine statistische Berechnung, um die Beziehung zwischen zwei Datensätzen transparenter zu machen. Angenommen, Anthropologen untersuchen die Größe und das Gewicht einer Bevölkerung innerhalb einer bestimmten Kultur. Für jede Person in der Studie können Größe und Gewicht mit einem Datenpaar (x, y) angezeigt werden. Diese Werte können in einer Standardformel zur Berechnung der Kovarianzbeziehung verwendet werden. In diesem Artikel werden zunächst die Berechnungen zur Bestimmung der Kovarianz eines Datensatzes erläutert. Als nächstes werden zwei andere automatisierte Methoden zur Bestimmung des Ergebnisses diskutiert.

Schreiten

Methode 1 von 4: Berechnen Sie die Kovarianz von Hand mit der Standardformel

  1. Lernen Sie die Standard-Kovarianzformel und ihre Teile. Die Standardformel zur Berechnung der Kovarianz lautet Σ(X.ichX.Durchschn)(yichyDurchschn)/(n1){ displaystyle Sigma (x_ {i} -x _ { text {avg}}) (y_ {i} -y _ { text {avg}}) / (n-1)}Erstellen Sie Ihre Datentabelle. Bevor Sie beginnen, ist es hilfreich, Ihre Daten zu sammeln. Erstellen Sie eine Tabelle mit fünf Spalten. Sie müssen jede Spalte wie folgt deklarieren:
    • X.{ displaystyle x}Berechnen Sie den Mittelwert der x Datenpunkte. Dieser Beispieldatensatz enthält 9 Zahlen. Um den Mittelwert zu ermitteln, addieren Sie sie und teilen Sie die Summe durch 9. Dies ergibt das Ergebnis 1 + 3 + 2 + 5 + 8 + 7 + 12 + 2 + 4 = 44. Wenn Sie dies durch 9 teilen, erhalten Sie den Durchschnitt 4.89. Dies ist der Wert, den Sie als x (Durchschnitt) für die bevorstehenden Berechnungen verwenden.
    • Berechnen Sie den Mittelwert der y-Datenpunkte. Diese y-Spalte muss auch aus 9 Datenpunkten bestehen, die mit den x-Datenpunkten übereinstimmen. Bestimmen Sie den Durchschnitt davon. Für diesen Beispieldatensatz beträgt dies 8 + 6 + 9 + 4 + 3 + 3 + 2 + 7 + 7 = 49. Teilen Sie diese Summe durch 9, um einen Durchschnitt von 5,44 zu erhalten. Sie werden 5,44 als Wert von y (Durchschnitt) für die bevorstehenden Berechnungen verwenden.
    • Berechnen Sie die Werte (X.ichX.Durchschn){ displaystyle (x_ {i} -x _ { text {avg}})}Berechnen Sie die Werte (yichyDurchschn){ displaystyle (y_ {i} -y _ { text {avg}})}Berechnen Sie die Produkte für jede Datenzeile. Sie füllen die Zeilen der letzten Spalte aus, indem Sie die Zahlen multiplizieren, die Sie in den beiden vorherigen Spalten von berechnet haben (X.ichX.Durchschn){ displaystyle (x_ {i} -x _ { text {avg}})}Suchen Sie die Summe der Werte in der letzten Spalte. Hier kommt das Σ-Symbol ins Spiel. Nachdem Sie alle bisherigen Berechnungen durchgeführt haben, addieren Sie die Ergebnisse. Für diesen Beispieldatensatz sollten Sie jetzt neun Werte in der letzten Spalte haben. Addiere diese neun Zahlen. Achten Sie genau darauf, ob eine Zahl positiv oder negativ ist.
      • Die Summe dieses Beispieldatensatzes sollte -64,57 ergeben. Schreiben Sie diese Summe in das Feld unten in der Spalte. Dies ist der Wert des Zählers der Standard-Kovarianzformel.
    • Berechnen Sie den Nenner der Kovarianzformel. Der Zähler der Standard-Kovarianzformel ist der Wert, den Sie gerade berechnet haben. Der Nenner wird durch (n-1) dargestellt und ist eins weniger als die Anzahl der Datenpaare in Ihrem Datensatz.
      • In diesem Beispielproblem gibt es neun Datenpaare, also ist n 9. Daher ist der Wert von (n-1) gleich 8.
    • Teilen Sie den Zähler durch den Nenner. Der letzte Schritt bei der Berechnung der Kovarianz besteht darin, den Zähler zu teilen. Σ(X.ichX.Durchschn)(yichyDurchschn){ displaystyle Sigma (x_ {i} -x _ { text {avg}}) (y_ {i} -y _ { text {avg}})}Beachten Sie die wiederholten Berechnungen. Kovarianz ist eine Berechnung, die Sie einige Male von Hand durchführen müssen, damit Sie die Bedeutung des Ergebnisses verstehen. Wenn Sie jedoch routinemäßig Kovarianz für die Interpretation von Daten verwenden, benötigen Sie eine schnellere und automatisiertere Methode, um die Ergebnisse zu erhalten. Inzwischen haben Sie vielleicht bemerkt, dass bei unserem relativ kleinen Datensatz von nur neun Datenpaaren die Berechnungen aus zwei Mitteln, achtzehn getrennten Subtraktionen, neun Multiplikationen, einer Addition und schließlich einer weiteren Division bestanden. Das sind 31 relativ kleine Berechnungen, um die Lösung zu finden. Unterwegs laufen Sie Gefahr, negative Vorzeichen zu verpassen oder die Ergebnisse falsch zu kopieren, sodass die Antwort nicht mehr korrekt ist.
    • Erstellen Sie ein Arbeitsblatt zur Berechnung der Kovarianz. Wenn Sie mit Excel (oder einem anderen Berechnungsprogramm) vertraut sind, können Sie einfach eine Tabelle zur Bestimmung der Kovarianz erstellen. Beschriften Sie die Überschriften der fünf Spalten wie bei den Berechnungen von Hand: x, y, (x (i) -x (Durchschnitt)), (y (i) -y (Durchschnitt)) und Produkt.
      • Um die Benennung zu vereinfachen, nennen Sie die dritte Spalte so etwas wie "x Unterschied" und die vierte Spalte "y Unterschied", solange Sie sich an die Bedeutung der Daten erinnern.
      • Wenn die Tabelle in der oberen linken Ecke des Arbeitsblatts beginnt, wird Zelle A1 mit x gekennzeichnet, während die anderen Beschriftungen bis zu Zelle E1 fortgesetzt werden.
    • Geben Sie die Datenpunkte ein. Geben Sie die Datenwerte in die beiden Spalten x und y ein. Denken Sie daran, dass die Reihenfolge der Datenpunkte von Bedeutung ist. Sie müssen daher jedes y mit dem entsprechenden Wert von x abgleichen.
      • Die x-Werte beginnen in Zelle A2 und setzen sich bis zur Anzahl der benötigten Datenpunkte fort.
      • Die y-Werte beginnen in Zelle B2 und setzen sich bis zur Anzahl der benötigten Datenpunkte fort.
    • Bestimmen Sie die Mittelwerte der x- und y-Werte. Excel berechnet die Durchschnittswerte sehr schnell für Sie. Geben Sie in die erste leere Zelle unter jeder Datenspalte die Formel = DURCHSCHNITT (A2: A ___) ein. Füllen Sie den leeren Raum mit der Nummer der Zelle, die Ihrem letzten Datenpunkt entspricht.
      • Wenn Sie beispielsweise 100 Datenpunkte haben, werden die Zellen A2 bis A101 gefüllt. Geben Sie also in die Zelle = AVERAGE (A2: A101) ein.
      • Geben Sie für die y-Daten die Formel = AVERAGE (B2: B101) ein.
      • Denken Sie daran, dass eine Formel in Excel mit einem "=" - Zeichen beginnt.
    • Geben Sie die Formel für die Spalte (x (i) -x (Durchschnitt)) ein. Geben Sie in Zelle C2 die Formel zur Berechnung der ersten Subtraktion ein. Diese Formel lautet: = A2 -___. Füllen Sie die Lücke mit der Zellenadresse, die den Mittelwert der x-Daten enthält.
      • Beispielsweise befindet sich der Durchschnitt der 100 Datenpunkte in Zelle A103, sodass Ihre Formel wie folgt lautet: = A2-A103.
    • Wiederholen Sie die Formel für die Datenpunkte (y (i) -y (Durchschnitt)). Nach dem gleichen Beispiel tritt es in die Zelle D2 ein. Die Formel lautet: = B2-B103.
    • Geben Sie die Formel für die Spalte "Produkt" ein. Geben Sie in der fünften Spalte in Zelle E2 die Formel ein, um das Produkt der beiden vorhergehenden Zellen zu berechnen. Dies wird dann: = C2 * D2.
    • Kopieren Sie die Formeln, um die Tabelle zu füllen. Bisher haben Sie nur die ersten Datenpunkte in Zeile 2 programmiert. Markieren Sie mit der Maus die Zellen C2, D2 und E2. Platzieren Sie den Cursor auf dem Kästchen in der unteren rechten Ecke, bis ein Pluszeichen angezeigt wird. Klicken und halten Sie die Maustaste gedrückt und ziehen Sie die Maus nach unten, um die Auswahl zu erweitern und die gesamte Datentabelle zu füllen. Dieser Schritt kopiert automatisch die drei Formeln aus den Zellen C2, D2 und E2 in die gesamte Tabelle. Die Tabelle sollte automatisch mit allen Berechnungen gefüllt werden.
    • Programmieren Sie die Summe der letzten Spalte. Sie benötigen die Summe der Artikel in der Spalte "Produkt". Geben Sie in die leere Zelle unmittelbar unter dem letzten Datenpunkt in dieser Spalte die Formel ein: = SUMME (E2: E ___). Füllen Sie die Lücke mit der Zellenadresse des letzten Datenpunkts.
      • Im Beispiel mit 100 Datenpunkten geht diese Formel in die Zelle E103. Typ: = SUMME (E2: E102).
    • Bestimmen Sie die Kovarianz. Sie können auch Excel die endgültige Berechnung für Sie durchführen lassen. Die letzte Berechnung in Zelle E103 in unserem Beispiel repräsentiert den Zähler der Kovarianzformel. Geben Sie direkt unter dieser Zelle die Formel ein: = E103 / ___. Füllen Sie den leeren Raum mit der Anzahl der Datenpunkte, die Sie haben. In unserem Beispiel ist dies 100. Das Ergebnis ist die Kovarianz Ihrer Daten.

Methode 3 von 4: Verwenden von Online-Kovarianzrechnern

  1. Suchen Sie online nach Kovarianzrechnern. Verschiedene Schulen, Unternehmen oder andere Quellen haben Websites, auf denen die Kovarianzwerte für Sie sehr einfach berechnet werden können. Verwenden Sie den Suchbegriff "Kovarianzrechner" in einer Suchmaschine.
  2. Geben Sie ihre Details ein. Lesen Sie die Anweisungen auf der Website sorgfältig durch, um sicherzustellen, dass Sie die Informationen korrekt eingeben. Es ist wichtig, dass Ihre Datenpaare in Ordnung gehalten werden, da sonst das generierte Ergebnis eine falsche Kovarianz ist. Websites haben unterschiedliche Arten der Dateneingabe.
    • Auf der Website http://ncalculators.com/statistics/covariance-calculator.htm gibt es beispielsweise ein horizontales Feld zur Eingabe der x-Werte und ein zweites horizontales Feld zur Eingabe der y-Werte. Sie müssen Ihre Daten durch Kommas getrennt eingeben. Daher sollte der zuvor in diesem Artikel berechnete x-Datensatz als 1,3,2,5,8,7,12,2,4 eingegeben werden. Die y-Daten lauten 8,6,9,4,3,3,2,7,7.
    • Auf einer anderen Site, https://www.thecalculator.co/math/Covariance-Calculator-705.html, werden Sie aufgefordert, die x-Daten in das erste Feld einzugeben. Die Daten werden vertikal mit einem Element pro Zeile eingegeben. Daher sieht der Eintrag auf dieser Site folgendermaßen aus:
    • 1
    • 3
    • 2
    • 5
    • 8
    • 7
    • 12
    • 2
    • 4
  3. Berechnen Sie Ihre Ergebnisse. Das Attraktive an diesen Online-Berechnungen ist, dass Sie nach Eingabe der Daten normalerweise nur auf die Schaltfläche "Berechnen" klicken müssen und die Ergebnisse automatisch angezeigt werden. Die meisten Websites bieten Ihnen die Zwischenberechnungen von x (Durchschnitt), y (Durchschnitt) und n.

Methode 4 von 4: Interpretation der Ergebnisse der Kovarianz

  1. Suchen Sie nach einer positiven oder negativen Beziehung. Die Kovarianz ist eine einzelne statistische Zahl, die die Beziehung zwischen einem Datensatz und einem anderen angibt. In dem in der Einleitung erwähnten Beispiel werden Größe und Gewicht gemessen. Sie würden erwarten, dass mit zunehmendem Wachstum auch das Gewicht der Menschen zunimmt, was zu einer positiven Kovarianzansicht führt. Ein weiteres Beispiel: Angenommen, es werden Daten gesammelt, die die Anzahl der Stunden angeben, die jemand Golf spielt, und die Punktzahl, die er oder sie erreicht. In diesem Fall erwarten Sie eine negative Kovarianz, was bedeutet, dass mit zunehmender Anzahl von Trainingsstunden die Golfpunktzahl abnimmt. (Beim Golf ist eine niedrigere Punktzahl besser).
    • Betrachten Sie den oben berechneten Beispieldatensatz. Die resultierende Kovarianz beträgt -8,07. Das Minuszeichen bedeutet, dass mit zunehmenden x-Werten die y-Werte tendenziell abnehmen. Sie können sehen, dass dies wahr ist, indem Sie sich einige der Werte ansehen. Beispielsweise entsprechen die x-Werte von 1 und 2 den y-Werten von 7, 8 und 9. Die x-Werte von 8 und 12 sind mit den y-Werten von 3 bzw. 2 verknüpft .
  2. Interpretieren Sie die Größe der Kovarianz. Wenn die Anzahl der Kovarianzwerte groß ist, entweder eine große positive Zahl oder eine große negative Zahl, können Sie dies als zwei Datenelemente interpretieren, die entweder positiv oder negativ stark miteinander verbunden sind.
    • Die -8.07-Kovarianz des Beispieldatensatzes ist ziemlich groß. Beachten Sie, dass die Daten zwischen 1 und 12 liegen. 8 ist also eine ziemlich große Zahl. Dies weist auf eine ziemlich starke Beziehung zwischen den Datensätzen x und y hin.
  3. Verstehe das Fehlen einer Beziehung. Wenn Ihr Ergebnis eine Kovarianz gleich oder sehr nahe bei 0 ist, können Sie daraus schließen, dass die Datenpunkte nicht miteinander zusammenhängen. Das heißt, eine Erhöhung eines Wertes kann, muss aber nicht zu einer Erhöhung des anderen führen. Die beiden Begriffe sind fast zufällig verknüpft.
    • Angenommen, Sie beziehen Schuhgrößen auf Prüfungsnoten. Da es so viele Faktoren gibt, die die Prüfungsnoten eines Schülers beeinflussen, kann ein Kovarianzwert nahe 0 erwartet werden. Dies zeigt an, dass zwischen den beiden Werten fast keine Beziehung besteht.
  4. Zeigen Sie die Beziehung grafisch an. Um die Kovarianz visuell zu verstehen, können Sie Ihre Datenpunkte in einem x, y-Diagramm darstellen. Wenn Sie dies tun, sollten Sie leicht erkennen, dass die Punkte, obwohl sie nicht genau in einer geraden Linie liegen, dazu neigen, sich einem Cluster in einer diagonalen Linie von oben links nach unten rechts zu nähern. Dies ist die Beschreibung einer negativen Kovarianz. Sie können auch sehen, dass der Wert der Kovarianz gleich -8,07 ist. Dies ist im Vergleich zu den Datenpunkten eine ziemlich große Zahl. Die hohe Zahl deutet darauf hin, dass die Kovarianz ziemlich stark ist, was Sie aus der linearen Form der Datenpunkte ableiten können.
    • Um dies noch einmal durchzugehen, lesen Sie Artikel zum Zeichnen von Punkten in einem Koordinatensystem auf wikiHow.

Warnungen

  • Kovarianz ist in der Statistik nur begrenzt anwendbar. Dies ist oft ein Schritt zur Berechnung von Korrelationskoeffizienten oder anderen Konzepten. Achten Sie auf zu kühne Interpretationen, die auf einem Kovarianz-Score basieren.