Wie wird die statistische Signifikanz bewertet?

Autor: Randy Alexander
Erstelldatum: 2 April 2021
Aktualisierungsdatum: 26 Juni 2024
Anonim
Verstehst auch Du statistische Signifikanz falsch?
Video: Verstehst auch Du statistische Signifikanz falsch?

Inhalt

Das Testen von Hypothesen wird von statistischen Analysen geleitet. Das statistisch signifikante Vertrauen wird unter Verwendung des p-Werts berechnet - der die Wahrscheinlichkeit eines beobachteten Ergebnisses angibt, wenn eine bestimmte (Nullhypothese) wahr ist. Wenn der p-Wert kleiner als das Signifikanzniveau ist (normalerweise 0,05), kann der Experimentator schließen, dass es genügend Beweise gibt, um die Nullhypothese zu widerlegen und die inverse Hypothese zuzulassen. Mit einem einfachen t-Test können Sie den p-Wert berechnen und die Signifikanz zwischen zwei verschiedenen Datengruppen bestimmen.

Schritte

Teil 1 von 3: Richten Sie Ihre Experimente ein

  1. Bestimmen Sie Ihre Hypothese. Der erste Schritt bei der Bewertung der statistischen Signifikanz besteht darin, die zu beantwortenden Fragen zu identifizieren und Ihre Hypothese zu deklarieren. Die Hypothese ist eine Aussage über die empirischen Daten und mögliche Diskrepanzen in der Bevölkerung. Jedes Experiment hat eine Nullhypothese und eine inverse Hypothese. Im Allgemeinen vergleichen Sie zwei Gruppen, um festzustellen, ob sie gleich oder verschieden sind.
    • Im Allgemeinen ist die Hypothese nicht (H.0) bestätigen, dass zwischen den beiden Datengruppen kein Unterschied besteht. Beispiel: Schüler, die das Material vor dem Unterricht lesen, erhalten keine besseren Abschlussnoten.
    • Die inverse Hypothese (H.ein) widerspricht der Nullhypothese und ist eine Aussage, die Sie mit Ihren empirischen Daten zu unterstützen versuchen. Zum Beispiel: Schüler, die das Material vor dem Unterricht lesen, erhalten tatsächlich bessere Abschlussnoten.

  2. Wählen Sie das Signifikanzniveau aus, um den Grad der Differenz zu bestimmen, der in den Daten als sinnvoll angesehen werden kann. Das Signifikanzniveau (auch als Alpha bezeichnet) ist der Schwellenwert, den Sie zur Bestimmung der Bedeutung auswählen. Wenn der p-Wert kleiner oder gleich einem bestimmten Signifikanzniveau ist, werden die Daten als statistisch signifikant angesehen.
    • In der Regel wird das Signifikanzniveau (oder Alpha) normalerweise auf dem Niveau von 0,05 gewählt - was bedeutet, dass die Wahrscheinlichkeit, den Unterschied in den Daten zu beobachten, nur zufällig 5% beträgt.
    • Je höher das Konfidenzniveau (und damit der p-Wert) ist, desto aussagekräftiger sind die Ergebnisse.
    • Wenn mehr Sicherheit erforderlich ist, senken Sie den p-Wert auf 0,01. Bei der Herstellung wird häufig ein niedriger p-Wert verwendet, um Produktfehler zu erkennen. Ein hohes Maß an Zuverlässigkeit ist entscheidend, um zu akzeptieren, dass jedes Teil so funktioniert, wie es sein sollte.
    • Für die meisten hypothesenbasierten Experimente ist ein Signifikanzniveau von 0,05 akzeptabel.

  3. Entscheiden Sie, ob Sie einen einseitigen oder einen zweiseitigen Test verwenden möchten. Eine der T-Test-Annahmen ist, dass sich Ihre Daten in einer Normalverteilung befinden. Die Normalverteilung bildet eine Glockenkurve, wobei die Mehrzahl der Beobachtungen zentriert ist. Der t-Test ist ein mathematischer Test, der prüft, ob Ihre Daten außerhalb oder außerhalb der Normalverteilung im oberen Teil der Kurve liegen.
    • Wenn Sie nicht sicher sind, ob die Daten über oder unter der Kontrollgruppe liegen, verwenden Sie einen zweiseitigen Test. Damit können Sie die Signifikanz in beide Richtungen überprüfen.
    • Wenn Sie die erwartete Richtung Ihrer Daten kennen, verwenden Sie einen einseitigen Test. Im obigen Beispiel erwarten Sie, dass sich die Punktzahlen des Schülers verbessern. Daher verwenden Sie den einseitigen Test.

  4. Bestimmen Sie die Probengröße mit der Kraftanalyse. Die Kraft eines Tests ist die Fähigkeit, das erwartete Ergebnis bei einer bestimmten Stichprobengröße zu beobachten. Die gemeinsame Kraftschwelle (oder β) beträgt 80%. Die Kraftanalyse kann ohne vorläufige Daten recht kompliziert sein, da Sie einige Informationen über den erwarteten Mittelwert zwischen den Gruppen und ihre Standardabweichungen benötigen. Verwenden Sie die Online-Kraftanalyse, um die optimale Stichprobengröße für Ihre Daten zu ermitteln.
    • Forscher führen häufig eine kleine Prämissenstudie durch, um die Kraftanalyse zu informieren und die für eine große und umfassende Studie erforderliche Stichprobengröße zu bestimmen.
    • Wenn es keine Möglichkeit gibt, komplexe Prämissenrecherchen durchzuführen, schätzen Sie den möglichen Mittelwert basierend auf dem Lesen von Artikeln und Recherchen, die andere Personen möglicherweise durchgeführt haben. Dies kann Ihnen einen guten Einstieg in die Bestimmung der Stichprobengröße ermöglichen.
    Werbung

Teil 2 von 3: Berechnung der Standardabweichung

  1. Bestimmen Sie die Formel für die Standardabweichung. Die Standardabweichung misst die Streuung der Daten. Sie erhalten Informationen zur Identität jedes Datenpunkts in der Stichprobe. Gleichungen können beim ersten Start ziemlich kompliziert aussehen. Die folgenden Schritte helfen Ihnen jedoch dabei, den Berechnungsprozess leicht zu verstehen. Die Formel lautet s = √∑ ((xich - µ) / (N - 1)).
    • s ist die Standardabweichung.
    • ∑ zeigt an, dass Sie alle gesammelten Beobachtungen addieren müssen.
    • xich Jedes repräsentiert Ihren Datenwert.
    • µ ist der Mittelwert der Daten für jede Gruppe.
    • N ist die Gesamtzahl der Beobachtungen.
  2. Durchschnitt der Anzahl der Beobachtungen in jeder Gruppe. Um die Standardabweichung zu berechnen, müssen Sie zunächst den Mittelwert der Beobachtungen für jede einzelne Gruppe berechnen. Dieser Wert wird durch den griechischen Buchstaben mu oder µ symbolisiert. Fügen Sie dazu einfach die Beobachtungen hinzu und dividieren Sie durch die Gesamtzahl der Beobachtungen.
    • Um beispielsweise die durchschnittliche Punktzahl der Gruppe zu ermitteln, die das Dokument vor dem Unterricht liest, sehen wir uns einige Daten an. Der Einfachheit halber verwenden wir einen Datensatz mit 5 Punkten: 90, 91, 85, 83 und 94 (auf einer 100-Punkte-Skala).
    • Addieren Sie alle Beobachtungen: 90 + 91 + 85 + 83 + 94 = 443.
    • Teilen Sie die obige Summe durch die Anzahl der Beobachtungen N (N = 5): 443/5 = 88,6.
    • Die durchschnittliche Punktzahl für diese Gruppe beträgt 88,6.
  3. Subtrahieren Sie den Durchschnitt von jedem beobachteten Wert. Der nächste Schritt beinhaltet Teil (xich - µ) der Gleichung. Subtrahieren Sie den Durchschnittswert von jedem beobachteten Wert. Mit dem obigen Beispiel haben wir fünf Subtraktionen.
    • (90 - 88,6), (91 - 88,6), (85 - 88,6), (83 - 88,6) und (94 - 88,6).
    • Der berechnete Wert beträgt 1,4; 2,4; -3,6; -5,6 und 5,4.
  4. Quadrieren Sie die obigen Unterschiede und addieren Sie sie. Jeder neu berechnete Wert wird jetzt quadriert. Hier wird auch das negative Vorzeichen entfernt. Wenn nach diesem Schritt oder am Ende der Berechnung ein negatives Vorzeichen angezeigt wird, haben Sie möglicherweise vergessen, den obigen Schritt auszuführen.
    • In unserem Beispiel arbeiten wir jetzt mit 1,96; 5,76; 12,96; 31.36 und 29.16.
    • Addieren Sie diese Quadrate: 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2.
  5. Teilen Sie durch die Gesamtzahl der Beobachtungen minus 1. Die Division durch N - 1 hilft, eine Berechnung zu kompensieren, die nicht für die gesamte Bevölkerung durchgeführt wird, sondern auf einer Stichprobe aller Schüler basiert.
    • Subtrahieren: N - 1 = 5 - 1 = 4
    • Teilen: 81,2 / 4 = 20,3
  6. Holen Sie sich die Quadratwurzel. Einmal durch die Anzahl der Beobachtungen minus 1 geteilt, ziehen Sie die Quadratwurzel des erhaltenen Wertes. Dies ist der letzte Schritt bei der Berechnung der Standardabweichung. Einige statistische Programme helfen Ihnen bei dieser Berechnung, nachdem die Originaldaten importiert wurden.
    • Mit dem obigen Beispiel beträgt die Standardabweichung der Semesterendnote der Schüler, die das Dokument vor dem Unterricht lesen: s = √20,3 = 4,51.
    Werbung

Teil 3 von 3: Bestimmung der statistischen Signifikanz

  1. Berechnen Sie die Varianz zwischen Ihren beiden Beobachtungsgruppen. Bis zu diesem Punkt hat sich das Beispiel nur mit einer Gruppe von Beobachtungen befasst. Um zwei Gruppen zu vergleichen, benötigen Sie natürlich Daten von beiden. Berechnen Sie die Standardabweichung der zweiten Beobachtungsgruppe und berechnen Sie daraus die Varianz zwischen den beiden Versuchsgruppen. Die Formel zur Berechnung der Varianz lautet: sd = √ ((s1/ N.1) + (s2/ N.2)).
    • S.d ist die Varianz zwischen den Gruppen.
    • S.1 ist die Standardabweichung der Gruppen 1 und N.1 ist die Größe der Gruppe 1.
    • S.2 ist die Standardabweichung der Gruppen 2 und N.2 ist die Größe der Gruppe 2.
    • Nehmen wir in unserem Beispiel an, dass die Daten aus Gruppe 2 (Schüler, die den Text vor dem Unterricht nicht gelesen haben) eine Größe von 5 und eine Standardabweichung von 5,81 haben. Die Varianz ist:
      • S.d = √ ((s1) / N.1) + ((s2) / N.2))
      • S.d = √(((4.51)/5) + ((5.81)/5)) = √((20.34/5) + (33.76/5)) = √(4.07 + 6.75) = √10.82 = 3.29.
  2. Berechnen Sie den t-Score der Daten. Mit T-Statistics können Sie Daten in eine Form konvertieren, die mit anderen Daten vergleichbar ist. Mit dem t-Wert können Sie auch einen t-Test durchführen, mit dem Sie die Wahrscheinlichkeit eines statistisch signifikanten Unterschieds zwischen den beiden Gruppen berechnen können. Die Formel zur Berechnung der t-Statistik lautet: t = (µ1 – µ2) / S.d.
    • µ1 ist der Durchschnitt der ersten Gruppe.
    • µ2 ist der Durchschnitt der zweiten Gruppe.
    • S.d ist die Varianz zwischen den Beobachtungen.
    • Verwenden Sie den größeren Mittelwert als µ1 um keine negative t-Statistik zu erhalten.
    • Nehmen wir für unser Beispiel an, dass der beobachtete Mittelwert für Gruppe 2 (die den vorherigen Artikel nicht gelesen hat) 80 beträgt. Der t-Score ist: t = (µ1 – µ2) / S.d = (88,6 – 80)/3,29 = 2,61.
  3. Bestimmen Sie den Freiheitsgrad der Probe. Bei Verwendung der t-Statistik werden die Freiheitsgrade anhand der Stichprobengröße bestimmt. Addieren Sie die Anzahl der Beobachtungen für jede Gruppe und subtrahieren Sie dann zwei. Im obigen Beispiel beträgt der Freiheitsgrad (d.f.) 8, da 5 Proben in der ersten Gruppe und 5 Proben in der zweiten Gruppe vorhanden sind ((5 + 5) - 2 = 8).
  4. Verwenden Sie Tabelle t, um die Signifikanz zu bewerten. Tabellen mit t-Werten und Freiheitsgraden finden Sie in einem Standardstatistikbuch oder online. Suchen Sie die Zeile, die die Freiheitsgrade der Daten enthält, und den p-Wert, der Ihrer t-Statistik entspricht.
    • Bei Freiheitsgraden 8 und t = 2,61 liegt der p-Wert für einen einseitigen Test zwischen 0,01 und 0,025. Da das gewählte Signifikanzniveau kleiner oder gleich 0,05 ist, sind unsere Daten statistisch signifikant. Mit diesen Daten lehnen wir die Nullhypothese ab und akzeptieren die umgekehrte Hypothese: Schüler, die das Material vor dem Unterricht lesen, haben höhere Endergebnisse.
  5. Erwägen Sie weitere Forschungen. Viele Forscher führen Prämissenstudien mit verschiedenen Metriken durch, um zu verstehen, wie eine größere Studie entworfen werden kann. Wenn Sie andere Untersuchungen mit mehr Metriken durchführen, erhöhen Sie Ihr Vertrauen in Ihre Schlussfolgerungen. Werbung

Rat

  • Statistik ist ein großes und komplexes Feld. Nehmen Sie an einem statistischen Hypothesentestkurs an einer High School oder Universität (oder höher) teil, um die statistische Signifikanz zu verstehen.

Warnung

  • Diese Analyse konzentriert sich auf den t-Test, um den Unterschied zwischen den beiden Normalverteilungspopulationen zu überprüfen. Abhängig von der Komplexität der Daten benötigen Sie möglicherweise einen weiteren statistischen Test.