Was besagt annahme gleiche varianzen

Q: Wie interpretiert man die Varianz?

Die Varianz gibt also an wie weit sich die Daten im Schnitt vom Mittelwert unterscheiden. Um so größer die Varianz umso weiter liegen die Daten vom Mittelwert entfernt. Wobei xˉ den Mittelwert darstellt. Wenn der Wert nun kleiner als der Durchschnitt ist fällt die Abweichung negativ aus.

Q: Wann Varianzgleichheit?

Viele statistische Verfahren setzen voraus, dass die Varianzen einer Variablen innerhalb verschiedener Fallgruppen identisch oder zumindest näherungsweise identisch sind, so beispielsweise diverse Signifikanztests oder Vergleiche zweier arithmetischer Mittel.

Q: Welche Werte kann die Varianz annehmen?

Die ersten n−1 Werte können also beliebige Werte annehmen, während der letzte Wert xn dann immer so ist, dass der Wert xn−ˉx die Summe der Abweichungen Null werden lässt.

Q: Was sagt die Varianz aus Wahrscheinlichkeit?

Die Varianz ist ein Maß für die Abweichung einer Zufallsvariablen X von ihrem Erwartungswert μ in der Stochastik. Sie beschreibt die mittlere quadratische Abweichung der Werte der Zufallsvariablen zum Erwartungswert. Die Varianz einer Zufallsgröße ist eng mit ihrer Standardabweichung verknüpft.

Inhaltsverzeichnis Show

1 Ziel des t-Test bei unabhängigen Stichproben in Excel
2 Voraussetzungen des t-Test bei unabhängigen Stichproben in Excel
3 Durchführung des t-Test bei unabhängigen Stichproben in Excel
4 Interpretation des t-Test bei unabhängigen Stichproben in Excel
4.1 Die Voraussetzung der Varianzhomogenität
4.2 Signifikanz des Tests
4.3 Effektstärke des Tests
5 Videotutorials
6 Reporting des t-Tests bei unabhängigen Stichproben
7 Literatur
Wie interpretiert man die Varianz?
Wann Varianzgleichheit?
Welche Werte kann die Varianz annehmen?
Was sagt die Varianz aus Wahrscheinlichkeit?

1 Ziel des t-Test bei unabhängigen Stichproben in Excel
2 Voraussetzungen des t-Test bei unabhängigen Stichproben in Excel
3 Durchführung des t-Test bei unabhängigen Stichproben in Excel
4 Interpretation des t-Test bei unabhängigen Stichproben in Excel
- 4.1 Die Voraussetzung der Varianzhomogenität
- 4.2 Signifikanz des Tests
- 4.3 Effektstärke des Tests
5 Videotutorials
6 Reporting des t-Tests bei unabhängigen Stichproben
7 Literatur

1 Ziel des t-Test bei unabhängigen Stichproben in Excel

Der t-Test für unabhängige Stichproben in Excel testet, ob bei zwei unabhängigen Stichproben die Mittelwerte bzw. zentralen Tendenzen unterschiedlich sind. Für abhängige Stichproben ist der t-Test für verbundene Stichproben zu rechnen. In SPSS gibt es den t-Test für unabhängige Stichproben auch. Habt ihr nur eine Stichprobe, rechnet ihr den Einstichproben t-Test.

2 Voraussetzungen des t-Test bei unabhängigen Stichproben in Excel

Die wichtigsten Voraussetzungen sind:

zwei voneinander unabhängige Stichproben/Gruppen
metrisch skalierte y-Variable
normalverteilte Fehlerterme innerhalb der Gruppen
Homogene (nahezu gleiche) Varianzen der y-Variablen der Gruppen – über Levene-Test
Achtung: Mindeststichprobengröße bedenken – über eine Poweranalyse zu ermitteln

Fragen können unter dem verlinkten Video gerne auf YouTube gestellt werden.

3 Durchführung des t-Test bei unabhängigen Stichproben in Excel

Über das Menü in Excel: Reiter “Daten” -> “Datenanalyse” -> “Zweistichproben t-Test: Gleicher Varianzen”.

Hinweis: Sollte die Funktion “Datenanalyse” nicht vorhanden sein, ist diese über “Datei” -> “Optionen” -> “Add-Ins” -> “Verwalten” -> “Los…” zu aktivieren. Dieses Video zeigt dies kurz.

Als Bereich Variable A markiert man die beobachteten Werte der ersten Stichprobe. Im Bereich Variable B sind es entsprechend die beobachteten Werte der zweiten Stichprobe. Unten ist zu sehen, dass B3-B15 die eine Variable bzw. Gruppe und E3-E15 die andere Gruppe bzw. Variable ist.

Bei “Hypothetische Differenz der Mittelwerte” ist eine “0” einzutragen Dies hat zur Folge, dass Excel folgende Nullhypothese testet: die beiden Stichproben stammen aus der gleichen Grundgesamtheit und besitzen damit ähnliche (“gleiche”) Mittelwerte.

Sollte in den Bereichen A und B eine Beschriftung mit markiert worden sein, ist bei “Beschriftungen” ein Haken zu setzen. Dadurch wird die erste Zeile, die dann die Beschriftung enthält, ignoriert.

Als Alpha ist das Alphafehler-Niveau einzutragen. Hier ist typischerweise 5% also 0,05 zu wählen. Es besteht auch die Möglichkeit eine geringere Wahrscheinlichkeit einen Fehler 1. Art zu wählen. Das entspricht einer geringeren Wahrscheinlichkeit, die Nullhypothese fälschlicherweise abzulehnen.

4 Interpretation des t-Test bei unabhängigen Stichproben in Excel

4.1 Die Voraussetzung der Varianzhomogenität

Sie kann auf zwei Arten geprüft werden. Zum einen mit der Berechnung der Varianz der Stichproben. Wenn sie ungefähr gleich sind, genügt dies. Zum anderen kann ein analytischer Test gerechnet werden: der Levene-Test (Video). Häufig reicht die erste Variante bereits. Sind die Varianzen nicht homogen bzw. gleich, muss ein t-Test mit unterschiedlichen Varianzen gerechnet werden. Die Auswahl ist im Menü analog zu oben: Reiter “Daten” -> “Datenanalyse” -> “Zweistichproben t-Test: Unterschiedlicher Varianzen”.

Ausgabe des Zweistichproben t-Test unter der Annahme gleicher Varianzen

4.2 Signifikanz des Tests

Neben den standardmäßig ausgegebenen Mittelwert, Varianzen, Beobachtungen usw. ist das Augenmerk auf den p-Wert (“P(T<=t) einseitig” bzw. “P(T<=t) zweiseitig”) zu richten. ACHTUNG: Hat man bereits eine Vermutung, dass z.B. eine Gruppe einen höheren/niedrigeren Wert hat, ist dies eine gerichtete Hypothese und man muss 1-seitig testen – sofern die Mittelwerte Anlass dazu geben und die Vermutung widerspiegeln. Demzufolge interessiert nur der Wert hinter “P(T<=t) einseitig” und jener wird auf Signifikanz getestet. Ist er kleiner als Alpha (z.B. 0,05), geht man davon aus, dass die Stichproben nicht aus der selben Grundgesamtheit stammen. Hier: 0,018. Oder etwas salopper formuliert: man kann von statistisch signifikanten Unterschieden hinsichtlich der Mittelwerte zwischen den Stichproben ausgehen.

Alternativ kann man statt dem p-Wert auch die sog. “t-Statistik” (hier 2,231) zur Beurteilung heranziehen. Sie ist mit dem “Kritischer t-Wert bei einseitigem t-Test” bzw. “Kritischer t-Wert bei zweiseitigem t-Test” zu vergleichen. Ist der kritische t-Wert kleiner als die t-Statistik , ist die Nullhypothese von Gleichheit ebenfalls zu verwerfen. Ob einseitig oder zweiseitig zu testen ist, ist analog zu 3. zu entscheiden.

4.3 Effektstärke des Tests

4.3.1 Cohen’s d manuell berechnen

mit

bzw. bei gleichen Gruppengrößen

Im Beispiel sind die Mittelwerte 61 und 52,38 (siehe oben) sowie die gepoolte Standardabweichung 9,85. Eingesetzt in die obige Formel:

Diese Größe wird nun eingeordnet. Laut Cohen: Statistical Power Analysis for the Behavioral Sciences (1988), S. 25-26 ist ein Effekt:

ab 0,2 klein,
ab 0,5 mittel und
ab 0,8 stark.

Im Beispiel liegt der Wert 0,875 über der Grenze zum starken Effekt. Somit ist der Unterschied zwischen den beiden Gruppen bzw. deren Ruhepulsen stark.
ACHTUNG: Je nach Disziplin können andere Grenzen gelten. Dies ist im Vorfeld zu prüfen.

4.3.2 Effektstärkemaß r manuell berechnen

Eine zweite Möglichkeit ist die manuelle Berechnung von r sowie die Beurteilung anhand Cohen: Statistical Power Analysis for the Behavioral Sciences (1988), S. 79-81. Cohen selbst merkt aber an, dass die Effektstärkemaße und deren Klassengrenzen nicht 1:1 vergleichbar sind. Vorzuziehen ist Cohen’s d. Die Berechnung von r erfolgt über die Formel mit t² als quadrierter T-Wert und df als degrees of freedom (Freiheitsgrade).

Ab 0,1 ist es ein schwacher Effekt, ab 0,3 ein mittlerer und ab 0,5 ein starker Effekt.

Im Beispiel ist der t-Wert 2,231 und die Freiheitsgrade (df) 24. Eingesetzt in die Formel:

Das Ergebnis von 0,414 liegt über der Grenze zur mittleren Effektstärke und der Unterschied ist damit lauut Cohen ein mittelstarker Unterschied. Allerdings gibt es neuere Richtlinien bzgl. r, die von Gignac, Szodorai (2016) vorgeschlagen wurden, die bei 0,1 (klein), 0,2 (mittel) und 0,3 (groß) liegen. Demnach wäre der Unterschied im Beispiel ein großer.

5 Videotutorials

6 Reporting des t-Tests bei unabhängigen Stichproben

Gruppenmittelwerte und Standardabweichungen sind zu berichten. Zusätzlich die t-Statistik mit Freiheitsgraden, der p-Wert und die Effektstärke (Cohens d bzw. Hedges’ Korrektur): t(df)=t-Wert; p-Wert; Effektstärke.

Untrainierte Probanden (M = 61; SD = 9,82) haben gegenüber trainierten Probanden (M = 52,38; SD = 9,87) einen signifikant höheren Ruhepuls, t(24) = 2,23; p = 0,035; d = 0,88. Nach Cohen (1992) ist dieser Unterschied groß.

7 Literatur

Cohen, J. (1988). Statistical power analysis for the behavioral sciences. New York, NY: Psychology Press, Taylor & Francis Group
Cohen, J. (1992). A power primer. Psychological bulletin, 112(1), 155-159.
Gignac, G. E., & Szodorai, E. T. (2016). Effect size guidelines for individual differences researchers. Personality and individual differences, 102, 74-78.

Weitere nützliche Tutorials findest du auf meinem YouTube-Kanal.

Hilfreiche Artikel für’s Arbeiten in Excel:

Dropdown-Liste zur Eingabe in Excel
Levene-Test für Excel
Chi²-Test in Excel

Wie interpretiert man die Varianz?

Die Varianz gibt also an wie weit sich die Daten im Schnitt vom Mittelwert unterscheiden. Um so größer die Varianz umso weiter liegen die Daten vom Mittelwert entfernt. Wobei xˉ den Mittelwert darstellt. Wenn der Wert nun kleiner als der Durchschnitt ist fällt die Abweichung negativ aus.

Wann Varianzgleichheit?

Viele statistische Verfahren setzen voraus, dass die Varianzen einer Variablen innerhalb verschiedener Fallgruppen identisch oder zumindest näherungsweise identisch sind, so beispielsweise diverse Signifikanztests oder Vergleiche zweier arithmetischer Mittel.

Welche Werte kann die Varianz annehmen?

Die ersten n−1 Werte können also beliebige Werte annehmen, während der letzte Wert xn dann immer so ist, dass der Wert xn−ˉx die Summe der Abweichungen Null werden lässt.

Was sagt die Varianz aus Wahrscheinlichkeit?

Die Varianz ist ein Maß für die Abweichung einer Zufallsvariablen X von ihrem Erwartungswert μ in der Stochastik. Sie beschreibt die mittlere quadratische Abweichung der Werte der Zufallsvariablen zum Erwartungswert. Die Varianz einer Zufallsgröße ist eng mit ihrer Standardabweichung verknüpft.