@Beyme : Ich kann meinem Wunsch nicht widerstehen, auch den Artikel von Braun et al. (1998) zu kommentieren:
Methodisch fällt auf, daß im Artikel nichts über die Verteilung der Werte im Vortest und im Experiment gesagt wird, also Minimum, Median, Maximum, etc. in jeder Untergruppe. Ein bißchen mehr deskriptive Statistik als nur das arithmetische Mittel bräuchte es schon, um erkenntlich zu machen, wie die Antworten der einzelnen Versuchspersonen aussahen.
Unterdessen wird durch die Prozentangaben bei den Frauenanteilsschätzungen eine sehr gute Übereinstimmung der Antworten in allen Untergruppen suggeriert, denn in den Tabellen 1 und 2 werden alle Testergebnisse mit zwei Nachkommastellen angegeben. Nach statistischer Konvention – (nur) die letzte Stelle ist unsicher – würde das eine sehr schmale Verteilung der Einzelwerte bedeuten. Doch selbst eine äußert enge Antwortverteilung z. B. mit 1 x 64 & 30 x 65 & 1 x 66 ergibt eine Standardabweichung von 0,25, der Mittelwert dürfte also schon in diesem extremen Beispiel nur mit einer Nachkommastelle angegeben werden.
Im Weiteren wird mit ANOVA und t-Test ausgewertet, ohne daß aus dem Artikel hervorgeht, daß eine Normalverteilung der Einzelwerte bestätigt worden wäre – eine Voraussetzung für diese weitere Vorgehensweise.
In Abbildung 5 werden dann Mittelwerte aus Tests mit unterschiedlichen Randbedingungen und Umfängen zusammengeworfen und dann ohne Begründung ein Erwartungswert von 50 % postuliert. Eine fragwürdige Vorgehensweise. Für sowas gibt es nichtparametrische Tests, die auch die Streuung der Einzelwerte berücksichtigen, doch die bleiben ungenutzt.
Ob die statistische Methodik der Studie schwach ist, kann man mangels Detailangaben gar nicht feststellen, allemal ist aber die Darstellung der statistischen Methodik und der Rohdaten des Experiments schwach, eine Nachvollziehbarkeit der Experimentauswertung nicht gegeben. Da kommen schon ein wenig Zweifel, ob die Ergebnisse der Studie belastbar sind.