Analyse & Statistik


Im Folgenden wollen wir auf die in der Marktforschung üblichen Analysemethoden eingehen und die wichtigsten Begriffe aus dem Bereich der Statistik erläutern. Dabei geht es vor allem um die Frage der Signifikanz, also wie „sicher“ gemessene Unterschiede tatsächlich sind und sich nicht nur durch Zufall ergeben haben.

Vorab aber kurz zu …

 

Stichprobengröße und Repräsentativität

Die Frage wird uns immer wieder gestellt: „Wie viele Interviews müssen gemacht werden, damit das Ergebnis repräsentativ ist?“

Hier unsere Antwort: Repräsentativität ist keine Frage der Stichprobengröße, vielmehr bestimmt die Fallzahl die Schärfe der Ergebnisse in der Stichprobe! Je größer eine Stichprobe, umso kleiner ist das Konfidenzintervall* (oft als Schwankungsbreite bezeichnet!), in welchem sich die Ergebnisse bewegen und umso sicherer (=schärfer) sind die Ergebnisse. Eine Stichprobengröße von 500 Interviews kann bereits ausreichend sein, sofern die Stichprobe sauber gezogen wurde.

hp_1

Bei der Bestimmung der Stichprobengröße ist vor allem wichtig, inwieweit die Studie die Betrachtung von Untergruppen (z.B. Männer, Personen unter 25 Jahre, Bewohner von Vorarlberg, Kenner einer Marke o.Ä.) erfordert. Hier kann es notwendig sein, eine größere Gesamtstichprobe zu wählen, um auch Untergruppen mit ausreichender Basis (= Zahl der Befragten) darstellen zu können – aber das hängt von den jeweiligen Studienanforderungen ab.

Die Repräsentativität ist keine berechenbare Größe, sondern klärt ab, welche Grundgesamtheit die Stichprobe vertritt, also repräsentiert. Warum ist das wichtig? Um Informationen über z.B. das Zeitungsleseverhalten der ÖsterreicherInnen zu erhalten, muss man eben diese Gruppe befragen, das heißt: Man muss aus allen Österreicherinnen eine saubere Stichprobe ziehen und eben diese Stichprobe befragen, um ein repräsentatives Ergebnis zu erhalten.

Wenn nun z.B. ein Zeitungsverlag die eigenen NewsletterabonnentInnen zum Zeitungskonsum befragt, wird, im Vergleich zur Österreich-Stichprobe, ein schiefes, eben nicht für Österreich repräsentatives Ergebnis herauskommen. Vollkommen unabhängig davon, ob 500, 1.000 oder 10.000 Personen befragt wurden.

 

Deskriptive Analysen und Signifikanz: Die Suche nach dem Unterschied

Die in der Marktforschung wohl bekanntesten Analysen sind deskriptiver Natur, also die Stichprobe „beschreibend“: Anhand von Prozentwerten (diese werden am häufigsten ausgewiesen), Mittelwerten oder Medianwerten werden die Ergebnisse zu den Fragen dargestellt. Ab und zu kann es auch sinnvoll sein, die Ergebnisse in absoluten Zahlen darzustellen, also durch die genaue Anzahl der Befragten, die eine Antwort gewählt haben.

 

Ein einfaches Beispiel:

Die Frage lautet: Wo kaufen Sie persönlich hauptsächlich Obst und Gemüse ein?

Ergebnis: 40% der 500 Befragten kaufen Obst und Gemüse hauptsächlich im Supermarkt ein.


Beispiel Tabelle Total – Bitte klicken zum Vergrößern

 

Wie oben beschrieben werden die Ergebnisse nicht nur als Totalergebnisse dargestellt, sondern für relevante und interessante Untergruppen, im Normalfall soziodemografische Gruppen wie Männer/Frauen, verschiedene Altersgruppen oder Ähnliches. Dies passiert in Form von Kreuztabellierungen.


Bespiel Tabelle Total + Soziodemografische Breaks – Bitte klicken zum Vergrößern

 

Ergebnis: Die Gruppe der 30 bis 39-Jährigen Befragten kauft Obst und Gemüse signifikant häufiger im Bio-Laden ein, als die Gruppe der 40 bis 49-Jährigen – diese beiden Ergebnisse unterscheiden sich TATSÄCHLICH – nicht zufällig. Außerdem kaufen ältere Personen signifikant häufiger „auf dem Markt“ als jüngere Personen.

 

Warum kann ich hier von signifikanten Unterschieden sprechen? Wann kann ich zum Beispiel sagen, das Ergebnis von befragten Männer unterscheidet sich – hochgerechnet auf die Grundgesamtheit – signifikant von jenem der befragten Frauen?

Einfach gesprochen sind Ergebnisse dann signifikant, wenn sie außerhalb des Konfidenzintervalls liegen. Das Konfidenzintervall beträgt bei einer Stichprobe von n=300 maximal +/- 5,8%, bei einer Stichprobe von n=600 maximal +/- 4,0%. Bei einem Tabellenwert von 50% tritt der Maximalwert in Kraft, das Konfidenzintervall liegt demnach bei n=300 zwischen 44,2% und 55,8%. Das bedeutet: Das Ergebnis aus der Stichprobe (=50%) liegt hochgerechnet auf die Grundgesamtheit (alle ÖsterreicherInnen) zwischen 44,2% und 55,8%. Wichtig ist zu wissen: Je näher der gemessene Wert bei 0% oder 100% liegt, umso geringer wird das Konfidenzintervall.

 

Folgendes Beispiel soll das erläutern:

Wir haben zwei Stichproben (Stichprobe 1: n=300 Interviews, Stichprobe 2: n=600 Interviews), beide messen eine Billa-Reichweite von 45% bzw. 53% für Männer bzw. Frauen.

Ist dieser Unterschied signifikant?

Die Antwort lautet: Ja, bei der 600er-Stichprobe, Nein, bei der 300er-Stichprobe.

Warum?

Signifikantzbeispiel1Signifikantzbeispiel2

 

Multivariate Verfahren

Neben den üblichen deskriptiven Analysen quantitativer Studien (Kreuztabellen) liefern multivariate Analysen einen tieferen Einblick in das erhobene Datenmaterial. Man spricht von einer multivariaten Analyse, wenn mehrere statistische Variablen (= Merkmale oder Ergebnisse aus einer Befragung) zugleich untersucht werden und Zusammenhänge zwischen mehreren Variablen hergestellt werden können.

 

In der Marktforschung werden folgende multivariate Analyseverfahren besonders häufig angewendet: