Mediatoranalyse - Teil 3:
Verfahren für Fortgeschrittene
Arndt Regorz, Dipl. Kfm. & M.Sc. Psychologie, Stand: 08.12.2017
Die Tutorials zu Grundbegriffen der Mediationsanalyse und zu den neueren Verfahren zur Schätzung indirekter Effekte mit Bootstrapping bilden eine gute Grundlage, um bei der Datenauswertung Mediationseffekte aufzudecken. Um in einer Querschnittsanalyse für eine Bachelorarbeit z.B. mit Sekundärdaten eine Mediationsanalyse zu berechnen, reichen die dortigen Informationen aus.
Wenn Sie jedoch eigenständig den Nachweis z.B. einer kausalen Mediation führen wollen, brauchen Sie neben dem Wissen zur Datenauswertung auch weitergehendes Know-how zum Untersuchungsdesign. Im Folgenden werden vor allem diese fortgeschrittenen Fragestellungen zur Mediation kurz vorgestellt:
- Einschränkungen der Reliabilität und mögliche Gegenmaßnahmen: Skalen und lineare Strukturgleichungsmodelle (SEM)
- Mediation in Hierarchischen Modellen (HLM)
- Prüfung von Mediation in Längsschnittmodellen
- Designs zur direkten Prüfung kausaler Effekte und die damit verbundenen Schwierigkeiten
Inhalt
- Einschränkungen der Reliabilität
- Hierarchische Modelle
- Längsschnittmodelle
- Kausalitätsprüfung bei Mediation
- Quellen
1. Einschränkungen der Reliabilität
Alle Berechnungen in der multiplen Regression beruhen auf den verwendeten unabhängigen und abhängigen Variablen. Diese werden bei der Regression theoretisch als 100%ig messfehlerfrei angenommen, also mit einer Reliabilität von 1.00.
Diese theoretische Annahme ist aber offensichtlich häufig nicht sehr realistisch, insbesondere wenn es um innerpsychische Konstrukte geht (z.B. Arbeitszufriedenheit, Wechselbereitschaft, Kreativität, Intelligenz usw.), die über Fragebögen und Tests gemessen werden. Lediglich für physische (Produktionsmenge) oder monetäre (Umsatzzahlen) Variablen ist dieses Problem häufig zu vernachlässigen.
Wenn die Annahme einer perfekten Reliabilität verletzt wird, kann dies zu Fehlschätzungen der Modellparameter führen. Bei einer multiplen Regression, wie sie für die Mediationsanalyse eingesetzt wird, kann dieser Fehler in beide Richtungen gehen: Es können einzelne Pfade überschätzt oder unterschätzt werden.
Das kann wiederum dazu führen, dass eigentlich signifikante Effekte nicht gefunden werden oder dass nicht-signifikante Effekte als signifikant ausgegeben werden. Dieses Problem wird um so stärker, je weniger reliabel die gemessenen Variablen sind.
Zum Umgang damit gibt es zwei Ansätze: Die Erhöhung der Reliabilität durch die Zusammenfassung von mehreren Variablen zu einer Skala und die Berücksichtigung der Messfehler im Rahmen linearer Strukturgleichungsmodelle (SEM).
Wenn mehrere gleichartige Items zur Messung eines Konstrukts zu einer Skala zusammengefasst werden, erhöht sich in der Regel die Reliabilität. Vor diesem Hintergrund sollten Sie, wenn immer möglich, nicht nur Einzelitems als unabhängige Variable, Mediator oder abhängige Variable in der Mediationsanalyse verwenden, sondern aus mehreren Items gebildete Skalen.
Damit das zu zuverlässigen Ergebnissen führt, muss allerdings zuvor überprüft werden, dass die Items auch das Gleiche messen. Dafür gibt es entsprechende Methoden der klassischen Testtheorie bzw. der probabilistischen Testtheorie.
Eine direkte Berücksichtigung von Messfehlern bei der Schätzung von Mediationseffekten kann im Rahmen linearer Strukturgleichungen (SEM) erfolgen. Diese bestehen für die Prüfung von Mediationshypothesen aus einer Kombination aus Messmodellen und Strukturmodellen.
In den Messmodellen werden die unabhängigen und abhängigen Variablen als latente Konstrukte betrachtet, denen jeweils mehrere manifeste Indikatorvariablen (z.B. Items in einem Fragebogen) zugeordnet sind. Dabei sind neben einfachen Strukturen – jeder Indikator ist nur einem latenten Konstrukt zugeordnet - auch deutlich komplexere Strukturen möglich mit Indikatoren, die mit mehreren Konstrukten in Verbindung stehen.
Isolierte Messmodelle werden mit der Methode der Konfirmatorischen Faktorenanalyse (CFA) betrachtet. Die Schätzung im Rahmen der Messmodelle berücksichtigt automatisch auch, dass alle Messungen mit Messfehlern behaftet sind.
Die Strukturmodelle hingegen verknüpfen die verschiedenen latenten Variablen miteinander, beispielsweise auch im Rahmen einer Mediationsanalyse. Das folgende etwas vereinfachte Diagramm zeigt schematisch eine Mediationsanalyse als lineares Strukturgleichungsmodell. Alle drei verwendeten Konstrukte UV, AV, Mediator (jeweils in ovalen Symbolen) werden dabei jeweils mit drei Indikatorvariablen (jeweils in eckigen Symbolen) gemessen.
Neben der Prüfung eines einfachen Mediationsmodells können mit linearen Strukturgleichungsmodellen auch sehr komplexe Modelle mit mehreren Mediatoren, Moderatoren usw. getestet werden. Das macht SEM zu einer sehr mächtigen, aber auch in der Anwendung recht komplexen Methodik.
2. Mediation in hierarchischen Modellen
Insbesondere bei der Untersuchung von Zusammenhängen in Organisationen sind häufig verschiedene Analyseebenen betroffen. Mitarbeiter gehören zu Arbeitsgruppen, Schüler sind in Schulklassen zusammengefasst usw. Einige interessierende Variablen sind nun auf der unteren Ebene (Arbeitsleistung, Schulnoten) gemessen, andere Variablen auf einer höheren Ebene (Arbeitsklima, Unterrichtsstil des gemeinsamen Lehrers). Man spricht dann von „genesteten“ Untersuchungseinheiten.
Ein weiterer Anwendungsfall für hierarchische Strukturen liegt in Längsschnittuntersuchungen. Hier sind die einzelnen Untersuchungszeitpunkte genestet in den untersuchten Personen – jede Person enthält verschiedene Ergebnisse zu unterschiedlichen Zeiten.
Ein konkretes Beispiel für eine hierarchische Mediationsfragestellung wäre: Sie wollen in einem Großkonzern wissen, wie sich das Führungsverhalten der Abteilungsleiter auf die Arbeitszufriedenheit der einzelnen Mitarbeiter auswirkt. Sie vermuten, dass ein autoritärer Führungsstil (unabhängige Variable) sich vermittelt über ein schlechtes Arbeitsklima in der Abteilung (Mediator) negativ auf die Arbeitszufriedenheit der einzelnen Mitarbeiter (abhängige Variable) auswirkt.
Bei der Untersuchung mit einer gewöhnlichen multiplen Regression besteht jetzt ein Problem: Die Arbeitszufriedenheit der verschiedenen Mitarbeiter einer Abteilung ist nicht unabhängig voneinander. Damit ist eine Grundvoraussetzung für die Regressionsanalyse verletzt.
Das hängt mit der hierarchischen Struktur der Daten zusammen. Die Arbeitszufriedenheit wird auf Ebene der Mitarbeiter gemessen (Ebene 1, die Zählung beginnt dabei immer bei der untersten Ebene), das Arbeitsklima und der Führungsstil auf Ebene der Abteilung (Ebene 2). Wenn man diese Mehrebenenstruktur nicht in der Auswertung berücksichtigt, kann dies zu völlig falschen Ergebnissen führen.
Eine Technik, welche die Mehrebenenstruktur von Daten explizit mit berücksichtigt, ist die der hierarchischen linearen Modellierung (HLM), auch Mehrebenenanalyse oder Hierarchical Linear Modeling genannt. Dabei wird das Zusammenspiel von Variablen auf mehreren Ebenen modelliert.
Im Rahmen von HLM ist nun auch die Prüfung von Mediationshypothesen möglich. Die geprüften Zusammenhänge können sich auf unterschiedlichen Ebenen befinden:
1-1-1-Modell: Alle untersuchten Variablen befinden sich auf der untersten Ebene, z.B. der Ebene des Individuums. Der Einfluss der höheren Ebene wird nur als Kontrollvariable in die Analyse mit einbezogen.
2-1-1-Modell: Die unabhängige Variable befindet sich auf der oberen Ebene, z.B. der Arbeitsgruppe. Sie wirkt auf einen Mediator auf der unteren Ebene, also beispielsweise auf eine Einstellung des Individuums, die wiederum auf eine weitere Variable auf unterster Ebene wirkt, z.B. auf die Arbeitsleistung.
2-2-1-Modell: Die unabhängige Variable und der Mediator befinden sich auf der höheren Ebene, die abhängige Variable auf der unteren Ebene. Das Ausgangsbeispiel oben (Führungsstil als unabhängige Variable und Abteilungsklima als Mediator auf Ebene 2, Arbeitszufriedenheit als abhängige Variable auf Ebene 1) ist so ein 2-2-1-Modell.
Um derartige Untersuchungsansätze für die Mediationsanalyse nutzen zu können, muss man sich jedoch zunächst einmal in die relativ komplexe Technik der Mehrebenenmodelle einarbeiten.
Bei komplexeren Mediationsfragestellungen gibt es darüber hinaus noch Verfahren der Mehrebenen-Strukturgleichungsmodelle.
3. Mediation in Längsschnittmodellen
Das Prüfen in einer korrelativen Querschnittsanalyse ergibt nur erste Hinweise auf einen kausalen Mediationsprozess, keinesfalls dessen Beleg. Wir wissen dann nicht einmal, ob bei einer Änderung der unabhängigen Variable sich zuerst der Mediator ändert und dann die abhängige Variable (bei tatsächlicher Mediation) oder vielleicht umgekehrt erst die abhängige Variable und dann erst der vermutete Mediator (was sehr stark gegen die angenommene Wirkungskette spräche).
Mit Längschnittdesigns zur Prüfung von Mediation können zumindest einige Alternativerklärungen beim Querschnittsdesign ausgeschlossen werden, weil der zeitliche Ablauf der Änderungen bei den untersuchten Variablen mit berücksichtigt werden kann.
Das konzeptionell einfachste Längsschnittmodell besteht aus drei Messzeitpunkten. Mit der Veränderung zwischen erstem und zweitem Messzeitpunkt kann man prüfen, wie sich die unabhängige Variable auf den Mediator auswirkt. Und mit der Veränderung zwischen zweitem und drittem Messzeitpunkt kann dann die Wirkung vom Mediator auf die abhängige Variable ermittelt werden.
Die folgende Abbildung zeigt schematisch diese Untersuchung. Interessant sind die Pfade a zwischen erstem und zweiten Zeitpunkt und b zwischen zweitem und drittem Zeitpunkt.
Eine Untersuchung mit drei Messzeitpunkten ist jedoch recht aufwändig. Man hat häufig das Problem vom Ausfall von Versuchspersonen, die nicht bei allen Messzeitpunkten mitmachen (attrition).
Eine mögliche Alternative ist ein Längsschnittdesign mit nur zwei Messzeitpunkten. Bei einem derartigen Design wird sowohl der Pfad von der unabhängigen Variable zum Mediator als auch der Pfad vom Mediator zur abhängigen Variable zwischen erstem und zweitem Zeitpunkt erhoben; im folgenden Schaubild die Pfade a und b.
Eine Schwierigkeit bei derartigen Analysen ist die Wahl von geeigneten Zeitabständen zwischen den Messzeitpunkten. Diese sollten möglichst gut mit der tatsächlichen Geschwindigkeit der ablaufenden Prozesse überein stimmen.
Beim zweiten Modell mit nur zwei Messzeitpunkten kommt als Schwierigkeit hinzu, dass dieses Modell nur dann angemessen ist, wenn sowohl die Wirkung von der unabhängigen Variable auf den Mediator als auch die Wirkung vom Mediator auf die abhängige Variable ungefähr gleich schnell ablaufen. Denn beide werden ja mit dem gleichen Zeitabstand zwischen erstem und zweiten Messzeitpunkt gemessen.
Beim vorherigen Modell mit drei Messzeitpunkten hingegen wäre es durchaus möglich, die Abstände zwischen den Messzeitpunkten auf evtl. bestehendes Vorwissen über eine unterschiedliche Ablaufgeschwindigkeit der verschiedenen Prozesse einzurichten.
4. Prüfung kausaler Modelle
Es gehört zu den wichtigsten Grundlagenkenntnissen zur Mediationsprüfung per Regressionsanalyse, dass man aus einer korrelativen Untersuchung keine Mediation nachweisen kann im Sinne einer kausalen Wirkungskette. Korrelative Untersuchungen können eine Mediationshypothese widerlegen, indem sie Ergebnisse liefern, die mit der Annahme einer Mediation nicht vereinbar sind. Aber beweisen können sie sie nicht; es gibt immer noch zahlreiche Alternativerklärungen, die auch zu einem signifikanten Ergebnis der Mediationsprüfung geführt haben könnten.
Die im vorherigen Abschnitt präsentierten Längsschnittdesigns sind schon ein Schritt in die richtige Richtung. Ein Kausalitätskriterium ist, dass die vermutete Ursache vor der vermuteten Wirkung stattfindet. Und genau das kann man im Längsschnitt im Gegensatz zum Querschnitt prüfen. Aber bei der Verwendung korrelativer Daten reicht das nicht für einen Beleg einer kausalen Mediation. Denn insbesondere die alternative Erklärung der vorliegenden Daten über nicht beobachtete Drittvariablen ist auch im Längsschnitt immer noch möglich.
Ein echter Beleg für einen kausalen Pfad von der unabhängigen Variable über einen Mediator auf die abhängige Variable setzt in der Regel das randomisierte Experiment voraus. Nur durch die experimentelle Manipulation der theoretisch wirksamen Variablen (unabhängige Variable, Mediator) können Sie wirklich prüfen, ob der vermutete Wirkungspfad so verläuft wie vermutet.
Für eine experimentelle Prüfung einer Mediationshypothese gibt es z.B. das experimental-causal-chain-design (Spencer, Zanna, & Fong, 2005), also auf Deutsch das Design der experimentellen Kausalkette. Dieses Design besteht aus der Kombination zweier Experimente (unter der Voraussetzung, dass die grundsätzliche Wirkung der unabhängigen Variable auf die abhängige Variable bereits vorher abgesichert ist und sich nur noch die Frage nach dem Mediator stellt).
Im ersten Experiment wird getestet, ob die unabhängige Variable theoriekonform den Mediator beeinflusst. Man manipuliert die unabhängige Variable in einem Design mit Kontrollgruppe und misst die Wirkung auf den Mediator. Es wird also nach der üblichen Notation von Mediationsanalysen der a-Pfad getestet.
Und in einem zweiten Experiment überprüft man dann, ob der Mediator die abhängige Variable beeinflusst. Hier wird jetzt der Mediator manipuliert und die Wirkung auf die abhängige Variable gemessen. Dies betrifft also den b-Pfad eines Mediationsmodells.
Wenn beide Experimente zu signifikanten Ergebnissen führen, dann besteht Grund zur Annahme, dass der vermutete Mediationspfad tatsächlich vorliegt.
Damit man jedoch mit diesen beiden Experimenten hinreichend sicher sein kann, dass die vermutete kausale Wirkungskette zutrifft, müssen eine Reihe von Voraussetzungen erfüllt sein:
- Die verwendeten Variablen (unabhängige Variable, Mediator, abhängige Variable) müssen reliabel messbar sein.
- Sowohl die unabhängige Variable als auch der Mediator müssen sicher manipulierbar sein. Das kann insbesondere beim Mediator schwierig sein, wenn es sich um ein innerpsychisches Konstrukt handelt. Wenn Sie beispielsweise in einem Modell (bei irgendeiner unabhängigen Variable) die Mediatorwirkung von Arbeitszufriedenheit auf die Arbeitsleistung feststellen wollen, wie manipulieren Sie dann direkt Arbeitszufriedenheit?
- Die direkte Manipulation des Mediators im Experiment 2 muss die gleiche sein wie die Wirkung auf den Mediator, welche von der unabhängigen Variable ausgeht. Das heißt, dass die abhängige Variable in Experiment 1 deckungsgleich mit der unabhängigen Variable in Experiment 2 sein muss. Das ist alles andere als sicher, denn es kann im Experiment 1 durchaus eine etwas andere Facette des Mediator-Konstrukts angesprochen werden als im Experiment 2 durch die Manipulation erreicht wird.
Trotz dieser potentiellen Einschränkungen ist das experimental-causal-chain-design ein wichtiger Ansatz zur Prüfung von Mediationshypothesen, der gegenüber nicht-experimentellen Designs häufig bessere Belege für eine kausale Wirkungskette über einen Mediator bringen kann.
Ein anderer experimenteller Untersuchungsansatz für Mediationshypothesen löst sich stärker von der Orientierung am statistischen Untersuchungsschema mit der gesonderten Untersuchung der Teilpfade a (unabhängige Variable - Mediator) und b (Mediator - abhängige Variable).
Im testing process by interaction strategy (TPIS)-Ansatz (Jacoby & Sassenberg, 2011), auf Deutsch Prozesstestung-per-Interaktion-Strategie, wird über einen Moderator die Mediation geprüft. Man versucht, durch einen geeigneten Eingriff einen vermuteten Mediator sozusagen „abzuschalten“ oder, ebenfalls möglich, zu verstärken. Wenn das Abschalten des Mediators dazu führt, dass damit auch die Wirkung auf die abhängige Variable ausbleibt, spricht das für den vermuteten Mediationspfad.
Um diesen Ansatz an einem einfachen Alltagsbeispiel zu erklären:
Sie haben ein Windrad und wollen testen, ob die Wirkung des Winds (unabhängige Variable) auf den erzeugten Strom (abhängige Variable) durch die Drehung des Windrades (Mediator) vermittelt wird. Den Wind selbst als unabhängie Variable können Sie kaum bzw. nur mit großem Aufwand manipulieren, so dass hier das experimental-causal-chain-design nicht eingesetzt werden kann.
Beim TIPS-Ansatz würden Sie nun den vermuteten Mediator abschalten und untersuchen, ob damit die Wirkung auf die abhängige Variable ausbleibt. Und das wäre hier offensichtlich der Fall: Wenn Sie das Windrad als Mediator zeitweise so mechanisch fixieren, dass es sich nicht mehr drehen kann, bleibt auch die Wirkung auf die abhängige Variable, den erzeugten Strom, aus. Und wenn Sie das Windrad wieder freigeben, fließt auch wieder Strom. So haben Sie ohne Eingriff in die unabhängige Variable dennoch einen Mediationsprozess zeigen können, nur indem Sie den Mediator direkt manipuliert haben.
Beispiele aus der Psychologie für dieses Vorgehen finden Sie im Beitrag von Jacoby und Sassenberg (2011).
5. Quellen
Jacoby, J., & Sassenberg, K. (2011). Interactions do not only tell us when, but can also tell us how: Testing process hypotheses by interaction. European Journal of Social Psychology, 41, 180-190. doi:10.1002/ejsp.762
Judd, C. M., Yzerbyt, V. Y., & Muller, D. (2012). Mediation and Moderation. In: H. T. Reis & C. M. Judd (Eds.), Handbook of Research Methods in Social and Personality Psychology. New York, NY: Cambridge University Press.
Spencer, S. J., Zanna, M. P., & Fong, G. T. (2005). Establishing a causal chain: why experiments are often more effective than mediational analyses in examining psychological processes. Journal of Personality and Social Psychology, 89, 845-851. doi:10.1037/0022-3514.89.6.845
Weitere Tutorials zur Mediationsanalyse:
-
Grundlagen der Mediation, klassisches Modell von Baron & Kenny
Mediatoranalyse 1 -
Mediationsanalyse mit dem PROCESS-Makro für SPSS
Mediatoranalyse 2 -
Wie berechnet man die nötige Stichprobengröße für eine Mediation?
Mediator Poweranalyse -
Mediation mit dem PROCESS-Makro für R
(einfache Mediation und parallele Mediation)
Mediatoranalyse mit PROCESS für R/RStudio -
Mediationsanalyse mit JASP
JASP Video-Tutorial Mediation