Regressionsvoraussetzungen beim PROCESS-Makro von Hayes

Arndt Regorz, Dipl. Kfm. & M.Sc. Psychologie, 13.08.2021


Wenn Sie mit PROCESS eine Mediation, Moderation oder moderierte Mediation testen, dann führen Sie eine oder mehrere Regressionsanalysen durch (eine bei einer Moderation, zwei oder mehr bei Mediation oder moderierter Mediation - abhängig von der Zahl der Mediatoren).

Regressionsanalysen haben wie alle statistischen Verfahren Voraussetzungen, deren Vorliegen Sie testen müssen, wenn Sie nicht zu falschen Schlussfolgerungen kommen wollen. Aber PROCESS testet diese Voraussetzungen nicht für Sie! Das gilt sowohl für das PROCESS Makro für SPSS als auch für das PROCESS Makro für R.

Inhalt

  1. Unabhängigkeit/Unkorreliertheit der Residuen
  2. Geeignete Skaleneigenschaften
  3. Normalverteilung der Residuen
  4. Homoskedastizität der Residuen
  5. Linearität des Zusammenhangs jeweils zwischen einzelnem Prädiktor und Kriterium
  6. Abwesenheit starker Multikollinearität
  7. Abwesenheit extremer Ausreißer
  8. Prüfung der Voraussetzungen außerhalb von PROCESS
  9. Quellen

1. Unabhängigkeit/Unkorreliertheit der Residuen

Diese Voraussetzung können Sie nicht empirisch testen (der häufig dafür verwendete Durbin-Watson-Test ist eigentlich nur für ein Längsschnittdesign geeignet und prüft dort lediglich Autokorrelation erster Ordnung). Hier würde ich über die Art der Stichprobenziehung argumentieren (Querschnittsdesign und Abwesenheit von geclusterten/hierarchischen Daten).

2. Geeignete Skaleneigenschaften

Auch das Vorliegen dieser Voraussetzung ist primär keine empirische Frage, sondern lässt sich anhand der verwendeten Skalen beurteilen.

3. Normalverteilung der Residuen

Für diese Voraussetzung haben Sie drei Optionen:

Nachbau der PROCESS-Regressionsmodelle mit SPSS oder R und dort einer oder mehrere der üblichen Tests auf Normalverteilung der Residuen (Histogramm, PP-Plot, QQ-Plot, Shapiro-Wilk-Test, Betrachtung von Schiefe und Kurtosis). Welches Regressionsmodell bzw. welche Regressionsmodelle PROCESS dabei geschätzt hat, können Sie aus dem ersten Teil des PROCESS-Outputs erkennen.

Bei hinreichend großen Stichproben: Argumentation, dass die Voraussetzung aufgrund des zentralen Grenzwertsatzes irrelevant ist (die hier häufig kursierenden Grenzwerte von ca. 30 oder 100 sind allerdings eher zu gering. Nach Lumley et al. (2002) könnte man ab einer Stichprobe von 500 vermutlich auf eine Prüfung der Normalverteilung verzichten (wobei es immer noch extreme Datenstrukturen geben könnte, bei denen auch über 500 noch verzerrte Standardfehler resultieren).

Die sicherste und bei PROCESS zugleich einfachste Option ist, für alle Regressionsgewichte Bootstrapping-Ergebnisse anzufordern. Wenn man für die Regressionsgewichte Konfidenzintervalle per Bootstrapping verwendet, ist die Normalverteilung der Residuen nicht mehr notwendig. (Allerdings sollte man eine Stichprobe von N > 50 verwenden, da in sehr kleinen Stichproben Bootstrapping nicht hinreichend zuverlässig ist.)

4. Homoskedastizität der Residuen

Für diese Voraussetzung haben Sie wiederum drei Optionen:

Nachbau der PROCESS-Regressionsmodelle mit SPSS oder R und dort einer oder mehrere der üblichen Tests auf Homoskedastizität der Residuen (Streudiagramm standardisierte vorhergesagte Werte mit standardisierten Residuen, Breusch-Pagan-Test oder einer der anderen Tests für Homoskedastizität). Welches Regressionsmodell bzw. welche Regressionsmodelle PROCESS dabei geschätzt hat, können Sie aus dem ersten Teil des PROCESS-Outputs erkennen.

Verwendung von Bootstrapping. Dieses Verfahren ist relativ robust gegen Verletzungen der Homoskedastizitätsvoraussetzung. Das Verfahren können Sie in PROCESS einfach anfordern.

Verwendung robuster Standardfehler (HC3 oder HC4), diese können Sie in PROCESS im Optionsdialog anfordern.

5. Linearität des Zusammenhangs

Eine multiple Regression setzt voraus, dass zwischen jedem Prädiktor (inkl. eventueller Interaktionsterme bei Moderation und moderierter Mediation) und dem jeweiligen Kriterium ein linearer Zusammenhang besteht (oder auch gar kein Zusammenhang – nicht jedoch ein nicht-linearer Zusammenhang, wie z.B. u-förmig, umgekehrt u-förmig usw.). Ausnahme sind binäre Prädiktoren, dort ist eine Linearitätsprüfung nicht möglich und nicht nötig.

Hierfür gibt es leider keine Möglichkeit, das in PROCESS selbst über irgendeine Option abzufangen. Für diese Voraussetzung haben Sie zwei Optionen:

Wenn Sie für Normalverteilung und Homoskedastizität auf eine Prüfung verzichten, weil Sie in PROCESS Bootstrapping und ggf. robuste Standardfehler anfordern, dann ist es am einfachsten, diese Voraussetzung über bivariate Streudiagramme (je ein Prädiktor mit dem Kriterium; bei einer Mediation oder moderierten Mediation sowohl für das Modell des a-Pfades als auch für das Modell von b- und c'-Pfad) zu prüfen.

Wenn Sie für die Prüfung von Normalverteilung und Homoskedastizität sowieso die einzelnen Regressionsmodelle nachbauen, können Sie stattdessen auch partielle Regressionsplots betrachten. Auch Signifikanztests auf Linearität sind (zumindest in R) möglich, wie z.B. der Rainbow-Test.

6. Abwesenheit starker Multikollinearität

Diese Voraussetzung können Sie nicht direkt in PROCESS abfangen. Für das Testen dieser Voraussetzung bietet sich der Nachbau der Regressionsmodelle in SPSS oder R an mit Anforderung des VIF als Instrument zur Diagnose von Multikollinearität.

Wenn Sie auf den Nachbau der Regressionsmodelle verzichten wollen, könnten Sie stattdessen die Korrelationsmatrix betrachten und prüfen, ob es dort zwischen verschiedenen Prädiktoren Korrelationen von beispielsweise über .70 gibt. Genau genommen können Sie damit aber nur Kollinearität zwischen einem Paar von Prädiktorvariablen aufdecken und keine echte Multikollineariät (Choueiry, n.d.).

7. Abwesenheit extremer Ausreißer

Sehr einflussreiche Fälle können Sie ggf. über Boxplots der verschiedenen Prädiktorvariablen entdecken.

Echte Ausreißer (im Sinne von Fällen, die einen starken Einfluss haben und die weit von der geschätzten Regressionsgeraden entfernt liegen) lassen sich tatsächlich am ehesten dadurch auffinden, dass man die Regressionsmodelle von PROCESS in SPSS oder R nachbaut und dort die Ausreißeranalyse durchführt (z.B. durch Speicherung und anschließende Analyse der Cook's Distanz).

8. Prüfung der Voraussetzung außerhalb von PROCESS

Für die Prüfung von Regressionsvoraussetzungen außerhalb von PROCESS finden Sie hier diverse Tutorials:


9. Quellen

Choueiry, G. (n.d.). Correlation vs Collinearity vs Multicollinearity. Quantifying Health. https://quantifyinghealth.com/correlation-collinearity-multicollinearity/

Lumley, T., Diehr, P., Emerson, S., & Chen, L. (2002). The importance of the normality assumption in large public health data sets. Annual review of public health, 23 (1), 151-169. https://www.annualreviews.org/doi/full/10.1146/annurev.publhealth.23.100901.140546