PLS SEM mit R / seminr 3:
Formatives Messmodell beurteilen
Arndt Regorz, Dipl. Kfm. & MSc. Psychologie, 30.11.2023
Bevor man ein PLS SEM Modell interpretieren kann, muss man die Modellgüte beurteilen, unter anderem auch die Güte des Messmodells. Um die Güte eines formativ spezifizierten Messmodells mit partial least squares (PLS) SEM zu beurteilen, prüft man vier verschiedene Bereiche:
- Inhaltsvalidität
- Konvergente Validität
- Keine hohe Kollinearität
- Höhe und Signifikanz formativer Indikatoren
Die nachfolgenden Empfehlungen zur Prüfung dieser drei Bereiche beruhen vor allem auf Hair et al. (2019).
Inhaltsvalidität
Eine wesentliche Voraussetzung für ein gutes formatives Messmodell ist die Inhaltsvalidität. Alle relevanten Facetten des zu messenden Konstruktes müssen als Indikatorvariablen enthalten sein, um das formativ gemessene Konstrukt korrekt abbilden zu können. Das lässt sich nicht primär anhand von quantitativen Auswertungen prüfen, hier ist stattdessen ein gründliches qualitatives Vorgehen gefordert.
Konvergente Validität
Die konvergente Validität eines formativ gemessenen Konstrukts kann man durch Korrelation mit einer reflektiven Messung abschätzen (Redundanzanalyse). Das setzt voraus, dass man neben den formativen Indikatoren auch eine reflektive Messung des gleichen Konstrukts vorgenommen hat, z.B. mit einem für das Konstrukt repräsentativen Single Item.
Dann ermittelt man den Pfad eines einfachen Modells, bei dem das formativ gemessene Konstrukt der Prädiktor und das reflektiv gemessene Konstrukt (z.B. mit einem Single-Item) das Kriterium ist. Ein standardisierter Pfadkoeffizient von größer als .70 spricht hier für konvergente Validität.
Keine hohe Kollinearität
Die Indikatoren des formativ gemessenen Konstrukts sollten keine hohe Multikollinearität aufweisen. Dazu werden die Varianzinflationsfaktoren (VIF) betrachtet. Werte über 5 werden als problematisch angesehen, Werte zwischen 3 und 5 als möglicherweise problematisch. Idealerweise liegen alle VIF-Werte unter 3.
In R erhalten Sie diese Varianzinflationsfaktoren als Teil der Modellschätzung. Im Basistutorial zu PLS SEM mit R (PLS SEM: Modellschätzung mit R / seminr) hatten wir u.a. ein SEM mit formativem Messmodell geschätzt und als Ergebnis ein Objekt poldem_pls_f erhalten.
Aufruf: summary(poldem_pls_f)$validity
Hier erhalten wir u.a. Tabellen mit den VIF-Werten je Item und Konstrukt:
$vif_items
indus :
x1 x2 x3
5.141 6.712 3.714
dem60 :
y1 y2 y3 y4
2.537 2.182 2.002 2.849
dem65 :
y5 y6 y7 y8
2.046 2.408 2.486 3.116
In diesem Beispiel zeigt sich beim Konstrukt Industrialisierung (indus) eine möglicherweise problematische Multikollinearität zwischen verschiedenen Indikatoren, insbesondere bei x1 und x2.
Höhe und Signifikanz formativer Indikatoren
Hier werden pro Indikator bis zu drei Größen betrachtet: Gewicht, Signifikanz, Ladung
Im Idealfall sind alle äußeren Gewichte (also die Gewichte des Messmodells) signifikant, haben also einen p-Wert unter .05 bzw. weisen ein 95% Konfidenzintervall auf, das die Null nicht einschließt. Dann gelten sie als relativ relevant und verbleiben im Modell.
Wenn ein oder mehrere äußere Gewichte nicht signifikant sind, dann betrachtet man noch die Ladung. Wenn in diesem Fall die Ladung über .50 liegt und signifikant ist, sind die Gewichte als absolut relevant anzusehen und verbleiben im Modell. Wenn auch das nicht der Fall ist, ist ein Verzicht auf den betreffenden Indikator in Erwägung zu ziehen, wobei jedoch auch inhaltliche und theoretische Aspekte eine Rolle spielen sollten.
Um die Signifikanz von Gewichten und Ladungen des Modells zu beurteilen, benötigen wir das Ergebnis des Bootstrappings für die Schätzung. Im o.g. Basistutorial hatten wir hier das Objekt poldem_pls_boot_f erhalten.
Aufruf: summary(poldem_pls_boot_f)
Jetzt erhalten wir zum einen die äußeren Gewichte mit Konfidenzintervallen:
Bootstrapped Weights:
Original Est. Bootstrap Mean Bootstrap SD T Stat. 2.5% CI 97.5% CI
x1 -> indus 0.809 0.732 0.454 1.782 -0.255 1.523
x2 -> indus 0.342 0.364 0.515 0.664 -0.593 1.359
x3 -> indus -0.155 -0.132 0.332 -0.467 -0.813 0.475
y1 -> dem60 0.450 0.432 0.142 3.178 0.114 0.680
y2 -> dem60 -0.000 0.004 0.153 -0.002 -0.277 0.328
y3 -> dem60 0.085 0.092 0.119 0.716 -0.119 0.333
y4 -> dem60 0.569 0.565 0.134 4.249 0.304 0.820
y5 -> dem65 0.461 0.431 0.126 3.647 0.184 0.684
y6 -> dem65 0.161 0.171 0.122 1.320 -0.050 0.406
y7 -> dem65 0.202 0.210 0.138 1.462 -0.050 0.467
y8 -> dem65 0.328 0.327 0.151 2.169 0.061 0.657
Wir sehen hier, dass die Gewichte für folgende Indikatoren signifikant sind (Konfidenzintervall enthält nicht die Null): y1, y4, y5, y8.
Für die anderen Gewichte müssen wir jetzt noch die Höhe der Ladungen und deren Signifikanz bestimmen, auch diese Tabelle erhalten wir mit dem o.g. Aufruf der Summary-Funktion.
Bootstrapped Loadings:
Original Est. Bootstrap Mean Bootstrap SD T Stat. 2.5% CI 97.5% CI
x1 -> indus 0.991 0.954 0.058 17.117 0.814 0.999
x2 -> indus 0.934 0.906 0.079 11.826 0.719 0.996
x3 -> indus 0.783 0.763 0.115 6.807 0.479 0.945
y1 -> dem60 0.902 0.887 0.045 20.009 0.788 0.954
y2 -> dem60 0.719 0.709 0.092 7.828 0.513 0.882
y3 -> dem60 0.737 0.726 0.084 8.815 0.544 0.870
y4 -> dem60 0.933 0.922 0.037 25.157 0.837 0.983
y5 -> dem65 0.895 0.877 0.054 16.553 0.741 0.960
y6 -> dem65 0.791 0.785 0.070 11.360 0.641 0.906
y7 -> dem65 0.846 0.844 0.052 16.281 0.734 0.931
y8 -> dem65 0.883 0.879 0.052 17.115 0.761 0.958
Alle Ladungen (Original Est.) sind über .50, und alle Ladungen sind signifikant (Konfidenzintervalle schließen die Null nicht ein). Damit können also alle Indikatoren im Modell verbleiben.
Literatur
Hair, J. F., Risher, J. J., Sarstedt, M., & Ringle, C. M. (2019). When to use and how to report the results of PLS-SEM. European Business Review, 31(1), 2-24.
Weitere Tutorials
Weitere Tutorials zu PLS SEM mit R:
- PLS SEM: Modellschätzung mit R / seminr
- PLS SEM: Evaluation eines reflektiven Messmodells mit R / seminr
- PLS SEM: Evaluation des Strukturmodells mit R / seminr