PLS SEM mit R / seminr 3:
Formatives Messmodell beurteilen

Arndt Regorz, Dipl. Kfm. & MSc. Psychologie, 30.11.2023

Bevor man ein PLS SEM Modell interpretieren kann, muss man die Modellgüte beurteilen, unter anderem auch die Güte des Messmodells. Um die Güte eines formativ spezifizierten Messmodells mit partial least squares (PLS) SEM zu beurteilen, prüft man vier verschiedene Bereiche:

Inhaltsvalidität
Konvergente Validität
Keine hohe Kollinearität
Höhe und Signifikanz formativer Indikatoren

Die nachfolgenden Empfehlungen zur Prüfung dieser drei Bereiche beruhen vor allem auf Hair et al. (2019).

Inhaltsvalidität

Eine wesentliche Voraussetzung für ein gutes formatives Messmodell ist die Inhaltsvalidität. Alle relevanten Facetten des zu messenden Konstruktes müssen als Indikatorvariablen enthalten sein, um das formativ gemessene Konstrukt korrekt abbilden zu können. Das lässt sich nicht primär anhand von quantitativen Auswertungen prüfen, hier ist stattdessen ein gründliches qualitatives Vorgehen gefordert.

Konvergente Validität

Die konvergente Validität eines formativ gemessenen Konstrukts kann man durch Korrelation mit einer reflektiven Messung abschätzen (Redundanzanalyse). Das setzt voraus, dass man neben den formativen Indikatoren auch eine reflektive Messung des gleichen Konstrukts vorgenommen hat, z.B. mit einem für das Konstrukt repräsentativen Single Item.

Dann ermittelt man den Pfad eines einfachen Modells, bei dem das formativ gemessene Konstrukt der Prädiktor und das reflektiv gemessene Konstrukt (z.B. mit einem Single-Item) das Kriterium ist. Ein standardisierter Pfadkoeffizient von größer als .70 spricht hier für konvergente Validität.

Keine hohe Kollinearität

Die Indikatoren des formativ gemessenen Konstrukts sollten keine hohe Multikollinearität aufweisen. Dazu werden die Varianzinflationsfaktoren (VIF) betrachtet. Werte über 5 werden als problematisch angesehen, Werte zwischen 3 und 5 als möglicherweise problematisch. Idealerweise liegen alle VIF-Werte unter 3.

In R erhalten Sie diese Varianzinflationsfaktoren als Teil der Modellschätzung. Im Basistutorial zu PLS SEM mit R (PLS SEM: Modellschätzung mit R / seminr) hatten wir u.a. ein SEM mit formativem Messmodell geschätzt und als Ergebnis ein Objekt poldem_pls_f erhalten.

Aufruf: summary(poldem_pls_f)$validity

Hier erhalten wir u.a. Tabellen mit den VIF-Werten je Item und Konstrukt:

$vif_items
indus :
x1 x2 x3
5.141 6.712 3.714

dem60 :
y1 y2 y3 y4
2.537 2.182 2.002 2.849

dem65 :
y5 y6 y7 y8
2.046 2.408 2.486 3.116

In diesem Beispiel zeigt sich beim Konstrukt Industrialisierung (indus) eine möglicherweise problematische Multikollinearität zwischen verschiedenen Indikatoren, insbesondere bei x1 und x2.

Höhe und Signifikanz formativer Indikatoren

Hier werden pro Indikator bis zu drei Größen betrachtet: Gewicht, Signifikanz, Ladung

Im Idealfall sind alle äußeren Gewichte (also die Gewichte des Messmodells) signifikant, haben also einen p-Wert unter .05 bzw. weisen ein 95% Konfidenzintervall auf, das die Null nicht einschließt. Dann gelten sie als relativ relevant und verbleiben im Modell.

Wenn ein oder mehrere äußere Gewichte nicht signifikant sind, dann betrachtet man noch die Ladung. Wenn in diesem Fall die Ladung über .50 liegt und signifikant ist, sind die Gewichte als absolut relevant anzusehen und verbleiben im Modell. Wenn auch das nicht der Fall ist, ist ein Verzicht auf den betreffenden Indikator in Erwägung zu ziehen, wobei jedoch auch inhaltliche und theoretische Aspekte eine Rolle spielen sollten.

Um die Signifikanz von Gewichten und Ladungen des Modells zu beurteilen, benötigen wir das Ergebnis des Bootstrappings für die Schätzung. Im o.g. Basistutorial hatten wir hier das Objekt poldem_pls_boot_f erhalten.

Aufruf: summary(poldem_pls_boot_f)

Jetzt erhalten wir zum einen die äußeren Gewichte mit Konfidenzintervallen:

Bootstrapped Weights:
Original Est. Bootstrap Mean Bootstrap SD T Stat. 2.5% CI 97.5% CI
x1 -> indus 0.809 0.732 0.454 1.782 -0.255 1.523
x2 -> indus 0.342 0.364 0.515 0.664 -0.593 1.359
x3 -> indus -0.155 -0.132 0.332 -0.467 -0.813 0.475
y1 -> dem60 0.450 0.432 0.142 3.178 0.114 0.680
y2 -> dem60 -0.000 0.004 0.153 -0.002 -0.277 0.328
y3 -> dem60 0.085 0.092 0.119 0.716 -0.119 0.333
y4 -> dem60 0.569 0.565 0.134 4.249 0.304 0.820
y5 -> dem65 0.461 0.431 0.126 3.647 0.184 0.684
y6 -> dem65 0.161 0.171 0.122 1.320 -0.050 0.406
y7 -> dem65 0.202 0.210 0.138 1.462 -0.050 0.467
y8 -> dem65 0.328 0.327 0.151 2.169 0.061 0.657

Wir sehen hier, dass die Gewichte für folgende Indikatoren signifikant sind (Konfidenzintervall enthält nicht die Null): y1, y4, y5, y8.

Für die anderen Gewichte müssen wir jetzt noch die Höhe der Ladungen und deren Signifikanz bestimmen, auch diese Tabelle erhalten wir mit dem o.g. Aufruf der Summary-Funktion.

Bootstrapped Loadings:
Original Est. Bootstrap Mean Bootstrap SD T Stat. 2.5% CI 97.5% CI
x1 -> indus 0.991 0.954 0.058 17.117 0.814 0.999
x2 -> indus 0.934 0.906 0.079 11.826 0.719 0.996
x3 -> indus 0.783 0.763 0.115 6.807 0.479 0.945
y1 -> dem60 0.902 0.887 0.045 20.009 0.788 0.954
y2 -> dem60 0.719 0.709 0.092 7.828 0.513 0.882
y3 -> dem60 0.737 0.726 0.084 8.815 0.544 0.870
y4 -> dem60 0.933 0.922 0.037 25.157 0.837 0.983
y5 -> dem65 0.895 0.877 0.054 16.553 0.741 0.960
y6 -> dem65 0.791 0.785 0.070 11.360 0.641 0.906
y7 -> dem65 0.846 0.844 0.052 16.281 0.734 0.931
y8 -> dem65 0.883 0.879 0.052 17.115 0.761 0.958

Alle Ladungen (Original Est.) sind über .50, und alle Ladungen sind signifikant (Konfidenzintervalle schließen die Null nicht ein). Damit können also alle Indikatoren im Modell verbleiben.

Literatur

Hair, J. F., Risher, J. J., Sarstedt, M., & Ringle, C. M. (2019). When to use and how to report the results of PLS-SEM. European Business Review, 31(1), 2-24.

Weitere Tutorials

Weitere Tutorials zu PLS SEM mit R: