Moderacja (statystyki) - Moderation (statistics)

W statystykach i analizę regresji , umiarkowanie występuje wówczas, gdy stosunek pomiędzy dwiema zmiennymi w zależności od trzeciej zmiennej. Trzecia zmienna nazywana jest zmienną moderatora lub po prostu moderatorem . Efekt zmiennej moderującej jest charakteryzowany statystycznie jako interakcja ; to jest zmienną kategoryczną (np. płeć, pochodzenie etniczne, klasa) lub ilościową (np. poziom nagrody) , która wpływa na kierunek i/lub siłę związku między zmiennymi zależnymi i niezależnymi . W szczególności w ramach analizy korelacji moderator jest trzecią zmienną, która wpływa na korelację rzędu zerowego między dwiema innymi zmiennymi lub wartość nachylenia zmiennej zależnej od zmiennej niezależnej. W analizie terminów wariancji (ANOVA) podstawowy efekt moderatora można przedstawić jako interakcję między ogniskową zmienną niezależną a czynnikiem, który określa odpowiednie warunki jej działania.

Przykład

Schemat koncepcyjny prostego modelu moderacji, w którym wpływ poprzednika ogniskowego (X) na wynik (Y) jest uzależniony lub zależny od moderatora (W).

Schemat statystyczny prostego modelu moderacyjnego.

Analiza moderacyjna w naukach behawioralnych obejmuje zastosowanie analizy liniowej regresji wielorakiej lub modelowania przyczynowego . W celu ilościowego określenia wpływu zmiennej moderującej w analizach regresji wielokrotnej, regresji zmiennej losowej Y na X , do modelu dodawany jest dodatkowy składnik. Termin ten jest interakcją między X a proponowaną zmienną moderującą.

Zatem dla odpowiedzi Y i dwóch zmiennych x ₁ oraz zmiennej moderującej x ₂ ,:

Y=b_{0}+b_{1}x_{1}+b_{2}x_{2}+b_{3}(x_{1}\razy x_{2})+\varepsilon \,

W tym przypadku rola x ₂ jako zmiennej moderującej jest realizowana poprzez ocenę b ₃ , oszacowania parametru dla składnika interakcji. Zobacz regresję liniową w celu omówienia statystycznej oceny oszacowań parametrów w analizach regresji.

Współliniowość w moderowanej regresji

W moderowanej analizie regresji obliczany jest nowy predyktor interakcji ( ). Jednak nowy termin interakcji będzie skorelowany z dwoma głównymi terminami efektów użytymi do jego obliczenia. Jest to problem wielowspółliniowości w regresji moderowanej. Wielowspółliniowość powoduje, że współczynniki są szacowane z wyższymi błędami standardowymi, a tym samym z większą niepewnością. $x_{1}x_{2}$

Wyśrodkowanie średniej (odjęcie surowych wyników od średniej) może zmniejszyć wielowspółliniowość, co skutkuje bardziej interpretowalnymi współczynnikami regresji. Nie wpływa to jednak na ogólne dopasowanie modelu.

Badanie interakcji post hoc

Podobnie jak prosta analiza efektu głównego w ANOVA, w sondowaniu post-hoc interakcji w regresji, badamy proste nachylenie jednej zmiennej niezależnej przy określonych wartościach drugiej zmiennej niezależnej. Poniżej znajduje się przykład sondowania interakcji dwukierunkowych. W dalszej części równania regresji z dwiema zmiennymi A i B oraz terminem interakcji A*B,

Y=b_{0}+b_{1}A+b_{2}B+b_{3}A*B+\varepsilon

zostanie rozważony.

Dwie kategoryczne zmienne niezależne

Jeżeli obie zmienne niezależne są zmiennymi kategorialnymi, możemy przeanalizować wyniki regresji dla jednej zmiennej niezależnej na określonym poziomie drugiej zmiennej niezależnej. Załóżmy na przykład, że zarówno A, jak i B są pojedynczymi fikcyjnymi zmiennymi zakodowanymi (0,1) i że A reprezentuje pochodzenie etniczne (0 = Europejscy Amerykanie, 1 = Wschodni Azjaci), a B reprezentuje stan w badaniu (0 = kontrola, 1 = eksperymentalne). Następnie efekt interakcji pokazuje, czy wpływ stanu na zmienną zależną Y jest inny dla Europejczyków, Amerykanów i mieszkańców Azji Wschodniej oraz czy wpływ statusu etnicznego jest inny dla tych dwóch stanów. Współczynnik A pokazuje wpływ pochodzenia etnicznego na Y dla warunku kontrolnego, podczas gdy współczynnik B pokazuje wpływ narzucenia warunku eksperymentalnego na uczestników europejsko-amerykańskich.

Aby zbadać, czy istnieje jakakolwiek znacząca różnica między Europejczykami a mieszkańcami Azji Wschodniej w warunkach eksperymentalnych, możemy po prostu przeprowadzić analizę ze zmienną warunku o odwrotnym kodowaniu (0 = eksperymentalna, 1 = kontrolna), tak aby współczynnik pochodzenia etnicznego odpowiadał wpływ etniczności na Y w warunkach eksperymentalnych. W podobnym duchu, jeśli chcemy sprawdzić, czy leczenie ma wpływ na uczestników z Azji Wschodniej, możemy odwrócić kod zmiennej etnicznej (0 = mieszkańcy Azji Wschodniej, 1 = Amerykanie z Europy Wschodniej).

Jedna kategorialna i jedna ciągła zmienna niezależna

Diagram statystyczny przedstawiający model moderacji z X jako wielokategoryczną zmienną niezależną.

Jeśli pierwsza zmienna niezależna jest zmienną kategoryczną (np. płeć), a druga jest zmienną ciągłą (np. wyniki w Skali Satysfakcji z Życia (SWLS)), to b ₁ reprezentuje różnicę zmiennej zależnej między mężczyznami i kobietami w okresie życia satysfakcja wynosi zero. Jednak wynik zerowy na Skali Satysfakcji z Życia jest bez znaczenia, ponieważ zakres wyniku wynosi od 7 do 35. Tutaj wkracza centrowanie. Jeśli odejmiemy średnią wyniku SWLS dla próbki od wyniku każdego uczestnika, średnia wynikowego wyśrodkowanego wyniku SWLS wynosi zero. Gdy analiza jest przeprowadzana ponownie, b ₁ reprezentuje teraz różnicę między mężczyznami i kobietami na średnim poziomie wyniku SWLS próbki.

Przykład modelu moderacji pojęciowej z jedną kategoryczną i jedną ciągłą zmienną niezależną.

Cohen i in. (2003) zalecili wykorzystanie następujących metod do zbadania prostego wpływu płci na zmienną zależną (Y) na trzech poziomach ciągłej zmiennej niezależnej: wysokim (jedno odchylenie standardowe powyżej średniej), umiarkowanym (przy średniej) i niskim ( jedno odchylenie standardowe poniżej średniej). Jeśli wyniki zmiennej ciągłej nie są standaryzowane, można po prostu obliczyć te trzy wartości, dodając lub odejmując jedno odchylenie standardowe od oryginalnych wyników; jeśli wyniki zmiennej ciągłej są standaryzowane, można obliczyć trzy wartości w następujący sposób: wysoka = wynik standaryzowany minus 1, średni (średnia = 0), niski = wynik standaryzowany plus 1. Następnie można zbadać wpływ płci na zmiennej zależnej ( Y ) na wysokim, umiarkowanym i niskim poziomie wyniku SWLS. Podobnie jak w przypadku dwóch kategorycznych zmiennych niezależnych, b ₂ reprezentuje wpływ wyniku SWLS na zmienną zależną dla kobiet. Poprzez odwrotne kodowanie zmiennej płci można uzyskać wpływ wyniku SWLS na zmienną zależną dla mężczyzn.

Kodowanie w moderowanej regresji

Diagram statystyczny przedstawiający model moderacji z W z 3 poziomami jako wielokategoryczną zmienną niezależną.

Traktując zmienne kategorialne, takie jak grupy etniczne i leczenie eksperymentalne, jako zmienne niezależne w moderowanej regresji, należy zakodować zmienne tak, aby każda zmienna kodu reprezentowała określone ustawienie zmiennej kategorialnej. Istnieją trzy podstawowe sposoby kodowania: kodowanie fikcyjnej zmiennej, kodowanie efektów i kodowanie kontrastowe. Poniżej znajduje się wprowadzenie do tych systemów kodowania.

Kodowanie obojętne jest stosowane, gdy ma się grupę odniesienia lub w szczególności jeden warunek (np. grupę kontrolną w eksperymencie), który ma być porównany z każdą z innych grup eksperymentalnych. W tym przypadku wyraz wolny jest średnią grupy odniesienia, a każdy z niestandaryzowanych współczynników regresji jest różnicą zmiennej zależnej między jedną z grup terapeutycznych a średnią grupy odniesienia (lub grupy kontrolnej). Ten system kodowania jest podobny do analizy ANOVA i jest odpowiedni, gdy badacze mają określoną grupę odniesienia i chcą porównać z nią każdą z pozostałych grup.

Kodowanie efektów stosuje się, gdy nie ma określonej grupy porównawczej lub kontrolnej i nie ma zaplanowanych kontrastów ortogonalnych. Punkt przecięcia jest średnią ogólną (średnią wszystkich warunków). Współczynnik regresji to różnica między średnią jednej grupy a średnią wszystkich grup (np. średnia grupy A minus średnia wszystkich grup). Ten system kodowania jest odpowiedni, gdy grupy reprezentują kategorie naturalne.

Kodowanie kontrastu jest stosowane w przypadku serii kontrastów ortogonalnych lub porównań grupowych, które mają zostać zbadane. W tym przypadku wyraz wolny jest średnią nieważoną poszczególnych średnich grupowych. Niestandaryzowany współczynnik regresji reprezentuje różnicę między nieważoną średnią jednej grupy (A) a nieważoną średnią innej grupy (B), gdzie A i B to dwa zestawy grup w kontraście. Ten system kodowania jest odpowiedni, gdy badacze mają a priori hipotezę dotyczącą specyficznych różnic między średnimi grupowymi.

Dwie ciągłe zmienne niezależne

Schemat koncepcyjny modelu addytywnego wielokrotnej moderacji

Przykład wykresu efektu interakcji dwukierunkowej

Jeśli obie zmienne niezależne są ciągłe, przy interpretacji pomocne jest wyśrodkowanie lub standaryzacja zmiennych niezależnych X i Z . (Centrujący obejmuje odjęcie całkowitej średniej próbki punktów z oryginalnej ścieżki;. Normalizująca ma takie same następnie przez podzielenie całkowitego odchylenia standardowe próbki) centrowania i standaryzacji niezależnych zmiennych, współczynnik X i Z mogą być interpretowane jako efekt ta zmienna na Y na średnim poziomie innej zmiennej niezależnej.

Aby zbadać efekt interakcji, często pomocne jest wykreślenie wpływu X na Y przy niskich i wysokich wartościach Z (niektórzy wolą również wykreślać wpływ przy umiarkowanych wartościach Z , ale nie jest to konieczne). Często do tego celu wybiera się wartości Z, które są o jedno odchylenie standardowe powyżej i poniżej średniej, ale można użyć dowolnych wartości sensownych (aw niektórych przypadkach można wybrać bardziej znaczące wartości). Wykres jest zwykle sporządzone na podstawie oceny wartości Y dla wysokich i niskich wartości zarówno X i Z , i tworząc dwie linie reprezentują wpływ X w Y na dwóch wartości Z . Czasami jest to uzupełniane prostą analizą nachylenia, która określa, czy wpływ X na Y jest statystycznie istotny przy poszczególnych wartościach Z . Istnieją różne narzędzia internetowe, które pomagają naukowcom wykreślać i interpretować takie dwukierunkowe interakcje.

Schemat koncepcyjny moderowanego modelu moderacji, zwanego inaczej interakcją trójstronną.

Interakcje wyższego poziomu

Zasady interakcji dwukierunkowych mają zastosowanie, gdy chcemy zbadać interakcje trójstronne lub na wyższym poziomie. Na przykład, jeśli mamy trójstronną interakcję między A , B i C , równanie regresji będzie wyglądać następująco:

{\ Displaystyle Y=b_{0}+b_{1}A+b_{2}B+b_{3}C+b_{4}A\cdot B+b_ {5}A\cdot C+b_ {6} B\cdot C+b_{7}A\cdot B\cdot C+\varepsilon .}

Fałszywe efekty wyższego rzędu

Warto zauważyć, że wiarygodność terminów wyższego rzędu zależy od rzetelności terminów niższego rzędu. Na przykład, jeśli rzetelność dla zmiennej A wynosi 0,70, a dla zmiennej B 0,80, to wiarygodność zmiennej interakcyjnej A * B wynosi 0,70 × 0,80 = 0,56. W tym przypadku niska niezawodność członu interakcji prowadzi do małej mocy; dlatego możemy nie być w stanie znaleźć efektów interakcji między A i B, które faktycznie istnieją. Rozwiązaniem tego problemu jest zastosowanie wysoce wiarygodnych miar dla każdej zmiennej niezależnej.

Innym zastrzeżeniem do interpretacji efektów interakcji jest to, że gdy zmienna A i zmienna B są silnie skorelowane, wtedy składnik A * B będzie silnie skorelowany z pominiętą zmienną A ² ; w konsekwencji to, co wydaje się być znaczącym efektem moderującym, może w rzeczywistości być znaczącym nieliniowym efektem samego A. W takim przypadku warto przetestować model regresji nieliniowej, dodając terminy nieliniowe w poszczególnych zmiennych do moderowanej analizy regresji, aby sprawdzić, czy interakcje pozostają istotne. Jeśli efekt interakcji A*B jest nadal istotny, będziemy pewniej mówić, że rzeczywiście występuje efekt moderacji; jeśli jednak efekt interakcji nie jest już istotny po dodaniu członu nieliniowego, będziemy mniej pewni istnienia efektu moderacji i preferowany będzie model nieliniowy, ponieważ jest bardziej oszczędny.

Analizy regresji moderowanej mają również tendencję do uwzględniania dodatkowych zmiennych, które są konceptualizowane jako nieinteresujące współzmienne. Jednak obecność tych współzmiennych może wywoływać niepożądane efekty, gdy (1) współzmienna (C) jest skorelowana z jedną z głównych zmiennych będących przedmiotem zainteresowania (np. zmienna A lub B) lub (2) gdy sama współzmienna jest moderatorem korelacji między A lub B i Y. Rozwiązaniem jest uwzględnienie w modelu dodatkowych terminów interakcji dla interakcji między każdym czynnikiem zakłócającym a zmiennymi głównymi w następujący sposób:

${\ Displaystyle Y=b_{0}+b_{1}A+b_{2}B+b_{3}C+b_{4}A\cdot B+b_ {5}A\cdot C+b_ {6} B\cdot C+\epsilon }$

Zobacz też

Błąd pominiętej zmiennej

Bibliografia

Hayes, AF i Matthes, J. (2009). „Procedury obliczeniowe do sondowania interakcji w OLS i regresji logistycznej: implementacje SPSS i SAS”. Metody badania zachowania, tom. 41, s. 924–936.

Languages

In other projects