Model przyczynowy Rubina - Rubin causal model

Model Rubin przyczynowy ( RCM ), znany również jako modelu przyczynowego Neyman-Rubin , to podejście do analizy statystycznej z przyczyny i skutku w oparciu o ramy o potencjalnych efektach , nazwanych Donald Rubin . Nazwa „model przyczynowy Rubina” została po raz pierwszy wymyślona przez Paula W. Hollanda . Ramy potencjalnych wyników zostały po raz pierwszy zaproponowane przez Jerzego Neymana w swojej pracy magisterskiej z 1923 r., choć omówił je tylko w kontekście całkowicie zrandomizowanych eksperymentów. Rubin rozszerzył to na ogólne ramy myślenia o przyczynowości zarówno w badaniach obserwacyjnych, jak i eksperymentalnych.

Wprowadzenie

Model przyczynowy Rubina opiera się na idei potencjalnych wyników. Na przykład dana osoba miałaby określony dochód w wieku 40 lat, gdyby uczęszczała do college'u, podczas gdy miałaby inny dochód w wieku 40 lat, gdyby nie uczęszczała do college'u. Aby zmierzyć przyczynowy skutek pójścia na studia dla tej osoby, musimy porównać wyniki dla tej samej osoby w obu alternatywnych przyszłościach. Ponieważ niemożliwe jest jednoczesne zobaczenie obu potencjalnych wyników, zawsze brakuje jednego z potencjalnych wyników. Dylemat ten jest „podstawowym problemem wnioskowania przyczynowego ”.

Ze względu na fundamentalny problem wnioskowania przyczynowego, efektów przyczynowych na poziomie jednostkowym nie można bezpośrednio zaobserwować. Jednak randomizowane eksperymenty pozwalają na oszacowanie skutków przyczynowych na poziomie populacji. W randomizowanym eksperymencie losowo przydzielani są ludzie do leczenia: studia lub brak college'u. Z powodu tego losowego przypisania grupy są (średnio) równoważne, a różnicę w dochodach w wieku 40 lat można przypisać przypisaniu do college'u, ponieważ była to jedyna różnica między grupami. Oszacowanie średniego efektu przyczynowego (określanego również jako średni efekt leczenia ) można następnie uzyskać przez obliczenie różnicy w średnich między próbkami leczonymi (uczęszczającymi na studia) i kontrolnymi (nieuczęszczającymi na studia).

Jednak w wielu okolicznościach randomizowane eksperymenty nie są możliwe ze względów etycznych lub praktycznych. W takich scenariuszach istnieje nielosowy mechanizm przypisywania. Tak jest w przypadku uczęszczania do college'u: ludzie nie są losowo przydzielani do uczęszczania do college'u. Ludzie mogą raczej zdecydować się na uczęszczanie do college'u w oparciu o swoją sytuację finansową, wykształcenie rodziców i tak dalej. Opracowano wiele metod statystycznych do wnioskowania przyczynowego, takich jak dopasowywanie wyników skłonności . Metody te próbują skorygować mechanizm przypisania, znajdując jednostki sterujące podobne do jednostek zabiegowych.

Rozszerzony przykład

Rubin definiuje skutek przyczynowy:

Intuicyjnie, efekt przyczynowy jednego leczenia, E, nad drugim, C, dla określonej jednostki i odstępu czasu od do jest różnicą między tym, co wydarzyłoby się w czasie, gdyby jednostka została narażona na działanie E zainicjowane o, a tym, co by się stało. zdarzyło się, gdyby urządzenie zostało wystawione na działanie C zainicjowane o : „Gdyby godzinę temu wziąłem dwie aspiryny zamiast tylko szklanki wody, mój ból głowy teraz by zniknął” lub „ponieważ godzinę temu wziąłem dwie aspiryny zamiast szklanki wody ból głowy zniknął. Nasza definicja przyczynowego efektu leczenia E kontra C będzie odzwierciedlać to intuicyjne znaczenie”.

Według RCM, przyczynowym skutkiem przyjęcia lub nieprzyjmowania aspiryny godzinę temu jest różnica między tym, jak czułaby się twoja głowa w przypadku 1 (przyjmowanie aspiryny) i przypadku 2 (nieprzyjmowanie aspiryny). Jeśli twój ból głowy pozostałby bez aspiryny, ale zniknął po zażyciu aspiryny, to przyczynowym skutkiem przyjmowania aspiryny jest złagodzenie bólu głowy. W większości przypadków interesuje nas porównanie dwóch przyszłości, jednej ogólnie określanej jako „leczenie”, a drugiej „kontrola”. Te etykiety są nieco arbitralne.

Potencjalne wyniki

Załóżmy, że Joe bierze udział w teście FDA na nowy lek na nadciśnienie. Gdybyśmy byli wszechwiedzący, znalibyśmy wyniki dla Joe zarówno pod względem leczenia (nowy lek), jak i kontroli (albo brak leczenia, albo obecne standardowe leczenie). Efektem przyczynowym lub efektem leczenia jest różnica między tymi dwoma potencjalnymi wynikami.

Przedmiot
Joe 130 135 -5

to ciśnienie krwi Joe, jeśli weźmie nową pigułkę. Ogólnie rzecz biorąc, ten zapis wyraża potencjalny wynik, który wynika z leczenia, t , na jednostce, u . Podobnie jest z wpływem innego leczenia, c lub kontroli, na jednostkę u . W tym przypadku jest to ciśnienie krwi Joe, jeśli nie zażyje pigułki. jest skutkiem zażywania nowego leku.

Z tej tabeli znamy tylko przyczynowy wpływ na Joego. Każdy inny uczestnik badania może mieć wzrost ciśnienia krwi, jeśli zażyje pigułkę. Jednak niezależnie od tego, jaki jest skutek przyczynowy u pozostałych badanych, dla Joego skutkiem jest niższe ciśnienie krwi w stosunku do tego, jakie byłoby jego ciśnienie krwi, gdyby nie zażył pigułki.

Rozważ większą próbę pacjentów:

Przedmiot
Joe 130 135 -5
Mary 140 150 -10
Wypad 135 125 10
Pion 135 150 -15

Skutek przyczynowy jest inny dla każdego pacjenta, ale lek działa na Joego, Mary i Boba, ponieważ efekt przyczynowy jest negatywny. Ich ciśnienie krwi jest niższe z lekiem niż byłoby, gdyby każdy z nich nie przyjmował leku. Z drugiej strony dla Sally lek powoduje wzrost ciśnienia krwi.

Aby potencjalny wynik miał sens, musi być możliwy przynajmniej a priori . Na przykład, jeśli Joe w żadnych okolicznościach nie ma możliwości uzyskania nowego leku, to jest on dla niego niemożliwy. To się nigdy nie stanie. A jeśli nigdy nie można zaobserwować, nawet w teorii, to wpływ leczenia na ciśnienie krwi Joego nie jest zdefiniowany.

Brak związku przyczynowego bez manipulacji

Przyczynowy wpływ nowego leku jest dobrze zdefiniowany, ponieważ jest to prosta różnica dwóch potencjalnych skutków, z których oba mogą się wydarzyć. W tym przypadku my (lub coś innego) możemy manipulować światem, przynajmniej koncepcyjnie, tak, aby możliwe było, że coś się wydarzy.

Ta definicja skutków przyczynowych staje się znacznie bardziej problematyczna, jeśli nie ma możliwości, aby kiedykolwiek wystąpił jeden z potencjalnych skutków. Na przykład, jaki jest wpływ wzrostu Joe na jego wagę? Naiwnie wydaje się to podobne do naszych innych przykładów. Musimy tylko porównać dwa potencjalne wyniki: jaka waga Joe byłaby pod kontrolą (gdzie leczenie jest zdefiniowane jako 3 cale wyższe) i jaka waga Joego byłaby pod kontrolą (gdzie kontrola jest zdefiniowana jako jego aktualny wzrost).

Chwila refleksji uwydatnia problem: nie możemy zwiększyć wzrostu Joe. Nie da się zaobserwować, nawet konceptualnie, jaka byłaby waga Joe, gdyby był wyższy, ponieważ nie ma sposobu, aby był wyższy. Nie możemy manipulować wzrostem Joe, więc nie ma sensu badać przyczynowego wpływu wzrostu na wagę. Stąd hasło: Nie ma związku przyczynowego bez manipulacji .

Założenie stabilnej wartości leczenia jednostkowego (SUTVA)

Wymagamy, aby „obserwacja [potencjalnego wyniku] w jednej jednostce nie miała wpływu na szczególne przypisanie terapii do innych jednostek” (Cox 1958, §2.4). Nazywa się to założeniem stabilnej wartości leczenia jednostkowego (SUTVA), które wykracza poza pojęcie niezależności.

W kontekście naszego przykładu ciśnienie krwi Joego nie powinno zależeć od tego, czy Mary otrzyma lek. A jeśli tak się stanie? Załóżmy, że Joe i Mary mieszkają w tym samym domu, a Mary zawsze gotuje. Lek powoduje, że Mary ma ochotę na słone potrawy, więc jeśli weźmie go, będzie gotowała z większą ilością soli, niż miałaby w innym przypadku. Dieta bogata w sól zwiększa ciśnienie krwi Joe. Dlatego jego wynik będzie zależał zarówno od tego, jakie leczenie otrzymał, jak i jakie leczenie otrzyma Mary.

Naruszenie SUTVA utrudnia wnioskowanie o przyczynach. Możemy wyjaśnić zależne obserwacje, rozważając więcej zabiegów. Tworzymy 4 zabiegi, biorąc pod uwagę, czy Mary otrzymuje leczenie.

Przedmiot Joe = c, Maria = t Joe = t, Maria = t Joe = c, Maria = c Joe = t, Maria = c
Joe 140 130 125 120

Przypomnijmy, że skutek przyczynowy definiuje się jako różnicę między dwoma potencjalnymi skutkami. W tym przypadku istnieje wiele skutków przyczynowych, ponieważ istnieje więcej niż dwa potencjalne skutki. Jednym z nich jest przyczynowy wpływ leku na Joe, gdy Mary jest leczona i jest obliczana . Innym jest przyczynowy wpływ na Joe, kiedy Mary nie jest leczona i jest wykalkulowana . Trzeci to wpływ leczenia Mary na Joego, gdy Joe nie jest leczony. Jest to obliczane jako . Traktowanie, jakie otrzymuje Mary, ma większy wpływ na Joego niż traktowanie, jakie otrzymał Joe, i jest w przeciwnym kierunku.

Rozważając w ten sposób więcej potencjalnych wyników, możemy sprawić, że SUTVA się utrzyma. Jeśli jednak jakiekolwiek jednostki inne niż Joe są zależne od Mary, musimy rozważyć dalsze potencjalne wyniki. Im większa liczba jednostek zależnych, tym więcej potencjalnych wyników musimy rozważyć i tym bardziej złożone stają się obliczenia (rozważ eksperyment z 20 różnymi osobami, z których każda może wpłynąć na wyniki dla każdej innej). W celu (łatwego) oszacowania związku przyczynowego pojedynczego leczenia w porównaniu z grupą kontrolną, należy zastosować SUTVA.

Średni efekt przyczynowy

Rozważać:

Przedmiot
Joe 130 135 -5
Mary 130 145 -15
Wypad 130 145 -15
Pion 140 150 -10
James 145 140 +5
OZNACZAĆ 135 143 -8

Średni efekt przyczynowy można obliczyć, biorąc średnią wszystkich skutków przyczynowych.

Sposób, w jaki mierzymy odpowiedź, wpływa na to, jakie wnioski wyciągamy. Załóżmy, że mierzymy zmiany ciśnienia krwi jako zmianę procentową, a nie w wartościach bezwzględnych. Następnie, w zależności od dokładnych liczb, przeciętnym efektem przyczynowym może być wzrost ciśnienia krwi. Na przykład załóżmy, że ciśnienie krwi George'a będzie 154 pod kontrolą i 140 po leczeniu. Bezwzględna wielkość efektu przyczynowego wynosi -14, ale różnica procentowa (w odniesieniu do poziomu leczenia 140) wynosi -10%. Jeśli ciśnienie krwi Sary wynosi 200 podczas leczenia i 184 pod kontrolą, to efekt przyczynowy w 16 wartościach bezwzględnych, ale 8% w kategoriach wartości leczenia. Mniejsza bezwzględna zmiana ciśnienia krwi (-14 vs 16) daje większą zmianę procentową (-10% vs 8%) dla George'a. Mimo że średni efekt przyczynowy dla George'a i Sary wynosi +1 w wartościach bezwzględnych, w wartościach procentowych wynosi -1.

Podstawowy problem wnioskowania przyczynowego

Wyniki, które widzieliśmy do tej pory, nigdy nie zostałyby zmierzone w praktyce. Z definicji niemożliwe jest obserwowanie wpływu więcej niż jednego leczenia na pacjenta w określonym czasie. Joe nie może jednocześnie brać pigułki i nie brać pigułki w tym samym czasie. Dlatego dane wyglądałyby mniej więcej tak:

Przedmiot
Joe 130 ? ?

Znaki zapytania to odpowiedzi, których nie można było zaobserwować. Podstawowy problem wnioskowania przyczynowego jest to, że bezpośrednio obserwując efekty przyczynowe jest niemożliwe. Nie uniemożliwia to jednak wnioskowania przyczynowego . Pewne techniki i założenia pozwalają przezwyciężyć podstawowy problem.

Załóżmy, że posiadamy następujące dane:

Przedmiot
Joe 130 ? ?
Mary ? 125 ?
Wypad 100 ? ?
Pion ? 130 ?
James ? 120 ?
OZNACZAĆ 115 125 -10

Możemy wywnioskować, jaki byłby potencjalny wynik Joego pod kontrolą, jeśli przyjmiemy założenie stałego efektu:

i

Gdybyśmy chcieli wywnioskować nieobserwowane wartości, moglibyśmy założyć stały efekt. Poniższe tabele ilustrują dane zgodne z założeniem stałego efektu.

Przedmiot
Joe 130 140 -10
Mary 115 125 -10
Wypad 100 110 -10
Pion 120 130 -10
James 110 120 -10
OZNACZAĆ 115 125 -10

Wszyscy badani mają ten sam skutek przyczynowy, mimo że mają różne wyniki w trakcie leczenia.

Mechanizm przypisania

Mechanizm przypisywania, czyli metoda, za pomocą której jednostki są przypisywane do leczenia, wpływa na obliczenie średniego efektu przyczynowego. Jednym z takich mechanizmów przypisywania jest randomizacja. Dla każdego przedmiotu możemy rzucić monetą, aby ustalić, czy otrzymuje leczenie. Jeśli chcielibyśmy leczyć pięciu badanych, moglibyśmy przypisać leczenie do pierwszych pięciu imion, które wybieramy z kapelusza. Kiedy losowo przypisujemy leczenie, możemy otrzymać różne odpowiedzi.

Załóżmy, że te dane są prawdą:

Przedmiot
Joe 130 115 15
Mary 120 125 -5
Wypad 100 125 -25
Pion 110 130 -20
James 115 120 -5
OZNACZAĆ 115 123 -8

Prawdziwy średni efekt przyczynowy wynosi -8. Ale efekt przyczynowy dla tych osób nigdy nie jest równy tej średniej. Skutek przyczynowy jest różny, jak zwykle (zawsze?) w prawdziwym życiu. Po losowym przypisaniu terapii możemy oszacować efekt przyczynowy jako:

Przedmiot
Joe 130 ? ?
Mary 120 ? ?
Wypad ? 125 ?
Pion ? 130 ?
James 115 ? ?
OZNACZAĆ 121,66 127,5 -5,83

Różne losowe przypisanie terapii daje inne oszacowanie średniego efektu przyczynowego.

Przedmiot
Joe 130 ? ?
Mary 120 ? ?
Wypad 100 ? ?
Pion ? 130 ?
James ? 120 ?
OZNACZAĆ 116,67 125 -8,33

Średni efekt przyczynowy jest różny, ponieważ nasza próba jest mała, a odpowiedzi mają dużą wariancję . Gdyby próba była większa, a wariancja mniejsza, średni efekt przyczynowy byłby bliższy prawdziwemu średniemu efektowi przyczynowemu, niezależnie od konkretnych jednostek losowo przypisanych do leczenia.

Ewentualnie załóżmy, że mechanizm przypisuje leczenie wszystkim mężczyznom i tylko im.

Przedmiot
Joe 130 ? ?
Pion 110 ? ?
James 105 ? ?
Mary ? 130 ?
Wypad ? 125 ?
Susie ? 135 ?
OZNACZAĆ 115 130 -15

W ramach tego mechanizmu przypisywania kobietom nie jest możliwe poddanie się leczeniu, a zatem niemożliwe jest określenie średniego wpływu przyczynowego na kobiety. Aby móc wnioskować o wpływie przyczynowym na pacjenta, prawdopodobieństwo, że pacjent otrzyma leczenie musi być większe niż 0 i mniejsze niż 1.

Idealny lekarz

Rozważ użycie idealnego lekarza jako mechanizmu przydziału. Idealny lekarz wie, jak każda osoba zareaguje na lek lub kontrolę i przypisuje każdej osobie leczenie, które przyniesie jej największe korzyści. Idealny lekarz zna te informacje o próbce pacjentów:

Przedmiot
Joe 130 115 15
Pion 120 125 -5
James 100 150 -50
Mary 115 125 -10
Wypad 120 130 -10
Susie 135 105 30
OZNACZAĆ 120 125 -5

W oparciu o tę wiedzę wykonałaby następujące zadania terapeutyczne:

Przedmiot
Joe ? 115 ?
Pion 120 ? ?
James 100 ? ?
Mary 115 ? ?
Wypad 120 ? ?
Susie ? 105 ?
OZNACZAĆ 113,75 110 3,75

Idealny lekarz zniekształca obie średnie, odfiltrowując słabe reakcje zarówno na leczenie, jak i na kontrolę. Różnica między średnimi, która jest rzekomym przeciętnym efektem przyczynowym, jest zniekształcona w kierunku zależnym od szczegółów. Na przykład osoba taka jak Susie, która jest poszkodowana przez zażywanie leku, zostanie przypisana do grupy kontrolnej przez doskonałego lekarza, a tym samym negatywny wpływ leku zostanie zamaskowany.

Wniosek

Przyczynowy wpływ leczenia na pojedynczą jednostkę w danym momencie jest różnicą między zmienną wyniku z leczeniem i bez leczenia. Podstawowym problemem wnioskowania przyczynowego jest to, że niemożliwe jest zaobserwowanie wpływu przyczynowego na pojedynczą jednostkę. Albo bierzesz aspirynę teraz, albo nie. W konsekwencji należy przyjąć założenia w celu oszacowania brakujących scenariuszy alternatywnych.

Model przyczynowy Rubina został również powiązany ze zmiennymi instrumentalnymi (Angrist, Imbens i Rubin, 1996) oraz innymi technikami wnioskowania przyczynowego. Więcej informacji na temat powiązań między modelem przyczynowym Rubina, modelowaniem równań strukturalnych i innymi statystycznymi metodami wnioskowania przyczynowego można znaleźć w Morgan i Winship (2007).

Zobacz też

Bibliografia

Dalsza lektura

Linki zewnętrzne