Ściśle standaryzowana średnia różnica - Strictly standardized mean difference

W statystykach The ściśle znormalizowane średnia różnica (SSMD) jest miarą wielkości efektu . Jest to średnia podzielona przez odchylenie standardowe różnicy między dwiema wartościami losowymi z jednej z dwóch grup. Został on początkowo zaproponowany do kontroli jakości i selekcji trafień w badaniach przesiewowych o wysokiej przepustowości (HTS) i stał się parametrem statystycznym mierzącym wielkość efektu dla porównania dowolnych dwóch grup z wartościami losowymi.

Tło

W badaniach przesiewowych o wysokiej przepustowości (HTS) kontrola jakości (QC) ma kluczowe znaczenie. Ważną cechą QC w teście HTS jest to, jak bardzo kontrole pozytywne, badane związki i kontrole negatywne różnią się od siebie. Tę charakterystykę QC można ocenić, porównując dwa typy dołków w testach HTS . Stosunek sygnału do szumu (S/N), stosunek sygnału do tła (S/B) oraz współczynnik Z zostały przyjęte do oceny jakości testów HTS poprzez porównanie dwóch badanych typów dołków. Jednak S/B nie uwzględnia żadnych informacji o zmienności; a S/N może uchwycić zmienność tylko w jednej grupie, a zatem nie może ocenić jakości testu, gdy dwie grupy mają różne zmienności. Zhang JH i in. zaproponował współczynnik Z . Przewaga współczynnika Z nad S/N i S/B polega na uwzględnieniu zmienności w obu porównywanych grupach. W rezultacie współczynnik Z jest szeroko stosowany jako metryka QC w testach HTS. Znak bezwzględny we współczynniku Z sprawia, że ​​niewygodne jest matematyczne wyprowadzanie wniosków statystycznych.

Aby uzyskać lepiej interpretowalny parametr pomiaru różnicowania między dwiema grupami, Zhang XHD zaproponował SSMD do oceny różnicowania między kontrolą pozytywną a kontrolą negatywną w testach HTS. SSMD ma podstawę probabilistyczną ze względu na silny związek z d + -prawdopodobieństwo (tj. prawdopodobieństwo, że różnica między dwiema grupami jest dodatnia). Do pewnego stopnia prawdopodobieństwo d + jest równoważne dobrze znanemu wskaźnikowi probabilistycznemu P( X  >  Y ), który był badany i stosowany w wielu dziedzinach. Obsługiwany na podstawie probabilistycznej, SSMD został wykorzystany zarówno do kontroli jakości, jak i selekcji trafień w wysokoprzepustowych badaniach przesiewowych.

Pojęcie

Parametr statystyczny

Jako parametr statystyczny SSMD (oznaczony jako ) jest zdefiniowany jako stosunek średniej do odchylenia standardowego różnicy dwóch wartości losowych odpowiednio z dwóch grup. Załóżmy, że jedna grupa z wartościami losowymi ma średnią i wariancję, a inna grupa ma średnią i wariancję . Kowariancji między grupami jest Następnie SSMD do porównania tych dwóch grup jest zdefiniowany jako

Jeśli dwie grupy są niezależne,

Jeśli dwie niezależne grupy mają równe wariancje ,

W sytuacji, gdy dwie grupy są skorelowane, powszechnie stosowaną strategią unikania obliczania jest najpierw uzyskanie sparowanych obserwacji z dwóch grup, a następnie oszacowanie SSMD na podstawie sparowanych obserwacji. Na podstawie sparowanej różnicy ze średnią populacji i , SSMD wynosi

Oszacowanie statystyczne

W sytuacji, gdy te dwie grupy są niezależne, Zhang XHD wyprowadził oszacowanie maksymalnego prawdopodobieństwa (MLE) i oszacowanie metody momentu (MM) dla SSMD. Załóżmy, że grupy 1 i 2 mają średnią próbki i wariancje próbki . Oszacowanie MM SSMD wynosi zatem

Gdy obie grupy mają rozkłady normalne z równą wariancją , estymator jednorodnej minimalnej wariancji (UMVUE) dla SSMD wynosi:

gdzie są wielkości próby w dwóch grupach i .

W sytuacji, gdy dwie grupy są skorelowane, w oparciu o sparowaną różnicę z wielkością próby , średnią próby i wariancją próby , oszacowanie MM SSMD wynosi

Oszacowanie UMVUE SSMD wynosi

SSMD wygląda podobnie do statystyki t i d Cohena, ale różnią się między sobą, jak pokazano na rysunku.

Zastosowanie w wysokoprzepustowych testach przesiewowych

SSMD to stosunek średniej do odchylenia standardowego różnicy między dwiema grupami. Gdy dane są wstępnie przetwarzane przy użyciu transformacji logarytmicznej, jak to zwykle robimy w eksperymentach HTS, SSMD jest średnią logarytmiczną zmianą podzieloną przez standardowe odchylenie logarytmicznej zmiany względem ujemnego odniesienia. Innymi słowy, SSMD to średnia krotność zmiany (na skali logarytmicznej) karana zmiennością krotności zmiany (na skali logarytmicznej). W przypadku kontroli jakości jednym wskaźnikiem jakości testu HTS jest wielkość różnicy między kontrolą dodatnią a ujemną w płytce testowej . W przypadku selekcji trafień, wielkość działania związku (tj. małej cząsteczki lub siRNA ) jest reprezentowana przez wielkość różnicy między związkiem a negatywnym odniesieniem. SSMD bezpośrednio mierzy wielkość różnicy między dwiema grupami. Dlatego SSMD może być używane zarówno do kontroli jakości, jak i selekcji trafień w eksperymentach HTS.

Kontrola jakości

Liczba dołków dla kontroli dodatniej i ujemnej na płytce w platformie 384-dołkowej lub 1536-dołkowej jest zwykle zaprojektowana tak, aby była dość duża. Załóż, że kontrole dodatnie i ujemne na płytce mają średnią próbki, wariancje próbki i wielkość próbki . Zwykle założenie, że kontrole mają równą wariancję w płytce, jest aktualne. W takim przypadku SSMD do oceny jakości na tej płycie jest szacowane jako

gdzie . Gdy założenie równej wariancji nie jest spełnione, SSMD do oceny jakości na tej płytce jest szacowane jako

Jeśli w kontrolach występują wyraźne wartości odstające , SSMD można oszacować jako:

gdzie są mediany i mediany bezwzględnych odchyleń odpowiednio w kontroli pozytywnej i negatywnej.

Z czynnikiem kryterium QC oparty jest powszechnie stosowany w testach HTS. Wykazano jednak, że to kryterium QC jest najbardziej odpowiednie dla testu z bardzo lub bardzo silnymi kontrolami pozytywnymi. W teście RNAi HTS silna lub umiarkowana kontrola pozytywna jest zwykle bardziej pouczająca niż bardzo lub bardzo silna kontrola pozytywna, ponieważ skuteczność tej kontroli jest bardziej podobna do wyników będących przedmiotem zainteresowania. Ponadto kontrole pozytywne w dwóch eksperymentach HTS teoretycznie mają różne rozmiary efektów. W konsekwencji progi QC dla kontroli umiarkowanej powinny różnić się od progów kontroli silnej w tych dwóch eksperymentach. Ponadto często stosuje się dwie lub więcej kontroli pozytywnych w jednym eksperymencie. Zastosowanie tych samych kryteriów kontroli jakości opartych na współczynniku Z do obu kontroli prowadzi do niespójnych wyników, jak przedstawiono w literaturze.

Kryteria QC oparte na SSMD wymienione w poniższej tabeli uwzględniają wielkość efektu kontroli pozytywnej w teście HTS, w którym kontrola pozytywna (taka jak kontrola hamowania) teoretycznie ma wartości mniejsze niż negatywna referencja.

Rodzaj jakości Odp.: umiarkowana kontrola B: Silna Kontrola C: bardzo silna kontrola D: Niezwykle silna kontrola
Świetny
Dobry
Gorszy
Słaby

W aplikacji, jeśli wielkość efektu kontroli pozytywnej jest znana biologicznie, należy przyjąć odpowiednie kryterium na podstawie tej tabeli. W przeciwnym razie, poniższa strategia powinna pomóc w ustaleniu, które kryterium QC należy zastosować: (i) w wielu testach HTS małocząsteczkowych z jedną kontrolą dodatnią, zwykle należy przyjąć kryterium D (i czasami kryterium C), ponieważ ta kontrola ma zwykle bardzo lub bardzo silne efekty; (ii) dla testów RNAi HTS, w których zmierzoną odpowiedzią jest żywotność komórek, kryterium D powinno być przyjęte dla kontroli bez komórek (mianowicie studzienek bez dodanych komórek) lub kontroli tła; (iii) w teście wirusowym , w którym przedmiotem zainteresowania jest ilość wirusów w komórkach gospodarza, zazwyczaj stosuje się kryterium C, a kryterium D jest czasami stosowane do kontroli pozytywnej składającej się z siRNA z wirusa.

Podobne kryteria QC oparte na SSMD można skonstruować dla testu HTS, w którym kontrola pozytywna (taka jak kontrola aktywacji) teoretycznie ma wartości większe niż negatywna referencja. Więcej szczegółów na temat stosowania kryteriów kontroli jakości opartych na SSMD w eksperymentach HTS można znaleźć w książce.

Wybór trafień

W teście HTS jednym głównym celem jest wyselekcjonowanie związków o pożądanej wielkości efektu hamowania lub aktywacji. Wielkość efektu związku jest reprezentowana przez wielkość różnicy między badanym związkiem a ujemną grupą odniesienia bez specyficznych efektów hamowania/aktywacji. Związkiem o pożądanej wielkości wpływu na ekranie HTS nazywa uderzenie. Proces wyboru trafień nazywa się selekcją trafień. Istnieją dwie główne strategie wybierania trafień z dużymi efektami. Jednym z nich jest zastosowanie pewnych mierników do uszeregowania i/lub klasyfikacji związków według ich działania, a następnie wybranie największej liczby silnych związków, która jest praktyczna w testach walidacyjnych . Inną strategią jest sprawdzenie, czy związek ma wystarczająco silne działanie, aby osiągnąć wcześniej ustalony poziom. W tej strategii należy kontrolować wskaźniki fałszywie ujemnych (FNR) i/lub fałszywie dodatnich (FPR).

SSMD może nie tylko klasyfikować wielkość efektów, ale także klasyfikować efekty, jak pokazano w poniższej tabeli na podstawie wartości populacji ( ) SSMD.

Podtyp efektu Progi dla ujemnego SSMD Progi dla pozytywnego SSMD
Niezwykle silny
Bardzo silny
Silny
Dość silny
Umiarkowany
Dość umiarkowany
Dość słaby
Słaby
Bardzo słaby
Ekstremalnie słaby
Bez efektu

Oszacowanie SSMD dla ekranów bez powtórzeń różni się od tego dla ekranów z powtórzeniami.

Na podstawowym ekranie bez powtórzeń, zakładając, że zmierzona wartość (zwykle w skali logarytmicznej) w dołku dla badanego związku jest równa, a negatywne odniesienie na tej płytce ma wielkość próbki , średnią próbki , medianę , odchylenie standardowe i medianę bezwzględnego odchylenia , SSMD dla tego związku jest szacowane jako

gdzie . Gdy w teście występują wartości odstające , które są zwykle powszechne w eksperymentach HTS, silną wersję SSMD można uzyskać za pomocą

W przesiewie potwierdzającym lub pierwotnym z powtórzeniami, dla i-tego badanego związku z powtórzeniami, obliczamy sparowaną różnicę między zmierzoną wartością (zwykle w skali logarytmicznej) związku a wartością mediany kontroli negatywnej na płytce, następnie uzyskaj średnią i wariancję sparowanej różnicy między powtórzeniami. SSMD dla tego związku szacuje się jako

W wielu przypadkach naukowcy mogą stosować zarówno SSMD, jak i średnią zmianę krotności do selekcji trafień w eksperymentach HTS. Wykres z podwójną latarką może pokazywać zarówno średnią zmianę krotności, jak i SSMD dla wszystkich testowanych związków w teście i pomóc w zintegrowaniu ich obu w celu wybrania trafień w eksperymentach HTS. Wykorzystanie SSMD do selekcji trafień w eksperymentach HTS zilustrowano krok po kroku w

Zobacz też

Dalsza lektura

Bibliografia