Niewyjaśniony ułamek wariancji - Fraction of variance unexplained

W statystyk The frakcja wariancji niewyjaśniona ( FVU ) w kontekście zadanie regresji jest ułamkiem wariancji regressand (zmienna zależna) Y , które nie mogą być wyjaśnione, to znaczy, które nie są prawidłowo przewidywanej przez wyjaśniający zmiennych X .

Definicja formalna

Niech dana funkcję regresji uginając dla każdego oszacowania gdzie jest wektorem ı th uwagi na wszystkie zmienne objaśniające. Definiujemy ułamek wariancji niewyjaśnionej (FVU) jako:

gdzie R 2 jest współczynnikiem determinacji, a VAR err i VAR tot to wariancja reszt i wariancja próbki zmiennej zależnej. SS err (suma kwadratów błędów prognoz, równoważnie resztkowa suma kwadratów ), SS tot ( całkowita suma kwadratów ) i SS reg (suma kwadratów regresji, równoważnie wyjaśniona suma kwadratów ) są podane przez

Alternatywnie, niewyjaśniony ułamek wariancji można zdefiniować w następujący sposób:

gdzie MSE ( f ) jest średnim kwadratem błędu funkcji regresji  ƒ .

Wyjaśnienie

Aby zrozumieć FVU, warto rozważyć drugą definicję. Próbując przewidzieć Y , najbardziej naiwną funkcją regresji, o jakiej możemy pomyśleć, jest stała funkcja przewidująca średnią Y , tj . Wynika z tego, że MSE tej funkcji jest równe wariancji Y ; to znaczy SS err = SS tot i SS reg = 0. W tym przypadku nie można uwzględnić żadnej zmiany w Y , a wówczas FVU ma swoją maksymalną wartość 1.

Bardziej ogólnie, FVU będzie 1 czy zmienne objaśniające X powiedzieć nam nic o Y w tym sensie, że przewidywane wartości Y nie covary z Y . Ale gdy prognozy stają się lepsze, a MSE można zmniejszyć, FVU spada. W przypadku doskonałego przewidywania, gdzie dla wszystkich i MSE wynosi 0, SS err = 0, SS reg = SS tot , a FVU wynosi 0.

Zobacz też

Bibliografia