Dobrze ułożona statystyki - Well-behaved statistic

Chociaż termin grzeczne statystyka często wydaje się być stosowany w literaturze naukowej w nieco taki sam sposób, jak to dobrze ułożona w matematyce, czyli oznacza „zakaz patologiczny” może być również przypisane dokładnego znaczenia matematycznego, aw więcej niż jeden sposób. W pierwszym przypadku, znaczenie tego terminu będzie się różnić od kontekstu do kontekstu. W tym drugim przypadku, warunki matematyczne mogą być wykorzystane do uzyskania kombinacji klas rozkładów statystyk, które są dobrze wychowane w każdym tego słowa znaczeniu.

Pierwsza definicja: wariancji z grzeczne statystycznych estymatora jest skończony i jeden warunek na jego myśli to, że jest różniczkowalna w parametrem jest szacunkowa.

Druga definicja: Statystykę jest monotoniczny, dobrze zdefiniowane, a lokalnie wystarczające.

Zawartość

1 Warunki dla grzecznych Statystyki: Pierwsza definicja
2 Warunki dla grzecznych Statystyki: Druga definicja
3 algorytmiczne wnioskowanie
- 3.1 Przykład
4 zewnętrzne

Warunki dla grzecznych Statystyki: Pierwsza definicja

Bardziej formalnie warunki mogą być wyrażone w ten sposób. jest stałą dla która jest funkcją próbki . Dla być grzeczne wymagamy: ${\ Textstyle T}$ ${\ Textstyle \} teta$ ${\ Textstyle {X} _ {1}, ..., {X} _ {n}}$ ${\ Textstyle T}$

${\ Textstyle {parametr} _ {\ theta} \ lewo [t \ lewo ({X} _ {1}, ..., {x} _ {A} \ prawo) \ prawo] <\ infty \ quad \ forall \ quad \ theta \ w \} theta$ : Stan 1

${\ Textstyle {E} _ {\ theta} \ lewo (\ prawej)}$ rozróżnialne w i pochodne spełnia: ${\ Textstyle \ theta \ quad \ forall \ quad \ theta \ w \} Theta$

${\ Textstyle {\ Frac {d} {d \ theta}} \ int {t \ lewo ({X} _ {1}, ..., {X} _ {A} \ prawej)} \ _ {i prod = 1} ^ {n} {f \ lewo ({x} _ {i} | \ theta \ prawej)} d {x} _ {1} ... d {x} _ {n} = \ {T int \ lewo ({X} _ {1}, ..., {X} _ {A} \ prawej) \ lewo [{\ Frac {\ częściowy} {\ częściowy \ theta}} \ prod _ {i = 1} ^ {n} {f \ lewo ({x} _ {i} | \ theta \ prawej)} \ prawo]} d {x} _ {1} ... d {x} _ {n}}$ : Stan 2

Warunki dla grzecznych Statystyki: Druga definicja

W celu uzyskania prawa dystrybucji parametru T , kompatybilny z , statystyka musi przestrzegać pewnych właściwości technicznych. Mianowicie, statystyka s mówi się, że dobrze wychowany , jeśli spełnia trzy następujące oświadczenia: ${\ Displaystyle {\ boldsymbol {x}}}$

monotoniczność . Istnieje równomiernie monotonia relacja między S a? dla każdego stałego materiału siewnego - tak, aby posiadały unikalną roztworu związku (1); ${\ Displaystyle \ {Z_ {1}, \ ldots, Z_ {m} \}}$
dobrze zdefiniowane . Na każdej obserwowanej s w statystyce są dobrze określone dla każdej wartości, to znaczy każdy przykładową specyfikację? Taki sposób, że ma gęstość prawdopodobieństwa różnego od 0 - tak, aby nie rozważa nie suriekcją odwzorowującym do tj kojarzenia poprzez do próbki A | nie może generować samej próbki; ${\ Displaystyle \ {x_ {1}, \ ldots, x_ {m} \} \ w {\ mathfrak {X}} ^ {m}}$ ${\ Displaystyle \ Rho (x_ {1}, \ ldots, x_ {m}) = s}$ ${\ Displaystyle {\ mathfrak {X}} ^ {m}}$ ${\ Displaystyle {\ mathfrak {S}}}$ ${\ S} displaystyle$ ${\ Displaystyle \ {x_ {1}, \ ldots, x_ {m} \}}$
miejscowy wystarczalności . stanowi rzeczywistą próbki T zaobserwowanych s , tak, że ten sam rozkład prawdopodobieństwa może być przypisana do każdej pobranej wartości. Teraz jest roztwór (1) nasiona . Ponieważ nasiona są równomiernie rozłożone, jedynym zastrzeżenie pochodzi od ich niezależności, lub odwrotnie ze swojego uzależnienia? samo. Kontrola ta może być ograniczona do nasion zaangażowanych przez s , czyli tę wadę można uniknąć poprzez wprowadzenie wymogu, że rozkład jest niezależny od?. Prostym sposobem na sprawdzenie tej własności jest poprzez mapowanie specyfikacji ziarno w s specyfikacji. Mapowanie oczywiście zależy od tego, ale dystrybucja? Nie będzie zależeć, czy powyższe niezależność siewny posiada - to warunek, który wygląda jak lokalnej samowystarczalności na statystycznego S . ${\ Displaystyle \ {{\ breve {\ theta}} _ {1}, \ ldots {\ breve {\ theta}} _ {A} \}}$ ${\ Displaystyle {\ breve {\ theta}} _ {j} = H ^ {- 1} (s {\ breve {Z}} _ {1} ^ {j} \ ldots {\ breve {Z} } _ {m} {J ^})}$ ${\ Displaystyle \ {{\ breve {Z}} _ {1} {J ^} \ ldots {\ breve {Z}} _ {m} {J ^} \}}$ ${\ Displaystyle \ {Z_ {1}, \ ldots, Z_ {m} | S = S \}}$ ${\ Displaystyle x_ {i}}$ ${\ Displaystyle \ {x_ {1}, \ ldots, x_ {m} | S = S \}}$

W dalszej części niniejszego Artykuł ten dotyczy głównie kontekście Mining procedur stosowanych do wnioskowania statystycznego , a w szczególności, do grupy obliczeniowo procedury, które zwane algorytmiczne wnioskowania .

wnioskowanie algorytmiczne

W algorytmicznej wnioskowania , własność statystyka, która ma największe znaczenie ma etap obrotu, która pozwala na przeniesienie prawdopodobieństwa rozważaniami z dystrybucji próbek do rozkładu parametrów reprezentujących rozkład populacji w taki sposób, że zawarcie tego statystyczny wnioskowanie krok jest zgodny z próbką rzeczywiście przestrzegane.

Domyślnie litery (takich jak U , X ) będzie oznaczać zmiennych losowych i małe litery ( u , x ) i odpowiadające im realizacje z gotyckimi literami (np ) w domenie, w której zmienna przyjmuje specyfikacje. W obliczu próby , biorąc pod uwagę mechanizm pobierania próbek , z skalarne, dla zmiennej losowej X , mamy ${\ Displaystyle {\ mathfrak {u}}, {\ mathfrak {X}}}$ ${\ Displaystyle {\ boldsymbol {x}} = \ {x_ {1}, \ ldots, x_ {m} \}}$ ${\ Displaystyle (g _ {\ theta} Z)}$ ${\ Displaystyle \} teta$

{\ Displaystyle {\ boldsymbol {x}} = \ {g _ {\ theta} (Z_ {1}) \ ldots G _ {\ theta} (Z_ {f}) \}.}

Mechanizm pobierania próbek , z statystyka s , jako funkcja? z ze specyfikacjami w posiada funkcję wyjaśniający określony równaniem głównym: ${\ Displaystyle (g _ {\ theta}, {\ boldsymbol {Z}})}$ ${\ Displaystyle \ {x_ {1}, \ ldots, x_ {m} \}}$ ${\ Displaystyle {\ mathfrak {S}}}$

{\ Displaystyle y = \ Rho (x_ {1}, \ ldots, x_ {f}) = \ Rho (g _ {\ theta} (Z_ {1}) \ ldots G _ {\ theta} (Z_ {m} )) = h (\ theta Z_ {1}, \ ldots, Z_ {f}) \ qquad \ qquad \ qquad (1)}

odpowiednich nasion i parametr? ${\ Displaystyle {\ boldsymbol {Z}} = \ {Z_ {1}, \ ldots, Z_ {m} \}}$

Przykład

Na przykład, zarówno dla rozkładu Bernoulliego z parametrem p oraz rozkład wykładniczy z parametrem? statystyka jest dobrze ułożona. Zaspokojenie tych trzech właściwości jest prosta, gdy patrząc na obu funkcji objaśniających: jeśli , 0 w przeciwnym razie w przypadku zmiennej losowej Bernoulliego, a dla zmiennej losowej wykładniczy, co daje wzrost statystyk ${\ Suma displaystyle \ _ {i = 1} ^ {m} x_ {i}}$ ${\ Displaystyle G_ {s} (U) = 1}$ ${\ Displaystyle u \ p} równoważnik$ ${\ Displaystyle g _ {\ N} (U) = - \ log u / \ N}$

{\ Displaystyle s_ {s} = \ _ suma {i = 1} ^ {m} I _ {[0, p]} (u_ {i})}

i

{\ Displaystyle y _ {\ N} = - {\ Frac {1} {\ N}} \ suma _ {i = 1} ^ {m} \ log U_ {i}.}

Odwrotnie , w przypadku X następstwie ciągłego równomiernego rozkładu na tych samych statystykach nie spełnia drugiego warunku. Na przykład, obserwowana próbka daje . Ale funkcja wyjaśniania tego X jest . Stąd równanie Master by wytwarzać z U próbki i roztworu . Jest to sprzeczne z obserwowanej próbki od pierwszego obserwowana wartość powinna spowodować większy niż prawy ekstremum X zasięgu. Statystyka jest dobrze zachowywał się w tej sprawie. ${\ Displaystyle [0, A]}$ ${\ Displaystyle \ {C, C / 2, C / 3 \}}$ ${_ {A} = \ displaystyle s 11 / 6c}$ ${\ Displaystyle G_ {A} (U) = ua}$ ${\ Displaystyle s_ {A} = \ _ suma {i = 1} ^ {m} u_ {i} a}$ ${\ Displaystyle \ {0.8,0.8,0.8 \}}$ ${\ Displaystyle {\ breve {A}}} = 0.76c$ ${\ Displaystyle s_ {A} = \ \ max {x_ {1}, \ ldots, x_ {m} \}}$

Analogicznie, dla zmiennej losowej X następstwie rozkładu Pareto z parametrów K i A (patrz przykład Pareto Więcej szczegółów tej sprawy)

{\ Displaystyle s_ {1} = \ _ suma {i = 1} ^ {m} \ log x_ {i}}

i

{\ Displaystyle s_ {2} = \ _ min {i = 1 \ ldots, m} \ {x_ {i} \}}

może być używany jako wspólnych statystyk dla tych parametrów.

W ogólnym stwierdzeniem, że trzyma w warunkach słabo, wystarczające statystyki są dobrze zachowywał w stosunku do powiązanych parametrów. Poniższa tabela daje wystarczający / grzeczne statystyki dla parametrów niektóre z najczęściej stosowanych rozkładów prawdopodobieństwa.

Wspólne przepisy dystrybucji wraz z powiązanymi wystarczających i dobrze wychowane statystyk.
Dystrybucja	Definicja funkcji gęstości	Wystarczający / Dobrze ułożona statystyka
uniform dyskretny	${\ Displaystyle f (x, n) = 1 / Ni _ {\ {1,2, \ ldots, n \}} (x)}$	${\ Displaystyle s_ {n} = \ max _ {i} x_ {i}}$
Bernoulliego	${\ Displaystyle f (x, t) = P {^} x (1-P) ^ {1-X} I _ {\ {0,1 \}} (x)}$	${\ Displaystyle s_ {P} = \ _ suma {i = 1} ^ {m} x_ {i}}$
Dwumianowy	${\ Displaystyle f (x, n, s) = {\ Binom {n} {x}} ^ P {X} (1 p) {^ nx I_ {0,1}, \ ldots n} (X) }$	${\ Displaystyle s_ {P} = \ _ suma {i = 1} ^ {m} x_ {i}}$
Geometryczny	${\ Displaystyle f (x, t) = s (1-P) ^ {x} I _ {\ {0,1 \ ldots \}} (x)}$	${\ Displaystyle s_ {P} = \ _ suma {i = 1} ^ {m} x_ {i}}$
Poisson	${\ Displaystyle F! (X, \ iM) = \ operatorname {e} ^ {- \ p, X} \ pi ^ {x} / x I _ {\ {0,1 \ ldots \}} (x)}$	${\ Displaystyle s_ {M} = \ _ suma {i = 1} ^ {m} x_ {i}}$
jednolity ciągły	${\ Displaystyle f (x, a, b) = 1 / (BA) I _ {[a, b]} (x)}$	${\ Displaystyle s_ {A} = \ _ min {i} x_ {i}; s_ {B} = \ max _ {i} x_ {i}}$
negatywna wykładniczy	${\ Displaystyle f (x, \ N) = \ N \ operatorname {e} ^ {- \ N x} I _ {[0 \ infty]} (x)}$	${\ Displaystyle y _ {\ N} = \ _ suma {i = 1} ^ {m} x_ {i}}$
Pareto	${\ Displaystyle F (x, a, k) = {\ Frac {A} {k}} \ lewo ({\ Frac {x} {k}} \ prawej) ^ {- A-1} I _ {[k \ infty]} (x)}$	${\ Displaystyle s_ {A} = \ _ suma {i = 1} ^ {m} \ log x_ {i}; s_ {k} = \ _ min {i} x_ {i}}$
Gaussian	${\ Displaystyle f (x, \ mu \ Sigma) = 1 / ({\ sqrt {2 \ pi}} \ Sigma) \ operatorname {e} ^ {- (X \ pi ^ {2}) / (2 \ Sigma ^ {2})}}$	${\ Displaystyle s_ {M} = \ suma _ {i = 1} ^ {m} x_ {i}; s _ {\ Sigma} = {\ sqrt {\ suma _ {i = 1} ^ {m} (x_ { i} - {\ bar {x}}) ^ {2}}}}$
Gamma	${\ Displaystyle f (x, r \ N) = \ N / \ gamma (R) (\ N x) ^ {r-1} \ operatorname {e} ^ {- \ N x} I _ {[0 \ infty]} (x)}$	${\ Displaystyle y _ {\ N} = \ _ suma {i = 1} ^ {m} x_ {i}; s_ {k} = \ prod _ {i = 1} ^ {m} x_ {i}}$

Referencje

Bahadur, RR ; Lehmann, EL (1955). „Dwie uwagi na temat skuteczności i decyzyjne statystyczne Funkcje”. Roczniki statystyki matematycznej . 26 : 139 & ndash, 142. doi : 10,1214 / aoms / 1177728604 .

Languages

In other projects