Dobrze ułożona statystyki - Well-behaved statistic

Chociaż termin grzeczne statystyka często wydaje się być stosowany w literaturze naukowej w nieco taki sam sposób, jak to dobrze ułożona w matematyce, czyli oznacza „zakaz patologiczny” może być również przypisane dokładnego znaczenia matematycznego, aw więcej niż jeden sposób. W pierwszym przypadku, znaczenie tego terminu będzie się różnić od kontekstu do kontekstu. W tym drugim przypadku, warunki matematyczne mogą być wykorzystane do uzyskania kombinacji klas rozkładów statystyk, które są dobrze wychowane w każdym tego słowa znaczeniu.

Pierwsza definicja: wariancji z grzeczne statystycznych estymatora jest skończony i jeden warunek na jego myśli to, że jest różniczkowalna w parametrem jest szacunkowa.

Druga definicja: Statystykę jest monotoniczny, dobrze zdefiniowane, a lokalnie wystarczające.

Warunki dla grzecznych Statystyki: Pierwsza definicja

Bardziej formalnie warunki mogą być wyrażone w ten sposób. jest stałą dla która jest funkcją próbki . Dla być grzeczne wymagamy:

: Stan 1

rozróżnialne w i pochodne spełnia:

: Stan 2

Warunki dla grzecznych Statystyki: Druga definicja

W celu uzyskania prawa dystrybucji parametru T , kompatybilny z , statystyka musi przestrzegać pewnych właściwości technicznych. Mianowicie, statystyka s mówi się, że dobrze wychowany , jeśli spełnia trzy następujące oświadczenia:

  1. monotoniczność . Istnieje równomiernie monotonia relacja między S a? dla każdego stałego materiału siewnego - tak, aby posiadały unikalną roztworu związku (1);
  2. dobrze zdefiniowane . Na każdej obserwowanej s w statystyce są dobrze określone dla każdej wartości, to znaczy każdy przykładową specyfikację? Taki sposób, że ma gęstość prawdopodobieństwa różnego od 0 - tak, aby nie rozważa nie suriekcją odwzorowującym do tj kojarzenia poprzez do próbki A | nie może generować samej próbki;
  3. miejscowy wystarczalności . stanowi rzeczywistą próbki T zaobserwowanych s , tak, że ten sam rozkład prawdopodobieństwa może być przypisana do każdej pobranej wartości. Teraz jest roztwór (1) nasiona . Ponieważ nasiona są równomiernie rozłożone, jedynym zastrzeżenie pochodzi od ich niezależności, lub odwrotnie ze swojego uzależnienia? samo. Kontrola ta może być ograniczona do nasion zaangażowanych przez s , czyli tę wadę można uniknąć poprzez wprowadzenie wymogu, że rozkład jest niezależny od?. Prostym sposobem na sprawdzenie tej własności jest poprzez mapowanie specyfikacji ziarno w s specyfikacji. Mapowanie oczywiście zależy od tego, ale dystrybucja? Nie będzie zależeć, czy powyższe niezależność siewny posiada - to warunek, który wygląda jak lokalnej samowystarczalności na statystycznego S .

W dalszej części niniejszego Artykuł ten dotyczy głównie kontekście Mining procedur stosowanych do wnioskowania statystycznego , a w szczególności, do grupy obliczeniowo procedury, które zwane algorytmiczne wnioskowania .

wnioskowanie algorytmiczne

W algorytmicznej wnioskowania , własność statystyka, która ma największe znaczenie ma etap obrotu, która pozwala na przeniesienie prawdopodobieństwa rozważaniami z dystrybucji próbek do rozkładu parametrów reprezentujących rozkład populacji w taki sposób, że zawarcie tego statystyczny wnioskowanie krok jest zgodny z próbką rzeczywiście przestrzegane.

Domyślnie litery (takich jak U , X ) będzie oznaczać zmiennych losowych i małe litery ( u , x ) i odpowiadające im realizacje z gotyckimi literami (np ) w domenie, w której zmienna przyjmuje specyfikacje. W obliczu próby , biorąc pod uwagę mechanizm pobierania próbek , z skalarne, dla zmiennej losowej X , mamy

Mechanizm pobierania próbek , z statystyka s , jako funkcja? z ze specyfikacjami w posiada funkcję wyjaśniający określony równaniem głównym:

odpowiednich nasion i parametr?

Przykład

Na przykład, zarówno dla rozkładu Bernoulliego z parametrem p oraz rozkład wykładniczy z parametrem? statystyka jest dobrze ułożona. Zaspokojenie tych trzech właściwości jest prosta, gdy patrząc na obu funkcji objaśniających: jeśli , 0 w przeciwnym razie w przypadku zmiennej losowej Bernoulliego, a dla zmiennej losowej wykładniczy, co daje wzrost statystyk

i

Odwrotnie , w przypadku X następstwie ciągłego równomiernego rozkładu na tych samych statystykach nie spełnia drugiego warunku. Na przykład, obserwowana próbka daje . Ale funkcja wyjaśniania tego X jest . Stąd równanie Master by wytwarzać z U próbki i roztworu . Jest to sprzeczne z obserwowanej próbki od pierwszego obserwowana wartość powinna spowodować większy niż prawy ekstremum X zasięgu. Statystyka jest dobrze zachowywał się w tej sprawie.

Analogicznie, dla zmiennej losowej X następstwie rozkładu Pareto z parametrów K i A (patrz przykład Pareto Więcej szczegółów tej sprawy)

i

może być używany jako wspólnych statystyk dla tych parametrów.

W ogólnym stwierdzeniem, że trzyma w warunkach słabo, wystarczające statystyki są dobrze zachowywał w stosunku do powiązanych parametrów. Poniższa tabela daje wystarczający / grzeczne statystyki dla parametrów niektóre z najczęściej stosowanych rozkładów prawdopodobieństwa.

Wspólne przepisy dystrybucji wraz z powiązanymi wystarczających i dobrze wychowane statystyk.
Dystrybucja Definicja funkcji gęstości Wystarczający / Dobrze ułożona statystyka
uniform dyskretny
Bernoulliego
Dwumianowy
Geometryczny
Poisson
jednolity ciągły
negatywna wykładniczy
Pareto
Gaussian
Gamma

Referencje