Chociaż termin grzeczne statystyka często wydaje się być stosowany w literaturze naukowej w nieco taki sam sposób, jak to dobrze ułożona w matematyce, czyli oznacza „zakaz patologiczny” może być również przypisane dokładnego znaczenia matematycznego, aw więcej niż jeden sposób. W pierwszym przypadku, znaczenie tego terminu będzie się różnić od kontekstu do kontekstu. W tym drugim przypadku, warunki matematyczne mogą być wykorzystane do uzyskania kombinacji klas rozkładów statystyk, które są dobrze wychowane w każdym tego słowa znaczeniu.
Pierwsza definicja: wariancji z grzeczne statystycznych estymatora jest skończony i jeden warunek na jego myśli to, że jest różniczkowalna w parametrem jest szacunkowa.
Druga definicja: Statystykę jest monotoniczny, dobrze zdefiniowane, a lokalnie wystarczające.
Warunki dla grzecznych Statystyki: Pierwsza definicja
Bardziej formalnie warunki mogą być wyrażone w ten sposób. jest stałą dla która jest funkcją próbki . Dla być grzeczne wymagamy:
: Stan 1
rozróżnialne w i pochodne spełnia:
: Stan 2
Warunki dla grzecznych Statystyki: Druga definicja
W celu uzyskania prawa dystrybucji parametru T , kompatybilny z , statystyka musi przestrzegać pewnych właściwości technicznych. Mianowicie, statystyka s mówi się, że dobrze wychowany , jeśli spełnia trzy następujące oświadczenia:
-
monotoniczność . Istnieje równomiernie monotonia relacja między S a? dla każdego stałego materiału siewnego - tak, aby posiadały unikalną roztworu związku (1);
-
dobrze zdefiniowane . Na każdej obserwowanej s w statystyce są dobrze określone dla każdej wartości, to znaczy każdy przykładową specyfikację? Taki sposób, że ma gęstość prawdopodobieństwa różnego od 0 - tak, aby nie rozważa nie suriekcją odwzorowującym do tj kojarzenia poprzez do próbki A | nie może generować samej próbki;
-
miejscowy wystarczalności . stanowi rzeczywistą próbki T zaobserwowanych s , tak, że ten sam rozkład prawdopodobieństwa może być przypisana do każdej pobranej wartości. Teraz jest roztwór (1) nasiona . Ponieważ nasiona są równomiernie rozłożone, jedynym zastrzeżenie pochodzi od ich niezależności, lub odwrotnie ze swojego uzależnienia? samo. Kontrola ta może być ograniczona do nasion zaangażowanych przez s , czyli tę wadę można uniknąć poprzez wprowadzenie wymogu, że rozkład jest niezależny od?. Prostym sposobem na sprawdzenie tej własności jest poprzez mapowanie specyfikacji ziarno w s specyfikacji. Mapowanie oczywiście zależy od tego, ale dystrybucja? Nie będzie zależeć, czy powyższe niezależność siewny posiada - to warunek, który wygląda jak lokalnej samowystarczalności na statystycznego S .
W dalszej części niniejszego Artykuł ten dotyczy głównie kontekście Mining procedur stosowanych do wnioskowania statystycznego , a w szczególności, do grupy obliczeniowo procedury, które zwane algorytmiczne wnioskowania .
wnioskowanie algorytmiczne
W algorytmicznej wnioskowania , własność statystyka, która ma największe znaczenie ma etap obrotu, która pozwala na przeniesienie prawdopodobieństwa rozważaniami z dystrybucji próbek do rozkładu parametrów reprezentujących rozkład populacji w taki sposób, że zawarcie tego statystyczny wnioskowanie krok jest zgodny z próbką rzeczywiście przestrzegane.
Domyślnie litery (takich jak U , X ) będzie oznaczać zmiennych losowych i małe litery ( u , x ) i odpowiadające im realizacje z gotyckimi literami (np ) w domenie, w której zmienna przyjmuje specyfikacje. W obliczu próby , biorąc pod uwagę mechanizm pobierania próbek , z skalarne, dla zmiennej losowej X , mamy
Mechanizm pobierania próbek , z statystyka s , jako funkcja? z ze specyfikacjami w posiada funkcję wyjaśniający określony równaniem głównym:
odpowiednich nasion i parametr?
Przykład
Na przykład, zarówno dla rozkładu Bernoulliego z parametrem p oraz rozkład wykładniczy z parametrem? statystyka jest dobrze ułożona. Zaspokojenie tych trzech właściwości jest prosta, gdy patrząc na obu funkcji objaśniających: jeśli , 0 w przeciwnym razie w przypadku zmiennej losowej Bernoulliego, a dla zmiennej losowej wykładniczy, co daje wzrost statystyk
i
Odwrotnie , w przypadku X następstwie ciągłego równomiernego rozkładu na tych samych statystykach nie spełnia drugiego warunku. Na przykład, obserwowana próbka daje
. Ale funkcja wyjaśniania tego X jest . Stąd równanie Master by wytwarzać z U próbki i roztworu . Jest to sprzeczne z obserwowanej próbki od pierwszego obserwowana wartość powinna spowodować większy niż prawy ekstremum X zasięgu. Statystyka jest dobrze zachowywał się w tej sprawie.
Analogicznie, dla zmiennej losowej X następstwie rozkładu Pareto z parametrów K i A (patrz przykład Pareto Więcej szczegółów tej sprawy)
i
może być używany jako wspólnych statystyk dla tych parametrów.
W ogólnym stwierdzeniem, że trzyma w warunkach słabo, wystarczające statystyki są dobrze zachowywał w stosunku do powiązanych parametrów. Poniższa tabela daje wystarczający / grzeczne statystyki dla parametrów niektóre z najczęściej stosowanych rozkładów prawdopodobieństwa.
Wspólne przepisy dystrybucji wraz z powiązanymi wystarczających i dobrze wychowane statystyk.
Dystrybucja |
Definicja funkcji gęstości |
Wystarczający / Dobrze ułożona statystyka
|
uniform dyskretny
|
|
|
Bernoulliego
|
|
|
Dwumianowy
|
|
|
Geometryczny
|
|
|
Poisson
|
|
|
jednolity ciągły
|
|
|
negatywna wykładniczy
|
|
|
Pareto
|
|
|
Gaussian
|
|
|
Gamma
|
|
|
Referencje