|
Wnioskowanie statystyczne a statystyka opisowaDate: 2015-10-07; view: 407.
Statystyka opisowa oparta jest na indukcji zupełnej, ukazuje metody gromadzenia, opracowania, prezentacji danych wraz z sumarycznym ich opisem przy wykorzystaniu właściwych narzędzi statystycznych.
Statystyka matematyczna (wnioskowanie statystyczne) oparta jest na indukcji niezupełnej.
Wnioskowanie statystyczne to procedura podejmowania decyzji o parametrach i rozkładach w zbiorowości generalnej na podstawie wyników z próby. Podstawowymi kategoriami stosowanymi w procedurze wnioskowania statystycznego są zmienne losowe i ich rozkłady teoretyczne.
Zdarzenia losowe to takie wyniki uzyskane przez relację danego procesu, które mogą w określonym zespole warunków wystąpić lub nie wystąpić.
Jeżeli każdorazowa realizacja określonego doświadczenia daje to samo zdarzenie A, to zdarzenie to nazywamy zdarzeniem pewnym. Natomiast jeśli każdorazowa realizacja doświadczenia nie daje zdarzenia A, to realizację zdarzenia A uważamy za niemożliwe. Jeżeli realizacja przypadkowego zdarzenia niekiedy prowadzi do zdarzenia A, a niekiedy nie, nazywamy to zdarzeniem przypadkowym.
Zmienna losowa w wyniku doświadczenia przyjmuje określoną wartość o zrealizowaniu tego doświadczenia, a nie dającą się przewidzieć przed tym doświadczeniem. Zmienna losowa może przybierać wartości z przedziału liczb rzeczywistych i to z określonym prawdopodobieństwem.
P(x = xi) = pi <- prawdopodobieństwo
pi można traktować jako wartość przyjmowaną przez zmienną losową.
Pi = f(xi)
Suma prawdopodobieństwa pi = 1
Zmienne losowe oznaczamy dużymi literami alfabetu np. X, Y, Z. Małymi literami alfabetu oznaczają realizację czyli wartości przybierane przez zmienne losowe zwane realizacjami x, y, z.
Pojęciem związanym ze zmienną losową i jej rozkładu jest pojęcie dystrybuanty. Dystrybuanta zmiennej losowej to funkcja zmiennej rzeczywistej określona wzorem:
Właściwości dystrybuanty:
Rozkłady empiryczne i teoretyczne zmiennej losowej warunkują przeprowadzenie wnikliwego opisu zbiorowości statystycznej.
Rozkłady empiryczne pochodzą z obserwacji ustalane są na podstawie konkretnych wielkości.
Rozkłady teoretyczne aproksymowane są za pomocą rozkładów probabilistycznych. Rozkład zmiennej losowej może być przedstawiony za pomocą funkcji matematycznej( )
Najważniejszymi parametrami zmiennej losowej X są:
Zmienna losowa skokowa to taka zmienna, która ma przeliczony i skończony zbiór wartości. Zmienna losowa ciągła przybiera dowolne wartości z określonego przedziału.
Rozkłady:
- zerojedynkowy - dwumianowy (Bernoulliego) - Pojssona
- normalny Gaussa Laplace'a
Rozkład zerojedynkowy - jest on rezultatem takiego doświadczenia, którego określone zdarzenie wystąpi lub nie. Zdarzeniem elementarnym realizującym zadanie A jest liczba 1, a nie realizującym zdarzenia A jest liczba 0.
Rozkład dwumianowy korzystamy z niego, gdy określamy prawdopodobieństwo wystąpienia k razy określonego zdarzenia w n niezależnych doświadczeniach, przy danym prawdopodobieństwie p
Jeśli: p = q rozkład symetryczny p ≠ q rozkład asymetryczny - asymetria dodatnia, gdy p < q - asymetria ujemna, gdy p > q
Jeśli p, q i n dążą jednocześnie do nieskończoności, to rozkład ten przekształca się w rozkład normalny.
Wartość oczekiwana: E(x) = np σ² (x) = npq σ (x)
Rozkład Pojssona szczególny przypadek rozkładu dwumianowego. Wykorzystujemy go, gdy liczba serii doświadczenia jest nieskończona (n → ∞), prawdopodobieństwo p maleje do zera (p→0), a iloczyn np = 2 jest wartością stałą (λ > 0).
gdzie e = 2,718 (podstawa logarytmu naturalnego) k liczba realizacji elementów wyróżnionych w doświadczeniu
Rozkład normalny Zmienna losowa ciągła X ma rozkład normalny, jeśli jej funkcja gęstości prawdopodobieństwa wyraża się wzorem:
gdzie: M = n(x) wartość oczekiwana f(x) funkcja gęstości rozkładu normalnego
Właściwości krzywej funkcji normalnej:
Reguła trzech sigm przyjmuje ona jako bliskie 1 prawdopodobieństwo, że realizacja zmiennej losowej ciągłej nie będzie różniła się od wartości oczekiwanej więcej aniżeli o trzy odchylenia standardowe.
Zmienna standaryzowana to duża litera U, a realizacja to mała litera u.
Estymacja (szacowanie) polega na tym, że na podstawie niekompletnych danych ze zbioru pochodzących z próby, wnioskuje się o wartościach liczbowych zbioru, a otrzymane w ten sposób wnioski służą do podejmowania decyzji.
Metody estymacji:
Estymacja punktowa oblicza pojedynczą liczbę dla każdego nieznanego parametru, np.: - estymatorem średniej arytmetycznej jest średnia arytmetyczna z próby, - estymatorem wariancji populacji generalnej jest wariancja z próby.
Estymacja przedziałowa polega na szacunku parametru w postaci takiego przedziału zwanego przedziałem ufności, który z dużym prawdopodobieństwem obejmuje prawdziwą wartość parametru.
Właściwości dobrego estymatora:
Każdy estymator jest zmienną losową mającą określony rozkład prawdopodobieństwa.
Przedział ufności dla średniej arytmetycznej:
|