Wnioskowanie statystyczne a statystyka opisowa

Date: 2015-10-07; view: 415.

Statystyka opisowa oparta jest na indukcji zupełnej, ukazuje metody gromadzenia, opracowania, prezentacji danych wraz z sumarycznym ich opisem przy wykorzystaniu właściwych narzędzi statystycznych.

Statystyka matematyczna (wnioskowanie statystyczne) oparta jest na indukcji niezupełnej.

teoria estymacji – metoda estymacji umożliwia szacunek nieznanych parametrów w populacje na podstawie próby.
teoria weryfikacji hipotez statystycznych – pozwala na sprawdzenie hipotez o parametrach lub kształcie rozkładu populacji na podstawie wyników z próby.

Wnioskowanie statystyczne to procedura podejmowania decyzji o parametrach i rozkładach w zbiorowości generalnej na podstawie wyników z próby.

Podstawowymi kategoriami stosowanymi w procedurze wnioskowania statystycznego są zmienne losowe i ich rozkłady teoretyczne.

Zdarzenia losowe to takie wyniki uzyskane przez relację danego procesu, które mogą w określonym zespole warunków wystąpić lub nie wystąpić.

Jeżeli każdorazowa realizacja określonego doświadczenia daje to samo zdarzenie A, to zdarzenie to nazywamy zdarzeniem pewnym. Natomiast jeśli każdorazowa realizacja doświadczenia nie daje zdarzenia A, to realizację zdarzenia A uważamy za niemożliwe.

Jeżeli realizacja przypadkowego zdarzenia niekiedy prowadzi do zdarzenia A, a niekiedy nie, nazywamy to zdarzeniem przypadkowym.

Zmienna losowa – w wyniku doświadczenia przyjmuje określoną wartość o zrealizowaniu tego doświadczenia, a nie dającą się przewidzieć przed tym doświadczeniem.

Zmienna losowa może przybierać wartości z przedziału liczb rzeczywistych i to z określonym prawdopodobieństwem.

P(x = xi) = pi <- prawdopodobieństwo

pi – można traktować jako wartość przyjmowaną przez zmienną losową.

Pi = f(xi)

Suma prawdopodobieństwa pi = 1

Zmienne losowe oznaczamy dużymi literami alfabetu np. X, Y, Z. Małymi literami alfabetu oznaczają realizację czyli wartości przybierane przez zmienne losowe zwane realizacjami x, y, z.

Pojęciem związanym ze zmienną losową i jej rozkładu jest pojęcie dystrybuanty.

Dystrybuanta zmiennej losowej to funkcja zmiennej rzeczywistej określona wzorem:

Właściwości dystrybuanty:

przyjmuje wartości od 0 do 1
funkcja malejąca, tzn. dla x1<x2 zawsze F(x1) ≤ F(x2)
funkcja lewostronna ciągła
F(-∞) = 0; F(+∞) = 1

Rozkłady empiryczne i teoretyczne zmiennej losowej warunkują przeprowadzenie wnikliwego opisu zbiorowości statystycznej.

Rozkłady empiryczne pochodzą z obserwacji ustalane są na podstawie konkretnych wielkości.

Rozkłady teoretyczne aproksymowane są za pomocą rozkładów probabilistycznych. Rozkład zmiennej losowej może być przedstawiony za pomocą funkcji matematycznej(…)

Najważniejszymi parametrami zmiennej losowej X są:

wartość oczekiwana (nadzieja matematyczna) średniej arytmetycznej rozkładu zmiennej X w zbiorowości generalnej
wariancja oraz odchylenie standardowe

Zmienna losowa skokowa to taka zmienna, która ma przeliczony i skończony zbiór wartości.

Zmienna losowa ciągła przybiera dowolne wartości z określonego przedziału.

Rozkłady:

dla zmiennej losowej skokowej:

- zerojedynkowy

- dwumianowy (Bernoulliego)

- Pojssona

dla zmiennej losowej ciągłej:

- normalny Gaussa – Laplace'a

Rozkład zerojedynkowy - jest on rezultatem takiego doświadczenia, którego określone zdarzenie wystąpi lub nie. Zdarzeniem elementarnym realizującym zadanie A jest liczba 1, a nie realizującym zdarzenia A jest liczba 0.

Rozkład dwumianowy – korzystamy z niego, gdy określamy prawdopodobieństwo wystąpienia k razy określonego zdarzenia w n niezależnych doświadczeniach, przy danym prawdopodobieństwie p

Jeśli: p = q rozkład symetryczny

p ≠ q rozkład asymetryczny

- asymetria dodatnia, gdy p < q

- asymetria ujemna, gdy p > q

Jeśli p, q i n dążą jednocześnie do nieskończoności, to rozkład ten przekształca się w rozkład normalny.

Wartość oczekiwana: E(x) = np

σ² (x) = npq

σ (x)

Rozkład Pojssona – szczególny przypadek rozkładu dwumianowego. Wykorzystujemy go, gdy liczba serii doświadczenia jest nieskończona (n → ∞), prawdopodobieństwo p maleje do zera (p→0), a iloczyn np = 2 jest wartością stałą (λ > 0).

gdzie e = 2,718 (podstawa logarytmu naturalnego)

k – liczba realizacji elementów wyróżnionych w doświadczeniu

Rozkład normalny

Zmienna losowa ciągła X ma rozkład normalny, jeśli jej funkcja gęstości prawdopodobieństwa wyraża się wzorem:

gdzie: M = n(x) – wartość oczekiwana

f(x) – funkcja gęstości rozkładu normalnego

Właściwości krzywej funkcji normalnej:

krzywa w kształcie dzwonu
funkcja ta posiada jedno maksimum i jest ono medianą, średnią arytmetyczną, dominantą rozkłady oraz wartością oczekiwaną
pole funkcji f(x) obejmuje zbiór liczb rzeczywistych
wewnątrz przedziału od M-σ do M+σ krzywa jest wypukła, a na zewnątrz jest wklęsła
krzywa ma dwa punkty przegięcia, a współrzędnych M-σ oraz M+σ
lewe i prawe ramię zbliża się asymptotycznie do osi odciętych, ale jej nie przecinają.

Reguła trzech sigm – przyjmuje ona jako bliskie 1 prawdopodobieństwo, że realizacja zmiennej losowej ciągłej nie będzie różniła się od wartości oczekiwanej więcej aniżeli o trzy odchylenia standardowe.

Zmienna standaryzowana – to duża litera ”U”, a realizacja – to mała litera ”u”.

Estymacja (szacowanie) – polega na tym, że na podstawie niekompletnych danych ze zbioru pochodzących z próby, wnioskuje się o wartościach liczbowych zbioru, a otrzymane w ten sposób wnioski służą do podejmowania decyzji.

Metody estymacji:

estymacja punktowa
estymacja przedziałowa

Estymacja punktowa oblicza pojedynczą liczbę dla każdego nieznanego parametru, np.:

- estymatorem średniej arytmetycznej jest średnia arytmetyczna z próby,

- estymatorem wariancji populacji generalnej jest wariancja z próby.

Estymacja przedziałowa polega na szacunku parametru w postaci takiego przedziału zwanego przedziałem ufności, który z dużym prawdopodobieństwem obejmuje prawdziwą wartość parametru.

Właściwości dobrego estymatora:

nieobciążony – estymator jest nie obciążony, gdy wartość estymatora jest równa parametrowi z próby.
zgodność z prawem wielkich liczb – prawdopodobieństwo, że estymator jest zgodny z prawem wielkich liczb, z wielkością liczebności próby. Wówczas estymator będzie przyjmował wartości bliskie parametru. Ryzyko popełnienia błędu jest niewielkie.
efektywny - posiadać powinien możliwie małą wariancję.

Każdy estymator jest zmienną losową mającą określony rozkład prawdopodobieństwa.

Przedział ufności dla średniej arytmetycznej:

<== previous lecture	\|	next lecture ==>
What Is Mathematics For?	\|	Model 1

lektsiopedia.org - 2013 год. | Page generation: 4.581 s.