Rozkład prawdopodobieństwa – Gry

Rozkład prawdopodobieństwa

Z Wikipedii, wolnej encyklopedii

Skocz do: nawigacji, szukaj

Rozkład prawdopodobieństwa – w najczęstszej interpretacji (rozkład zmiennej losowej) miara probabilistyczna określona na sigma-ciele podzbiorów zbioru wartości zmiennej losowej (wektora losowego), pozwalająca przypisywać prawdopodobieństwa zbiorom wartości tej zmiennej, odpowiadającym zdarzeniom losowym. Formalnie rozkład prawdopodobieństwa może być jednak rozpatrywany także bez stosowania zmiennych losowych.

Spis treści

[edytuj] Definicja

Rozkładem prawdopodobieństwa nazywa się dowolną miarę probabilistyczną P\; określoną na σ-ciele podzbiorów borelowskich pewnej przestrzeni polskiej. Zwykle jest nią zbiór liczb rzeczywistych \mathbb R (tzw. rozkład jednowymiarowy) lub przestrzeń euklidesowa \mathbb{R}^n dla pewnej liczby naturalnej n\; (rozkład wielowymiarowy).

[edytuj] Zastosowanie dla zmiennych losowych

Zwykle rozważa się tzw. przestrzeń probabilistyczną, złożoną z przestrzeni zdarzeń elementarnych \Omega\;, określonego na niej σ-ciała \mathcal F, którego elementy są nazywane zdarzeniami losowymi, oraz miary probabilistycznej P\;, przyporządkowującej zdarzeniom liczby zwane prawdopodobieństwami. Tak określone prawdopodobieństwa są jednak niewygodne do badania, gdyż \Omega\; może być dowolnym zbiorem, nawet bez zadanych jakichkolwiek relacji między jego elementami.

Wprowadza się zatem funkcję mierzalną zwaną zmienną losową, która przyporządkowuje elementom przestrzeni zdarzeń elementarnych \Omega\; elementy pewnej przestrzeni mierzalnej Y\; o pożądanych właściwościach[1]. Najczęściej wykorzystuje się przestrzeń euklidesową Y=\mathbb R^n, n\in\mathbb N_{+}\; a zmienną nazywa się wówczas wektorem losowym. Czasem miano zmiennej losowej rezerwuje się tylko dla przypadku jednowymiarowego Y=\mathbb R\;.

Obrazem każdego zdarzenia losowego (elementu rodziny\mathcal F) poprzez zmienną losową X\; jest mierzalny podzbiór Y\;. Mierzalne podzbiory Y\; tworzą także σ-ciało \mathcal B(Y)\;. Ponieważ zmienna losowa nie musi być funkcją różnowartościową, więc ten sam zbiór mierzalny A\in\mathcal B(Y)\; można w ogólnym przypadku otrzymać z wielu różnych zdarzeń o różnych prawdopodobieństwach. Aksjomaty σ-ciała zapewniają, że wśród tych zdarzeń jest także ich suma i do niej jest przypisane największe prawdopodobieństwo. Suma ta jest równa przeciwobrazowi zbioru A\;, czyli X^{-1}(A)\;.

Rozkład zmiennej losowej X\; to funkcja P_X\; określona na \mathcal B(Y)\; wzorem P_X(A) = P (X^{-1}(A)),\ A\in \mathcal B(Y)\;.

Rozkład P_X\; jest nową miarą probabilistyczną. Jest on w przestrzeni stanów Y\; odpowiednikiem miary probabilistycznej P\;.
Uwaga: Zapis P_X\; gdzie X\; jest zdarzeniem a nie zmienną losową jest stosowany na oznaczenie prawdopodobieństwa warunkowego.

Wyróżnia się niżej omówione rozkłady ciągłe i dyskretne, jednak należy pamiętać, iż oprócz nich istnieją także rozkłady nie mieszczące się w żadnej z tych kategorii – na przykład rozkład o dystrybuancie Cantora.

[edytuj] Rozkład ciągły

Jeżeli istnieje funkcja f\colon Y\to [0,\infty)\;, taka że

P(A)=\int\limits_A~f(x)\;dx

(całka Lebesgue'a) dla dowolnego zbioru borelowskiego A \in \mathcal B(Y), to funkcję tę nazywa się gęstością (rozkładu) prawdopodobieństwa lub funkcją gęstości prawdopodobieństwa. Nazwa pochodzi od intuicji fizycznych, zob. gęstość masy. O rozkładzie P\; mającym gęstość mówi się, że jest ciągły (lub typu ciągłego).

Powyższa definicja jest poprawna dla dowolnych rozkładów prawdopodobieństwa, także wielowymiarowych – wówczas x\; jest wektorem.

Rozkład P_X\; zmiennej losowej X\; spełniający powyższe warunki definiuje się analogicznie. O zmiennej losowej również mówi się wówczas, iż jest ciągła (lub typu ciągłego).

[edytuj] Rozkład dyskretny

Rozkład P nazywa się dyskretnym, jeśli jest skupiony na zbiorze przeliczalnym, tzn. istnieje zbiór (co najwyżej) przeliczalny S \subseteq Y dla którego P(S) = 1. Jeżeli

S = \{s_i\colon i \in I\} oraz pi = P({si}) dla każdego i \in I,

to dla dowolnego zbioru borelowskiego A

P(A) = P(A \cap S) = \sum_{i \in I}~p_i \boldsymbol 1_A(s_i),

gdzie \boldsymbol 1_A to indykator (funkcja charakterystyczna) zbioru A.

Zatem zbiór par \{(s_i, p_i)\colon i \in I\} jednoznacznie wyznacza rozkład P. Stąd dowolny zbiór tej postaci, gdzie pi > 0 oraz \sum p_i = 1 (co wynika z własności rozkładu), nazywa się czasami rozkładem (dyskretnym). Odwzorowanie s_i \mapsto p_i, oznaczane \operatorname{pmf}(s_i) = p_i, nosi nazwę funkcji masy prawdopodobieństwa i jest ono dyskretnym odpowiednikiem gęstości prawdopodobieństwa.

Dyskretna zmienna losowa X to zmienna losowa o rozkładzie dyskretnym. Wówczas można go zdefiniować podobnie jak wyżej równością

PX({xi}) = P(X − 1(A)),

jednakże w tym wypadku zachodzi dodatkowo

P (X^{-1}(A)) = P (\{\omega \in \Omega\colon X(\omega) = x_i\}) \overset\underset\mathrm{ozn}\ {=} P (X = x_i) \overset\underset\mathrm{ozn}\ {=} \operatorname{pmf}_X(x_i),

gdzie \left\{x_i\right\}_{i \in I} jest zbiorem wszystkich wartości przyjmowanych przez zmienną X.

[edytuj] Dystrybuanta

Information icon.svg Osobny artykuł: dystrybuanta.

Badanie rozkładu jako miary jest zadaniem dość trudnym, jednak można je znacząco uprościć wprowadzając funkcję dystrybuanty, która całkowicie go opisuje i jest funkcją przestrzeni euklidesowej w przedział [0,1].

[edytuj] Dystrybuanta rozkładu jednowymiarowego

Dystrybuanta jednowymiarowego rozkładu (prawdopodobieństwa) P\; to funkcja F_P\colon \mathbb R \to \mathbb R zdefiniowana jest wzorem

F_P(t) = P((-\infty, t]).

Dystrybuanta (rozkładu) zmiennej losowej X\;, to dystrybuanta F_{P_X}\;, oznaczana zwykle symbolem F_X\;, otrzymana z rozkładu tej zmiennej losowej:

F_X(t) =  P_X(\{x\colon x \leqslant t\})

Dystrybuanta w pełni wyznacza rozkład, tzn. dwie zmienne o tej samej dystrybuancie muszą mieć ten sam rozkład; obrazuje to poniższy przykład.

Jeśli rozkład P\; ma gęstość f\;, jego dystrubuanta F_P\; wyraża się wzorem:

F_P(t) = \int\limits_{-\infty}^t~f(x)\;dx.

[edytuj] Przykład

Niech \Omega_1 = \{\mathrm O, \mathrm R\}\; będzie modelem doświadczenia losowego polegającego na rzucie monetą, które może z jednakowym prawdopodobieństwem dać dwa wyniki: orła i reszkę. Stąd

P (\mathrm O) = \tfrac{1}{2} oraz P (\mathrm R) = \tfrac{1}{2}.

Jeżeli zmienna X\colon \Omega_1 \to \mathbb R jest określona równościami

X(\mathrm O) = -1\; oraz X(\mathrm R) = 1\;,

to jej rozkład P_X\; jest określony następująco:

P (X \in A) = \begin{cases} 0, & \mbox{dla } A = \mathbb R \setminus \{-1, 1\} \\ \tfrac{1}{2}, & \mbox{dla } A = \{-1\} \mbox{ lub } A = \{1\} \\ 1, & \mbox{dla } A = \{-1, 1\} \end{cases},

funkcja masy prawdopodobieństwa ma z kolei postać:

P (X = x) = \begin{cases} 0, & \mbox{dla } x \ne -1\ \mbox{ i }\ \ x \ne 1  \\ \tfrac{1}{2}, & \mbox{dla } x = -1 \mbox{ lub } x = 1 \end{cases},

co oznacza, że zmienna losowa X\; odwzorowuje zdarzenia

\Omega_1 \ni \mathrm O \mapsto -1 \in \mathbb R \iff X(\mathrm O) = -1,
\Omega_1 \ni \mathrm R \mapsto \,\ \ 1 \in \mathbb R \iff X(\mathrm R) = \,\ \ 1

oraz zachowuje prawdopodobieństwo określone na (\Omega_1, \mathcal F) przekształcając je w rozkład określony na (\mathbb R, \mathcal B(\mathbb R)).

Niech \Omega_2 = \{\mathrm O, \mathrm R, \mathrm K\; będzie modelem opisującym jak wyżej rzut monetą poszerzone o dodatkowy wynik: upadek na kant, który prawie na pewno się nie zdarzy. Jeżeli

P (\mathrm O) = P (\mathrm R) = \tfrac{1}{2} oraz P (\mathrm K) = 0\;,

to zmienna losowa Y\colon \Omega_2 \to \mathbb R określona równościami

Y(\mathrm O) = -1,\; Y(\mathrm R) = 1 oraz Y(\mathrm K) = 7\;,

będzie miała taki sam rozkład P_Y\; (oraz funkcję masy) co zmienna X\; określona wyżej, mimo iż są one różne.

Z definicji dystrybuanty wynika, iż prawdopodobieństwo zdarzenia

A = \{\omega \in \Omega\colon a < X(\omega) \leqslant b\} \overset\underset\mathrm{ozn}\ {=} \{a < X \leqslant b\}

dane jest wzorem

P (X \in A) = P (a < X \leqslant b) =  F_X(b) - F_X(a).

Dystrybuanta zmiennej X\; to funkcja F_X\colon \mathbb R \to [0, 1] określona wzorem

F_X(t) = \begin{cases} 0, & \mbox{dla } t \leqslant -1 \\ \tfrac{1}{2}, & \mbox{dla } -1 < t \leqslant 1 \\ 1, & \mbox{dla } t > 1. \end{cases}

Warto zauważyć, iż dystrybuanta F_Y\; zmiennej Y\; dana jest tym samym wzorem co dystrybuanta F_X\;.

[edytuj] Dystrybuanta rozkładu wielowymiarowego

Jeśli X\; jest wektorem losowym, tzn. X\colon \Omega \to \mathbb R^n, to zmienia się nieco postać dystrybuanty. Rozważa się wówczas przedziały wielowymiarowe, tzn. zbiory będące iloczynami kartezjańskimi przedziałów prostej postaci

(-\infty, t_1] \times (-\infty, t_2] \times \dots \times (-\infty, t_n];

dystrybuanta F_P\colon \mathbb R^n \to \mathbb R takiego zdarzenia zapisywana jest zwykle jako

F_P(t_1, t_2, \dots, t_n) = P((-\infty, t_1] \times (-\infty, t_2] \times \dots \times (-\infty, t_n]).

Stosuje się następujący zapis dystrybuanty rozkładu zmiennej losowej:

F_X(t_1, t_2, \dots, t_n) = P (\{X\colon X_1 \leqslant t_1\wedge X_2 \leqslant t_2 \wedge \dots \wedge X_n \leqslant t_n\}),

gdzie X = (X_1, X_2, \dots, X_n). Jeżeli przyjmie się t = (t_1, t_2, \dots, t_n), to zapis

F_X(t) = P (X \leqslant t)

nie prowadzi zwykle do większych nieporozumień.

Jeśli rozkład wielowymiarowy P\; ma gęstość f\;, jego dystrybuanta F_P\; wyraża się wzorem (całka Lebesgue'a):

F_P(t) = \int\limits_{(-\infty, t_1] \times (-\infty, t_2] \times \dots \times (-\infty, t_n]}~f(t)\;dt.

Zwykle wzór ten spotyka się w prostszej wersji, choć o mniejszym zakresie stosowalności (nie każdą całkę Lebesgue'a da się w ten sposób rozbić):

F_P(t) = \int\limits_{-\infty}^{t_1}\int\limits_{-\infty}^{t_2}\cdots\int\limits_{-\infty}^{t_n} f(t_1,t_2,\dots,t_n) dt_n \dots dt_2 dt_1

[edytuj] Dodatkowe definicje

Zmienna losowa X\; ma rozkład osobliwy (singularny), jeśli ma ciągłą dystrybuantę i istnieje zbiór A \subseteq \mathbb R, który ma zerową miarę Lebesgue'a, ale jednostkowy rozkład (miarę) prawdopodobieństwa, tzn. \lambda(A) = 0\; oraz P(A) = 1\;

Rozkłady skoncentrowane na zbiorze punktów postaci kc\;, gdzie k \in \mathbb Z nazywa się arytmetycznymi. To, iż rozkład P\; jest skupiony na zbiorze \left\{\tfrac{2\pi k}{t} \colon k \in \mathbb Z\right\} jest równoważne temu, iż jego funkcja charakterystyczna \varphi ma okres równy t\; bądź \varphi(t) = 1\; dla pewnego t \ne 0\;. Z obserwacji funkcji charakterystycznych wynika, iż arytmetyczne są rozkłady: geometryczny, Bernoulliego i Poissona; rozkłady jedno- i dwupunktowe są przesuniętymi rozkładami tego typu.

[edytuj] Popularne rozkłady

[edytuj] Rozkłady ciągłe

Wybrane rozkłady gęstości prawdopodobieństwa:
ƒN(x)rozkład normalny,
ƒE(x)rozkład wykładniczy,
ƒR(x)rozkład jednostajny,
ƒT(x)rozkład trójkątny,
ƒD(x)– rozkład delty Diraca dla zmiennej pewnej.

[edytuj] Rozkłady dyskretne

[edytuj] Statystyka

Jeśli mamy na myśli rzeczywiste prawdopodobieństwa wystąpienia danej wartości cechy w populacji, to mówimy o rozkładzie w populacji. Jeśli mamy na myśli prawdopodobieństwa wystąpienia danej cechy wyznaczone podczas badania statystycznego, to mówimy o rozkładzie empirycznym.

Przypisy

  1. Ściślej musi to być funkcja \mathcal{F}/\mathcal{B}(Y)-mierzalna, gdzie \mathcal{B}(Y) jest rodziną podzbiorów borelowskich przestrzeni Y\;. Jako Y\; zwykle wybiera się jedną z tzw. przestrzeni polskich, do których zaliczają się w szczególności przestrzenie euklidesowe.

[edytuj] Zobacz też

Commons in image icon.svg






#635840: powiedzmy sobie jakies komplementy
<alka> powiedzmy sobie jakies komplementy
<alka> ale takie ze pozniej dodajemy do niego
<alka> czynnosc zwiazana z komplementem
<zelu> no ok...
<alka> ja pierwsza
<alka> jestes niesamowicie silny
<alka> chcialabym zebys mnie nosil na rekach :)
<alka> teraz ty
<zelu> ok
<zelu> masz piekne oczy
<alka> dziekuje :*
<zelu> przeruchalbym cie
<alka> ehhh...
#635814: i wiesz, ten wyswietlasz ma x-milionow kolorow!
<on> i wiesz, ten wyswietlasz ma x-milionow kolorow!
<ona> przeciez i tak rozrozniasz tylko 10, wiec co za roznica?
#635759: Daj spokoj, nie jestes brzydka
<Orsoneq> Daj spokoj, nie jestes brzydka
<Mooonia> wlasnei ze jestem : <
<Orsoneq> Ty bys mogla byc miss...
<Mooonia> Chyba kurwa niemiec
#635484: Kochanie, masz rączki?:)
<Ja> Kochanie, masz rączki?:)
<Misiek> No....
<Ja> To zrób mi kanapki;*
<Misiek> Kochanie, masz nóżki?:)
<ja> Tak...
<Misiek> To wypierdalaj...
#634774: Czuje sie uwieziony pomiedzy dziecinstem a dorosłością
<Zaop> Czuje sie uwieziony pomiedzy dziecinstem a dorosłością
<Zaop> jem płatki nesquik i piję piwo...
systemy alarmowe Alkoholizm nagrzewnice olejowe gyk giełda rolna rynek wtórny kamera internetowa otwarty fundusz emerytalny SEM Agencja SEM