Nechť (, , P) je pravděpodobnostní prostor: Náhodná veličina. Nechť (, , P) je pravděpodobnostní prostor: je základní prostor, je -algebra (všechny podmnožiny ), P je pravděpodobnost. Náhodná veličina X je reálná měřitelná funkce X: R. Poznámka: Měřitelná funkce: vzorem otevřeného intervalu je prvek , neboli je podmnožina . Příklad. Házíme kostkou. = {padne 1, padne 2, …, padne 6} jsou všechny podmnožiny P je pravděpodobnostní funkce definovaná na . Definujeme náhodnou veličinu X: padne i i. Rozlišujeme diskrétní a spojité náhodné veličiny. Diskrétní náhodná veličina má obor hodnot diskrétní (například konečný). Spojitá náhodná veličina má obor hodnot interval, nebo jejich spočetné sjednocení.
Diskrétní náhodná veličina. Ke každé hodnotě oboru hodnot definujeme pravděpodobnost, s níž hodnota nastane. Postup je následující: p je tak zvaná pravděpodobnostní funkce. Jestliže obor hodnot náhodné veličiny X je {x1, x2, …, xn}, pak Náhodná veličina X je definována současně: předpisem pravděpodobnostní funkcí Další možnost je definovat náhodnou funkci předpisem a distribuční funkcí F takto:
Příklad. Auto musí projet 4 křižovatky řízené semafory. Na každém semaforu může být buď zelená, nebo červená (oranžovou neuvažujeme). Označme náhodnou veličinu X počet projetých křižovatek na zelenou do první, kam dojede na červenou. Napište pravděpodobnostní funkci p a distribuční funkci F. Obor hodnot X je {0, 1, 2, 3, 4} p(0) = 0.5 p(1) = 0.52 = 0.25 p(2) = 0.53 = 0.125 p(3) = 0.54 = 0.0625 p(4) = 0.54 = 0.0625 p(x) = 0, x > 4. F(x) = pro
Příklad. V osudí je 5 bílých a 7 červených míčků. Náhodná veličina X představuje počet bílých míčků mezi pěti vybranými. Vytvořte pravděpodobnostní a distribuční funkci této náhodné veličiny. Obor hodnot X je {0, 1, 2, 3, 4, 5} , x = 0, 1, 2, 3, 4, 5
Spojitá náhodná veličina. K popisu se používá distribuční funkce F. F (x) = P (X (w) < x) Vlastnosti F(x) (společné pro spojitou i diskrétní náhodnou veličinu): 0 ≤ F(x) ≤ 1 P(x1 ≤ X (w) < x2) = F(x2) - F(x1) pro x1 < x2 F(x) je neklesající funkce F(- ∞) = 0, F(∞) = 1 F(x) je zleva spojitá v bodech x = xi, i = 1,2,..., a spojitá v ostatních bodech. Místo pravděpodobnostní funkce u diskrétní náhodné veličiny definujeme funkci hustoty f takto: Je to reálná funkce definovaná a nezáporná na intervalu <a, b>, , x, x+h <a, b>, f (x) = 0, x <a, b>
Vlastnosti f (x) a F (x) spojité náhodné veličiny X: pro x ∈ R platí: f (x) ≥ 0 , f(x) > 0, x <a, b> Příklad. Náhodná veličina X je dána distribuční funkcí F: Určete f (x), znázorněte graficky F (x), f (x), vypočtěte P(0.4 ≤ X (w ) < 1.6). F (x) = 0, x 0, F (x) = x 2 / 4, 0 < x 2, F (x) = 1, x > 2.
f (x) = 0, x 0, f (x) = x / 2, 0 < x 2, f (x) = 0, x > 2.
Definice náhodné veličiny pomocí momentů. Obecná definice momentu mk: pro diskrétní náhodnou veličinu pro spojitou náhodnou veličinu Obecná náhodná veličina může mít nekonečně mnoho nenulových momentů (k + ). To znamená, že pro její charakterizaci je nutno spočítat nekonečně mnoho momentů. V praxi se používají náhodné veličiny, které mají jen několik nenulových momentů počítá jen několik prvních momentů, i když se jedná o obecnou náhodnou veličinu. (nejčastěji 2). Obecná definice centrálního momentu nk (m je 1. moment náhodné veličiny podle definice výše): pro diskrétní náhodnou veličinu pro spojitou náhodnou veličinu
Nejčastěji používané momenty. 1. moment m1 označuje střední hodnotu náhodné veličiny X, m1 E ( X ) m pro diskrétní náhodnou veličinu pro spojitou náhodnou veličinu Pro střední hodnotu platí: 1. E(c) = c , kde c je konstanta 2. E(c.X) = c.E(X) 3. E(X±Y) = E(X) ± E(Y) 4. E(X.Y) = E(X).E(Y), jsou-li X a Y nezávislé 2. Centrální moment označuje rozptyl náhodné veličiny X, n2 s2 = var X pro diskrétní náhodnou veličinu pro spojitou náhodnou veličinu
Pro rozptyl D (X) s 2 platí: 1. D(c) = 0, kde c je konstanta 2. D(c.X) = c 2.D(X) 3. D(X + Y) = D(X) + D(Y), jsou-li X a Y nezávislé 4. σ se nazývá směrodatná odchylka 3. centrální moment slouží k určení asymetrie rozdělení náhodné veličiny X, n3 se nazývá šikmost. n3 = E[(X – EX)3] / s3 4. centrální moment n4 se nazývá špičatost n4 = E[(X – EX)4] / s4
Kvantily. Nechť F(x) je distribuční funkce spojité náhodné veličiny X. Pak hodnota xp, pro kterou platí F(xp) = p, kde p∈<0,1>, se nazývá p-kvantil. Nejužívanější kvantily: kvartily: x0.25, x 0.50, x 0.75 - rozdělí obor možných hodnot na čtyři části se stejnou pravděpodobností výskytu decily: x 0.1, x 0.2, ..., x 0.9 - rozdělí obor možných hodnot na deset částí se stejnou pravděpodobností výskytu percentily: x 0.01, x 0.02, ..., x 0.99 - rozdělí obor možných hodnot na sto částí se stejnou pravděpodobností výskytu medián: x 0.5 . . . rozdělí obor možných hodnot na 2 části se stejnou pravděpodobností výskytu.
Modus. u diskrétní náhodné veličiny je to hodnota, v níž pravděpodobnostní funkce p(xi) dosahuje maxima. u spojité náhodné veličiny je to hodnota, v níž hustota pravděpodobnosti f (x) nabývá lokálního maxima.
Náhodný výběr. Sledujeme životnost součástky v počítači, který je v nepřetržitém provozu. Životnost kolísá podle prostředí, v němž je počítač umístěn (prašnost, vlhkost, …) “Životnost součástky“ lze pokládat za náhodnou veličinu. Označím ji X. X je definována na časovém intervalu, lze říci, že X je spojitá náhodná veličina. Náhodnou veličinu můžeme definovat pomocí momentů nebo pomocí hustoty rozdělení (nebo distribuční funkce). Ani jednu z těchto dvou možností však nejsme schopni využít, protože předem není nic o naší náhodné veličině známo. Ve snaze “popsat“ náhodnou veličinu vybereme náhodně a nezávisle na sobě n počítačů (ze zásoby počítačů, u nichž již součástka není funkční) a určíme životnost součástky. Máme tedy náhodný výběr 𝑥 1 , 𝑥 2 , …, 𝑥 𝑛 z náhodné veličiny X. Pro tento náhodný výběr lze definovat výběrové charakteristiky, například 𝑋 = 1 𝑛 𝑖=1 𝑛 𝑥 𝑖 výběrový průměr, nebo 𝑆 2 = 1 𝑛 𝑖=1 𝑛 ( 𝑥 𝑖 − 𝑋 ) 2 výběrový rozptyl
Náhodný výběr n-ti počítačů můžeme provést opakovaně a vždy dostaneme jiné charakteristiky (protože se jedná o výběr) 𝑋 𝑗 , 𝑆 𝑗 2 , j = 1, …, m. Výběrové charakteristiky lze tedy pokládat za náhodné veličiny. Definujeme 𝑋 𝑚 = 1 𝑚 𝑗=1 𝑚 𝑋 𝑗 . Pokud existuje 𝑚 0 >0 tak, že pro 𝑚 ≥ 𝑚 0 je 𝑋 𝑚 = m = konstanta, pak 𝑋 𝑚 je nestranný odhad střední hodnoty m . Pokud existuje lim 𝑚→+∞ 𝑋 𝑚 , pak označíme lim 𝑚→+∞ 𝑋 𝑚 = m a řekneme, že 𝑋 𝑚 je asymptoticky nestranný odhad střední hodnoty m , nebo 𝑋 𝑚 je konzistentní odhad střední hodnoty m Stejně definujeme 𝑆 𝑚 2 jako nestranný odhad variance 𝜎 2 .
Poznámky I. Povšimněme si, že zatímco 𝑋 𝑚 , 𝑆 𝑚 2 jsou náhodné veličiny, m a 𝜎 2 jsou reálná čísla. Na základě vlastností výběrových charakteristik usuzujeme na vlastnosti náhodné (teoretické) veličiny. Z předchozího vyplývá, že velmi záleží na kvalitě a rozsahu náhodného výběru. Poznámky II. Předpokládá se, že prvky náhodného výběru 𝑥 1 , 𝑥 2 , …, 𝑥 𝑛 jsou na sobě nezávislé. Jsou to realizace náhodných veličin 𝑋 1 , 𝑋 2 , …, 𝑋 𝑛 , které pocházejí ze stejného rozdělení, jehož charakteristiky neznáme.
Cvičení. Hustota pravděpodobnosti náhodné veličiny X má tvar: f (x) = 0, x < 0; f (x) = a sin x, 0 ≤ x < p ; f (x) = 0, x p. Určete koeficient a, distribuční funkci F(x) a P(p/2 < X < 2p ). Náhodná veličina X je dána tabulkou. Určete její první moment, 2. centrální moment. Náhodná veličina X má hustotu pravděpodobnosti: f (x) = x2 e-x /2, x (0, + ), f (x) = 0, jinak. Určete modus. Náhodná veličina X má hustotu pravděpodobnosti: f (x) = 2x, x<0, 1>, f (x) = 0 jinak. Spočtěte střední hodnotu a varianci. Určete první decil a třetí kvartil pro náhodnou veličinu danou hustotou takto: f (x) = 1/2, x<0, 2>, f (x) = 0 jinak. Třikrát vystřelíme na cíl. Pravděpodobnost zásahu při každém výstřelu je p = 0.7. Určete: pravděpodobnostní funkci počtu zásahů při třech nezávislých výsledcích, b) distribuční funkci a její graf. Náhodná veličina X je dána distribuční funkcí: F (x) = 0, x < 3, F (x) = x/3 – 1, 3 ≤ x < 6, F (x) = 1, x 6. Určete f(x), znázorněte graficky f(x), F(x) a P(1.5 ≤ X ≤ 4).
Určete, a) pro jaká A, B bude F (x) = A + B/(1 + x2) funkcí rozložení náhodné proměnné pro x∈(0, +∞), b) příslušnou hustotu rozložení. V městě byl po dobu 60 dnů evidován počet dopravních nehod v průběhu každého dne a podle počtu nehod v jednom dni vytvořena tabulka.Pro počet nehod v jednom dni jako náhodnou proměnnou sestrojit zákon rozložení, střední hodnotu a varianci. Výsledkem náhodného pokusu je náhodná veličina nabývající hodnot 1/ n (n je přirozené číslo) s pravděpodobnostmi nepřímo úměrnými 3n. Určit střední hodnotu této náhodné veličiny. Funkce f (x) = C (2x – x2) má být hustotou rozložení pravděpodobnosti pro x ∈ <0,2>. Určete a) konstantu C, b) funkci rozložení F(x), c) střední hodnotu příslušné náhodné veličiny, d) varianci a směrodatnou odchylku, e) pravděpodobnost P(X<1).