Statistika - náhodný výběr, bodový odhad
Níže je uveden pouze náhled materiálu. Kliknutím na tlačítko 'Stáhnout soubor' stáhnete kompletní formátovaný materiál ve formátu DOCX.
1. Náhodný výběr. Speciálně výběr z normálního rozdělení. Výběrový průměr a rozptyl, jejich rozdělení a kovariance.
Ve statistice (na rozdíl od teorie pravděpodobnosti) vycházíme z naměřených dat experimentu. Z těchto dat pak odhadujeme rozdělení náhodné veličiny X či některé z jejích vlastností.
Požadavky na experiment
Lze ho provádět opakovaně za stejných podmínek
Jednotlivé pokusy se neovlivňují
Náhodný výběr
Definice:
Náhodným výběrem z rozdělení náhodné veličiny X nazveme n–tici nezávislých stejně rozdělených náhodných veličin X1, …, Xn pocházejících z rozdělení náhodné veličiny X.
Realizace náhodného výběru je n naměřených hodnot x1, …, xn, získaných opakováním experimentu za stejných podmínek.
Základní výběrové charakteristiky náhodného výběru
Výběrový průměr
$\overline{x} = \frac{1}{n}\sum_{i = 1}^{n}x_{i}$
Výběrový rozptyl
$s^{2} = \frac{1}{n - 1}\sum_{i = 1}^{n}{(x_{i} - \overline{x})}^{2}$
Výběrová směrodatná odchylka
$s = \sqrt{s^{2}}$
Vlastnosti výběrových charakteristik
Náhodný výběr pocházející z normálního rozdělení
X ∼ N (µ, σ2), kde µ, σ2 jsou neznámé parametry
Výběrový průměr
$\overline{X} \sim \ N\ (\mu,\frac{\sigma^{2}}{n})$
Důsledkem -> $\frac{\overline{X} - \mu}{\sigma} \bullet \sqrt{n} \sim \ N\ (0,1)$
Výběrový rozptyl
$\frac{(n - 1)}{\sigma^{2}} \bullet S^{2} \sim \ \chi^{2} \bullet \left( n - 1 \right),\ \ \ \ \ n > 1$
$\overline{X}\text{\ a\ }S^{2}$ jsou nezávislé
Data
Pro diskrétní veličiny – data se setřídí do tabulky četností
Hodnoty yi se v realizaci náhodného výběru opakují ni-krát
$n = \sum_{i = 1}^{k}n_{i}$
n – počet provedených pokusů, ni – četnost dané hodnoty yi, k– třída četnosti
grafické znázornění dat – diagram četností
spojité veličiny – data se třídí do k tříd (podobná tabulka jako tabulka četností jen jsou hodnoty yi uvedené jako intervaly
grafické znázornění se nazývá histogram
Odhad nějakého parametru se typicky značí stříškou – např. µ̂
Bodový odhad parametru rozdělení
Bodový odhad parametru θ je funkce náhodného výběru θ̂ ≡ θ̂(X1, …, Xn) – je to funkce pozorování náhodného výběru -> bodový odhad je sám o sobě náhodná veličina!
Hodnotu θ̂ musí být možné smysluplně interpretovat
Např. pokud odhadujeme střední hodnotu - θ = µ, pak $\widehat{µ} = \overline{X} = \widehat{\theta}(X_{1},\ldots,X_{n})$
Nestranný bodový odhad
θ̂N(X1, …, Xn) je nestranný pokud,
Eθ̂N = θ
= střední hodnota náhodné veličiny (našeho odhadu) by se měla rovnat skutečné hodnotě parametru θ
Nejlepší nestranný bodový odhad – (vybíráme z vícero nestranných odhadů)
θ̂NN(X1, …, Xn) je nejlepší nestranný bodový odhad pokud,
Rozptyl nejlepšího nestranného odhadu je nejmenší možný mezi všemi nestrannými odhady -> NN odhad má nejmenší rozptyl