Statistika - chí kvadrát test dobré shody
Níže je uveden pouze náhled materiálu. Kliknutím na tlačítko 'Stáhnout soubor' stáhnete kompletní formátovaný materiál ve formátu DOCX.
13. χ 2 -test dobré shody. Uveďte předpoklady a použití.
Využívá se k testování, zda výběr pochází z určitého rozdělení L (např. diskrétního, alternativního atd.). Parametry rozdělení L známe.
Princip testu
pochází-li výběr z teoretického rozdělení L, pak musí být naměřené četnosti a teoretické četnosti blízké
H0 : náhodný výběr pochází z rozdělení L
H1 : nonH0 (náhodný výběr nepochází z rozdělení L)
Realizace náhodného výběru je uspořádaná v tabulce četností
Teoretické četnosti jednotlivých tříd:
Četnost Ni odpovídá tomu, kolikrát by v n pokusech měla přibližně nastat možnost xi, pokud výběr skutečně pochází z L
Testová statistika R závisí na rozdílu ni – Ni
$$R = \sum_{i =}^{k}\frac{{(n_{i} - N_{i})}^{2}}{N_{i}}$$
Testová statistika R má za platnosti H0 asymptoticky χ2-rozdělení o k−1 stupních volnosti
Princip testu, pokud parametry rozdělení L neznáme.
Předpokládáme, že náhodný výběr pochází z rozdělení L(θ). Θ je neznámý parametr.
Neznámý parametr musíme odhadnout -> při testování potom ověřujeme rozdělení ale pouze s tímto odhadnutým parametrem
Tomu se lze vyhnout, pokud parametr odhadneme modifikovanou metodou minimálního χ2 -> poté je R
Dalším předpokladem použití testu dobré shody je dostatečná četnost jednotlivých tříd. Pokud nejsou předpoklady splněny je potřeba třídy sloučit nebo obstarat více dat -> jinak test nelze použít
Příklad použití testu:
V obchodě zjišťují, zda počet objednávek v jednotlivých dnech týdne je stejný (podobný) – zda odpovídá normálnímu rozdělení
Testy nezávislosti v kontingenčních tabulkách. Uveďte předpoklady a použití.
Využití pro kvalitativní veličiny
můžeme jim přiřadit (pro snadnou manipulaci) číselné hodnoty, ale nemůžeme zavést žádné uspořádání (říct co je víc či míň)
např. barva vlasů
využívá se kontingenční tabulka četností – řádky udávají četnost veličiny X, sloupce četnost veličiny Y
kontingenční tabulka (nij) o r řádcích a c sloupcích
$$n = \sum_{i = 1}^{r}{\sum_{j = 1}^{c}n_{\text{ij}}}$$
H0 : veličiny X a Y jsou nezávislé
H1 : veličiny X a Y nejsou nezávislé
Testová statistika R za platnosti H0 má asymptoticky χ2–rozdělení o (r − 1)(c − 1) stupních volnosti
Příklad použití testu:
Zkoumáme, zda je preferovaný typ jídla (maso/vegetariánské) nezávislý na pohlaví (muž/žena). Chceme zjistit, zda existuje statisticky významný vztah mezi preferencí jídla a pohlavím.