Jak Začít?

Máš v počítači zápisky z přednášek
nebo jiné materiály ze školy?

Nahraj je na studentino.cz a získej
4 Kč za každý materiál
a 50 Kč za registraci!




Statistika - chí kvadrát test dobré shody

DOCX
Stáhnout kompletní materiál zdarma (123.2 kB)

Níže je uveden pouze náhled materiálu. Kliknutím na tlačítko 'Stáhnout soubor' stáhnete kompletní formátovaný materiál ve formátu DOCX.

13. χ 2 -test dobré shody. Uveďte předpoklady a použití.

  • Využívá se k testování, zda výběr pochází z určitého rozdělení L (např. diskrétního, alternativního atd.). Parametry rozdělení L známe.

  • Princip testu

    • pochází-li výběr z teoretického rozdělení L, pak musí být naměřené četnosti a teoretické četnosti blízké

  • H0 : náhodný výběr pochází z rozdělení L

  • H1 : nonH0 (náhodný výběr nepochází z rozdělení L)

  • Realizace náhodného výběru je uspořádaná v tabulce četností

    • Teoretické četnosti jednotlivých tříd:

  • Četnost Ni odpovídá tomu, kolikrát by v n pokusech měla přibližně nastat možnost xi, pokud výběr skutečně pochází z L

  • Testová statistika R závisí na rozdílu ni – Ni


$$R = \sum_{i =}^{k}\frac{{(n_{i} - N_{i})}^{2}}{N_{i}}$$

  • Testová statistika R má za platnosti H0 asymptoticky χ2-rozdělení o k−1 stupních volnosti

Princip testu, pokud parametry rozdělení L neznáme.

  • Předpokládáme, že náhodný výběr pochází z rozdělení L(θ). Θ je neznámý parametr.

  • Neznámý parametr musíme odhadnout -> při testování potom ověřujeme rozdělení ale pouze s tímto odhadnutým parametrem

    • Tomu se lze vyhnout, pokud parametr odhadneme modifikovanou metodou minimálního χ2 -> poté je R

Dalším předpokladem použití testu dobré shody je dostatečná četnost jednotlivých tříd. Pokud nejsou předpoklady splněny je potřeba třídy sloučit nebo obstarat více dat -> jinak test nelze použít

Příklad použití testu:

  • V obchodě zjišťují, zda počet objednávek v jednotlivých dnech týdne je stejný (podobný) – zda odpovídá normálnímu rozdělení

Testy nezávislosti v kontingenčních tabulkách. Uveďte předpoklady a použití.

  • Využití pro kvalitativní veličiny

    • můžeme jim přiřadit (pro snadnou manipulaci) číselné hodnoty, ale nemůžeme zavést žádné uspořádání (říct co je víc či míň)

    • např. barva vlasů

  • využívá se kontingenční tabulka četností – řádky udávají četnost veličiny X, sloupce četnost veličiny Y

  • kontingenční tabulka (nij) o r řádcích a c sloupcích


$$n = \sum_{i = 1}^{r}{\sum_{j = 1}^{c}n_{\text{ij}}}$$

  • H0 : veličiny X a Y jsou nezávislé

  • H1 : veličiny X a Y nejsou nezávislé

  • Testová statistika R za platnosti H0 má asymptoticky χ2–rozdělení o (r − 1)(c − 1) stupních volnosti

Příklad použití testu:

Zkoumáme, zda je preferovaný typ jídla (maso/vegetariánské) nezávislý na pohlaví (muž/žena). Chceme zjistit, zda existuje statisticky významný vztah mezi preferencí jídla a pohlavím.

Témata, do kterých materiál patří