Jak Začít?

Máš v počítači zápisky z přednášek
nebo jiné materiály ze školy?

Nahraj je na studentino.cz a získej
4 Kč za každý materiál
a 50 Kč za registraci!




Předmět Analýza a prezentace dat (61APD0)

Na serveru studentino.cz naleznete nejrůznější studijní materiály: zápisky z přednášek nebo cvičení, vzorové testy, seminární práce, domácí úkoly a další z předmětu 61APD0 - Analýza a prezentace dat, Fakulta managementu JH, Vysoká škola ekonomická v Praze (VŠE).

Top 10 materiálů tohoto předmětu

Materiály tohoto předmětu

Materiál Typ Datum Počet stažení

Další informace

Obsah

1.ÚVOD: (dotace 2/2) a.Ukázky použití statistiky v ekonomii, marketingu a managementu.b.Popisná vs. matematická statistika - účel, obsah, metody, výstupy, obtížnost.c.Základní statistické pojmy - statistická jednotka (subjekt), statistický znak (proměnná), základní (populační) soubor, výběrový soubor.d.Kvalitativní (nominální, ordinální) a kvantitativní proměnné - rozdělení, příklady.e.Přehled statistického software (komerční, nekomerční).f.Datová matice, základní manipulace s daty (import, editování, filtrování, export).2.POPIS A PREZENTACE JEDNOROZMĚRNÝCH DAT: (dotace 2/2) a.Kvalitativní data: - absolutní četnosti, relativní četnosti, tabulky (relativních) četností, kumulativní četnosti; - grafické znázornění: sloupcový graf, Clevelandův bodový graf, výsečový (koláčový) graf.b.Kvantitativní data:- číselné charakteristiky polohy (minimum, maximum, průměr, medián, kvantily) a variability (variační a kvartilové rozpětí, rozptyl a směrodatná odchylka, variační koeficient), medián vs. průměr, interpretace kvartilů, chování číselných charakteristik vzhledem k posunutí a změně měřítka;- grafické znázornění: boxplot (krabicový graf), histogram, qq-graf;- zavedení normálního rozdělení (intuitivně), posuzování normality na základě obrázků, pravidlo dvou, resp. tří směrodatných odchylek;- kategorizace kvantitativních dat, důvody kategorizace, volba velikosti intervalu.3.POPIS A PREZENTACE DVOUROZMĚRNÝCH DAT: (dotace 2/2) a.Kvalitativní vs. kvalitativní veličina: - sdružené absolutní (relativní) četnosti, marginální absolutní (relativní) četnosti, kontingenční tabulka, podmíněné četnosti, nezávislost znaků;- grafické znázornění: podmíněné sloupcové grafy, podmíněné kumulativní sloupcové grafy.b.Kvantitativní vs. kvalitativní veličina: - podmíněné míry polohy (podmíněná minima a maxima, podmíněné průměry a mediány, podmíněné kvantily) a variability (podmíněné rozptyly a směrodatné odchylky, podmíněná variační a kvartilová rozpětí, podmíněné variační koeficienty), subjektivní vyhodnocení (ne)závislosti znaků;- grafické znázornění: podmíněné histogramy, boxploty, qq-grafy.c.Kvantitativní vs. kvantitativní veličina:- výběrová kovariance a korelace, vlastnosti korelačního koeficientu, nekorelovanost vs. nezávislost, statistická závislost vs. kauzalita;- grafické znázornění: scatterplot (rozptylový graf).4.VIZUALIZACE A REPORTOVÁNÍ STATISTICKÝCH DAT: (dotace 2/2) a.Principy tvorby tabulek a grafů, optické klamy u grafů, vizualizace dat jako nástroj průzkumové analýzy, zásady psaní statistických zpráv.b.Statistické grafy:- rozšíření již zavedených grafů: prstencový graf, pp-graf, kombinovaný krabicový a bodový graf, měřící bodový graf, histogram v polárních souřadnicích, bublinový graf, atd.;- speciální grafy: strom života (věková pyramida), Paretův graf, zobrazování časových řad (spojnicový, plošný graf);- vizualizace vícerozměrných dat: zobecněné rozptylové diagramy (scatterploty), symbolové grafy (profily, polygony, tváře, křivky a stromy).5.TYPY STATISTICKÝCH STUDIÍ: (dotace 2/2) a.Výběrová šetření - reprezentativní (průzkumy) vs. nereprezentativní (anketa), typy náhodných výběrů (prostý náhodný výběr s vracením a bez vracení, oblastní (strafikovaný) náhodný výběr), opora výběru, výběrová chyba a výběrové vychýlení, příklady špatné volby opory výběru, příčiny výběrového vychýlení.b.Experimentální studie - klinický pokus, průmyslový experiment.c.Pozorovací studie - prospektivní, retrospektivní, kohortové studie.d.Ukázky použití, rozdíly v možnostech zobecňování výsledků pro jednotlivé typy studií.6.ZÁKLADY ODHADOVÁNÍ: (dotace 2/2) a.Zobecňování popisných statistik na populaci, bodový odhad a směrodatná chyba odhadu, vlastnosti bodového odhadu (konzistence, nestrannost).b.Oboustranný a jednostranný intervalový odhad (interval spolehlivosti), interpretace intervalového odhadu, chování intervalového odhadu vzhedem k zadané spolehlivosti, vzhledem k rozsahu výběru, variabilitě dat.c.Kvalitativní data: bodový a intervalový odhad populační relativní četnosti.d.Kvantitativní data: bodový a intervalový odhad populačního průměru.7.ZÁKLADY TESTOVÁNÍ: (dotace 2/2) a.Základní princip testování hypotéz, nulová a alternativní hypotéza, jednostranná a oboustranná verze testu, chyba I. druhu, chyba II. druhu a síla testu, hladina významnosti, problém současné minimalizace obou chyb, interpretace rozhodnutí (nezamítáme vs. přijímáme nulovou hypotézu, prokázat lze jen alternativu).b.Význam p-hodnoty a její praktické použití pro rozhodování, statistická vs. praktická významnost.c.Souvislost testování s intervalovými odhady.d.Formální ověřování normality (Shapirův-Wilkův test).8.JEDNOVÝBĚROVÉ TESTY: (dotace 2/2) a.Kvalitativní data: - jednovýběrový test o proporci: nulová a alternativní hypotéza (symbolicky i slovně), základní princip testu, testová statistika, souvislost s intervalem spolehlivosti pro populační relativní četnost;- chí-kvadrát test dobré shody: pozorované vs. očekávané četnosti, souvislost s jednovýběrovým testem o proporci pro alternativní data, podmínka pro platnost asymptotické aproximace.b.Kvantitativní data: - jednovýběrový t-test: nulová a alternativní hypotéza (symbolicky i slovně, jednostranná, oboustranná alternativa), základní princip testu, souvislost s intervalem spolehlivosti pro populační průměr, předpoklady metody a situace, kdy není nutné brát zřetel na porušení předpokladu normality;- jednovýběrový Wilcoxonův test: předpoklady metody, odlišnost ve formulaci hypotéz oproti jednovýběrovému t-testu, jednovýběrový t-test vs. jednovýběrový Wilcoxonův test (proč se dává přednost parametrickým testům před neparametrickými).9.DVOUVÝBĚROVÉ TESTY (SROVNÁVÁNÍ DVOU NEZÁVISLÝCH VÝBĚRŮ): (dotace 2/2) a.Kvalitativní data: - dvouvýběrový test o proporcích (založený na rozdílu): formulace nulové a alternativní hypotézy, základní princip testu, souvislost s intervalem spolehlivosti pro rozdíl relativních populačních četností;- chí-kvadrát test nezávislosti: homogenita podmíněných rozdělení, nulová hypotéza testu nezávislosti, očekávané (hypotetické) vs. pozorované (empirické) četnosti, testová statistika, řešení nesplněného předpokladu.b.Kvantitativní data: - dvouvýběrový t-test: formulace testového problému, souvislost s intervalem spolehlivosti pro rozdíl populačních průměrů, rozvolnění předpokladu normality výběrů, heteroskedastická (Welchova) verze testu, prezentace výsledků v kombinaci s popisnou statistikou (podmíněné průměry a směrodatné odchylky);- dvouvýběrový Wilcoxonův (Mannův-Whitneyův, rank sum) test: předpoklady testu, odlišnost od dvouvýběrového t-testu ve formulaci nulové a alternativní hypotézy, příklady použití tohoto testu a situace, kdy není vhodné použít ani dvouvýběrový Wilcoxonův test, prezentace výsledků v kombinaci s popisnou statistikou (podmíněné mediány a podmíněná kvartilová rozpětí).10.PÁROVÉ TESTY (SROVNÁVÁNÍ DVOU ZÁVISLÝCH VÝBĚRŮ): (dotace 2/2) a.Význam párování a randomizace.b.Kvalitativní data: - McNemarův test: kontingenční tabulka 2x2, homogenita marginálních rozdělení, symetrie kontingenční tabulky, předpoklady testu, správná volba testu pro tabulky 2x2 (McNemarův test vs. chí-kvadrát test nezávislosti);- Stuartův test homogenity: zobecnění McNemarova testu, homogenita marginálních rozdělení ve čtvercové tabulce r x r.c.Kvantitativní data: - párový t-test: souvislost s jednovýběrovým testem s rozdíly, odlišnost v předpokladech použití od dvouvýběrového t-testu; - párový Wilcoxonův (signed rank) test: souvislost s jednovýběrovým Wilcoxonovým testem pro rozdíly, předpoklady testu, rozdíl v nulové hypotéze oproti dvouvýběrovému Wilcoxonovu testu.11.ANALÝZA ROZPTYLU JEDNODUCHÉHO TŘÍDĚNÍ: (dotace 2/2) a.Zobrazování dat v kontextu ANOVy jednoduchého třídění.b.ANOVA jednoduchého třídění jako zobecnění dvouvýběrového t-testu pro větší počet nezávislých výběrů, formulace nulové a alternativní hypotézy, tabulka analýzy rozptylu, diagnostické nástroje (reziduální grafy, Leveneův test homoskedasticity, Shapirův-Wilkův test aplikovaný na rezidua) a nápravné prostředky (logaritmická transformace), mnohonásobné porovnávání (rozdíl proti párovému srovnávání - kumulace chyby, Bonferroniho princip, Tukeyova metoda).c.Heteroskedastická verze (Welchova ANOVA) a neparametrická verze analýzy rozptylu (Kruskalův-Wallisův test).d.Blokové studie jako nástroj pro porovnání většího počtu závislých výběrů (informativně).12.JEDNODUCHÁ LINEÁRNÍ REGRESE: (dotace 2/2) a.Normální regresní model a jeho předpoklady, odhad regresních koeficientů metodou nejmenších čtverců, intervaly spolehlivosti a testy pro regresní parametry, koeficient determinace, predikce, konfidenční vs. predikční interval, ověřování předpokladů (reziduální grafy, modifikovaný Leveneův test, Shapirův-Wilkův test aplikovaný na rezidua) a nápravné prostředky.b.Regresní přímka: interpretace regresních parametrů, vztah koeficientu determinace a korelačního koeficientu.c.Ostatní regresní funkce: transformace prediktoru a/nebo odezvy, nalezení nejvhodnějšího modelu.13.STRUČNÝ PŘEHLED DALŠÍCH STATISTICKÝCH PROCEDUR (pouze informativně): (dotace 2/2) a.Vícenásobná lineární regrese (kvantitativní i kvalitativní prediktory), logistická regrese.b.Časové řady (nekorelované, korelované chyby).c.Vícerozměrné metody (shluková, diskriminační analýza, metoda hlavních komponent, faktorová analýza,...).d.Řešení ukázkové zkouškové písemky a diskuse nad dotazy studentů.

Získané způsobilosti

Po úspěšném absolvování budou studenti schopni:- identifikovat kvalitativní a kvantitativní statistické proměnné a vybrat pro ně vhodný způsob zpracování- vytvářet tabulky a grafy souhrnně zobrazující příslušné popisné statistiky - posuzovat normalitu kvantitativních dat a ověřovat i další předpoklady jednotlivých metod- konstruovat bodové a intervalové odhady pro populační průměr a proporci- porovnávat parametry polohy dvou nezávislých i závislých výběrů- posoudit (ne)závislost dvou znaků pomocí dvourozměrných technik (graficky, v některých případech i testem), v případě dvou kvantitativních proměnných hledat vhodnou funkční závislost- reportovat výsledky statistických analýz

Literatura

TypAutorNázevMísto vydáníNakladatelRokISBNZHENDL, J.Přehled statistických metod : analýza a metaanalýza dat.Praha:Portál, 2012.978-80-262-0200-4ZMAREK, L.Statistika pro ekonomy : aplikace.Praha:Professional Publishing, 2007.978-80-86946-40-5ZMEYERS, L S. -- GAMST, G. -- GUARINO, A J.Data analysis using SAS enterprise guide.Cambridge:Cambridge University Press, 2009.978-0-521-11268-0ZFIELD, A P. -- MILES, J.Discovering statistics using SAS : (and sex and drugs and rock 'n' roll).Los Angeles:Sage, 2010.978-1-84920-092-9DMAREK, L.Statistika v příkladech.Praha:Professional Publishing, 2013.978-80-7431-118-5DKOMÁRKOVÁ, L. -- KOMÁREK, A. -- BÍNA, V.Základy analýzy dat a statistického úsudku s příklady v R.Praha:Oeconomica, 2007.978-80-245-1227-3DKOMÁREK, A. -- KOMÁRKOVÁ, L.Statistická analýza závislostí s příklady v R.Praha:Oeconomica, 2007.978-80-245-1226-6DKLEINMAN, K. -- HORTON, N J.SAS and R : management, statistical analysis, and graphics.Boca Raton:CRC Press, 2010.978-1-4200-7057-6DRUMSEY, D J.Statistics for dummies.Hoboken:Wiley Publishing, 2003.0-7645-5423-9DRUMSEY, D J.Statistics II for dummies.Hoboken:Wiley Pub., Inc., 2009.978-0-470-46646-9DRUMSEY, D J.Statistics workbook for dummies.Hoboken:Wiley, 2005.0-7645-8466-9DMCDANIEL, S. -- HEMEDINGER, C.SAS for dummies.Hoboken:Wiley Publishing, 2010.978-0-470-53968-2

Požadavky

žádné

Garant

prof. Radim Jiroušek, DrSc.

Vyučující

doc. RNDr. Jitka Bartošová, Ph.D.doc. Ing. Vladislav Bína, Ph.D.prof. Radim Jiroušek, DrSc.doc. RNDr. Lenka Komárková, Ph.D.