Předmět Statistické metody pro analýzu dat z databází (4MM405)
Na serveru studentino.cz naleznete nejrůznější studijní materiály: zápisky z přednášek nebo cvičení, vzorové testy, seminární práce, domácí úkoly a další z předmětu 4MM405 - Statistické metody pro analýzu dat z databází, Fakulta informatiky a statistiky, Vysoká škola ekonomická v Praze (VŠE).
Top 10 materiálů tohoto předmětu
Materiály tohoto předmětu
Materiál | Typ | Datum | Počet stažení |
---|
Další informace
Obsah
1) Statistické výpočetní prostředí R. Dokumentace a balíčky v softwaru R.2) Práce s datovými zdroji, databázové systémy, databázový model.3) Příprava dat, pseudonáhodná čísla, výběr vzorku, výpočet základníchstatistických charakteristik pomocí SQL.4) Explorační analýza a vizualizace dat.5) Úvod do shlukové analýzy, vzdálenosti, metoda k průměrů.6) Fuzzy shluková analýza, PAM, model-based clustering.7) Grafické modely.8) Modely náhodných grafů, analýza sociálních sítí.9) Vzdálenosti pro kategoriální sekvence, hledání reprezentativních sekvencí.10) Hodnocení modelu, návrh kontrolních skupin, stratifikace.11) Lineární diskriminační analýza, logistická regrese.12) Klasifikační a regresní stromy, random forest.13) Spojitá lineární lomená regrese.
Získané způsobilosti
Po úspěšném absolvování předmětu budou studenti schopni řešit vybrané úlohy z praxe pomocí metod pro analýzu dat (explorační analýza dat, shluková analýza, analýza kategoriálních sekvencí). Budou schopni vytvořit predikční model (metodami logistické regrese, rozhodovacích stromů nebo pomocí random forest) a posoudit jeho vhodnost.
Literatura
TypAutorNázevMísto vydáníNakladatelRokISBNZHASTIE, T. -- TIBSHIRANI, R. -- FRIEDMAN, J H.The elements of statistical learning : data mining, inference, and prediction.New York:Springer, 2009.978-0-387-84857-0DVENABLES, W. N. -- SMITH, M. -- R CORE TEAM; An Introduction to R.; 2012.;; ISBN 3-900051-12-7.
Požadavky
žádné
Garant
Ing. Nikola Kaspříková, Ph.D.
Vyučující
Ing. Nikola Kaspříková, Ph.D.