Jak Začít?

Máš v počítači zápisky z přednášek
nebo jiné materiály ze školy?

Nahraj je na studentino.cz a získej
4 Kč za každý materiál
a 50 Kč za registraci!




Předmět Data mining (MTI / DM)

Na serveru studentino.cz naleznete nejrůznější studijní materiály: zápisky z přednášek nebo cvičení, vzorové testy, seminární práce, domácí úkoly a další z předmětu MTI / DM - Data mining, Fakulta mechatroniky a MIS, Technická univerzita v Liberci (TUL).

Top 10 materiálů tohoto předmětu

Materiály tohoto předmětu

Materiál Typ Datum Počet stažení

Další informace

Obsah

Přednášky :1. Proces dobývání znalostí - historie, vymezení cílů, přehled metodologií2. Dělení dataminingových úloh, představení typických úloh - CRM péče o zákazníka, získávání nových zákazníků, predikce odchodů zákazníků ke konkurenci (churn), marketingová úspěšnost obchodních kampaní apod.3. Odhalování podvodů - fraud úlohy, kreditní riziko, behaviorální skórování pro hodnocení rizikovosti splácených úvěrů.4. Příprava dat, porozumění datům, popis datové množiny, příprava datové matice, výběr dat a jejich čištění, konstrukce a slučování datových zdrojů, typová homogenita, formátování dat.5. Klasifikační algoritmy jako nástroje predikce vycházející z historických dat. Rozhodovací stromy, algoritmy C&RT, C5.0, CHAID&QUEST. Převod stromu na pravidla, prořezávání stromů.6. Diskriminační analýza - klasifikace případů do tříd, skórování.7. Segmentační algoritmy - odhalení neobvyklých struktur v datech nasazením algoritmů seskupování K-Means, Two Step, Anomaly.8. Asociační algoritmy - hledání asociačních pravidel, model Apriori, Carma, statistiky implikací, predikční model.9. Základy neuronových sítí pro zpracování kategorizovaných i číselných proměnných, použití v případech, kdy klasické lineární metody neposkytují očekávané výsledky.10. Analýza a predikce časových řad pomocí modelů DM, příprava dat, doplnění chybějících hodnot, diference, sezónní diference, klouzavé průměry a mediány, vyhlazování časových řad.11. Modelování a evaluace řešení, zavádění DM řešení do praxe, zařazení skórovacích procesů do rozhodovacího firemního workflow.12. Webmining, Textmining.13.- 14. Rozbor typických úloh data miningu.Cvičení:1.- 2. Zpracování a vizualizace dat v SPSS Modeleru a další jeho ovládací prvky, případně srovnání s jiným Open source SW.3.- 9. Příprava modelů pro případové studie, jejich analýza a interpretace výsledků - na vzorové studie bude navazovat jejich modifikace v několika samostatných zadáních.Aplikace DM algoritmů bude diskutována a studovaná na širokém spektru úloh.Například:-doporučení léčebné metody na základě biomedicínckých dat,-klasifikace v biologických a fyzikálních datech,-marketingové úlohy pro predikci chování zákazníka - odhad jeho migrace ke konkurenci, citlivost na marketingové nabídky,-model prevence kriminality doporučený na základě zpracování dat z policejních databází, --monitorování zkušebního provozu a predikce selhání stroje,-úlohy spojené s bankovním sektorem ? hledání podezřelých úvěrů, praní špinavých peněz a další.10.- 12. Samostatná individuální práce.13.- 14. Obhajoby individuálních prací.

Získané způsobilosti

Student získá znalost řešení dataminingových úloh. Na praktických úlohách se naučí používat typické dataminingové algoritmy a analytické postupy vývoje a nasazení dataminingového řešení do praxe.

Literatura

Yong Yin, Ikou Kaku, Jiafu Tang. Data Mining. Springer London Ltd. , 2011. Olivia Parr Rud. Datamining. Computer Press a.s., 2006. Berka Petr. Dobývání znalostí z databází. Academia, Oraha, 2006. Hendl Jan. Přehled statistických metod zpracování dat. Praha, 2009.

Požadavky

Absolvování předepsaných úloh, odevzdání a obhájení individuální semestrální práce, znalost odpřednášené látky a uspokojivé výsledky průběžné kontroly.

Garant

RNDr. Klára Císařová, Ph.D.

Vyučující

RNDr. Klára Císařová, Ph.D.Ing. Pavel TylRNDr. Klára Císařová, Ph.D.Ing. Marián LamrIng. Pavel Tyl