Jak Začít?

Máš v počítači zápisky z přednášek
nebo jiné materiály ze školy?

Nahraj je na studentino.cz a získej
4 Kč za každý materiál
a 50 Kč za registraci!




Předmět Pokročilé Big Data technologie (NDBI041)

Na serveru studentino.cz naleznete nejrůznější studijní materiály: zápisky z přednášek nebo cvičení, vzorové testy, seminární práce, domácí úkoly a další z předmětu NDBI041 - Pokročilé Big Data technologie, Matematicko-fyzikální fakulta, Univerzita Karlova v Praze (UK).

Top 10 materiálů tohoto předmětu

Materiály tohoto předmětu

Materiál Typ Datum Počet stažení

Další informace

Sylabus

1. Ukladáni dat Rozdíly mezi klasickými RDBMS, sloupcovými bázemi a NoSQL. C-store, MongoDB, CouchDB, Cassandra, HBase. Optimalizace a efektivita přístupu k datům.2. Zpracování dat Zpracování proudu dat, napojení datawarehouse systému: Linkedin/Kafka, Twitter/Storm. Dávková zpracování dat: problematika Hadoop-u, efektivita zpracování. Sdílení zdrojů, optimalizace: YARN, Corona, Mesos. Řešení dotazů nad velkými daty: Drill & Dremel.3. Analýza dat Nizkoúrovňové zpracování: Hadoop a map&reduce. Data warehouse: Pig, Hive, Shark, RHadoop, RHive, RHIPE. Klasifikace textů, clustering, pattern mining: Mahout. Analýza grafových struktur a vztahů mezi objekty: Giraph, GoldenOrb, Gremlin.

Garant

RNDr. Leo Galamboš, Ph.D.