Jak Začít?

Máš v počítači zápisky z přednášek
nebo jiné materiály ze školy?

Nahraj je na studentino.cz a získej
4 Kč za každý materiál
a 50 Kč za registraci!




Předmět Distribuované zpracování rozsáhlých dat (NPFL102)

Na serveru studentino.cz naleznete nejrůznější studijní materiály: zápisky z přednášek nebo cvičení, vzorové testy, seminární práce, domácí úkoly a další z předmětu NPFL102 - Distribuované zpracování rozsáhlých dat, Matematicko-fyzikální fakulta, Univerzita Karlova v Praze (UK).

Top 10 materiálů tohoto předmětu

Materiály tohoto předmětu

Materiál Typ Datum Počet stažení

Další informace

Sylabus

Technologické problémy při zpracování velkého objemu dat (Sun/Oracle/Son of) Grid Engine - architektura, příkazy Framework MapReduce - principy Apache Spark - architektura, implementace algoritmů případně OpenMPI - architektura, poskytované operacepřípadně Mahout, Vowpal Wabbit - algoritmy strojového učení

Literatura

Data-Intensive Text Processing with MapReduce; Jimmy Lin and Chris Dyer.; Morgan & Claypool Publishers, 2010Hadoop: The Definitive Guide; Tom White; 2010Son of Grid Engine - https://arc.liv.ac.uk/trac/SGEApache Spark - https://spark.apache.org/OpenMPI - http://www.open-mpi.org/ Apache Mahout - https://mahout.apache.org/ Vowpal Wabbit - https://github.com/JohnLangford/vowpal_wabbit/wiki

Garant

RNDr. Mgr. Milan Straka, Ph.D.