Předmět Distribuované zpracování rozsáhlých dat (NPFL102)
Na serveru studentino.cz naleznete nejrůznější studijní materiály: zápisky z přednášek nebo cvičení, vzorové testy, seminární práce, domácí úkoly a další z předmětu NPFL102 - Distribuované zpracování rozsáhlých dat, Matematicko-fyzikální fakulta, Univerzita Karlova v Praze (UK).
Top 10 materiálů tohoto předmětu
Materiály tohoto předmětu
Materiál | Typ | Datum | Počet stažení |
---|
Další informace
Sylabus
Technologické problémy při zpracování velkého objemu dat (Sun/Oracle/Son of) Grid Engine - architektura, příkazy Framework MapReduce - principy Apache Spark - architektura, implementace algoritmů případně OpenMPI - architektura, poskytované operacepřípadně Mahout, Vowpal Wabbit - algoritmy strojového učení
Literatura
Data-Intensive Text Processing with MapReduce; Jimmy Lin and Chris Dyer.; Morgan & Claypool Publishers, 2010Hadoop: The Definitive Guide; Tom White; 2010Son of Grid Engine - https://arc.liv.ac.uk/trac/SGEApache Spark - https://spark.apache.org/OpenMPI - http://www.open-mpi.org/ Apache Mahout - https://mahout.apache.org/ Vowpal Wabbit - https://github.com/JohnLangford/vowpal_wabbit/wiki
Garant
RNDr. Mgr. Milan Straka, Ph.D.