Předmět Jazykové modelování (PA154)
Na serveru studentino.cz naleznete nejrůznější studijní materiály: zápisky z přednášek nebo cvičení, vzorové testy, seminární práce, domácí úkoly a další z předmětu PA154 - Jazykové modelování, Fakulta informatiky, Masarykova univerzita (MU).
Top 10 materiálů tohoto předmětu
Materiály tohoto předmětu
Materiál | Typ | Datum | Počet stažení |
---|
Další informace
Cíl
Cílem předmětu je seznámit studenty se soudobými, převážně statistickými metodami, algoritmy a nástroji, které se používají pro zpracování velkých textových korpusů při jejich vytváření a následné extrakci informací.Tyto nástroje nacházející praktické využití v mnoha oblastech zpracování přirozeného jazyka (poloautomatická tvorba textových korpusů, morfologická analýza a desambiguace, syntaktická analýza, efektivní indexace a vyhledávání v textových korpusech, statistický strojový překlad, sémantická analýza aj.).Na konci kurzu budou studenti nejen schopni tyto nástroje používat, ale zejména budou rozumět souvisejícím teoriím a algoritmům, což často představuje klíčovou kompetenci pro správné (efektivní a korektní) použití těchto nástrojů.
Osnova
Sada nástrojů NLTKZáklady pravděpodobnosti a informační teorieJazykové modelování, Noisy Channel ModelVyhlazování, algoritmus Expectation-MaximizationMarkovovy modely, Skryté Markovovy modely (HMMs)Viterbiho algoritmusZnačkovací metody, značkování pomocí HMM, značkování založené na statistických transformačních pravidlechStatistické zarovnávání a strojový překladKategorizace a shlukování textuGrafické modelyParalelizace, MapReduce
Literatura
RYCHLÝ, Pavel. Korpusové manažery a jejich efektivní implementace. Brno, 2000. xiv, 128 s. infoMANNING, Christopher D. a Hinrich SCHÜTZE. Foundations of statistical natural language processing. Cambridge: MIT Press, 1999. xxxvii, 68. ISBN 0-262-13360-1. info
Garant
doc. RNDr. Aleš Horák, Ph.D.
Vyučující
Mgr. Pavel Rychlý, Ph.D.RNDr. Miloš JakubíčekRNDr. Vojtěch Kovář, Ph.D.