Předmět Počítačové zpracování přirozeného jazyka (PA153)
Na serveru studentino.cz naleznete nejrůznější studijní materiály: zápisky z přednášek nebo cvičení, vzorové testy, seminární práce, domácí úkoly a další z předmětu PA153 - Počítačové zpracování přirozeného jazyka, Fakulta informatiky, Masarykova univerzita (MU).
Top 10 materiálů tohoto předmětu
Materiály tohoto předmětu
Materiál | Typ | Datum | Počet stažení |
---|
Další informace
Cíl
Předmět nabízí seznámení s počítačovým zpracováním přirozeného jazykana jednotlivých rovinách: morfologické, syntaktické, sémantické apragmatické. Na každé rovině se probírají teoretická východiska apoužívané algoritmické popisy a nástroje a také jejich organizacedo složitějších systémů.Studenti získají znalosti o jednotlivých rovinách analýzy jazyka - morfologické, syntaktické, sémantické a pragmatické.Zvládnou problematiku jazykových dat - korpusů, korpusových nástrojů, značkování korpusových textů, budou se orientovat v otázkách disambiguace s použitím pravidlových a statistických systémů.Studenti se seznámí representací morfologických stuktur, notací a algoritmy morfologické analýzy.Budou schopni pracovat s representacemi syntaktických struktur, formálními gramatikami a jejich typy. Seznámí se s gramatikami - nekontextovými, funkcionálními, vymezených formulí (definite-clause) a s algoritmy syntaktické analýzy.Budou probrány datové struktury jako valenční slovesné rámce a jejich typy.Osvojí si problematiku sémantické representace. Bude probrána lexikální sémantika - významy slov a slovních spojení (kolokací), elektronické slovníky, lexikální databáze (WordNet,EuroWordNet, thesaury).Budou charakterizovány základní principy sémantické analýzy věty na bázi logické sémantiky včetně Normálního translačního algoritmu.Studenti získají základní představu o problematice pragmatiky.Pozornost bude věnována analýze promluvy a její segmentaci, dále anafoře a koreferenci.Prezentovány budou dialogové systémy.Dále pak problematika inference a reprezentace znalostí pro systémy zpracování přirozeného jazyka.Studenti získají základní informace o komunikačních agentech aevaluačních technikác
Osnova
Počítačové zpracování přirozeného jazyka a počítačová lingvistika.Počítačové porozumění přirozenému jazyku.Roviny analýzy jazyka - morfologie, syntax, sémantika.Jazyková data - textové korpusy. Typy korpusů. Korpusové nástroje. Značkování korpusových textů. Disambiguace, pravidlové a statistické systémy.Representace morfologických struktur, notace, morfologické algoritmy.Representace syntaktických struktur - formální gramatiky a jejich typy. Nekontextové, funkční, DC (definite-clause) gramatiky. Algoritmy syntaktické analýzy. Valenční rámce a jejich typy.Sémantická representace. Lexikální významy - slova a kolokace,elektronické slovníky, lexikální databáze (WordNet, EuroWordNet, thesaury).Semantická analýza věty, Normální translační algoritmus.Pragmatika.Analýza promluvy a její segmentace. Anafora a koreference.Dialogové systémy.Inference a reprezentace znalosti pro NL systémy.Komunikační agenti.Evaluační techniky.
Literatura
ALLEN, James. Natural language understanding. 2nd ed. Redwood City: Benjamin/Cummings Publishing Company, 1995. xv, 654 s. ISBN 0-8053-0334-0. infoCHOMSKY, Noam. Syntaktické struktury., Logický základ teorie jazyka., O pojmu gramatické pravidlo. Praha: Academia, 1966. 209 s. info
Požadavky
Logická analýza přirozeného jazyka I a II
Garant
doc. RNDr. Aleš Horák, Ph.D.
Vyučující
doc. PhDr. Karel Pala, CSc.doc. RNDr. Aleš Horák, Ph.D.