Předmět Úvodní seminář matematické lingvistiky II (NPFL031)
Na serveru studentino.cz naleznete nejrůznější studijní materiály: zápisky z přednášek nebo cvičení, vzorové testy, seminární práce, domácí úkoly a další z předmětu NPFL031 - Úvodní seminář matematické lingvistiky II, Matematicko-fyzikální fakulta, Univerzita Karlova v Praze (UK).
Top 10 materiálů tohoto předmětu
Materiály tohoto předmětu
Materiál | Typ | Datum | Počet stažení |
---|
Další informace
Sylabus
I. Syntaktická analýza (parsing) přirozených jazyků hlavní cíle a problémy syntaktické analýzy obecně a přirozených jazyků zvláště analyzovaný vstupní text, gramatika a syntaktický analyzátor (parser) - vzájemné vztahy deklarativní a procedurální aspekty syntaktické analýzy definite-clause grammars (DCG) chunking, mělká syntaktická analýza některé algoritmy syntaktické analýzy: top-down parsing, bottom-up parsing, left-corner parsing, chart-parsing, Earleyův algoritmus vztah syntaktické analýzy a morfologické disambiguace J. Základy Funkčního generativního popisu jazyka (FGP) stratifikační lingvistika FGP jako představitel stratifikačních popisů struktury přirozeného jazyka charakteristika jednotlivých rovin ve FGP, elementární a komplexní jednotky vztah reprezentace jako vztah formy a funkce, asymetrický dualismus homonymie a synonymie vztahy mezi rovinami, převodní složky K. Rovina jazykového významu ve FGP (tektogramatická rovina): rozlišení jazykového významu a mimojazykového obsahu rozlišení hloubkové a povrchové struktury věty charakteristika roviny jazykového významu: syntaktická struktura věty (závislostní, projektivní); zachycení koordinace; aktuální členění větné (AČV), hloubkový slovosled; negace a rematizátory a jejich dosah, jejich vztah k AČV; gramatická a textová koreference L. Výkonné součásti FGP generativní složka a její matematické podoby: závislostní gramatika; zásobníková závislostní gramatika převodní složky FGP M. FGP a Pražský závislostní korpus smysl a charakteristika Pražského závislostního korpusu analytická rovina tektogramatická rovina N. Úvod do unifikačních formalismů a gramatik deklarativní a procedurální popis jazyka, nestratifikační popisy jazyka motivace unifikačních formalismů a vztah k bezkontextovým gramatikám struktury rysů podspecifikace, subsumpce, unifikace, generalizace orientovaný acyklický graf návrh unifikačních gramatik pro popis různých syntaktických struktur typy a jejich hierarchie lexikalismus, vztah slovníku a gramatiky O. Stručný přehled vlivných západních gramatických formalismů teorie Řízení a vázání (Government and Binding) Generalized Phrase-Structure Grammar Lexical Functional Grammar Head-Driven Phrase-Structure Grammar P. Úvod do korpusové lingvistiky předmět korpusové lingvistiky počítačový jazykový korpus elektronických textů koncepce a budování korpusu typy korpusů správní, textové a jazykové značkování korpusů; značkovací jazyky (SGML a XML)
Literatura
Čermák F., J. Klímová, V. Petkevič (2000): Studie z korpusové lingvistiky. Nakladatelství Karolinum, Univerzita Karlova v Praze, Praha. Český národní korpus (2000). Úvod a příručka uživatele. Ústav Českého národního korpusu FFUK. http://ucnk.ff.cuni.cz Covington M. A. (1994): Natural Language Processing for Prolog Programmers. Prentice Hall, Englewood Cliffs, New Jersey. Garside R., G. Leech, A. McEnery (eds.) (1997): Corpus Annotation. Linguistic Information from Computer Text Corpora. Longman, London, New York. Karlsson F., A. Voutilainen, J. Heikkilä, A. Antilla (eds.) (1995): Constraint Grammar. A Language-Independent System for Parsing Unrestricted Text. Mouton de Gruyter, Berlin - New York. Kennedy G. (1998): An Introduction to Corpus Linguistics. Longman, London. Kuboň V. (2001): Problems of Robust Parsing of Czech. Doktorská disertační práce. ÚFAL MFF UK. Květoň P., K. Oliva (2002): Achieving an Almost Correct PoS-Tagged Corpus. Text, Speech and Dialogue. Proceedings of the Fifth International Conference, TSD 2002, LNAI 2448, Brno, Czech Republic 2002, 19-26. McEnery A.M. (1992): Computational Linguistics. Sigma Press, Wilmslow. Panevová J. (1980): Formy a funkce ve stavbě české věty. Academia, Praha. B.H. Partee, A. ter Meulen, R. E. Wall (1990): Mathematical Methods in Linguistics. Kluwer Academic Publishers. Dordrecht, Boston, London. Petkevič V. (1995): A New Formal Specification of Underlying Structures. Theoretical Linguistics 21, No. 1, 1-61. Sells P. (1985): Lectures on Contemporary Syntactic Theories. (An Introduction to Government-Binding Theory, Generalized Phrase Structure Grammar and Lexical Functional Grammar.) CSLI Lecture Note Series No. 3. CSLI Publications, Stanford (California). Sgall P., Hajičová E., Buráňová E. (1980). Aktuální členění věty v češtině. Academia, Praha. Sgall P. (ed.) (1984): Contributions to Functional Syntax, Semantics, and Language Comprehension. Academia, Praha. Sgall P. et al. (1986): Úvod do syntaxe a sémantiky. Academia, Praha. Shieber S. (1986): An Introduction to Unification-Based Approaches to Grammar. CSLI Lecture Note Series No. 4. CSLI, Stanford (California). Wintner S. (1998): Unification-based Linguistic Formalisms. 10th European Summer School in Logic, Language and Information. Saarbruecken, BRD.
Garant
doc. RNDr. Vladimír Petkevič, CSc.