Předmět Korpusová lingvistika (KBH / KOR)
Na serveru studentino.cz naleznete nejrůznější studijní materiály: zápisky z přednášek nebo cvičení, vzorové testy, seminární práce, domácí úkoly a další z předmětu KBH / KOR - Korpusová lingvistika, Filozofická fakulta, Univerzita Palackého v Olomouci (UP).
Top 10 materiálů tohoto předmětu
Materiály tohoto předmětu
Materiál | Typ | Datum | Počet stažení |
---|
Další informace
Obsah
1. Základní pojmy, literatura a software, typy korpusů2. Metodologie: sběr dat, velikost korpusů, reprezentativnost a vyváženost dat3. České korpusy psaného a mluveného jazyka: charakteristika a možnosti vytěžování dat4. Ostatní projekty: elektronické slovníky, databáze, literární/literárněvědné korpusy5. Korpusové nástroje a metody vyhodnocování (KWIC, konkordance, kolokace; regulární a booleovské výrazy, statistika: MI-score, T-score; frekvenční distribuce)6. Lingvistická anotace: lemmatizace, morfologické a syntaktické značkování (hlavní modely)7. Strukturované vyhledávání dat - dotazovací jazyk CQL (regulární a booleovské výrazy)8. Vnitřní struktura korpusu: formáty korpusů a anotace dat9. Stručný úvod do značkovacího jazyka XML (strukturace dat a metadat)10. Práce s lingvistickými daty v různých korpusových aplikacíchDůležitou součástí práce v semináři bude vyhledávání dat a vytváření jednoduchých i složitěji strukturovaných vyhledávacích formalismů v korpusových manažerech.
Získané způsobilosti
Cílem kurzu je seznámit účastníky se základy korpusové lingvistiky a připravit je na práci s korpusy, které se v posledních letech staly jednou ze základních pomůcek pro vědecké studium jazyka.V teoretickém exkurzu jsou představeny české i zahraniční korpusy psaného i mluveného jazyka, metodologie, softwarové aplikace, mezinárodní standardy, formáty, značkování a anotace korpusů. V praktické časti kurzu si studenti osvojí techniky vyhledávání jazykových dat, práci s lingvistickými daty v různých korpusových aplikacích a vypracují seminární projekt, který povede k sestavení vlastního korpusového vzorku.
Literatura
Baker, P. - Hardie, A. - McEnery, T. A Glossary of Corpus Linguistics. Edinburgh 2006. Kol. Český národní korpus. Úvod a příručka uživatele. Praha 2000. Český národní korpus. Úvod a příručka uživatele. Praha 2000. Čermák, F. - Křen, M. (eds.). Frekvenční slovník češtiny. Praha 2004. Čermák, F. (ed.). Frekvenční slovník mluvené češtiny. Praha 2007. Čermák, F. - Blatná, R. (eds.). Jak využívat Český národní korpus. Praha 2005. Čermák František. Komputační lexikografie. In: Manuál lexikografie. Jinočany 1995, s. 50-71. Šulc Michal. Korpusová lingvistika (první vstup). Praha 1999. Čermák, F. - Blatná, R. Korpusová lingvistika: Stav a modelové přístupy. Praha 2006. Kol. Průvodce českým akademickým korpusem 1.0. Praha 2007. Čermák - Klímová - Petkevič. Studie z korpusové lingvistiky. Praha 2000.
Požadavky
(1) Pravidelná účast a aktivní práce v semináři (včetně plnění zadaných úkolů)(2) Úspěšně realizovaný seminární projekt
Garant
PhDr. Petr Pořízka, Ph.D.