Jak Začít?

Máš v počítači zápisky z přednášek
nebo jiné materiály ze školy?

Nahraj je na studentino.cz a získej
4 Kč za každý materiál
a 50 Kč za registraci!




Předmět Korpusová lingvistika (KBH / KOR)

Na serveru studentino.cz naleznete nejrůznější studijní materiály: zápisky z přednášek nebo cvičení, vzorové testy, seminární práce, domácí úkoly a další z předmětu KBH / KOR - Korpusová lingvistika, Filozofická fakulta, Univerzita Palackého v Olomouci (UP).

Top 10 materiálů tohoto předmětu

Materiály tohoto předmětu

Materiál Typ Datum Počet stažení

Další informace

Obsah

1. Základní pojmy, literatura a software, typy korpusů2. Metodologie: sběr dat, velikost korpusů, reprezentativnost a vyváženost dat3. České korpusy psaného a mluveného jazyka: charakteristika a možnosti vytěžování dat4. Ostatní projekty: elektronické slovníky, databáze, literární/literárněvědné korpusy5. Korpusové nástroje a metody vyhodnocování (KWIC, konkordance, kolokace; regulární a booleovské výrazy, statistika: MI-score, T-score; frekvenční distribuce)6. Lingvistická anotace: lemmatizace, morfologické a syntaktické značkování (hlavní modely)7. Strukturované vyhledávání dat - dotazovací jazyk CQL (regulární a booleovské výrazy)8. Vnitřní struktura korpusu: formáty korpusů a anotace dat9. Stručný úvod do značkovacího jazyka XML (strukturace dat a metadat)10. Práce s lingvistickými daty v různých korpusových aplikacíchDůležitou součástí práce v semináři bude vyhledávání dat a vytváření jednoduchých i složitěji strukturovaných vyhledávacích formalismů v korpusových manažerech.

Získané způsobilosti

Cílem kurzu je seznámit účastníky se základy korpusové lingvistiky a připravit je na práci s korpusy, které se v posledních letech staly jednou ze základních pomůcek pro vědecké studium jazyka.V teoretickém exkurzu jsou představeny české i zahraniční korpusy psaného i mluveného jazyka, metodologie, softwarové aplikace, mezinárodní standardy, formáty, značkování a anotace korpusů. V praktické časti kurzu si studenti osvojí techniky vyhledávání jazykových dat, práci s lingvistickými daty v různých korpusových aplikacích a vypracují seminární projekt, který povede k sestavení vlastního korpusového vzorku.

Literatura

Baker, P. - Hardie, A. - McEnery, T. A Glossary of Corpus Linguistics. Edinburgh 2006. Kol. Český národní korpus. Úvod a příručka uživatele. Praha 2000. Český národní korpus. Úvod a příručka uživatele. Praha 2000. Čermák, F. - Křen, M. (eds.). Frekvenční slovník češtiny. Praha 2004. Čermák, F. (ed.). Frekvenční slovník mluvené češtiny. Praha 2007. Čermák, F. - Blatná, R. (eds.). Jak využívat Český národní korpus. Praha 2005. Čermák František. Komputační lexikografie. In: Manuál lexikografie. Jinočany 1995, s. 50-71. Šulc Michal. Korpusová lingvistika (první vstup). Praha 1999. Čermák, F. - Blatná, R. Korpusová lingvistika: Stav a modelové přístupy. Praha 2006. Kol. Průvodce českým akademickým korpusem 1.0. Praha 2007. Čermák - Klímová - Petkevič. Studie z korpusové lingvistiky. Praha 2000.

Požadavky

(1) Pravidelná účast a aktivní práce v semináři (včetně plnění zadaných úkolů)(2) Úspěšně realizovaný seminární projekt

Garant

PhDr. Petr Pořízka, Ph.D.