Jak Začít?

Máš v počítači zápisky z přednášek
nebo jiné materiály ze školy?

Nahraj je na studentino.cz a získej
4 Kč za každý materiál
a 50 Kč za registraci!








Předmět Angličtina a korpusy (AAA300120)

Na serveru studentino.cz naleznete nejrůznější studijní materiály: zápisky z přednášek nebo cvičení, vzorové testy, seminární práce, domácí úkoly a další z předmětu AAA300120 - Angličtina a korpusy, Filozofická fakulta, Univerzita Karlova v Praze (UK).

Top 10 materiálů tohoto předmětu

Materiály tohoto předmětu

Materiál Typ Datum Počet stažení

Další informace

Sylabus

Teacher: Mgr. Václav Cvrček, PhD. & Mgr. Lucie Chlumská vaclav.cvrcek@ff.cuni.cz; chlumska@trnka.ff.cuni.czRoom: Computer lab, Národní 37 (Room 7)Structure of this courseThe course consists of 13 lessons (2 hours). 1. introduction to corpus linguistics, registration, structure of corpora in the Czech National Corpus project and British National Corpus2. CQL (corpus query language), basic regular expressions (use of wild characters, operators of repetition etc.)3. advanced regular expressions (logical operators, filters - positive and negative, using graphical interface for creating complex queries)4. word - lemma - tag, principles of lemmatisation and morphological tagging of corpora (stochastic methods, rule-based methods of disambiguation); using lemmas and tags in complex queries5. concept of representativeness in corpora of spoken and written language, Heaps' law and its consequences for corpus size6. internal structure of the corpus (opus, document, sentence), text types (fiction, newspapers, science; formal, informal speech), work with subcorpora7. collocations and statistical methods for their identification; multi-word units in the description of language (lexicon, grammar)8. word-sketches, co-occurrences and semantic prosody; corpus-based syntagmatic and paradigmatic approach to language units9. parallel and multilingual corpora (InterCorp)10. basic statistics for corpus linguistics (mean, standard deviation, chi-square, normal distribution, correlation, Zipf's laws)11. corpus-based vs. corpus-driven approach; corpus applications: phonology (graphemics), morphology (language system vs. prototypes)12. corpus applications: lexicography (automatic term recognition, collocations dictionaries), syntax, stylometry13. presentation of students' work, discussionEvaluationCredits: 5 (Z)a) active participation in lessonsb) presentation of individual corpus-based researchCredits: 10 (Z+PP)a) active participation in lessonsb) presentation of individual corpus-based researchc) essay describing methods used and conclusions made in the research (emphasis is laid on interpretation of facts)

Literatura

Materials and literatureBaayen, H. R.: Analyzing Linguistic Data, Cambridge University Press, Cabridge 2008.Bartoň, T. - Cvrček, V. - Čermák, F. - Jelínek, T. - Petkevič, V.: Statistiky češtiny. NLN, Praha 2009.Biber, D. - Conrad, S. - Reppen, R.: Corpus Linguistics: Investigating Language Structure and Use (Cambridge Approaches to Linguistics). Cambridge: Cambridge University Press. 1998.Biber, D. - Conrad, S. - Leech, G. - Finegan, E. - Johansson, S.: Longman Grammar of Spoken and Written English, Longmann. England 2000.Biber, D. - Conrad, S.: Real Grammar. Pearson Longman. NY 2009.Blatná, R.: Víceslovné předložky v současné češtině. NLN, Praha 2006.Cvrček, V.: Regulace jazyka a Koncept minimální intervence. NLN, Praha 2008.Čermáková, A.: Valence českých substantiv. NLN, Praha 2009.Čermák F. - Klímová J. - Petkevič V. (eds.): Studie z korpusové lingvistiky. Karolinum, Praha 2000.Čermák F.: Jazykový korpus: Prostředek a zdroj poznání. Slovo a slovesnost 56, 1995, (s. 119-140)Čermák, F. - Blatná, R. (eds.): Jak využívat Český národní korpus. NLN, Praha 2005.Čermák, F. - Blatná, R.: Korpusová lingvistika: Stav a modelové přístupy. NLN, Praha 2006.Čermák, F. - Šulc, M. (eds.): Kolokace. Nakladatelství Lidové noviny, Praha 2006.Esvan, F.: Vidová morfologie českého slovesa. NLN, Praha 2007.Gries, S. Th.: Quantitative Corpus Linguistics with R, Routledge 2009.Gries, S. Th. - Wulff, S. - Davies, M. (eds.): Corpus-linguistic applications, Rodopi 2010.Kocek, J. - Kopřivová, M. - Kučera, K. (eds.): Český národní korpus - úvod a příručka uživatele. ÚČNK FF UK, Praha 2000.Kopřivová, M.: Valence českých adjektiv. NLN, Praha 2006.Kopřivová, M. - Waclawičová, M.: Čeština v mluveném korpusu. NLN, Praha 2008.Oakes, M. P.: Statistics for Corpus Linguistics. Edinburgh University Press, Edinburgh 1998.Quirk, R. - Greenbaum, S. - Leech, G. - Svartvik, J.: A Grammar of Contemporary English. Longman Group United Kingdom 1972.Sinclair, J.: Trust the text. Routledge. London. 2004.Šonková, J.: Morfologie mluvené češtiny: Frekvenční analýza. NLN, Praha 2008.Teubert, W. - Krishnamurthy, R. (eds.): Corpus Linguistics Vol. I-VI, Critical Concepts in Linguistics, Routledge 2007.and http://www.korpus.cz - section "Manuál a instalace manažeru Bonito" (Manual and installation of the corpus manager Bonito)

Garant

doc. Mgr. Václav Cvrček, Ph.D.Mgr. Dominika Kováříková, M.A., Ph.D.