Předmět Zdroje lingvistických dat (NPFL070)
Na serveru studentino.cz naleznete nejrůznější studijní materiály: zápisky z přednášek nebo cvičení, vzorové testy, seminární práce, domácí úkoly a další z předmětu NPFL070 - Zdroje lingvistických dat, Matematicko-fyzikální fakulta, Univerzita Karlova v Praze (UK).
Top 10 materiálů tohoto předmětu
Materiály tohoto předmětu
Materiál | Typ | Datum | Počet stažení |
---|
Další informace
Sylabus
1. Úvod motivace pro vytváření lingvisticky anotovaných dat podstata anotování klasifikace lingvistických dat, možnosti využití technické prostředky, kódování, datové formáty2. Korpusy typologie korpusů, sady značek Brown Corpus, Český národní korpus vyhledávání v korpusech3. Treebanky složkové a závislostní struktury a otázka jejich převoditelnosti Penn Treebank, Pražský závislostní korpus, Negra/Tiger vyhledávání v treebancích4. Počítačová lexikografie typy lexikální informace machine readable/tractable dictionaries wordnety, valenční slovníky, překladové slovníky Princeton Wordnet, EuroWordNet, FrameNet, PropBank, Vallex dictionary production systems5. Tektogramatická rovina Pražského závislostního korpusu závislostní strom, typy hran, vnitřní struktura uzlu koreference gramatémy aktuální členění
Literatura
Vybrané články z konferencí (LREC,ACL atd.), technické zprávy ÚFAL/CKL.(Selected conference papers (LREC,ACL etc.), UFAL/CKL technical reports.)
Garant
doc. Ing. Zdeněk Žabokrtský, Ph.D.Mgr. Martin Popel