Jak Začít?

Máš v počítači zápisky z přednášek
nebo jiné materiály ze školy?

Nahraj je na studentino.cz a získej
4 Kč za každý materiál
a 50 Kč za registraci!




Předmět Zdroje lingvistických dat (NPFL070)

Na serveru studentino.cz naleznete nejrůznější studijní materiály: zápisky z přednášek nebo cvičení, vzorové testy, seminární práce, domácí úkoly a další z předmětu NPFL070 - Zdroje lingvistických dat, Matematicko-fyzikální fakulta, Univerzita Karlova v Praze (UK).

Top 10 materiálů tohoto předmětu

Materiály tohoto předmětu

Materiál Typ Datum Počet stažení

Další informace

Sylabus

1. Úvod motivace pro vytváření lingvisticky anotovaných dat podstata anotování klasifikace lingvistických dat, možnosti využití technické prostředky, kódování, datové formáty2. Korpusy typologie korpusů, sady značek Brown Corpus, Český národní korpus vyhledávání v korpusech3. Treebanky složkové a závislostní struktury a otázka jejich převoditelnosti Penn Treebank, Pražský závislostní korpus, Negra/Tiger vyhledávání v treebancích4. Počítačová lexikografie typy lexikální informace machine readable/tractable dictionaries wordnety, valenční slovníky, překladové slovníky Princeton Wordnet, EuroWordNet, FrameNet, PropBank, Vallex dictionary production systems5. Tektogramatická rovina Pražského závislostního korpusu závislostní strom, typy hran, vnitřní struktura uzlu koreference gramatémy aktuální členění

Literatura

Vybrané články z konferencí (LREC,ACL atd.), technické zprávy ÚFAL/CKL.(Selected conference papers (LREC,ACL etc.), UFAL/CKL technical reports.)

Garant

doc. Ing. Zdeněk Žabokrtský, Ph.D.Mgr. Martin Popel