Předmět Morfologická a syntaktická analýza II (NPFL105)
Na serveru studentino.cz naleznete nejrůznější studijní materiály: zápisky z přednášek nebo cvičení, vzorové testy, seminární práce, domácí úkoly a další z předmětu NPFL105 - Morfologická a syntaktická analýza II, Matematicko-fyzikální fakulta, Univerzita Karlova v Praze (UK).
Top 10 materiálů tohoto předmětu
Materiály tohoto předmětu
Materiál | Typ | Datum | Počet stažení |
---|
Další informace
Sylabus
Modelový scénář 1:Chceme vybudovat systém statistického strojového překladu do/z nového jazyka.Potřebujeme především paralelní korpus daného jazyka a angličtiny, případně češtiny nebo něčeho jiného, co je k dispozici.Dále nás budou zajímat nástroje pro morfologickou a syntaktickou analýzu, rozpoznávání pojmenovaných entit atd. za účelem zlepšení překladu.Modelový scénář 2:Máme málo nebo žádná paralelní data, zaměříme se na pravidlové systémy.Navrhneme sadu morfologických značek, vytvoříme jednoduchý morfologický a syntaktický analyzátor,podle možnosti i dvojjazyčný slovník, to vše se pokusíme zapojit do existujícho pravidlovéhopřekladového systému (Treex, Apertium) a využít při primitivním překladu.
Literatura
• Martin Popel, Zdeněk Žabokrtský: TectoMT: Modular NLP Framework. In Proceedings of IceTAL , 7th International Conference on Natural Language Processing, Reykjavík, Iceland, August 17, 2010, pp. 293-304.• Antonio M. Corbí-Bellot, Mikel L. Forcada, Sergio Ortiz-Rojas, Juan Antonio Pérez-Ortiz, Gema Sánchez-Ramírez, Felipe Sánchez-Martínez, Iñaki Alegria, Aingeru Mayor, Kepa Sarasola (2005) "An open-source shallow-transfer machine translation engine for the romance languages of Spain ", in Proceedings of the European Associtation for Machine Translation, 10th Annual Conference (Budapest, Hungary, 30-31.05.2005), p. 79-86• Philip Resnik, Noah A. Smith, The Web as a parallel corpus Computational Linguistics, Volume 29 , Issue 3 (September 2003), Pages: 349 - 380.• Rayid Ghani, Rosie Jones, Dunja Mladenic: "Building Minority Language Corpora by Learning to Generate Web Search Queries"KAIS Knowledge and Information Systems, volume 7, number 1, 2005
Garant
RNDr. Daniel Zeman, Ph.D.