Jak Začít?

Máš v počítači zápisky z přednášek
nebo jiné materiály ze školy?

Nahraj je na studentino.cz a získej
4 Kč za každý materiál
a 50 Kč za registraci!




Předmět Morfologická a syntaktická analýza II (NPFL105)

Na serveru studentino.cz naleznete nejrůznější studijní materiály: zápisky z přednášek nebo cvičení, vzorové testy, seminární práce, domácí úkoly a další z předmětu NPFL105 - Morfologická a syntaktická analýza II, Matematicko-fyzikální fakulta, Univerzita Karlova v Praze (UK).

Top 10 materiálů tohoto předmětu

Materiály tohoto předmětu

Materiál Typ Datum Počet stažení

Další informace

Sylabus

Modelový scénář 1:Chceme vybudovat systém statistického strojového překladu do/z nového jazyka.Potřebujeme především paralelní korpus daného jazyka a angličtiny, případně češtiny nebo něčeho jiného, co je k dispozici.Dále nás budou zajímat nástroje pro morfologickou a syntaktickou analýzu, rozpoznávání pojmenovaných entit atd. za účelem zlepšení překladu.Modelový scénář 2:Máme málo nebo žádná paralelní data, zaměříme se na pravidlové systémy.Navrhneme sadu morfologických značek, vytvoříme jednoduchý morfologický a syntaktický analyzátor,podle možnosti i dvojjazyčný slovník, to vše se pokusíme zapojit do existujícho pravidlovéhopřekladového systému (Treex, Apertium) a využít při primitivním překladu.

Literatura

• Martin Popel, Zdeněk Žabokrtský: TectoMT: Modular NLP Framework. In Proceedings of IceTAL , 7th International Conference on Natural Language Processing, Reykjavík, Iceland, August 17, 2010, pp. 293-304.• Antonio M. Corbí-Bellot, Mikel L. Forcada, Sergio Ortiz-Rojas, Juan Antonio Pérez-Ortiz, Gema Sánchez-Ramírez, Felipe Sánchez-Martínez, Iñaki Alegria, Aingeru Mayor, Kepa Sarasola (2005) "An open-source shallow-transfer machine translation engine for the romance languages of Spain ", in Proceedings of the European Associtation for Machine Translation, 10th Annual Conference (Budapest, Hungary, 30-31.05.2005), p. 79-86• Philip Resnik, Noah A. Smith, The Web as a parallel corpus Computational Linguistics, Volume 29 , Issue 3 (September 2003), Pages: 349 - 380.• Rayid Ghani, Rosie Jones, Dunja Mladenic: "Building Minority Language Corpora by Learning to Generate Web Search Queries" KAIS Knowledge and Information Systems, volume 7, number 1, 2005

Garant

RNDr. Daniel Zeman, Ph.D.