Jak Začít?

Máš v počítači zápisky z přednášek
nebo jiné materiály ze školy?

Nahraj je na studentino.cz a získej
4 Kč za každý materiál
a 50 Kč za registraci!




Předmět Automatické zpracování textových dat (NPFL098)

Na serveru studentino.cz naleznete nejrůznější studijní materiály: zápisky z přednášek nebo cvičení, vzorové testy, seminární práce, domácí úkoly a další z předmětu NPFL098 - Automatické zpracování textových dat, Matematicko-fyzikální fakulta, Univerzita Karlova v Praze (UK).

Top 10 materiálů tohoto předmětu

Materiály tohoto předmětu

Materiál Typ Datum Počet stažení

Další informace

Sylabus

Na ukázkových textech většího rozsahu si ukážemezákladní metody zpracování textu potřebné pro získání netriviálníchinformací a ověření hypotéz. Pravděpodobně použijeme texty děl KarlaČapka a různá další díla v jazycích dle zaměření frekventantů.Význam a vlastnosti velkých dat unixový shell; nejzákladnější příkazy další příkazy pro manipulaci s texty textové editory vyhledávání pomocí regulárních výrazů využití regulárních výrazů pro úpravy textu základní principy formulace a ověřování hypotéz, aplikace na data, přesnost, úplnost, vypovídací hodnota výsledků odstranění diakritiky, segmentace na věty, tokenizace pravidlové automatické určení slovních druhů vytvoření vlastního korpusu"NLP workflow engines" - GATE, OpenNLP, Treexautomatická komplexní analýza korpusu vizualizace analýzy a výsledků

Literatura

Prezentace z výuky 2012: http://ufal.mff.cuni.cz/~stranak/2012/index.htmlLearning Perl, Fifth Edition Learning the bash ShellLinux Pocket Guide

Garant

Mgr. Pavel Straňák, Ph.D.