Předmět Automatické zpracování textových dat (ATKL00345)
Na serveru studentino.cz naleznete nejrůznější studijní materiály: zápisky z přednášek nebo cvičení, vzorové testy, seminární práce, domácí úkoly a další z předmětu ATKL00345 - Automatické zpracování textových dat, Filozofická fakulta, Univerzita Karlova v Praze (UK).
Top 10 materiálů tohoto předmětu
Materiály tohoto předmětu
Materiál | Typ | Datum | Počet stažení |
---|
Další informace
Sylabus
Na ukázkových textech většího rozsahu si ukážemezákladní metody zpracování textu potřebné pro získání netriviálníchinformací a ověření hypotéz. Pravděpodobně použijeme texty děl KarlaČapka a různá další díla v jazycích dle zaměření frekventantů. Zpracování textu jako nutný základ (nejen) komputační linvistiky Proč používat unixový shell; nejzákladnější příkazy další příkazy pro manipulaci s texty textové editory vyhledávání pomocí regulárních výrazů využití regulárních výrazů pro úpravy textu základní principy formulace a ověřování hypotéz, aplikace na data, přesnost, úplnost, vypovídací hodnota výsledků odstranění diakritiky, segmentace na věty, tokenizace pravidlové automatické určení slovních druhů
Garant
Mgr. Pavel Straňák, Ph.D.