Jak Začít?

Máš v počítači zápisky z přednášek
nebo jiné materiály ze školy?

Nahraj je na studentino.cz a získej
4 Kč za každý materiál
a 50 Kč za registraci!




Předmět Vyhledávání informací (KIV / IR)

Na serveru studentino.cz naleznete nejrůznější studijní materiály: zápisky z přednášek nebo cvičení, vzorové testy, seminární práce, domácí úkoly a další z předmětu KIV / IR - Vyhledávání informací, Fakulta aplikovaných věd, Západočeská univerzita v Plzni (ZČU).

Top 10 materiálů tohoto předmětu

Materiály tohoto předmětu

Materiál Typ Datum Počet stažení

Další informace

Obsah

1. Taxonomie úloh strojového zpracování přirozeného jazyka. Typické problémy a aplikace.2. Tokenizace, stemming, Porterův algoritmus, lematizace, POS značkování, parsing. Slovníky, editační vzdálenost.3. Vyhledávání informace, booleovský model, indexování.4. Podobnost dotazu s dokumentem, vektorový model dokumentu, výběr top hitů.5. Hodnocení vyhledávacího systému, standardní kolekce.6. XML vyhledávání, vektorový model v XML prostředí, vyhodnocování relevantnosti.7. Pravděpodobnostní modely pro IR. Maticové dekompozice, latentní sémantické indexování.8. Klasifikace textů, výběr vlastností, vyhodnocování klasifikace, klasifikace ve vektorovém prostoru. Detekce plagiátů, spamů.9. Shlukování textů, volba počtu shluků. Systémy shlukování zpravodajských textů.10.Extrakce informací, extrakce událostí, extrakce relací.11.Sumarizační metody, generování textu.12.Vyhledávání názorů. Aplikace na texty sociálních médií.13.Získávání informací z Webu, analýza obsahu, prohledávače Webu, distribuované indexy, Web jako graf, analýza struktury Webu, PageRank, HITS.

Získané způsobilosti

Po absolvování je student nejen schopen realizovat různé metody zpracování přirozeného jazyka, ale také získá profesionální znalosti o možnostech jejich využití v oblasti softwarového inženýrství, Business Intelligence, Social Media monitoring, odhalování závadných a společensky nebezpečných textů a názorů, analýzy názorů apod. Získá i schopnost používat formální metody pro konstruování takového softwaru.

Literatura

Manning, Christopher D.; Raghavan, Prabhakar; Schütze, Hinrich. Introduction to information retrieval. 1st pub. New York : Cambridge University Press, 2008. ISBN 978-0-521-86571-5.Baeza-Yates, R.; Ribeiro-Neto, Berthier. Modern information retrieval. Harlow : Addison-Wesley, 1999. ISBN 0-201-39829-X.Jurafsky, Daniel; Martin, James H. Speech and language processing : an introduction to natural language processing, computational linguistics, and speech recognition. 2nd ed. Upper Saddle River : Pearson/Prentice Hall, 2009. ISBN 978-0-13-504196-3.

Požadavky

Vypracování a obhájení semestrálního softwarového projektu. Získání alespoň 50% z možných bodů hodnocení projektu a alespoň 50% z možných bodů hodnocení zkoušky.

Garant

Doc. Ing. Josef Steinberger, Ph.D.