Předmět Moderní metody zpracování řeči (FIT-MZD)
Na serveru studentino.cz naleznete nejrůznější studijní materiály: zápisky z přednášek nebo cvičení, vzorové testy, seminární práce, domácí úkoly a další z předmětu FIT-MZD - Moderní metody zpracování řeči, Fakulta informačních technologií, Vysoké učení technické v Brně (VUT).
Top 10 materiálů tohoto předmětu
Materiály tohoto předmětu
Materiál | Typ | Datum | Počet stažení |
---|
Další informace
Cíl
Zmíníme se o metodách v současnosti implementovaných vprůmyslových aplikacích (jako GSM telefony nebo komerčně dostupnérozpoznávače), ale neopomeneme ani perspektivní metody existující zatímpouze ve výzkumných laboratořích. Zvláštní pozornost bude věnovánapostupům odvozeným na řečových datech a využití poznatků o tvorbě aslyšení řeči lidmi.
Osnova
Osnova přednášek: Základní pojmy: signálové vektory a matice parametrů,statistiky. Statistické modelování parametrů, modelování času stavovými sekvencemi. Skryté Markovovy modely (HMM), struktura, trénování. Rozpoznávání řeči pomocí HMM: Viterbiho algoritmus, předávání žetonů (token passing). ýslovnostní slovníky a jazykové modely. Tvorba řeči a odvozené parametry: LPC, log area ratios (LAR), line spectral pairs (LSP). Slyšení řeči a odvozené parametry - Mel-frekvenční cepstrální koeficienty, Perceptual linear prediction (PLP). Časové vlastnosti sluchu - RASTA filtrování. Trénování výpočtu příznaků na datech: lineární diskriminační analýza. Řečové databáze: standardy, obsah, mluvčí, anotace. Vokodéry a modelování jejich buzení, multipulsní a statistické modelování (GSM kódování). CELP kódování: dlouhodobý prediktor, kódové knihy. Kódování s velmi malým bitovým tokem. Současné metody identifikace a ověřování mluvčího.
Literatura
Moore, B.C.J., : An introduction to the psychology of hearing, Academic Press, 1989Jelinek, F.: Statistical Methods for Speech Recognition, MIT Press, 1998Fukunaga, K.: Introduction to Statistical Pattern Recognition, Academic Press, 1990 Vapnik, V. N.: Statistical Learning Theory, Wiley-Interscience, 1998 Dutoit, T.: An Introduction to Text-To-Speech Synthesis, Kluwer Academic Publishers, 1997Psutka, J.: Komunikace s s počítačem mluvenou řečí. Academia, Praha, 1995Gold, B., Morgan, N.: Speech and audio signal processing, John Wiley & Sons, 2000 Texty z http://www.fit.vutbr.cz/~cernocky/speech/
Požadavky
základní znalost číslicového zpracování signálů, absolvování základního kursu o zpracování řeči je výhodou.
Garant
doc. Dr. Ing. Jan Černocký
Vyučující
doc. Dr. Ing. Jan Černocký