Jak Začít?

Máš v počítači zápisky z přednášek
nebo jiné materiály ze školy?

Nahraj je na studentino.cz a získej
4 Kč za každý materiál
a 50 Kč za registraci!




Předmět Moderní metody zpracování řeči (FIT-MZD)

Na serveru studentino.cz naleznete nejrůznější studijní materiály: zápisky z přednášek nebo cvičení, vzorové testy, seminární práce, domácí úkoly a další z předmětu FIT-MZD - Moderní metody zpracování řeči, Fakulta informačních technologií, Vysoké učení technické v Brně (VUT).

Top 10 materiálů tohoto předmětu

Materiály tohoto předmětu

Materiál Typ Datum Počet stažení

Další informace

Cíl

Zmíníme se o metodách v současnosti implementovaných vprůmyslových aplikacích (jako GSM telefony nebo komerčně dostupnérozpoznávače), ale neopomeneme ani perspektivní metody existující zatímpouze ve výzkumných laboratořích. Zvláštní pozornost bude věnovánapostupům odvozeným na řečových datech a využití poznatků o tvorbě aslyšení řeči lidmi.

Osnova

Osnova přednášek: Základní pojmy: signálové vektory a matice parametrů,statistiky. Statistické modelování parametrů, modelování času stavovými sekvencemi. Skryté Markovovy modely (HMM), struktura, trénování. Rozpoznávání řeči pomocí HMM: Viterbiho algoritmus, předávání žetonů (token passing). ýslovnostní slovníky a jazykové modely. Tvorba řeči a odvozené parametry: LPC, log area ratios (LAR), line spectral pairs (LSP). Slyšení řeči a odvozené parametry - Mel-frekvenční cepstrální koeficienty, Perceptual linear prediction (PLP). Časové vlastnosti sluchu - RASTA filtrování. Trénování výpočtu příznaků na datech: lineární diskriminační analýza. Řečové databáze: standardy, obsah, mluvčí, anotace. Vokodéry a modelování jejich buzení, multipulsní a statistické modelování (GSM kódování). CELP kódování: dlouhodobý prediktor, kódové knihy. Kódování s velmi malým bitovým tokem. Současné metody identifikace a ověřování mluvčího.

Literatura

Moore, B.C.J., : An introduction to the psychology of hearing, Academic Press, 1989Jelinek, F.: Statistical Methods for Speech Recognition, MIT Press, 1998Fukunaga, K.: Introduction to Statistical Pattern Recognition, Academic Press, 1990 Vapnik, V. N.: Statistical Learning Theory, Wiley-Interscience, 1998 Dutoit, T.: An Introduction to Text-To-Speech Synthesis, Kluwer Academic Publishers, 1997Psutka, J.: Komunikace s s počítačem mluvenou řečí. Academia, Praha, 1995Gold, B., Morgan, N.: Speech and audio signal processing, John Wiley & Sons, 2000 Texty z http://www.fit.vutbr.cz/~cernocky/speech/

Požadavky

základní znalost číslicového zpracování signálů, absolvování základního kursu o zpracování řeči je výhodou.

Garant

doc. Dr. Ing. Jan Černocký

Vyučující

doc. Dr. Ing. Jan Černocký