2018 Prednaska RMK 02
Níže je uveden pouze náhled materiálu. Kliknutím na tlačítko 'Stáhnout soubor' stáhnete kompletní formátovaný materiál ve formátu PDF.
• Využívá poznatků o lidském hlasu a hlasovém traktu
6
Obr. 2.3. Časové průběhy hovorového signálu
• Základní parametry lidského hlasu
-
perioda základního tónu hlasu T
0
-
základní hlasový kmitočet (pitch) v
rozsahu 50 až 400 Hz
Obr. 2.4. Fyziologický model hlasového traktu
7
• Elektrický model pro syntézu řeči je základem vokodérů s lineárním prediktivním kódováním LPC (Linear Predictive Coding)
-
zpracování signálů v časové oblasti
-
přijímací část tvoří syntezátor hlasu
-
filtr modeluje vlastnosti hlasového traktu
-
komunikačním kanálem tedy neprochází hovorový signál, ale jeho nejdůležitější parametry získané na
základě jeho analýzy
-
ve vysílací části se provádí segmentace signálu tj. jeho časové dělení na úseky o délce 10 až 30 ms
-
na výstupu kodéru je přenosová rychlost signálu menší než 4 kbit/s
-
reprodukovaná řeč má syntetický charakter
8
2.1.3 Hybridní zdrojové kódování
• Spojuje přednosti obou předchozích způsobů kódování
• Součástí zdrojového kodéru je i dekodér (stejný jako na přijímací straně), který již na
vysílací straně vytváří syntetizovaný signál jež se odečítá od signálu vstupního. Vzniklá
chyba se minimalizuje na základě smyslového (perceptuálního) vnímání.
-
Multiimpulzní buzení MPE (Multi Pulse Excitation) 8 až 16 kbit/s
-
Regulární buzení RPE (Regular Pulse Excitation) 8 až 16 kbit/s
-
Kódové buzení CELP (Code Excited Linear Prediction) 4 kbit/s a menší
Poznámka:
• Kodéry s plnou rychlostí FR (Full Rate)
• Kodéry s poloviční rychlostí HR (Half Rate)