MPI_DS_P_02
Níže je uveden pouze náhled materiálu. Kliknutím na tlačítko 'Stáhnout soubor' stáhnete kompletní formátovaný materiál ve formátu PDF.
26
V dnešní době převažuje používání dvou skupin kódových stránek:
Kódové stránky ISO 8859-1 až ISO 8859-16 (LATIN1 – LATIN16)
(např. v operačním systému Linux)
Kódové stránky Windows 1250 až Windows 1258
(např. v operačním systému Windows)
V programech firmy Microsoft se tyto kódové stránky často souhrnně označují
zkratkou ANSI
, přičemž záleží na jazykové verzi programu, která konkrétní
kódová stránka je tím myšlena
Jedna
kódová stránka obvykle obsahuje znaky potřebné v jedné
geografické nebo jazykové oblasti
např. kódová stránka ISO 8859-1 je určena pro západoevropské
jazyky
(francouzštinu, němčinu, španělštinu, dánštinu atd.)
!!! V jednom textu nelze použít více kódových stránek !!!
kódové stránky ISO 8859-2 (LATIN2) a Windows 1250 pokrývají
všechny znaky využívané v češtině
!!! Význam znaků není zcela jednoznačný ani pro stejné jazyky !!!
1.3.2013
Moderní prostředky informatiky
© David Buchtela
Unicode
27
Tabulka Unicode
obsahuje znaky všech světových jazyků
v současné době obsahuje přes 100 000 znaků
v textu není problém používat znaky z více jazyků
Pro převod čísla znaku do dvojkové soustavy se používají různé
metody
nejpoužívanější se označují jako UTF-8, UTF-16 a UTF-32
(UTF = Unicode Transformation Format)
pokud je někde uvedeno pouze obecné „Unicode“, znamená to často
metodu UTF-16
Volba metody UTF má vliv např. na velikost reprezentace znaku:
při použití UTF-8 má reprezentace znaku velikost 1, 2, 3 nebo 4 bajty
(podle typu znaku)
při použití UTF-16 mají znaky 2 nebo 4 bajty
u UTF-32
mají všechny znaky 4 bajty
1.3.2013
Moderní prostředky informatiky
© David Buchtela
Srovnání kódování textu
28
Znakový repertoár
1.3.2013
Moderní prostředky informatiky