MPI_DS_P_03
Níže je uveden pouze náhled materiálu. Kliknutím na tlačítko 'Stáhnout soubor' stáhnete kompletní formátovaný materiál ve formátu PDF.
Digitalizace textu - OCR
25
Digitalizací tištěného textu rozumíme převod textu z tištěné
předlohy (obrázku textu, noviny, knihy, …) na posloupnost znaků
a jejich uložení v počítači – OCR (Optical Character Recognition)
Typicky se k digitalizaci textu používá skeneru, postup je zhruba
následující:
Tištěný text (předlohu) vložíme do skeneru a skenujeme
Vznikne
obrázek – datový soubor v rastrové grafice
Obrázek se načte do OCR programu, kde probíhá rozpoznávání
jednotlivých znaků (písmen) - z rastrové předlohy se rozpoznávají
samostatné objekty, které se srovnávají s předlohami písmen, a
pokud vyhovují, prohlásí se spojitá rastrová oblast za jeden znak
Eventuálně je provedena korektura – některá písmena nemusí být
rozpoznána správně
Nakonec
uložíme data do zvoleného typu souboru
27.2.2013
Moderní prostředky informatiky
© David Buchtela
Skener
26
Skener
je zařízení, které převádí
tištěnou předlohu na obrázek v
rastrové grafice
Obrazová předloha je po řádcích
osvětlována, tmavé oblasti
odrážejí méně světla než plochy
světlé
Odražené světlo dopadá
soustavou zrcadel na
světlocitlivý
snímač CCD (Charge Coupled
Device
), světelné senzory
obsažené v tomto snímači
převedou obrazovou informaci na
digitální signál (jeho intenzita
odpovídá množství odraženého
světla)
Intenzita odraženého světla je
pak chápána jako barva
jednotlivých bodů předlohy
27.2.2013
Moderní prostředky informatiky
© David Buchtela
© David Buchtela
27
Barva a barevné modely
27.2.2013
Moderní prostředky informatiky
© David Buchtela
Barva
28
Barva – směs záření o různých vlnových délkách
Část spektra viditelného záření, odraženého předmětem,
jehož barvu posuzujeme okem pozorovatele
Barva je závislá na mnoha okolních podmínkách: