Skenování knihy

Datum vydání: 2011-11-21 00:00:00; aktualizováno: 2019-11-12 18:07:17

Člověk občas potřebuje oskenovat pár listů nějaké knížky. Nikoli vždy tento pokus dopadne úspěšně. Buď jsou vidět ošklivé okraje knihy, nebo je soubor příliš veliký, případně je text zdeformovaný.

Počítám, že máte k dispozici obyčejný domácí skener a nikoli skenovací roboty.

Mé požadavky na výsledný dokument

Popíši zde postup, který se mně osvědčil, a který používám. Výstupem není text v elektronické podobě (získaný pomocí ORC), ale obrázek. Obrázek spňuje tyto mé požadavky:

  • je relativně malý (co se týká uložené velikosti – cca do 250 kB jedna strana);
  • dobře čitelný;
  • dobře tisknutelný na černobílé tiskárně při malé spotřebě toneru;
  • čistý (bílá je opravdu bílá), text opravdu černý;
  • uložený do png (nikoli v jpg, který ztrácí případným přeukládáním kvalitu).

Nastavení skeneru

Titulní strana knihy

Protože titulní strana je barevný obrázek, tak ten skenuji s rozlišením 300 dpi ve 24 bitové hloubce. Obrázek má rozměry cca 2550 px × 3509 px (záleží na skeneru, jedná se o rozměr o malinko větší než A4). Obrázek ukládám do jpg s kompresí 70 % (tj. střední kvalita 30% JPG). Případně ukládám do bitmapového formátu (např. bmp), ze kterého si následně udělám jpg např. ve Photoshopu v kvalitě 30 % (čím vyšší číslo, tím je kvalita větší). Nastavení kvality komprese u skeneru či grafického editoru se může trochu lišit. Je třeba volby ozkoušet a zvolit vhodný poměr kvalita versus velikost. Čím větší bude kvalita, tím bohužel větší bude výsledný soubor. Velikost souboru je cca 500 kB.

V grafickém programu ještě výsledný obrázek oříznu na velikost formátu knihy. Toto oříznutí je vhodnější udělat ještě před uložením do jpg, protože opakovaným přeukládáním do jpg se kvalita obrázku zhoršuje. Proto raději skenuji do bmp a následně provádím úpravy a přeuložení do jiného formátu.

Text knihy

Black and white

Text skenuji s vyšším rozlišením, konkrétně s 600 dpi černobíle (BW). Skenuji pouze černobíle, tj. čistě bílá, nebo černá. Při takto skenovaném textu je vhodnější volit vyšší dpi – 300 dpi je minimum, znatelně lepší je 600 dpi. Tento postup se mi osvědčil lépe, než skenovat ve stupních šedi či barevně. Sice i v grafických programech lze následně barevný obrázek či obrázek uložený v odstínech šedi předělat na černobílý, ale skener si s tímto převodem rovnou poradí obvykle lépe a odpadne vám další nutná práce úprav. Hodně záleží na druhu textu. Pokud se v textu vystytují šedé partie, je lepší použít skenování v šedé a do černobílé hásledně upravit grafickým programem (viz postup níže).

Pro černobílé skenování je nutné u skeneru nastavit tzv. práh. To je moment odstínu šedi, která bude už vnímána jako černá. Tento práh je vhodné si předem ozkoušet pro daný skener, případně můžete ponechat výchozí nastavení, které vám skener nabídne. Mně osobně se osvědčila mezní hodnota 90 (příp. 100, výchozí nastavení programu bylo na 110). Přitom rozpětí mezní hodnoty mám od 0 (bílá) do 255 (černá).

Z bmp do png

Skenuji do bitmapového bezeztrátového obrázku, který skener umí. Můj skener bohužel umí pouze bmp. Formát bmp vytváří strašně velký soubor, proto si bmp následně přeuložím grafickým programem Photoshop (či Gimp) do png. Pro automatické přeukládání obrázků lze využít nahrání akce, které Photoshop umí. Akce jdou volat i na více souborů najednou (tzv. dávkové zpracování), takže do png si můžete přeuložit hromadně např. všechny soubory z určitého adresáře.

Výhody černobílého obrázku

Černobílý soubor má oproti souboru v odstínech šedi či barevnému souboru dvě výhody:

  1. je malý, co se týká velikosti;
  2. text je pěkně černý;
  3. okolí textu je čistě bílé, a to včetně většiny okrajů či hřbetu knihy;
  4. tam, kde byl hřbet knihy či okraj knihy dosti tmavý, tak sice vznikne černá plocha, ale ta lze jednoduše odstranit a nahradit bílou barvou.

Úpravy v grafickém programu

Černá místa hřbetu knihy musí pryč

Vylití černých ploch bílou barvou

Pokud se vyskytnou při skenování nějaké černé plochy na okrajích, tak je v grafickém programu označíme (např. obdélníkem) a nahradíme je bílou barvou (vylejeme plechovkou s bílou barvou).

Tip: Pokud máte jako barvu pozadí nastavenu bílou, tak stačí zmáčknout Delete pro výmaz označené oblasti.

Oříznutí obrázku a obnovení původní velikosti v px

Pokud takových černých okrajů kolem textu je více, můžeme text nechat oříznout Nástrojem oříznutí (crop). Následně je vhodné zpátky zvětšit plátno na původní velikost obrázku. Pro jednotný vzhled obrázků je vhodné a dá se říci nutné, aby všechny vaše obrázky měly shodný rozměr co se týká pixelů. Také je vhodné, aby měly všechny obrázky shodné rozlišení. Pak se vám všechny obrázky vytisknou ve stejné kvalitě a shodně veliké – jeden jako druhý. Pokud se pustíte do ořezávání a měnění velikostí obrázku, tak na to dejte pozor. Buď velikost obrázku vůbec neměňte a jen případná černá místa vylejte bílou barvou nebo, pokud je černých a ošklivých ploch moc, tak si nástrojem crop označte část textu, ořízněte pomocí nástroje oříznutí obrázek, ale pak zpátky vraťte obrázku jeho původní velikost (bez přepočítávání velikosti), a to tím způsobem že zvětšíte plátno (tj. nikoli příkazem Obraz/Velikost obrazu). Ve Photoshopu se velikost plátna mění příkazem Obraz/Velikost plátna. Nastavte ji na původní výšku a šířku v px, kterou měl obrázek ještě před tím, než jste ho ořízli nástrojem oříznutí (crop).

Automatický podavač listů skeneru

Pokud jste skenovali větší množství textu a máte k dispozici skener, který má automatický podavač listů pro skenování, tak s okraji knihy nebývá takový problém. Pro takovéto skenování je však zapotřebí nejprve knihu rozřezat na samostatné listy. Bohužel se tím kniha zničí. Následně si můžete ve Photoshopu nahrát akci, která všechny obrázky na okrajích ořízne o určitou velikost a máte vystaráno.

Křivě naskenovaný text se musí narovnat

Zvláště při skenování listů knihy se vám mnohdy nepodaří dát knihu zcela rovně. Případné úsilí o opětovné naskenování a narovnání knihy a jejího textu je ve většině případů marné a pouhou ztrátou času. Pokud skener má v sobě zabudovanou volbu automatického narovnání textu, můžete ji zapnout a tím možná problém vyřešíte. Pokud tuto volbu nemáte, nebo vám tato volba nefunguje správně, tak holt naskenujete křivě dokument a následně ho narovnáme až v grafickém programu.

Protože jsme záměrně skenovali v černobílém režimu, nepůjde obrázek jednoduše oříznout s narovnáním (otočením) pomocí Nástroje oříznutí (crop). Nástroj oříznutí ve Photoshopu sice funguje, ale v černobílém režimu neumí zároveň otáčet výběrem (růžek označené oblasti se nezmění na otáčení). Přitom vhodným natočením vybrané oblasti způsobíme oříznutí a ihned srovnání (otočení) textu. Aby tato volba byla přístupná, musíme nejprve převést černobílý režim do odstínů šedi.

Převod z BW do odstínů šedi

Černobílý (BW – black and white) obrázek má aktuálně nastaven režim v menu Photoshopu: Obraz/Režim/Bitová mapa. Tento režim změníme na Obraz/Režim/Stupně šedi/Poměr velikosti 1. Případně bychom mohli převést obrázek ještě následně do RGB.

Nástroj oříznutí

Pro opravu naklonění textu použijeme patřičně otočený Nástroj oříznutí (crop). Při narovnání textu do vodorovné polohy pomocí Nástroje oříznutí se nám automaticky vytvoří vyhlazování textu. Text už není čistě černobílý, ale je ve stupních šedi (vyhlazovaný).

Samozřejmě po této operaci případně upravíme velikost dokumentu na původní rozměr pomocí nastavení velikosti plátna Obraz/Velikost plátna.

Převod z odstínů šedi zpět do BW

Po srovnání textu do vodorovné polohy je vhodné zpět převést obrázek ze stupních šedi čistě do černobílého režimu. Je to vhodné kvůli velikosti obrázku, která bude po převodu značně menší a na kvalitě to příliš neubere. Provedeme to volbou Obraz/Režim/Bitová mapa/50% práh.

Pokud bychom měli původně RGB obrázek a z RGB obrázku chtěli udělat BW, tak musíme nejprve udělat volbu Obraz/Režim/Stupně šedi a teprve pak zvolit Obraz/Režim/Bitová mapa.

Uložení souboru do PNG

Na závěr výsledný soubor uložím do PNG.

Tisk

Pro hromadný tisk knihy mohu opět použít nahrání a spuštění akce ve Photoshopu s tím, že obrázek nechám přizpůsobit na stránku A4. Lze tak hromadně vytisknout všechny dokumenty aniž bych se o něco starala.

Jinak tisk jednotlivých stránek lze také udělat přes standardní prohlížeč obrázků ve Windows – ve Windows fotogalerii. Nejlépe je opět zaškrtnout volbu Vyplnit snímek obrázkem. Nemusíte si pak hlídat nastavení dpi apod.

Skenování v odstínech šedi a převod do BW

Další možnost, jak dosáhnout černobílého obrázku je, že dokument naskenujeme v odstínech šedi. Např. při skenování nastavíme 16-bit Grayuscale při 600 dpi. Obrázek uložíme do bmp či png. Následně otevřeme obrázek v Gimpu. Ořízneme ho, případně zrotujeme a uložíme do PNG. Pro převod do černobílé, která zajistí lepší tisk a menší velikost, můžeme použít volbu v Gimpu: Barvy/Práh (127 a 255 výchozí nastavení).

Výhodou tohoto postupu je, že pokud byla skenovaná barva šedá (např. nějaká větší šedá či barevná plocha), dostaneme šedý plochu složenou z černých a bílých pixelů. Tohoto efektu při přímém skenování do černobílé varianty nedosáhneme, protože tam se celá plocha vybarví buď černě, nebo bíle. Nakonec můžeme převést obrázek z odstínů šedi do indexovaných barev volbou: Obrázek/Režim/Indexovaná…/Použít černobílou (1bitovou) paletu, čímž se velikost obrázku ještě o něco zmenší.

Tento postup se mi ve výsledku jeví jako nejlepší a univerzální.