SKANERY


  1. Typy skanerów
  2. Rodzaje skanerów
  3. Zasada działania skanera
  4. Podstawowe parametry skanera
  5. Oprogramowanie OCR i ICR
  6. Pytania kontrolne

1. Typy skanerów

Skanery to urządzenia cyfrowe umożliwiające przenoszenie obrazu zapisanego w postaci tradycyjnej do pamięci masowej komputera. Skanowany obraz po przetworzeniu na postać cyfrową może być zapisany jako plik komputerowy do archiwizacji lub dalszej obróbki cyfrowej. Skaner umożliwia szybką cyfrową archiwizację zdjęć, dokumentów, gazet i wszelkiego innego tekstu zapisanego na papierze. Przy zastosowaniu specjalistycznego oprogramowania OCR (Optical Character Recognition - optyczne rozpoznawanie znaków) możliwe jest odczytanie przez komputer treści zeskanowanych dokumentów i formatowania ich w dowolnym edytorze tekstowym.




2. Rodzaje skanerów

Wśród skanerów możemy dokonać podstawowego podziału na :

Skanery ręczne (ruchome),

Skanery płaskie (stacjonarne):

- Biurowe,
- Skanery fotograficzne – filmowe,
- Skanery do slajdów.

Skanery kodów kreskowych.

Skanery bębnowe,




Skanery ręczne - to najprostsze z urządzeń tego typu. Ich obsługa polega na przeciąganiu czytnikiem nad wprowadzanym dokumentem. Szerokość skanowanego pola w starszych i tańszych modelach skanerów ręcznych nie przekracza 10 cm, toteż urządzenia tego typu nie nadają się do amatorskich zastosowań. Można za ich pomocą wczytać do programu graficznego zdjęcie standardowego formatu, lecz większe może sprawić problemy. Oprogramowanie takich skanerów przeważnie umożliwia sklejanie z kilku pasków stron większego formatu, nawet A4. Najczęściej skanery ręczne pracują w trybie czarno-białym 100 – 200 dpi.



Przykładowe współczesne skanery ręczne:


DocuPen R700 przenośny skaner wielkości długopisu wyposażony jest w system podwójnych rolek prowadzących i technologię kalibracji optycznej, co zapewnia sprawne i dokładne skanowanie. Potrafi skanować dokumenty w rozdzielczości 100 dpi oraz 200 dpi w trybie czarno-białym. Posiada pamięć flash o pojemności 2 MB, która mieści do 100 zeskanowanych stron w rozdzielczości 100 dpi, dołączono do niego dodatkowo program OCR ABBYY FineReader 6.0 Sprint.


Skaner  przenośny DocuPen R700
Rys 1. Skaner przenośny DocuPen R700 .
DocuPen R700 - Dane techniczne

Wymiary urządzenia: 216 mm x 18 mm
Waga: 57 g
Szerokość obszaru skanowania: 205 mm
Prędkość skanowania: 4-8 sekund na stronę
Rozdzielczość: 200 x 100 dpi; 200 x 200 dpi
Pamięć: 2 MB flash
Interfejs: Twain
Złącze: USB
Zasilanie: bateria litowo-jonowa, ładowana przez USB
Tryb skanowania: monochromatyczny
Wymagania systemowe:
Windows 98/2000/ME/XP, minimum 32 MB RAM,
60 MB miejsca na dysku twardym, port USB



Skaner przenośny C-Pen 20Rys 2. Skaner przenośny C-Pen 20 .

Skaner C-Pen 20

C-Pen 20 wyglądem przypomina marker z wbudowanym kablem USB. Skanowanie tekstu odbywa sie poprzez przesunięcia skanera nad linią tekstu. Dzięki wbudowanej aplikacji ABBYY FineReader 7.0 urządzenie zdaniem producenta cechuje wysoka dokładność rozpoznawania pisma. Odczytuje tekst drukowany napisany w 167 językach (w tym w j. polskim), cyfry, kody bankowe (OCR-A, OCR-B i MICR (E13B)) oraz jednowymiarowe kody kreskowe Warto zwrócić uwagę na szybkość odczytu tekstu, która wynosi 15 cm/ s.




br>





Skanery płaskie

Skanery płaskie Skaner płaski (ang. desktop scanner) – peryferyjne urządzenie wejściowe komputera służące do przetwarzania rzeczywistego obrazu do postaci cyfrowej. Tym obrazem na ogół jest ilustracja lub tekst. W skanerach płaskich skanowany dokument układa się w łożu urządzenia, po czym precyzyjny mechanizm przesuwa układ optyczny pod powierzchnią dokumentu. Obraz jest dzięki temu skanowany równomiernie na całej powierzchni (zwykle co najmniej A4), bez deformacji i szarpnięć, a przy okazji znacznie szybciej. Z punktu widzenia najpopularniejszych zastosowań - wczytywania zdjęć i dokumentów tekstowych jest to metoda optymalna.

Skanery fonograficzne – filmowe

Skaner służący do przetwarzania obrazów analogowych z błon fotograficznych (potocznie filmów) do postaci cyfrowej. Najpopularniejsze skanery do filmów służą do skanowania małoobrazkowych (35 mm) diapozytywów i negatywów, są jednak dostępne również skanery do filmów średnioformatowych. Skanowany materiał fotograficzny może być umieszczany w skanerze w postaci pojedynczych klatek lub krótkich odcinków filmu i wprowadzany jest do urządzenia po umieszczeniu ich w odpowiednich ramkach, lub też cały film może być wprowadzana do skanera za pomocą specjalnego adaptera. Nowoczesne skanery do filmów poza skanowaniem samego obrazu, bardzo często skanują również powierzchnię filmu w celu uzyskania informacji o jego uszkodzeniach i zabrudzeniach. Informacja ta jest wykorzystywana przez skaner do interpolacji obrazu w miejscach, gdzie występują uszkodzenia, przy jednoczesnym pominięciu wizualnie podobnych efektów będących zawartością obrazu.

Skaner do slajdów (ang. slide scanner)

Wyspecjalizowane urządzenie komputerowe do skanowania 35-milimetrowych slajdów, pozwalające przenieść ich zawartość do edycji w programie komputerowym. Obecnie zamiast skanera slajdów najczęściej wykorzystuje się skanery płaskie lub skanerów do filmów fotograficznych z dodatkowym osprzętem do mocowania slajdów.





 HP ScanJet G4050
Rys 3. HP ScanJet G4050 .

Przykładowe współczesne skanery płaskie:

Dwa skanery firmy HP - modele ScanJet G4050 i SkanJet G4010. Urządzenia wyposażono we wbudowane przystawki do przeźroczy, wysoka rozdzielczość i 96 bitowa głębia kolorów stawia w pozycji wysokiej klasy skanerów fotograficznych.

HP ScanJet G4050 to skaner fotograficzny, umożliwiający skanowanie w rozdzielczości 4800 x 9600 dpi i 96-bitowej głębi koloru. Dzięki wbudowanej przystawce możemy zeskanować jednocześnie szesnaście slajdów 35 mm lub trzydzieści klatek negatywu 35 mm. Urządzenie dysponuje technologią HP Real Life, umożliwiającą między innymi usuwanie efektu czerwonych oczu, wydobywanie szczegółów z ciemnych obszarów zdjęcia oraz usuwanie zadrapań. Użytkownik ma możliwość skanowania jednocześnie czterech fotografii (10x15 cm) i automatycznego zapisywania ich w osobnych plikach. Oczywiście w skanerze nie zabrakło ułatwiających obsługę przycisków szybkiego wybierania.

HP ScanJet G4010 różni się przede wszystkim od poprzednika przystawką umożliwiającą zeskanowanie jednocześnie pięciu slajdów 35 mm lub sześciu klatek negatywu 35 mm.



Epson Perfection V700 Photo
Rys 4. Epson Perfection V700 Photo .

Epson Perfection V700 Photo

Epson wprowadza na rynek nowy model fotograficznego skanera - Perfection V700 Photo. Skaner dysponuje systemem podwójnych soczewek (Dual Lens System) - jedna skanuje zdjęcia, dokumenty oraz klisze fotograficzne z rozdzielczością 6400, a druga - 4800 ppi. Urządzenie umożliwia skanowanie materiałów w formacie do 203x254 mm, z 48-bitową głębią kolorów i gęstością optyczną 4,0 Dmax. Dysponuje interfejsami USB 2.0 i IEEE 1394 (FireWire). Ponadto zastosowana w skanerze technologia Digital ICE automatycznie usuwa zabrudzenia dokumentów, takie jak kurz, zadrapania bądź odciski palców.







Kod kreskowy
Rys 5. Kod kreskowy.

Skanery kodów kreskowych.

Kod kreskowy, kod paskowy – to graficzna reprezentacja informacji poprzez kombinację ciemnych i jasnych elementów, ustaloną według przyjętych reguł budowy danego kodu. Kod kreskowy przeznaczony jest dla czytników elektronicznych. Ma na celu umożliwienie automatycznego wczytywania informacji. Głównym zastosowaniem jest identyfikacja produktów w szeroko pojętej logistyce. W trakcie czytania kodu, światło pochodzące z czytnika jest odbijane przez jasne elementy kodu (przerwy) a pochłaniane przez jego ciemne elementy (kreski, pola). Światło odbite od przerw powoduje powstanie w czytniku słabszych sygnałów elektrycznych, natomiast w wyniku braku odbicia (kreski) powstają sygnały silniejsze. W zależności od grubości kresek różna jest też długość trwania poszczególnych sygnałów. W wyniku tego powstaje ciąg sygnałów elektrycznych o różnym natężeniu i różnej długości. Jest to tylko nieco bardziej skomplikowane od zasady działania alfabetu Morse'a. Otrzymane w ten sposób impulsy elektryczne są tłumaczone przez dekoder czytnika na język cyfr, liter i innych znaków i przesyłane do komputera.

Skaner kodów kreskowych
Rys 6. Skaner kodów kreskowych.


Skaner bębnowy

Skaner bębnowy urządzenie peryferyjne komputera pozwalające na stworzenie postaci cyfrowej obrazu z oryginałów transparentnych (przeźroczystych) czyli slajdów lub odbitek fotograficznych.Nazwa wywodzi się od metody odczytu obrazu, w skanerach bębnowych, bowiem głównym elementem jest bęben, na którym umieszcza się przed procesem skanowania oryginały fotografii. W trakcie skanowania bęben obraca się z prędkością od kilkuset do ponad 1500 obrotów na minutę pod głowicą skanującą. Skanery bębnowe stosowane są w profesjonalnych studiach graficznych ze względu na wysoką jakość uzyskiwanych obrazów, charakteryzują sie wysoką rozdzielczością (do kilku tysięcy dpi) i gęstością optyczną 4.0 D i więcej, co pozwala np. uzyskać dobrej jakości obraz z przeznaczeniem do druku w formacie A3 z skanowanego slajdu 36 mm.






3. Zasada działania skanera



Element CCD (Charge Cuupled Devices)
Rys 7. Element CCD (Charge Cuupled Devices).

Materiały elektroniczne i elementy fotoczułe dla różnych typów urządzeń rejestracji cyfrowej są różne. W najpopularniejszej konstrukcji wykorzystuje się tzw. elementy CCD (Charge Cuupled Devices), tj. scalone układy elektroniczne (chipy) o sprzężeniu ładunkowym. Elementy CCD znajdują się na przesuwającej się wewnątrz skanera listwie. Przeznaczony do wprowadzenia do komputera oryginał umieszcza się na szklanym blacie, zwracając go analizowaną stroną do wnętrza urządzenia. Podczas skanowania dokument oświetlany jest przez lampę ksenonową, halogenową lub fluoroscencyjną. Specjalny układ optyczny kieruje wiązkę światła, by pokryć całą powierzchnię dokumentu.





Schemat dzialania skanera
Rys 8. Schemat dzialania skanera.

Układ optyczny

Układ optyczny w skanerze płaskim tworzą obiektyw soczewkowy i zwierciadła. W lepszych skanerach może być więcej obiektywów, co zwiększa tzw. rozdzielczość optyczną skanera. Odbita od materiału refleksyjnego (np. papierowego dokumentu) lub przepuszczona przez materiał transparentny (np. przeźrocze) wiązka światła, przechodzi przez filtry odpowiedzialne za poszczególne składowe koloru i trafia do elementów CCD. Otrzymany z nich sygnał odwzorowany w postaci cyfrowej po wstępnej obróbce przesyłany jest do komputera. Podczas skanowania kolorowych dokumentów do niedawna stosowano technikę trójprzebiegowego skanowania - każda z trzech analiz odpowiadała za jedną z trzech składowych barw RGB. Takie rozwiązanie miało jednak wiele wad, w tym np. długi czas oczekiwania oraz niedokładne nakładanie kolorów. Obecnie tego typu urządzeń praktycznie się nie spotyka, a współczesne jednoprzebiegowe skanery pracują dużo szybciej i z większą dokładnością. Analiza barw wykonywana jest jednocześnie dla wszystkich składowych, co znacznie poprawia zbieżność kolorów.

Światło białe odbite od kolorowego fragmentu oryginału przyjmuje barwę tego fragmentu. To barwne światło, po przejściu przez układ optyczny, pada na filtr dichroiczny, który rozdziela odbity sygnał świetlny na trzy jednakowe strumienie. Powstałe strumienie padają na trzy rzędy czujników fotoelektrycznych. Każdy element czujnika jest pokryty filtrem, odpowiednio: czerwonym R, zielonym G i niebieskim B. W wyniku tego następuje automatyczne odfiltrowanie trzech tzw. podstawowych barw składowych RGB (Red, Green, Blue). Każda składowa ma jasność odpowiednią do koloru światła odbitego od elementu oryginału. Im jasność podstawowej barwy składowej większa, tym większy ładunek, co powoduje, że większy prąd jest generowany przez element fotoczuły. Z kolei w przetworniku A/C sygnał analogowy (prąd) jest zamieniany na sygnał cyfrowy w celu utworzenia pliku cyfrowego. Plik ten może być rozpoznawany i reprodukowany w systemie komputerowym.Zasadę działania skanera płaskiego, w którym uwidoczniono omówione elementy budowy, przedstawia rysunek






4. Podstawowe parametry określające skanery

Rozdzielczość optyczna,
Dokładność reprezentacji barwnej,
Gęstość optyczna skanera.

Rozdzielczość optyczna skanera Od liczby elementów CCD na przesuwającej się pod szklanym blatem listwie zależy, z jaką poziomą dokładnością zostanie przetworzony badany oryginał. Kombinacja soczewek i układów CCD w skanerze określa rozdzielczość optyczną definiującą najmniejszy szczegół, który może być zreprodukowany przez skaner. Skaner o większej liczbie elementów światłoczułych przypadających na elementarny fragment obrazu potrafi rozpoznawać w nim więcej szczegółów tak, więc;

Rozdzielczość optyczna skanera płaskiego jednoobiektywowego to liczba pojedynczych elementów CCD na jednostkę długości listwy tworzącej element fotoczuły skanera.

Rozdzielczość optyczna jest mierzona w jednostkach ppi (pixels per inch) - pikselach na cal, niekiedy utożsamianych z dpi (dots per inch) - punktami na cal, co w skrócie oznacza liczbę analizowanych punktów obrazu (pikseli) na cal.

Przykład
Obliczymy rozdzielczość optyczną Ro skanera jednoobiektywowego. który w jednym rzędzie ma ułożonych 5000 elementów CCD, a szerokość obszaru skanowania wynosi 210 mm. Dane: liczba elementów fotoczułych l= 5000, szerokość skanowania s = 210 mm, 1 cal = 25,4 mm. Niewiadome: Ro Rozwiązanie. Ponieważ soczewki muszą zogniskować całą szerokość 210 mm na wszystkich elementach CCD, a każdy element CCD jest odpowiedzialny za wytworzenie jednego piksela w obrazie, więc Ro=l/s Podstawiając dane liczbowe Ro = (5000/210) * 25,4 = 600 ppi.

Rozdzielczości optyczne amatorskich i półprofesjonatnych skanerów płaskich są w zakresie 300-1200 ppi, natomiast profesjonalnych do 5000 ppi. Rozdzielczość optyczna skanera decyduje o możliwości uzyskiwania ostrego obrazu o maksymalnej rozdzielczości.


Dokładność odwzorowania barwy

Drugim z parametrów określających skaner jest jego dokładność odwzorowania. Parametr ten określa liczbę bitów opisujących jasność i natężenie barw składowych. Przykładowo skaner o dokładności odczytu równej 1 (1 bit) mógłby zapisać tylko dwie informacje - badany punkt jest "jasny" albo "ciemny". Przy zapisie 2- bitowym możliwe są już cztery wartości, przy zapisie 4- bitowym jest ich 16 itd. Urządzenie o dokładności odwzorowania równej 8 bitów na punkt potrafi odwzorować 256 wartości natężenia jasności, co przy zastosowaniu 8 bitów na każdą składową barwę RGB daje w efekcie liczbę około 16,7 milionów stanów natężenia jasności. Współczesne skanery oferują coraz częściej dokładność równą 96 bitowej głębi kolorów, przeważnie jednak urządzenia wyjściowe (np. karta graficzna) nie pozwalają na przeniesienie tak szerokiego zakresu wartości. Przy poważniejszych zastosowaniach tego typu nadmiarowe informacje są jednak użyteczne i przy wykorzystaniu profesjonalnego oprogramowania graficznego pozwalają na dużo większą swobodę działania.


Jakość odwzorowania obrazu

Największy wpływ na ocenę jakości skanerów ma analiza ostrości uzyskanych rezultatów wierność odwzorowania barw. Szczególną uwagę należy zwrócić na zachowanie właściwych proporcji w tonacji i kolorystyce oraz na nasycenie kolorów poszczególnych fragmentów skanowanego dokumentu.


Krzywa tonalna.

Dobre sterowniki skanerów są wyposażone w oprogramowanie, które umożliwia precyzyjne ustalanie sposobu skanowania według tzw, krzywej tonalnej, zwanej również krzywą odwzorowania tonów. Krzywa tonalna to wykres ilustrujący sposób zapisywania odczytanych z oryginału pozioinow jasności pikseli. Przedstawiono to na rys. 11. Na osi odciętych układu współrzędnych są poziomy jasności oryginału, które zobrazowano skalą szarości. Na osi rzędnych znajdują się analogiczne poziomy wynikowego obrazu cyfrowego. Gdy skaner ma zapisywać poziomy bez zmian, wtedy wykres jest linią prostą nachyloną pod kątem 45° . Jeżeli ma nastąpić inna interpretacja poziomów wyjściowych, to krzywą możemy kształtować.

Przykładowy kształt krzywej tonalnej
Rys. 9. Przykładowy kształt krzywej tonalnej

Dzięki krzywej tonalnej można zmieniać obraz cyfrowy względem oryginału np. zbyt jasnego, zbyt ciemnego, o zbyt małym kontraście. Efekt skanowania tego samego oryginału przy różnych ustawieniach krzywej odwzorowania tonów przedstawiono na rys. 12. Mniej skomplikowane sterowniki skanerów zamiast krzywej tonalnej umożliwiają zmianę jaskrawości (brightness) i kontrastu (contrast) obrazu względem oryginału.

Wyniki skanowania tego samego oryginału dla różnych 
      kształtów krzywej tonalnej
Rys. 10. Wyniki skanowania tego samego oryginału dla różnych kształtów krzywej tonalnej

Gęstość optyczna skanera


Gęstość optyczna skanera to wielkość charakteryzująca proces rejestrowania światła przez elementy fotoczułe i oznaczająca zakres gęstości optycznej D, który z oryginału może zarejestrować skaner, czyli różnicę między największą gęstością optyczną Dmax na materiale fotograficznym a najmniejszą Dmin (D = Dmax - Dmin). Im wartość D jest mniejsza, tym gorszej jakości czerń i zbliżone do nie] barwy (ciemne granaty, brązy itp.) uzyskuje się na obrazie z najlepszego nawet oryginału, czyli tym gorsze zinterpretowanie cieni oryginału w obrazie cyfrowym. Bardzo ciemne barwy staną się nierozróżnialne - mówi się o utracie szczegółów w cieniach. Jest to podstawowe niedomaganie w amatorskich skanerach płaskich. Efekt skanowania tego samego oryginału na dwóch skanerach różniących się rejestrowanymi gęstościami optycznymi przedstawiono na zdjęciach poniżej.

Efekt skanowania tego samego oryginału na skanerach o różnych gęstościach optycznych (różnica w cieniach)
Rys. 11. Efekt skanowania tego samego oryginału na skanerach o różnych gęstościach optycznych (różnica w cieniach)





5. Oprogramowanie OCR i ICR



Rozpoznawaniem skanowanego tekstu, zajmują się systemy typu OCR (Optical Character Recognition - optyczne rozpoznawanie znaków) lub bardziej zaawansowane tak zwane systemy ICR (ang. Intelligent Character Recognition - inteligentne rozpoznawanie znaków), których "inteligencja" polega na wykorzystywaniu algorytmów rozpoznawania wzorowanych na ludzkim sposobie percepcji.

Nowoczesne oprogramowanie ICR nie realizuje wyłącznie rozpoznawania pojedynczych znaków. Proces konwersji zdjęcia na tekst przebiega w czterech etapach, z których każdy wykorzystuje zaawansowane algorytmy, niejednokrotnie opracowane na bazie skomplikowanych teorii naukowych. Skuteczność działania każdego z etapów wpływa znacząco na jakość danego programu ICR.

Pierwszy etap to wstępne przetworzenie obrazu strony (Preprocessing). Na tym etapie automatycznie wykrywana i korygowana jest orientacja tekstu na stronie - program sprawdza, czy wydruk nie został włożony do skanera "do góry nogami" lub koryguje często występujące "przekręcenie tekstu" (gdy wiersze z tekstem nie są równoległe do podstawy dokumentu). Również w tym kroku program ustala, czy ma do czynienia z drukiem "czarno na białym", czy też wydruk jest negatywem - białe litery na czarnym tle. Podczas przetwarzania wstępnego niektóre programy ICR wykonują różnego typu filtracje, usuwając np. drobne kropki i zakłócenia, co może wpłynąć na poprawę skuteczności następnych etapów. W trakcie segmentacji (Atto Zoning lub Page Decomposition), drugiego etapu przetwarzania, program automatycznie wykrywa te fragmenty obrazu, które warto rozpoznawać. Rezultatem tej operacji jest wyróżnienie w obrazie dokumentu obszarów zawierających tekst (Text Zones), grafikę lub zdjęcia (Graphic Zones) oraz tabelek (Table Zones). Dodatkowo ustalana jest kolejność obszarów tekstowych, tak aby wynik rozpoznawania jak najdokładniej odzwierciedlał logiczny porządek tekstu w skanowanym dokumencie. Regułą jest to, że użytkownik może manualnie skorygować rezultat segmentacji.

Kolejny etap to rozpoznawanie znaków (Character Recognition). Podczas rozpoznawania obraz dokumentu, wiersz po wierszu, znak po znaku, zamieniany jest na tekst. Nowoczesne programy ICR wykorzystują co najmniej dwie, równolegle działające metody konwersji obrazu na znaki, a ostateczny rezultat tejże konwersji weryfikuje i ustala specjalny system ekspertowy. W rozpoznawaniu może aktywnie uczestniczyć użytkownik, "podpowiadając" komputerowi wówczas, gdy ten ma kłopot z rozpoznaniem określonego znaku. "Podpowiedź" taką program zapamiętuje i wykorzystuje przy przetwarzaniu kolejnych fragmentów tekstu, gdy napotka podobnie wyglądający znak.

Ostatnim krokiem jest analiza językowa (Language Analysis). W prostszych systemach OCR analiza językowa jest całkowicie oddzielona od etapu rozpoznawania znaków i sprowadza się do wykrywania literówek (Spell Checking) na podstawie słownictwa wybranego języka. W programach ICR algorytmy analizy językowej uczestniczą w rozpoznawaniu znaków i pełnią funkcję ekspertów przejmujących odpowiedzialność za ostateczny wynik, a wykorzystują do tego wiedzę zarówno o słownictwie, jak i o gramatyce.




6. Pytania kontrolne




Źródło:
www.pl.wikipedia.org/wiki/Skaner
www.zsaslawno.com/lekcje
www.PC World Komputer.pl
Kamiński, „Przetwarzanie informacji Cz. 1”, WSiP Warszawa 2004.
Opracował mgr Piotr Ochmiński Lublin 2007r.