Dzień dobry!

Witajcie po dłuższej przerwie w kolejnym odcinku naszego cyklu. W dzisiejszym wpisie postaramy się Wam krótko wytłumaczyć czym jest funkcjonalność OCR, jak działa, i dlaczego jest tak ważna dla systemów elektronicznego obiegu dokumentów.

Żeby jednak w ogóle zacząć rozmawiać o OCR, musimy wyjaśnić sobie dwa pojęcia: grafika rastrowa i warstwa tekstowa.

Każdy z nas przynajmniej raz w życiu rysował coś w programie Paint. Nie ma znaczenia co to było – korzystając z Painta na pewno zauważyliście, że Wasza grafika, a szczególnie okręgi, łuki czy linie krzywe nie mają idealnie gładkich krawędzi, ale są „kanciaste”. Dlaczego? Ponieważ obraz, który oglądacie, de facto składa się z pojedynczych punktów – pikseli. Piksele o różnych kolorach i o różnej jasności, dzięki swojemu małemu rozmiarowi zlewają się w całość dzięki czemu mamy wrażenie, że oglądamy rozmyty, jednorodny obraz. Niech za przykład posłuży nam nasze logo:


Obieg dokumentów, Automatyzacja procesów biznesowych, Optymalizacja procesów biznesowych, Portal pracowniczy, Elektroniczny obieg dokumentów, WEBCON BPS

Kiedy je znacznie powiększymy, zobaczymy, że tak naprawdę składa się właśnie z pojedynczych pikseli w różnych odcieniach niebieskiego i szarości. Jest to przykład grafiki rastrowej – czyli takiej, która składa się z wielu punktów (pikseli) w różnych kolorach.


Obieg dokumentów, Automatyzacja procesów biznesowych, Optymalizacja procesów biznesowych, Portal pracowniczy, Elektroniczny obieg dokumentów, WEBCON BPS

Dokładnie w taki sposób zapisywane są dokumenty podczas skanowania ich z wersji papierowej.

Spójrzcie proszę na ten skan tabeli z liczbami:


Obieg dokumentów, Automatyzacja procesów biznesowych, Optymalizacja procesów biznesowych, Portal pracowniczy, Elektroniczny obieg dokumentów, WEBCON BPS

Kiedy znacznie ją powiększymy, dokładnie zobaczymy pojedyncze piksele skanu.


Obieg dokumentów, Automatyzacja procesów biznesowych, Optymalizacja procesów biznesowych, Portal pracowniczy, Elektroniczny obieg dokumentów, WEBCON BPS

Dlaczego nas to interesuje? Z jednej, prostej przyczyny: kiedy dostaniemy skan w formie grafiki rastrowej, nie mamy możliwości łatwego pobrania danych z pliku z zeskanowanym dokumentem. Nasz komputer widzi go, jako zbiór punktów o określonym kolorze i położeniu, ale nie jest w stanie samodzielnie rozpoznać jakie znaki znajdują się na zeskanowanym dokumencie. Dla nas, jako użytkowników, znaczy to ni mniej, ni więcej, tylko konieczność ręcznego przepisania tekstu ze skanu.

Kiedy jednak danych jest dużo, a liczba dokumentów które mamy do przerobienia też jak na złość nie chce zmaleć, konieczne jest wsparcie. Przydałaby się nam przynajmniej możliwość kopiowania tekstu ze skanu, tak jak w przypadku plików np. Worda. Aby mieć taką możliwość, musimy nałożyć na nasz skan, czyli plik rastrowy, warstwę tekstową – czyli mówiąc krótko, wytłumaczyć komputerowi, że ten zbiór czarnych i białych kropek, który widzicie powyżej, to liczby „9” i „0”. I tu pojawia się główny bohater naszego artykułu, czyli oprogramowanie OCR.

Skrót OCR oznacza funkcjonalność optycznego rozpoznawania znaków (ang. Optical Character Recognition). Co może dla nas zrobić taki system? Przede wszystkim, utworzyć na skanie wspomnianą wyżej warstwę tekstową. Przez rozpoznanie kolorów oraz położenia konkretnych pikseli, system jest w stanie zdefiniować jaki konkretnie znak się pod nimi kryje. Dzięki temu, zaczyna działać chyba najczęściej używana para skrótów klawiszowych: Ctrl + C i Ctrl + V. Dlaczego? Bo w pliku ze skanem, poza grafiką rastrową, pojawił się rozpoznany przez OCR tekst.


Obieg dokumentów, Automatyzacja procesów biznesowych, Optymalizacja procesów biznesowych, Portal pracowniczy, Elektroniczny obieg dokumentów, WEBCON BPS

Na grafice powyżej widzicie zaznaczone znaki – a właściwie zaznaczone pola warstwy tekstowej. Możemy teraz wykorzystać funkcję „Kopiuj”:


Obieg dokumentów, Automatyzacja procesów biznesowych, Optymalizacja procesów biznesowych, Portal pracowniczy, Elektroniczny obieg dokumentów, WEBCON BPS

A następnie wkleić tak skopiowany tekst.

Korzystając z OCR należy koniecznie pamiętać o tym, że o ile dostępne w tej chwili rozwiązania rozpoznawania tekstu są już bardzo zaawansowane, to mogą zdarzyć się sytuacje kiedy tekst będzie rozpoznany błędnie. Przykładem niech będzie znów nasza tabelka z cyframi – może zdarzyć się, że zamiast „0” system rozpozna wielką literę „O”. Z pomocą przychodzą tu bardziej zaawansowane systemy, które potrafią niejako „z kontekstu” rozpoznać, jaki znak powinien pojawić się w rozpoznawanym tekście. To jednak nie wszystko – posiadając odpowiedni OCR możemy znacznie, znacznie więcej!

Jak jeszcze możemy zatem wykorzystać nasze oprogramowanie? Niech za przykład posłuży nam OCR AI, będący jednym z elementów platformy WEBCON BPS. Jest to jeden z bardziej zaawansowanych systemów, który nie tylko rozpoznaje pojedyncze znaki tekstu, ale łączy je w kompletne słowa czy zwroty, umożliwiając też zdefiniowanie konkretnych pól i wartości, jakie miałyby być wyszukiwane na dokumentach. Co nam to daje? Na przykład: ogromną automatyzację i przyspieszenie rozpoznawania faktur w przypadku organizacji, które przetwarzają ich duże ilości. OCR AI potrafi samodzielnie odczytać, rozpoznać i pobrać do systemu takie dane jak daty, kwoty, numery kont czy numery NIP. Dzięki temu, nie musimy przepisywać ich ręcznie do systemu księgowego, a bądźmy szczerzy – w przypadku, kiedy musimy przetworzyć kilkaset czy kilka tysięcy faktur miesięcznie, da się to przełożyć na konkretne oszczędności czasowe, a te – na zmniejszenie kosztów.

Na tym oczywiście możliwości się nie kończą – o tym, co jeszcze możemy zrobić, opowiemy jednak w jednym z naszych kolejnych wpisów. Tymczasem dziękujemy Wam za odwiedziny i zapraszamy do obserwowania naszych stron – dzięki temu dowiecie się pierwsi o nowych wpisach. Do zobaczenia!


Poznaj świat WEBCON BPS z

Obieg dokumentów, Automatyzacja procesów biznesowych, Optymalizacja procesów biznesowych, Portal pracowniczy, Elektroniczny obieg dokumentów, WEBCON BPS

Poznaj świat WEBCON BPS z

Obieg dokumentów, Automatyzacja procesów biznesowych, Optymalizacja procesów biznesowych, Portal pracowniczy, Elektroniczny obieg dokumentów, WEBCON BPS

Udostępnij artykuł