Pojęcie w definicji ABC
Różne / / July 04, 2021
Francisco Cano, maj. 2014
Widzimy, że nie tylko skaner potrafi rozpoznawać litery i pisać.
OCR lub optyczne rozpoznawanie znaków, przetłumaczony na język hiszpański, to technologia, która ma na celu naśladowanie ludzkiego oka, ta technologia stara się osiągnąć, że postacie i rodzaj czcionka (krój pisma) z czego zrobiony jest dokument. Mówimy o zwykłym skanerze i dość potężnym oprogramowaniu. Kiedy mówimy o potężnym oprogramowaniu, mamy na myśli duże i szerokie Baza danych aby móc rozpoznać różne litery i odpowiadające im typy.
Oprócz oprogramowania ważny jest skaner. Bardzo czuły skaner lepiej odczyta piksele dokumentu, ponieważ to wrażliwość pozwoli to oprogramowaniu popełniać mniej błędów. Oprogramowanie jest dość trudne nie mylić się. Każdy dokument jest umieszczany w skanerze i wychodzi w Format Word lub w formacie, który program pozwala wybrać. Następnie musisz poprawić dokument. Po poprawieniu możemy umieścić go w formacie pdf do udostępnienia lub zarchiwizowania.
Jednym z najlepszych zastosowań OCR jest skanowanie książek. Jak na przykład zbiory Biblioteki Narodowej. Podobnie słynny e.book, który można czytać wszędzie na tabletach typu iPad i Android oraz w czytnikach
e-book.Przykład skanowania książki.
Technologia OCR ma swoje ograniczenia. To nie działa w przypadku starożytnych tekstów lub dla niektórych powód doznali fizycznego pogorszenia. To pogorszenie jest bardzo normalne, jeśli chodzi o dokumenty historyczne, które mogą mieć nawet tysiąc lat. Tego typu dokumenty, które od lat zbierają żniwo, są zupełnie nierozpoznawalne dla omawianej technologii OCR. Tego typu dokumenty są zwykle archiwizowane ze skanami w wysokiej rozdzielczości w Fotografia aby publiczność mogła podziwiać wszystkie szczegóły dokumentu, nie psując go.
Rozdzielczość w OCR mówi nam, ile szczegółów wykrywa sam system. W przypadku wyraźnych i zdefiniowanych tekstów normalne jest używanie 300 dpi (punktów na cal). Jest to konfigurowane ze skanera. Jeden cal to 25 400 milimetrów, więc 300 pikseli na tak mały obszar wystarczy. W przypadku gazet i tym podobnych. gdzie druk jest mały, a papier zawsze trochę poobijany, optymalna rozdzielczość to 600 dpi. Jeśli skanujemy w tej ostatniej rozdzielczości, lepiej jest mieć dobry skaner, ponieważ zwykły skaner kosztuje dużo, aby wykonać akcję w tej rozdzielczości.
ewolucja OCR przechodzi przez a dobrzeje tego systemu. Dobrzeje który już trwa w a wersja robocza o nazwie WPŁYW. Ten projekt ma na celu dzielenie się informacjami między różnymi instytucje państwo i jakaś firma opracuje oprogramowanie OCR, które spełnia wszystkie wymogi masowej digitalizacji. .
Tematy w OCR