Koncept u definiciji ABC
Miscelanea / / July 04, 2021
Francisco Cano, u svibnju. 2014
Vidimo da nije samo skener sposoban prepoznati slova i tip.
The OCR ili optičko prepoznavanje znakova, prevedena na španjolski, tehnologija je čiji je cilj oponašati ljudsko oko, a ova tehnologija pokušava postići da likovi i vrsta font (slovo) od čega je sačinjen dokument. Govorimo o običnom skeneru i prilično moćnom softveru. Kad mislimo na moćan softver, mislimo na velik i širok baza podataka kako bi mogli prepoznati različita slova i njihove odgovarajuće vrste.
Osim softvera, važan je i skener. Vrlo osjetljiv skener bolje će čitati piksele dokumenta od ovog trenutka osjetljivost omogućit će softveru manje pogrešaka. Prilično je teško za softver ne biti u krivu. Bilo koji dokument se stavi u skener i izađe u Format Word ili u formatu koji vam program omogućuje odabir. Nakon toga morate ispraviti dokument. Jednom ispravljen, možemo ga staviti u pdf za dijeljenje ili arhiviranje.
Jedna od sjajnih upotreba OCR-a je skeniranje knjiga. Kao na primjer, zbirka nacionalne knjižnice. Isto tako, poznata e.book koja se svugdje može čitati na ipadu i android tabletima te na čitačima.
e-knjiga.Primjer kako se knjiga skenira.
OCR tehnologija ima ograničenja. To ne uspijeva za drevne tekstove ili za neke razlog pretrpjeli fizičko pogoršanje. To je pogoršanje sasvim normalno kada su u pitanju povijesni dokumenti koji mogu biti stari i do tisuću godina. Takve vrste dokumenata kojima su godine učinile danak prilično su neprepoznatljive za dotičnu OCR tehnologiju. Te se vrste dokumenata obično arhiviraju skeniranjima visoke rezolucije u Fotografija tako da se javnost može diviti svim pojedinostima dokumenta bez da ga pogoršava.
Rezolucija u OCR-u govori nam koliko detalja sam sustav otkriva. Za jasne i definirane tekstove uobičajeno je koristiti 300 dpi (točaka po inču). Ovo se konfigurira iz skenera. Jedan inč jednak je 25.400 milimetara, pa je dovoljno 300 piksela za tako malu površinu. U slučaju novina ili slično. tamo gdje je ispis mali, a papir uvijek pomalo istrošen, optimalna razlučivost bila bi 600 dpi. Ako skeniramo u ovoj posljednjoj razlučivosti, bolje je da imamo dobar skener jer zajednički skener puno košta da bi dovršio radnju u ovoj rezoluciji.
The evolucija OCR prolazi kroz postaje bolje ovog sustava. Postaje bolje koja je već u tijeku u a Nacrt pod nazivom IMPACT. Cilj ovog projekta je razmjena informacija između različitih ustanovama države i neke tvrtke da razviju OCR softver koji udovoljava svim zahtjevima za masovnu digitalizaciju.
Teme u OCR-u