Koncepció az ABC definícióban
Vegyes Cikkek / / July 04, 2021
Francisco Cano írta, májusban. 2014
Láthatjuk, hogy nem csak egy szkenner képes a betűk és a típus felismerésére.
A OCR vagy optikai karakterfelismerés, spanyolra fordítva, olyan technológia, amelynek célja az emberi szem utánzása, ez a technológia megpróbálja elérni, hogy a karakterek és a betűtípus (betűtípus) miből készül egy dokumentum. Közönséges szkennerről és elég erős szoftverről beszélünk. Ha nagy szoftverekre utalunk, akkor nagyokat és széleseket értünk adatbázis hogy képes legyen felismerni a különböző betűket és azok megfelelő típusait.
A szoftveren kívül a szkenner is fontos. Egy nagyon érzékeny szkenner ettől kezdve jobban olvassa a dokumentum képpontjait érzékenység ez lehetővé teszi a szoftver számára, hogy kevesebb hibát kövessen el. A szoftver számára meglehetősen nehéz nem tévedj. Bármelyik dokumentum a szkennerbe kerül, és kijön Formátum Word vagy abban a formátumban, amelyet a program választhat. Ezt követően ki kell javítania a dokumentumot. Miután kijavítottuk, feltölthetjük pdf-be megosztásra vagy archiválásra.
Az OCR egyik nagyszerű felhasználása a könyv beolvasása. Ami például a nemzeti könyvtár gyűjteményét illeti. Hasonlóképpen, a híres e-könyv, amely mindenhol olvasható ipad és android típusú táblagépeken és olvasókban ebook.
Példa egy könyv beolvasására.
Az OCR technológia korlátozott. Nem működik ókori szövegeknél, vagy egyeseknél ok fizikai romlást szenvedtek. Ez a romlás nagyon normális, ha olyan történelmi dokumentumokról van szó, amelyek akár ezer évesek is lehetnek. Az ilyen típusú dokumentumok, amelyekért az évek megtették a hatásukat, meglehetősen felismerhetetlenek a szóban forgó OCR technológia számára. Az ilyen típusú dokumentumokat általában nagyfelbontású beolvasással archiválják a Fényképezés hogy a nyilvánosság megcsodálhassa a dokumentum minden részletét anélkül, hogy rontaná.
Az OCR felbontása megmondja, hogy a rendszer mennyi részletességet érzékel. Világos és határozott szövegek esetén normális a 300 dpi (pont per hüvelyk) használat. Ezt a szkenner konfigurálja. Egy hüvelyk 25 400 milliméter, így egy ilyen kis területre 300 pixel elegendő. Újságok vagy hasonlók esetében. ahol a nyomtatás kicsi és a papír mindig kissé kopott, az optimális felbontás 600 dpi lenne. Ha ezen az utolsó felbontáson pásztázunk, jobb, ha jó szkennerünk van, mivel a közös szkenner számára sokba kerül a művelet végrehajtása ezen a felbontáson.
A evolúció Az OCR megy keresztül a jobb lesz ennek a rendszernek. Jobb lesz amely már folyamatban van a huzat IMPACT néven. A projekt célja az információk megosztása a különféle szervezetek között intézmények állam és néhány vállalat OCR szoftver fejlesztésére, amely megfelel a tömeges digitalizálás minden követelményének.
Témák az OCR-ben