Concept în definiție ABC
Miscellanea / / July 04, 2021
De Francisco Cano, în mai. 2014
Putem vedea că nu numai un scaner este capabil să recunoască litere și tip.
OCR sau recunoașterea optică a caracterelor, tradusă în spaniolă, este o tehnologie care urmărește emularea ochiului uman, această tehnologie încearcă să realizeze recunoașterea pixel cu pixel a caracterelor și tipul de font (font) din ce este făcut un document. Vorbim despre un scaner obișnuit și un software destul de puternic. Când ne referim la un software puternic, ne referim la un program larg și larg Bază de date pentru a putea recunoaște diferitele litere și tipurile lor corespunzătoare.
În afară de software, scanerul este important. Un scaner foarte sensibil va citi mai bine pixelii documentului de atunci sensibilitate va permite software-ului să facă mai puține greșeli. Este destul de dificil pentru software nu greșește. Orice document este plasat în scaner și acesta iese în Format Word sau în formatul pe care programul vă permite să îl alegeți. După aceasta, trebuie să corectați documentul. Odată corectat îl putem pune în pdf pentru a-l partaja sau arhiva.
Una dintre marile utilizări pentru OCR este scanarea cărților. Ca de exemplu, colecția bibliotecii naționale. La fel faimoasa carte electronică care poate fi citită peste tot pe tablete de tip iPad și Android și în cititoare carte electronică.
Un exemplu de scanare a unei cărți.
Tehnologia OCR are o limitare. Nu funcționează pentru texte antice sau pentru unele motiv au suferit deteriorări fizice. Această deteriorare este foarte normală atunci când vine vorba de documente istorice care pot avea o vechime de până la o mie de ani. Aceste tipuri de documente, pentru care anii și-au luat efectul, sunt destul de nerecunoscute pentru tehnologia OCR în cauză. Aceste tipuri de documente sunt de obicei arhivate cu scanări de înaltă rezoluție în Fotografie astfel încât publicul să poată admira toate detaliile unui document fără a-l deteriora.
Rezoluția din OCR ne spune cât de multe detalii detectează sistemul în sine. Pentru texte clare și definite, normal este să folosiți 300 dpi (puncte per inch). Aceasta este configurată din scaner. Un inch este egal cu 25.400 milimetri, deci 300 de pixeli pentru o zonă atât de mică sunt suficiente. În cazul ziarelor sau altora asemenea. în cazul în care tipărirea este mică și hârtia este întotdeauna puțin bătută, rezoluția optimă ar fi de 600 dpi. Dacă scanăm la această ultimă rezoluție, este mai bine pentru noi să avem un scaner bun, deoarece costă mult pentru un scaner comun să finalizeze acțiunea la această rezoluție.
evoluţie OCR trece printr-un devine mai bine a acestui sistem. Devine mai bine care este deja în desfășurare într-un proiect numit IMPACT. Acest proiect își propune să împărtășească informații între diverse instituții stat și unele companii să dezvolte software OCR care îndeplinește toate cerințele pentru digitalizarea în masă.
Subiecte în OCR