Mõiste definitsioonis ABC
Miscellanea / / July 04, 2021
Francisco Cano poolt, mais. 2014
Näeme, et mitte ainult skanner ei suuda tähti ja tüüpi ära tunda.
The OCR ehk märkide optiline tuvastamineon hispaania keelde tõlgitud tehnoloogia, mille eesmärk on jäljendada inimsilma. Selle tehnoloogia abil püütakse saavutada font (kirjatüüp) millest dokument on tehtud. Me räägime tavalisest skannerist ja üsna võimsast tarkvarast. Kui viidame võimsale tarkvarale, peame silmas suurt ja laia andmebaasi osata ära tunda erinevaid tähti ja neile vastavaid tüüpe.
Peale tarkvara on skanner oluline. Sellest ajast alates loeb väga tundlik skanner dokumendi piksleid paremini tundlikkus see võimaldab tarkvaral vähem vigu teha. Tarkvara jaoks on see üsna keeruline mitte ole vale. Mis tahes dokument asetatakse skannerisse ja see tuleb sisse Vormindus Word või vormingus, mille programm võimaldab teil valida. Pärast seda peate dokumendi parandama. Kui see on parandatud, võime selle jagada pdf-failina, et seda jagada või arhiivida.
OCR-i üks suuremaid kasutusviise on raamatute skaneerimine. Nagu näiteks rahvusraamatukogu kogu. Samamoodi kuulus e-raamat, mida saab lugeda kõikjal ipadi ja androidi tüüpi tahvelarvutites ning lugejates
e-raamat.Näide raamatu skaneerimisest.
OCR-tehnoloogial on piirang. See ei tööta iidsete tekstide ega mõne jaoks põhjust on füüsiliselt halvenenud. See halvenemine on väga normaalne, kui tegemist on ajalooliste dokumentidega, mis võivad olla kuni tuhat aastat vanad. Seda tüüpi dokumendid, mille jaoks aastad on oma osa maksnud, on kõnealuse OCR-tehnoloogia jaoks üsna tundmatud. Seda tüüpi dokumendid arhiveeritakse tavaliselt suure eraldusvõimega skannimisega Fotograafia et üldsus saaks imetleda dokumendi kõiki üksikasju ilma seda halvendamata.
OCR-i eraldusvõime ütleb meile, kui palju üksikasju süsteem ise tuvastab. Selgete ja määratletud tekstide puhul on normaalne kasutada 300 dpi (täppi tolli kohta). See on konfigureeritud skannerist. Üks toll on võrdne 25 400 millimeetriga, seega piisab 300 pikslist nii väikese ala jaoks. Ajalehtede vms puhul. seal, kus trükiseid on vähe ja paber on alati natuke räsitud, oleks optimaalne eraldusvõime 600 dpi. Kui skannime selle viimase eraldusvõimega, on parem, kui meil on hea skanner, kuna selle eraldusvõimega toimingu lõpuleviimine ühise skanneri jaoks maksab palju.
The evolutsioon OCR läbib a saab paremaks selle süsteemi. Läheb paremaks mis on juba käimas a mustand nimega IMPACT. Selle projekti eesmärk on jagada teavet erinevate inimeste vahel institutsioonid riik ja mõni ettevõte arendama OCR-tarkvara, mis vastab kõigile massdigiteerimise nõuetele.
Teemad OCR-is