Concetto in definizione ABC
Varie / / July 04, 2021
Di Francisco Cano, a maggio. 2014
Possiamo vedere che non solo uno scanner è in grado di riconoscere lettere e caratteri.
Il OCR o riconoscimento ottico dei caratteri, tradotto in spagnolo, è una tecnologia che mira a emulare l'occhio umano, questa tecnologia cerca di ottenere il riconoscimento pixel per pixel dei caratteri e del tipo di carattere (carattere tipografico) di cosa è fatto un documento. Stiamo parlando di un normale scanner e di un software abbastanza potente. Quando ci riferiamo a un software potente, intendiamo un ampio e ampio Banca dati per essere in grado di riconoscere le diverse lettere e i loro tipi corrispondenti.
Oltre al software, lo scanner è importante. Uno scanner molto sensibile leggerà meglio i pixel del documento poiché questo sensibilità consentirà al software di commettere meno errori. È abbastanza difficile per il software non essere in errore. Qualsiasi documento viene inserito nello scanner ed esce in Formato Word o nel formato che il programma ti consente di scegliere. Dopodiché devi correggere il documento. Una volta corretto possiamo metterlo in pdf per condividerlo o archiviarlo.
Uno dei grandi usi dell'OCR è la scansione dei libri. Come per esempio, la collezione della biblioteca nazionale. Allo stesso modo il famoso e.book che si legge ovunque su tablet di tipo ipad e android e nei lettori ebook.
Un esempio di come viene scansionato un libro.
La tecnologia OCR ha un limite. Non funziona per i testi antichi o quello per alcuni Motivo hanno subito un deterioramento fisico. Questo deterioramento è molto normale quando si tratta di documenti storici che possono avere fino a mille anni. Questi tipi di documenti, per i quali gli anni hanno preso il sopravvento, sono abbastanza irriconoscibili per la tecnologia OCR in questione. Questi tipi di documenti vengono solitamente archiviati con scansioni ad alta risoluzione nel Fotografia in modo che il pubblico possa ammirare tutti i dettagli di un documento senza deteriorarlo.
La risoluzione in OCR ci dice quanti dettagli il sistema stesso rileva. Per testi chiari e definiti la cosa normale è usare 300 dpi (punti per pollice). Questo è configurato dallo scanner. Un pollice equivale a 25.400 millimetri, quindi 300 pixel per un'area così piccola sono sufficienti. Nel caso di giornali o simili. dove la stampa è piccola e la carta è sempre un po' rovinata, la risoluzione ottimale sarebbe di 600 dpi. Se eseguiamo la scansione a quest'ultima risoluzione, è meglio per noi avere un buon scanner poiché costa molto per uno scanner comune completare l'azione a questa risoluzione.
Il Evoluzione L'OCR passa attraverso un migliora di questo sistema. Migliora che è già in corso in a bozza chiamato IMPATTO. Questo progetto mira a condividere le informazioni tra i vari istituzioni stato e alcune società per sviluppare software OCR che soddisfi tutti i requisiti per la digitalizzazione di massa.
Argomenti in OCR