Concept en définition ABC
Divers / / July 04, 2021
Par Francisco Cano, en mai. 2014
Nous pouvons voir que non seulement un scanner est capable de reconnaître les lettres et le type.
le OCR ou reconnaissance optique de caractères, traduit en espagnol, est une technologie qui vise à imiter l'œil humain, cette technologie essaie de réaliser que les caractères et le type de police (police) de quoi est fait un document. Nous parlons d'un scanner ordinaire et d'un logiciel assez puissant. Lorsque nous parlons de logiciels puissants, nous entendons un vaste et large base de données être capable de reconnaître les différentes lettres et leurs types correspondants.
En dehors du logiciel, le scanner est important. Un scanner très sensible lira mieux les pixels du document puisque cela sensibilité cela permettra au logiciel de faire moins d'erreurs. C'est assez difficile pour le logiciel ne pas se tromper. Tout document est placé dans le scanner et il sort dans Format Word ou dans le format que le programme vous permet de choisir. Après cela, vous devez corriger le document. Une fois corrigé, nous pouvons le mettre en pdf pour le partager ou l'archiver.
L'une des grandes utilisations de l'OCR est la numérisation de livres. Comme par exemple, la collection de la bibliothèque nationale. De même, le fameux e.book qui se lit partout sur les tablettes de type ipad et android et dans les liseuses livre électronique.
Un exemple de la façon dont un livre est numérisé.
La technologie OCR a une limite. Cela ne fonctionne pas pour les textes anciens ou que pour certains raison ont subi une détérioration physique. Cette détérioration est tout à fait normale lorsqu'il s'agit de documents historiques pouvant aller jusqu'à mille ans. Ces types de documents, pour lesquels les années ont fait des ravages, sont assez méconnaissables pour la technologie OCR en question. Ces types de documents sont généralement archivés avec des numérisations haute résolution dans le La photographie afin que le public puisse admirer tous les détails d'un document sans le détériorer.
La résolution en OCR nous indique le niveau de détail que le système lui-même détecte. Pour des textes clairs et définis, il est normal d'utiliser 300 dpi (points par pouce). Ceci est configuré à partir du scanner. Un pouce équivaut à 25 400 millimètres, donc 300 pixels pour une si petite surface sont suffisants. Dans le cas de journaux ou similaires. où l'impression est petite et le papier est toujours un peu abîmé, la résolution optimale serait de 600 dpi. Si nous numérisons à cette dernière résolution, il est préférable pour nous d'avoir un bon scanner car cela coûte cher à un scanner ordinaire de terminer l'action à cette résolution.
La évolution L'OCR passe par un s'améliore de ce système. S'améliore qui est déjà en cours dans un projet appelé IMPACT. Ce projet vise à partager des informations entre divers établissements l'État et certaines entreprises pour développer un logiciel d'OCR qui répond à toutes les exigences de la numérisation de masse.
Sujets en OCR