Konzept in Definition ABC
Verschiedenes / / July 04, 2021
Von Francisco Cano, im Mai. 2014
Wir sehen, dass nicht nur ein Scanner in der Lage ist, Buchstaben und Typen zu erkennen.
Das OCR oder optische Zeichenerkennung, ins Spanische übersetzt, ist eine Technologie, die darauf abzielt, das menschliche Auge zu emulieren. Diese Technologie versucht zu erreichen, dass die Charaktere und die Art der Schriftart (Schriftart) woraus ein Dokument besteht. Wir sprechen von einem gewöhnlichen Scanner und einer ziemlich leistungsstarken Software. Wenn wir von leistungsstarker Software sprechen, meinen wir ein großes und breites Datenbank um die verschiedenen Buchstaben und ihre entsprechenden Typen erkennen zu können.
Neben der Software ist der Scanner wichtig. Ein sehr empfindlicher Scanner wird die Pixel des Dokuments besser lesen, da dies Empfindlichkeit Dadurch kann die Software weniger Fehler machen. Es ist ziemlich schwierig für die Software nicht falsch liegen. Jedes Dokument wird in den Scanner eingelegt und ausgegeben Format Word oder in dem Format, das Ihnen das Programm zulässt. Danach müssen Sie das Dokument korrigieren. Nach der Korrektur können wir es als PDF zum Teilen oder Archivieren bereitstellen.
Eine der großartigen Anwendungen von OCR ist das Scannen von Büchern. Wie zum Beispiel die Sammlung der Nationalbibliothek. Ebenso das berühmte e.Book, das überall auf iPad- und Android-Tablets und auf Readern gelesen werden kann. ebook.
Ein Beispiel dafür, wie ein Buch gescannt wird.
Die OCR-Technologie hat eine Einschränkung. Es funktioniert nicht für alte Texte oder das für manche Grund körperliche Verschlechterung erlitten haben. Diese Verschlechterung ist bei historischen Dokumenten, die bis zu tausend Jahre alt sein können, ganz normal. Diese Art von Dokumenten, für die die Jahre ihren Tribut forderten, sind für die jeweilige OCR-Technologie kaum zu erkennen. Diese Art von Dokumenten werden in der Regel mit hochauflösenden Scans im Fotografie damit die Öffentlichkeit alle Details eines Dokuments bewundern kann, ohne es zu verschlechtern.
Die Auflösung in OCR sagt uns, wie viele Details das System selbst erkennt. Für klare und definierte Texte ist es normal, 300 dpi (dots per inch) zu verwenden. Dies wird vom Scanner aus konfiguriert. Ein Zoll entspricht 25.400 Millimeter, also sind 300 Pixel für einen so kleinen Bereich ausreichend. Bei Zeitungen oder dergleichen. Wo der Druck klein ist und das Papier immer etwas ramponiert ist, wäre die optimale Auflösung 600 dpi. Wenn wir mit dieser letzten Auflösung scannen, ist es für uns besser, einen guten Scanner zu haben, da es für einen normalen Scanner viel kostet, die Aktion bei dieser Auflösung abzuschließen.
Das Evolution OCR durchläuft a wird besser dieses Systems. Wird besser die bereits in a. läuft Entwurf WIRKUNG genannt. Dieses Projekt zielt darauf ab, Informationen zwischen verschiedenen Institutionen Staat und einigen Unternehmen OCR-Software zu entwickeln, die alle Anforderungen für die Massendigitalisierung erfüllt.
Themen in OCR