Концепция в дефиниция ABC
Miscellanea / / July 04, 2021
От Франсиско Кано, през май. 2014
Виждаме, че не само скенерът е способен да разпознава букви и тип.
The OCR или оптично разпознаване на символи, преведена на испански, е технология, която има за цел да подражава на човешкото око, тази технология се опитва да постигне, че символите и вида на шрифт (шрифт) от какво е съставен документ. Говорим за обикновен скенер и доста мощен софтуер. Когато говорим за мощен софтуер, имаме предвид голям и широк база данни за да може да разпознава различните букви и съответстващите им типове.
Освен софтуера, скенерът е важен. Много чувствителен скенер ще прочете по-добре пикселите на документа след това чувствителност това ще позволи на софтуера да прави по-малко грешки. Това е доста трудно за софтуера не греши. Всеки документ се поставя в скенера и той излиза в Формат Word или във формата, който програмата ви позволява да изберете. След това трябва да коригирате документа. След като бъде коригиран, можем да го поставим в pdf за споделяне или архивиране.
Едно от най-големите приложения на OCR е сканирането на книги. Както например колекцията на националната библиотека. По същия начин известната електронна книга, която може да се чете навсякъде на таблети от тип ipad и android и в четци
електронна книга.Пример за това как се сканира книга.
OCR технологията има ограничение. Не работи за древни текстове или за някои причина са претърпели физическо влошаване. Това влошаване е съвсем нормално, когато става въпрос за исторически документи, които могат да бъдат на възраст до хиляда години. Този тип документи, за които годините взеха своето, са доста неразпознаваеми за въпросната технология OCR. Този тип документи обикновено се архивират със сканиране с висока разделителна способност в Фотография така че обществеността да може да се възхищава на всички детайли на даден документ, без да го влошава.
Разделителната способност в OCR ни казва колко подробно разпознава самата система. За ясни и дефинирани текстове е нормално да се използват 300 dpi (точки на инч). Това се конфигурира от скенера. Един инч се равнява на 25 400 милиметра, така че 300 пиксела за такава малка площ са достатъчни. В случай на вестници или други подобни. когато отпечатъкът е малък и хартията винаги е малко очукана, оптималната разделителна способност ще бъде 600 dpi. Ако сканираме с тази последна разделителна способност, по-добре е да имаме добър скенер, тъй като един общ скенер струва много, за да завърши действието при тази резолюция.
The еволюция OCR преминава през a става по-добре на тази система. Става по-добре което вече е в ход в a проект наречен IMPACT. Този проект има за цел да споделя информация между различни институции държава и някаква компания да разработят OCR софтуер, който отговаря на всички изисквания за масова дигитализация.
Теми в OCR