Понятие в определении ABC
Разное / / July 04, 2021
Франсиско Кано, май. 2014
Мы видим, что не только сканер способен распознавать буквы и шрифты.
В OCR или оптическое распознавание символов, переведенная на испанский язык, представляет собой технологию, которая имитирует человеческий глаз, эта технология пытается добиться того, чтобы символы и тип шрифт (гарнитура) из чего сделан документ. Речь идет об обычном сканере и достаточно мощном программном обеспечении. Когда мы говорим о мощном программном обеспечении, мы имеем в виду большой и широкий база данных чтобы уметь распознавать разные буквы и соответствующие им типы.
Помимо программного обеспечения важен сканер. Очень чувствительный сканер лучше прочитает пиксели документа, так как это чувствительность это позволит программе делать меньше ошибок. Для программного обеспечения это довольно сложно нет быть неправым. Любой документ помещается в сканер и выходит в Формат Word или в формате, который программа позволяет вам выбрать. После этого вам необходимо исправить документ. После исправления мы можем поместить его в pdf, чтобы поделиться или заархивировать.
Одно из прекрасных применений OCR - сканирование книг. Как, например, коллекция национальной библиотеки. Точно так же знаменитая электронная книга, которую можно читать везде на планшетах типа ipad и android, а также в ридерах. электронная книга.
Пример сканирования книги.
У технологии OCR есть ограничение. Это не работает для древних текстов или для некоторых причина испытали физический износ. Такое ухудшение является нормальным явлением, когда речь идет об исторических документах, возраст которых может достигать тысячи лет. Эти типы документов, на создание которых ушли годы, совершенно неузнаваемы для рассматриваемой технологии OCR. Эти типы документов обычно архивируются со сканированными изображениями с высоким разрешением в Фотография чтобы публика могла любоваться всеми деталями документа, не портя его.
Разрешение в OCR говорит нам, сколько деталей обнаруживает сама система. Для четких и четких текстов обычно используется разрешение 300 dpi (точек на дюйм). Это настраивается со сканера. Один дюйм равен 25 400 миллиметрам, поэтому 300 пикселей для такой небольшой площади вполне достаточно. В случае газет и т.п. там, где отпечаток небольшой, а бумага всегда немного потрепана, оптимальным разрешением будет 600 dpi. Если мы будем сканировать с этим последним разрешением, для нас лучше иметь хороший сканер, поскольку для обычного сканера выполнение действия с этим разрешением обходится дорого.
В эволюция OCR проходит через становится лучше этой системы. Становится лучше который уже идет в черновой вариант называется УДАР. Этот проект направлен на обмен информацией между различными учреждения государство и некоторая компания разработали программное обеспечение OCR, отвечающее всем требованиям массовой оцифровки.
Темы в OCR