Концепція у визначенні ABC
Різне / / July 04, 2021
Франсіско Кано, у травні. 2014
Ми бачимо, що не тільки сканер здатний розпізнавати літери та типи.
OCR або оптичне розпізнавання символів, перекладена на іспанську мову, - це технологія, яка має на меті наслідувати людське око, ця технологія намагається досягти того, шрифт (шрифт) з чого складається документ. Мова йде про звичайний сканер і досить потужне програмне забезпечення. Коли ми маємо на увазі потужне програмне забезпечення, ми маємо на увазі велике і широке база даних щоб мати можливість розпізнавати різні літери та їх відповідні типи.
Окрім програмного забезпечення, важливим є сканер. З цього часу дуже чутливий сканер краще зчитує пікселі документа чутливість це дозволить програмному забезпеченню робити менше помилок. Для програмного забезпечення це досить складно ні помилятися. Будь-який документ поміщається в сканер і виходить у форматі Формат Word або у форматі, який програма дозволяє вам вибрати. Після цього ви повинні виправити документ. Після виправлення ми можемо помістити його в pdf для спільного використання або архівування.
Одне з найкращих застосувань OCR - це сканування книг. Як, наприклад, колекція національної бібліотеки. Так само відома електронна книга, яку можна читати скрізь на планшетах типу ipad та android та в читачах електронна книга.
Приклад того, як сканується книга.
Технологія OCR має обмеження. Це не працює для стародавніх текстів чи для деяких причина перенесли фізичне погіршення. Це погіршення є цілком нормальним, коли йдеться про історичні документи, яким може бути вік до тисячі років. Такі типи документів, для яких роки зробили своє, досить невпізнанні для розглянутої технології OCR. Ці типи документів, як правило, архівуються зі сканами високої роздільної здатності в Фотографія так що громадськість може милуватися усіма деталями документа, не погіршуючи його.
Роздільна здатність в OCR говорить нам, наскільки детально сама система виявляє. Для чітких і чітких текстів звичайним є використання 300 dpi (крапок на дюйм). Це налаштовано із сканера. Один дюйм дорівнює 25400 міліметрів, отже, 300 пікселів для такої невеликої площі достатньо. У випадку з газетами тощо. там, де друк невеликий, а папір завжди трохи пошарпаний, оптимальною роздільною здатністю буде 600 dpi. Якщо ми скануємо з цією останньою роздільною здатністю, нам краще мати хороший сканер, оскільки загальний сканер коштує багато, щоб виконати дію з цією роздільною здатністю.
еволюція OCR проходить через a стає краще цієї системи. Поправляється яка вже триває в чернетка називається ІМПАКТ. Цей проект спрямований на обмін інформацією між різними установ штату та деякої компанії розробити програмне забезпечення OCR, яке відповідає всім вимогам до масової оцифровки.
Теми з OCR