정의 ABC의 개념
잡집 / / July 04, 2021
프란시스코 카노, 5 월. 2014
스캐너 만이 글자와 글자를 인식 할 수 있다는 것을 알 수 있습니다.
그만큼 OCR 또는 광학 문자 인식스페인어로 번역 된는 인간의 눈을 모방하는 것을 목표로하는 기술이며, 이 기술은 문자와 유형의 글꼴 (서체) 문서의 구성. 우리는 일반 스캐너와 매우 강력한 소프트웨어에 대해 이야기하고 있습니다. 강력한 소프트웨어를 언급 할 때 우리는 크고 광범위한 데이터 베이스 다른 문자와 해당 유형을 인식 할 수 있습니다.
소프트웨어 외에도 스캐너가 중요합니다. 매우 민감한 스캐너는 문서의 픽셀을 더 잘 읽을 수 있습니다. 감광도 소프트웨어가 실수를 덜 할 수 있습니다. 소프트웨어는 꽤 어렵습니다 아니 틀렸다. 모든 문서가 스캐너에 놓여지고 체재 Word 또는 프로그램에서 선택할 수있는 형식입니다. 그 후에 문서를 수정해야합니다. 수정되면 pdf에 넣어 공유하거나 보관할 수 있습니다.
OCR의 가장 큰 용도 중 하나는 책 스캔입니다. 예를 들어 국립 도서관의 컬렉션입니다. 마찬가지로, 아이 패드와 안드로이드 태블릿, 리더기 어디에서나 읽을 수있는 유명한 e.book 전자 책.
책을 스캔하는 방법의 예입니다.
OCR 기술에는 한계가 있습니다. 고대 텍스트 또는 일부에서는 작동하지 않습니다. 이유 신체적 악화를 겪었습니다. 이러한 열화는 최대 천년이 될 수있는 역사적 문서의 경우 매우 정상적인 현상입니다. 이러한 유형의 문서는 수년에 걸쳐 손실을 입었지만 문제의 OCR 기술에서는 인식 할 수 없습니다. 이러한 유형의 문서는 일반적으로 고해상도 스캔으로 보관됩니다. 사진술 대중이 문서의 모든 세부 사항을 손상시키지 않고 감탄할 수 있습니다.
OCR의 해상도는 시스템 자체가 얼마나 세부적으로 감지하는지 알려줍니다. 명확하고 정의 된 텍스트의 경우 300dpi (인치당 도트 수)를 사용하는 것이 일반적입니다. 이것은 스캐너에서 구성됩니다. 1 인치는 25,400mm와 같습니다., 따라서 이러한 작은 영역에는 300 픽셀이면 충분합니다. 신문 등의 경우 인쇄물이 작고 용지가 항상 약간 낡은 경우 최적의 해상도는 600dpi입니다. 이 마지막 해상도로 스캔하면 일반 스캐너가이 해상도에서 작업을 완료하는 데 많은 비용이 들기 때문에 좋은 스캐너를 갖는 것이 좋습니다.
그만큼 진화 OCR은 좋아진다 이 시스템의. 좋아진다 이미 진행중인 초안 IMPACT라고합니다. 이 프로젝트는 다양한 사람들과 정보를 공유하는 것을 목표로합니다. 기관 주와 일부 회사는 대량 디지털화에 대한 모든 요구 사항을 충족하는 OCR 소프트웨어를 개발합니다.
OCR 주제