Tanım ABC Kavramı
Çeşitli / / July 04, 2021
Francisco Cano, Mayıs ayında. 2014
Harfleri ve yazı tipini yalnızca bir tarayıcının tanımadığını görebiliriz.
OCR veya Optik Karakter Tanıma, İspanyolca'ya çevrilmiş, insan gözünü taklit etmeyi amaçlayan bir teknolojidir, bu teknoloji karakterlerin ve türün karakterini elde etmeye çalışır. yazı tipi (yazı tipi) hangi belgeden yapılır. Sıradan bir tarayıcıdan ve oldukça güçlü bir yazılımdan bahsediyoruz. Güçlü yazılımdan bahsettiğimizde, büyük ve geniş kapsamlı bir yazılımı kastediyoruz. veri tabanı farklı harfleri ve bunlara karşılık gelen türlerini tanıyabilme.
Yazılımın yanı sıra tarayıcı da önemlidir. Çok hassas bir tarayıcı belgenin piksellerini daha iyi okuyacaktır çünkü bu duyarlılık yazılımın daha az hata yapmasını sağlar. Yazılım için oldukça zor değil yanlış olmak. Tarayıcıya herhangi bir belge yerleştirilir ve Biçim Word veya programın seçmenize izin verdiği biçimde. Bundan sonra belgeyi düzeltmeniz gerekir. Düzeltildikten sonra paylaşmak veya arşivlemek için pdf'ye koyabiliriz.
OCR'nin harika kullanımlarından biri kitap taraması içindir. Örneğin, milli kütüphane koleksiyonu. Aynı şekilde ipad ve android tabletlerde ve okuyucularda her yerde okunabilen ünlü e.book. e-kitap.
Bir kitabın nasıl tarandığına dair bir örnek.
OCR teknolojisinin bir sınırlaması vardır. Eski metinler için ya da bazıları için işe yaramaz. sebep fiziksel bozulma yaşadı. Bin yıla kadar dayanabilen tarihi belgeler söz konusu olduğunda bu bozulma çok normaldir. Bu tür belgeler, yıllar içinde çok zorlanmış, söz konusu OCR teknolojisi için oldukça tanınmaz haldedir. Bu tür belgeler genellikle yüksek çözünürlüklü taramalarla arşivlenir. Fotoğrafçılık böylece halk bir belgenin tüm ayrıntılarını bozmadan hayranlıkla izleyebilir.
OCR'deki çözünürlük bize sistemin kendisinin ne kadar ayrıntı algıladığını söyler. Net ve tanımlanmış metinler için normal olan şey 300 dpi (inç başına nokta) kullanmaktır. Bu, tarayıcıdan yapılandırılır. Bir inç 25.400 milimetreye eşittir, bu kadar küçük bir alan için 300 piksel yeterlidir. Gazeteler veya benzerleri durumunda. baskının küçük olduğu ve kağıdın her zaman biraz yıpranmış olduğu durumlarda, optimum çözünürlük 600 dpi olacaktır. Bu son çözünürlükte tarama yaparsak, iyi bir tarayıcıya sahip olmak bizim için daha iyidir çünkü bu çözünürlükte işlemi tamamlamak ortak bir tarayıcının maliyeti çok fazladır.
evrim OCR bir daha iyi bu sistemin. Daha iyi Halihazırda devam etmekte olan bir taslak ETKİ denir. Bu proje, çeşitli kuruluşlar arasında bilgi paylaşımını amaçlamaktadır. kurumlar devlet ve bazı şirketler, toplu sayısallaştırma için tüm gereksinimleri karşılayan OCR yazılımı geliştirmek için.
OCR'deki konular