Konsep dalam Definisi ABC
Bermacam Macam / / July 04, 2021
Oleh Francisco Cano, pada bulan Mei. 2014
Kita dapat melihat bahwa tidak hanya pemindai yang mampu mengenali huruf dan jenis.
Itu Pengenalan Karakter OCR atau Optik, diterjemahkan ke dalam bahasa Spanyol, adalah teknologi yang bertujuan untuk meniru mata manusia, teknologi ini mencoba untuk mencapai bahwa karakter dan jenis huruf (jenis huruf) dari apa dokumen dibuat. Kita berbicara tentang pemindai biasa dan perangkat lunak yang cukup kuat. Ketika kami merujuk pada perangkat lunak yang kuat, yang kami maksud adalah perangkat lunak yang besar dan luas basis data untuk dapat mengenali huruf yang berbeda dan jenis yang sesuai.
Selain perangkat lunak, pemindai juga penting. Pemindai yang sangat sensitif akan lebih baik membaca piksel dokumen karena ini kepekaan itu akan memungkinkan perangkat lunak untuk membuat lebih sedikit kesalahan. Cukup sulit untuk perangkat lunak tidak salah. Dokumen apa pun ditempatkan di pemindai dan keluar di Format Word atau dalam format yang dapat Anda pilih oleh program. Setelah ini, Anda harus memperbaiki dokumen. Setelah diperbaiki, kami dapat memasukkannya ke dalam pdf untuk dibagikan atau diarsipkan.
Salah satu kegunaan besar OCR adalah dalam pemindaian buku. Seperti misalnya koleksi perpustakaan nasional. Demikian juga e.book terkenal yang dapat dibaca di mana saja di tablet jenis ipad dan android dan di pembaca ebook.
Contoh bagaimana sebuah buku dipindai.
Teknologi OCR memiliki keterbatasan. Ini tidak berfungsi untuk teks kuno atau untuk beberapa orang alasan telah mengalami kemunduran fisik. Kemerosotan ini sangat lumrah bila menyangkut dokumen sejarah yang usianya bisa mencapai seribu tahun. Jenis dokumen ini, yang telah memakan waktu bertahun-tahun, tidak dapat dikenali oleh teknologi OCR yang bersangkutan. Jenis dokumen ini biasanya diarsipkan dengan pindaian resolusi tinggi di Fotografi sehingga publik dapat mengagumi semua detail dokumen tanpa merusaknya.
Resolusi dalam OCR memberi tahu kita seberapa banyak detail yang dideteksi oleh sistem itu sendiri. Untuk teks yang jelas dan jelas, biasanya menggunakan 300 dpi (dots per inch). Ini dikonfigurasi dari pemindai. Satu inci sama dengan 25.400 milimeter, jadi 300 piksel untuk area sekecil itu sudah cukup. Dalam hal surat kabar atau sejenisnya. di mana cetakannya kecil dan kertasnya selalu sedikit usang, resolusi optimalnya adalah 600 dpi. Jika kita memindai pada resolusi terakhir ini, lebih baik kita memiliki pemindai yang baik karena membutuhkan banyak biaya untuk pemindai biasa untuk menyelesaikan tindakan pada resolusi ini.
Itu evolusi OCR melewati a menjadi lebih baik dari sistem ini. Menjadi lebih baik yang sudah berlangsung di minuman disebut DAMPAK. Proyek ini bertujuan untuk berbagi informasi di antara berbagai institusi negara bagian dan beberapa perusahaan untuk mengembangkan perangkat lunak OCR yang memenuhi semua persyaratan untuk digitalisasi massal.
Topik dalam OCR