แนวคิดในคำจำกัดความ ABC
เบ็ดเตล็ด / / July 04, 2021
โดย Francisco Cano ในเดือนพฤษภาคม 2014
เราจะเห็นได้ว่าไม่เพียงแต่เครื่องสแกนเท่านั้นที่สามารถจดจำตัวอักษรและประเภทได้
OCR หรือการรู้จำอักขระด้วยแสงซึ่งแปลเป็นภาษาสเปนเป็นเทคโนโลยีที่มีจุดมุ่งหมายเพื่อเลียนแบบสายตามนุษย์เทคโนโลยีนี้พยายามที่จะบรรลุถึงตัวอักษรและประเภทของ แบบอักษร (แบบอักษร) เอกสารทำมาจากอะไร เรากำลังพูดถึงเครื่องสแกนธรรมดาและซอฟต์แวร์ที่ทรงพลังทีเดียว เมื่อเราอ้างถึงซอฟต์แวร์ที่ทรงพลัง เราหมายถึงซอฟต์แวร์ที่มีขนาดใหญ่และกว้าง ฐานข้อมูล เพื่อให้สามารถจดจำตัวอักษรต่าง ๆ และประเภทที่สอดคล้องกันได้
นอกจากซอฟต์แวร์แล้ว สแกนเนอร์ก็มีความสำคัญ เครื่องสแกนที่ละเอียดอ่อนมากจะอ่านพิกเซลของเอกสารได้ดีกว่าตั้งแต่นี้เป็นต้นไป ความไว จะช่วยให้ซอฟต์แวร์ทำผิดพลาดน้อยลง มันค่อนข้างยากสำหรับซอฟต์แวร์ ไม่ จะผิด. เอกสารใด ๆ ถูกวางลงในเครื่องสแกนและออกมาใน รูปแบบ Word หรือในรูปแบบที่โปรแกรมให้คุณเลือก หลังจากนี้คุณต้องแก้ไขเอกสาร เมื่อแก้ไขแล้ว เราสามารถใส่เป็น pdf เพื่อแชร์หรือเก็บถาวรได้
การใช้ OCR ที่ยอดเยี่ยมอย่างหนึ่งคือการสแกนหนังสือ เช่น การสะสมของหอสมุดแห่งชาติ ในทำนองเดียวกัน e.book ที่มีชื่อเสียงที่สามารถอ่านได้ทุกที่บนแท็บเล็ตประเภท iPad และ Android และในผู้อ่าน ebook.
ตัวอย่างวิธีการสแกนหนังสือ
เทคโนโลยี OCR มีข้อจำกัด ใช้ไม่ได้กับตำราโบราณหรือบางเล่ม เหตุผล ได้รับความเดือดร้อนทางกาย การเสื่อมสภาพนี้เป็นเรื่องปกติมากเมื่อพูดถึงเอกสารทางประวัติศาสตร์ที่อาจมีอายุถึงพันปี เอกสารประเภทนี้ซึ่งใช้เวลาหลายปีนั้นไม่สามารถจดจำได้สำหรับเทคโนโลยี OCR ที่เป็นปัญหา เอกสารประเภทนี้มักจะถูกเก็บถาวรด้วยการสแกนที่มีความละเอียดสูงใน การถ่ายภาพ เพื่อให้ประชาชนสามารถชื่นชมรายละเอียดทั้งหมดของเอกสารได้โดยไม่เสื่อมคุณภาพ
ความละเอียดใน OCR บอกเราว่าระบบตรวจจับรายละเอียดได้มากเพียงใด สำหรับข้อความที่ชัดเจนและกำหนดไว้ เป็นเรื่องปกติที่จะใช้ 300 dpi (จุดต่อนิ้ว) สิ่งนี้ถูกกำหนดค่าจากเครื่องสแกน หนึ่งนิ้ว เท่ากับ 25,400 มิลลิเมตรดังนั้น 300 พิกเซลสำหรับพื้นที่ขนาดเล็กดังกล่าวก็เพียงพอแล้ว ในกรณีของหนังสือพิมพ์หรือสิ่งที่คล้ายกัน โดยที่งานพิมพ์มีขนาดเล็กและกระดาษค่อนข้างเลอะเทอะ ความละเอียดที่เหมาะสมที่สุดคือ 600 dpi หากเราสแกนที่ความละเอียดสุดท้ายนี้ จะดีกว่าสำหรับเราที่จะมีเครื่องสแกนที่ดี เนื่องจากเครื่องสแกนทั่วไปมีค่าใช้จ่ายจำนวนมากในการดำเนินการที่ความละเอียดนี้
วิวัฒนาการ OCR ผ่าน a ดีขึ้น ของระบบนี้ ดีขึ้น ซึ่งได้ดำเนินการไปแล้วใน ร่าง เรียกว่าอิมแพ็ค โครงการนี้มีวัตถุประสงค์เพื่อแบ่งปันข้อมูลระหว่างต่างๆ สถาบัน รัฐและบริษัทบางแห่งเพื่อพัฒนาซอฟต์แวร์ OCR ที่ตรงตามข้อกำหนดทั้งหมดสำหรับการแปลงเป็นดิจิทัลจำนวนมาก
หัวข้อใน OCR