परिभाषा एबीसी. में अवधारणा
अनेक वस्तुओं का संग्रह / / July 04, 2021
मई में फ्रांसिस्को कैनो द्वारा। 2014
हम देख सकते हैं कि न केवल एक स्कैनर अक्षरों और प्रकारों को पहचानने में सक्षम है।
ओसीआर या ऑप्टिकल कैरेक्टर रिकग्निशन, स्पेनिश में अनुवादित, एक ऐसी तकनीक है जिसका उद्देश्य मानव आंख का अनुकरण करना है, यह तकनीक यह प्राप्त करने की कोशिश करती है कि वर्ण और प्रकार फ़ॉन्ट (टाइपफेस) दस्तावेज़ किससे बना है। हम बात कर रहे हैं एक साधारण स्कैनर और काफी दमदार सॉफ्टवेयर की। जब हम शक्तिशाली सॉफ्टवेयर का उल्लेख करते हैं, तो हमारा मतलब एक बड़े और व्यापक सॉफ्टवेयर से है डेटाबेस विभिन्न अक्षरों और उनके संगत प्रकारों को पहचानने में सक्षम होना।
सॉफ्टवेयर के अलावा स्कैनर महत्वपूर्ण है। एक बहुत ही संवेदनशील स्कैनर दस्तावेज़ के पिक्सल को बेहतर ढंग से पढ़ेगा क्योंकि यह संवेदनशीलता यह सॉफ्टवेयर को कम गलतियाँ करने की अनुमति देगा। सॉफ्टवेयर के लिए यह काफी कठिन है नहीं गलत होना। किसी भी दस्तावेज़ को स्कैनर में रखा जाता है और वह अंदर आ जाता है प्रारूप शब्द या प्रारूप में जिसे प्रोग्राम आपको चुनने देता है। इसके बाद आपको दस्तावेज़ को सही करना होगा। एक बार सही हो जाने पर हम इसे साझा करने या संग्रह करने के लिए पीडीएफ में डाल सकते हैं।
ओसीआर के महान उपयोगों में से एक पुस्तक स्कैनिंग के लिए है। उदाहरण के लिए, राष्ट्रीय पुस्तकालय का संग्रह। इसी तरह, प्रसिद्ध ई.बुक जिसे आईपैड और एंड्रॉइड टैबलेट और पाठकों पर हर जगह पढ़ा जा सकता है ई-पुस्तक.
किसी पुस्तक को स्कैन कैसे किया जाता है इसका एक उदाहरण।
OCR तकनीक की एक सीमा होती है। यह प्राचीन ग्रंथों या कुछ के लिए काम नहीं करता है कारण शारीरिक गिरावट का सामना करना पड़ा है। जब ऐतिहासिक दस्तावेजों की बात आती है तो यह गिरावट बहुत सामान्य है जो एक हजार साल तक पुरानी हो सकती है। इस प्रकार के दस्तावेज़, जिनके लिए वर्षों से टोल लिया गया है, प्रश्न में ओसीआर तकनीक के लिए काफी अपरिचित हैं। इस प्रकार के दस्तावेज़ आमतौर पर उच्च रिज़ॉल्यूशन स्कैन के साथ संग्रहीत किए जाते हैं फोटोग्राफी ताकि जनता किसी दस्तावेज़ को खराब किए बिना उसके सभी विवरणों की प्रशंसा कर सके।
OCR में रिजॉल्यूशन हमें बताता है कि सिस्टम खुद कितनी डिटेल का पता लगाता है। स्पष्ट और परिभाषित टेक्स्ट के लिए सामान्य बात 300 डीपीआई (डॉट्स प्रति इंच) का उपयोग करना है। यह स्कैनर से कॉन्फ़िगर किया गया है। एक इंच 25,400 मिलीमीटर के बराबर होता है, इसलिए इतने छोटे क्षेत्र के लिए 300 पिक्सेल पर्याप्त हैं। समाचार पत्रों या इस तरह के मामले में। जहां प्रिंट छोटा होता है और कागज हमेशा थोड़ा सा पस्त होता है, इष्टतम रिज़ॉल्यूशन 600 डीपीआई होगा। यदि हम इस अंतिम रिज़ॉल्यूशन पर स्कैन करते हैं, तो हमारे लिए एक अच्छा स्कैनर होना बेहतर है क्योंकि इस रिज़ॉल्यूशन पर कार्रवाई को पूरा करने के लिए एक सामान्य स्कैनर के लिए बहुत खर्च होता है।
क्रमागत उन्नति OCR a. से होकर जाता है बेहतर होना इस प्रणाली का। बेहतर होना जो पहले से ही चल रहा है प्रारूप प्रभाव कहा जाता है। इस परियोजना का उद्देश्य विभिन्न के बीच जानकारी साझा करना है संस्थानों ओसीआर सॉफ्टवेयर विकसित करने के लिए राज्य और कुछ कंपनी जो बड़े पैमाने पर डिजिटलीकरण के लिए सभी आवश्यकताओं को पूरा करती है।
ओसीआर. में विषय