OCR क्या है?What is OCR in Hindi?OCR Full Form in Hindi

क्या आपने ऐसी तकनीक के बारे मे सुना है जो किसी छवि के इरादे को समझ सकता है या पढ़ सकता है और उसे टेक्स्ट फॉर्मेट में बदल सकता है।

आपने खरीदारी करते समय अक्सर शॉपिंग मॉल मे बार कोड को स्कैन करते हुए देखा होगा। क्या आपने कभी सोचा है कि बार कोड के पीछे कौन सी रहस्यमयी चीज छिपी हुई हैं।

वे सूचनाओं की व्याख्या कैसे करते हैं। कैसे एक मशीन इन छिपे हुए सूचनाओं को बहुत ही आसानी से पढ़ सकता है, जबकि एक इनसान ऐसा नहीं कर सकता।

दरअसल, इसके पीछे एक तकनीक काम करता है जिसे OCR कहा जाता है। इस लेख में आप OCR क्या है इसके बारे में सब कुछ जानेंगे साथही OCR ka full form क्या है और यह कैसे काम करता है इसके बारे में भी चर्चा करेंगे?

OCR full form in Hindi

यह Optical Character Recognition का संक्षिप्त रूप है। यह सॉफ्टवेयर के माध्यम से चलने वाली एक तकनीक है जो एक छवि के अन्दर कि पाठ को आसानि से पहचानता है। OCR आमतौर पर दस्तावेज़ों और छवियों के टेक्स्ट को पहचानने के लिए इस्तेमाल किया जाता है।

कई कारण है जौ इसकी कार्यान्वयन को चुनौतीपूर्ण बनाता है, जैसे कि विभिन्न प्रकार के फोंट या अक्षर निर्माण के लिए उपयोग की जाने वाली विधियाँ। एक OCR कार्यान्वयन जटिल हो सकता है अगर गैर-डिजिटल हस्तलेखन नमूने टाइप किए गए लेखन के बजाय इनपुट के रूप में उपयोग किया जाए तो।

दरसल, इस पूरी प्रक्रिया में एक श्रृंखला शामिल होता है, जिसमें तीन मुख्य उद्देश्य होते हैं: छवि की पूर्व-प्रसंस्करण, चरित्र पहचान, और प्रसंस्करण।

संक्षेप में कहा जाए तो,इसके सॉफ्टवेयर छवियों या किसी भौतिक दस्तावेजों को डिजिटल प्रारुप मे सहजने और खोजने योग्य रूप में बदलने में मदद करता है। text extraction tools, PDF से .txt converter और Google का इमेज सर्च फंक्शन को इसके उदाहरण के तौर पर लिया जा सकता है।

What is OCR in hindi?

OCR (ऑप्टिकल कैरेक्टर रिकॉग्निशन) एक ऐसी तकनीक है जो सभी प्रकार की छवियों को पहचान सकती है। यह तकनीक हस्तलिखित या मुद्रित वर्णों को पहचानती है और उन्हें मशीन-पठनीय वस्तु, डिजिटल डेटा में परिवर्तित करती है। इस सॉफ़्टवेयर का उपयोग किसी भी भौतिक कागज़ या दस्तावेज़ या किसी भी छवि को मशीन-पठनीय कोड में बदलने के लिए किया जाता है।

मान लीजिए आपके पास एक सीरियल नंबर या कोई कोड है जिसमें कुछ संख्याएँ और अक्षर हैं जिन्हें आपको डिजिटाइज़ करना है। इस तकनीक की मदद से आप इन कोड को आसानी से डिजिटल आउटपुट में बदल सकते हैं। OCR उस वस्तु की वास्तविक प्रकृति को नहीं बदलता है जिसे आप स्कैन करना चाहते हैं।

ऑप्टिकल कैरेक्टर रिकॉग्निशन उस वस्तु को देखता है जिसे आप डिजिटल फ़ॉर्मेट में बदलना चाहते हैं। उदाहरण के लिए, यदि आप किसी शब्द को स्कैन करते हैं तो यह मशीन लर्निंग तकनीक की मदद से अक्षरों को सीखता और पहचानता है और फिर उसे डिजिटल फ़ॉर्मेट में बदल देता है।

यह कैसे काम करता है?

सबसे पहले, Optical Character Recognition द्बारा भौतिक दस्तावेज़ को स्कैन करता है और एक स्कैनर के जरिए उनकी प्रतिलिपि बनाता है। एक बार सभी दस्तावेज़ों को स्कैन और कॉपी कर लेने के बाद, उन्हे एक सॉफ़्टवेयर के माध्यम से black-and-white संस्करणो में बदला जाता है।

उसके बाद, स्कैन की गई छवि का विश्लेषण उसके प्रकाश और अंधेरे क्षेत्रों के लिए किया जाता है। अंधेरे क्षेत्रों को वर्णों के रूप में पहचाना जाता है, जबकि सफेद या हल्के क्षेत्रों को इस पाठ की पृष्ठभूमि के रूप में पहचाना जाता है। फिर काले क्षेत्रों को वर्णानुक्रमिक अक्षरों या संख्यात्मक अंकों को संसाधित किया जाता है।

फिर दो प्रकार के एल्गोरिदम का उपयोग करके वर्णों की पहचान की जाती है जिन्हें 1) पैटर्न पहचान 2) फ़ीचर पहचान के रूप में जाना जाता है। यह छवि की संरचनाओ का भी विश्लेषण करता है। यह पेज को टेक्स्ट, टेबल या इमेज ब्लॉक जैसे तत्वों में विभाजित करता है।

एक बार इन सभी तत्वों को अलग कर लेने के बाद, OCR प्रक्रिया उन्हें पैटर्न छवियों के साथ तुलना करता है। सभी संभावित प्रक्रियाओ को संसाधित कर लेने के बाद, कार्यक्रम आपको अन्तिम रेजल्ट प्रस्तुत करता है।

ocr software technology in hindi, OCR full form in Hindi

Types of OCR in hindi

ये विभिन्न प्रकार के होते हैं, जिनमें से अधिकतर उपयोग किए जाने वाले OCR नीचे दिए गए हैं: –

  • Intelligent Word Recognition:- Intelligent Word Recognition (IWR) कर्सिव टेक्स्ट या हस्तलिखित टेक्स्ट को कैप्चर करता है। इसका एल्गोरिथ्म अलग-अलग कैरेक्टरस को चुनने के बजाय एक संपूर्ण अप्रतिबंधित हस्तलिखित शब्द को पहचान करता है और उस पर काम करता है।
  • Intelligent Word Recognition:- Intelligent Word Recognition (IWR) कर्सिव टेक्स्ट या हस्तलिखित टेक्स्ट को कैप्चर करता है। इसका एल्गोरिथ्म अलग-अलग कैरेक्टरस को चुनने के बजाय एक संपूर्ण अप्रतिबंधित हस्तलिखित शब्द को पहचान करता है और उस पर काम करता है।
  • Intelligent Character Recognition:- Intelligent Character Recognition (ICR) यह हस्तलिखित या कर्सिव टेक्स्ट को कैप्चर करता है और एक समय में एक ही कैरेक्टर की पहचान करता है और उस पर काम करता है।
  • Optical Word Recognition:- Optical Word Recognition (OWR) इसका लक्ष्य टाइप किए गए टेक्स्ट को वर्डवाइज करना होता है।
  • Optical Character Recognition:- यह टाइप किए गए टेक्स्ट को कैप्चर करता है और एक बार में एक कैरेक्टर पर काम करता है।
  • Optical Mark Recognition:- संक्षेप में (OMR) जो एक दस्तावेज़ के पैटर्न को पहचानकर इंसानों द्वारा इनपुट डेटाओ को एकत्रीत करता है।

इनका प्रयोग कहा किया जाता है?

कई विभिन्न प्रकार के क्षेश्र या उद्योग है जहा Optical Character Recognition का उपयोग किया जाता है, इनमे से कुछ उद्योग निम्नलिखित हैं:

  • Banking:- बैंकिंग जेसे उद्योग जहा ऋण , जमा चेक या कोई अन्य जटिल वित्तीय लेनदेन मे कागजी दस्तावेजों को व्यवस्थित रूप से प्रबंधित करने और सत्यापित करने के लिए इनको उपयोग मे लाया जाता है। बैंकिंग या वित्तीय संस्हानो जेसे महत्वपूर्ण स्हानो मे धोखाधड़ी की रोकथाम और लेनदेन की सुरक्षा को बढ़ाने के लिए ये एक अहम भुमिका निभाता है।
  • Health care:- अस्पतालो मे रोगीओ की उपचार के दोरान परीक्षण के रिकॉर्ड तथा बीमा भुगतान जैसे कामो को डिजिटलि प्रबंधित करने मे भी इसका इत्तेमाल किया जाता है।
  • Logistics:- लॉजिस्टिक्स कंपनियां पैकेजेस के लेबल, चालान, रसीदे जैसी दस्तावेजों को अधिक कुशलता से ट्रैक करने के लिए OCR का इत्तेमाल किया जाता है।
  • Traveling:- Optical Character Recognition तकनीक ने tour और traveling को बहुत आसान बना दिया है। चाहे आप आपने लिए फ्लाइट कि टिकिट या होटल बुक कर रहे हों, एयरपोर्ट या होटल के कमरे में चेक-इन कर रहे हों, हर जगह पर इस तकनीक का इस्तेमाल आपको देखनेको मिलेंगे। यात्रीओ कि भीर को सम्भालने और ग्राहक अनुभव को बढ़ाने के लिए हर जगह OCR तकनीको का उपयोग किया जा रहा है।

अधिकांश हवाई अड्डे और मोबाइल यात्रा ऐप सुरक्षा के लिए ओसीआर तकनीक का उपयोग करता हैं। इस तकनीक का उपयोग उड़ान के लिए पासपोर्ट स्कैन करने से लेकर होटल बुक और व्यक्तिगत डेटाए संग्रहीत करने तक मे शामिल हैं।

इसके अलाबा, यह तकनीक Microsoft OneNote, Windows App, Google Docs, इहा तक Photo Scaning के लिए भी इस्तेमाल किया जाता है।

Optical Character Recognition के फाएदे

  • Searchability:- स्कैन की गई फ़ाइलो को टेक्स्ट में बदलने के बाद आप उन फ़ाइलो को .doc,.rtf,.txt (सरलतम), pdf, आदि के रूप में सहेजा जा सकता हैं। फिर इन फ़ाइलों को लगभग हर कंप्यूटर सिस्टम के जरिए आसानी से खोजा जा सकता है।
  • Editing ability:- अगर आप चाहे तो, वर्षों पहले लिखे गए किसी पुराने अनुबंध को संशोधित करना चाहते है याफिर किसी पुराने वसीयत को संशोधित करना चाहते हे तो, ओसीआर के इस्तेमाल से दस्तावेज़ो के डिजिटलीकरण के बाद उन्हे संशोधित कर सकते है।
  • Easy use:- इसके द्वारा स्कैन किए गए दस्तावेज़ को एक डेटाबेस मे रखा जा सकता है जहा से हर व्यक्ति उन दस्तावेज़ो को access कर सकता है। यह खास तौर पर बैंकों या सरकारी अभिलेखागारो के लिए बहुत उपियोगी होता है,जहा पर बैंक आपने किसी ग्राहक कि पिछले क्रेडिट record की जांच कर सकता हैं या सरकारी अभिलेखागार मे से भूमि और संपत्ति से समन्दित रिकॉर्ड तुरंत पा सकते है।
  • Storage capacity:- स्कैन की गई डिजिटल फाइलों को पारंपरिक विशाल भौतिक भंडारण जैसे अलमारी या इसी तरह के अन्य भंडारण के बजाय कुछ बाइट्स के भीतर आसानी से संग्रहीत किया जा सकता है। इस तरह ओसीआर रिक्त स्थान को कम करने के साथ-साथ भौतिक रखरखाव की कठिनाइयों से राहत देने में मदद कर सकता है।
  • Backup:- दस्तावेज़ो को कागजो के रूप में सहेज ने के बजाय, डिजिटल बैकअप सस्ते और संभवतः ज्यादा टिकाऊ होते है। इसके अलावा, ये प्रबंधन में अधिक स्थिरता प्रदान करता है।
  • Translatability:- आधुनिक OCR कि मदद से अंग्रेज़ी से लेकर भारतीय,अरबी, चीनी जैसे अनेको भाषाओं मे दस्तावेज़ो को प्रबंधित किया जा सकता है। इसका मतलब यह है कि एक भाषा से दुसरी भाषाओं मे दस्तावेज़ो को आसानि से अनुवाद किया और खोजा जा सकता है।

जैसेकि Google का अनुवाद सिस्टम, जोकि मशीन लर्निंग या Artificial Intelligence (AI)पर आधारित यूनिकोड अनुवाद कार्यक्रम का उपयोग करके इस काम को सरल बनाता है।

OCR के नुकसान

उपरोक्त लाभों के अलाबा इस तकनिक के कुछ नुकसान भी हैंऔर ये कुछ इस प्रकार हैं:

  • OCR टेक्स्ट केवल प्रिंटेड टेक्स्ट के साथ कुशलता से काम करता है, हस्तलिखित टेक्स्ट के साथ यह उतना उपियोगी नहीं है।
  • यह सिस्टम एक महंगे प्रक्रिया हैं।
  • इसकी छवि निर्मित की पुरी प्रक्रिया के लिए अधिक स्थान की आवश्यकता होती है।
  • इस प्रक्रिया के दौरान छवि की गुणवत्ता कम हो सकता है।
  • इस प्रक्रिया के दौरान छवि की गुणवत्ता कम हो सकता है।
  • अंतिम परिनाम मे मिली छवि की गुणवत्ता असल छवि की गुणवत्ता पर पुरि तरह निर्भर करता है।
  • अंतिम परिनाम 100 प्रतिशत सटीक ही इस बात कोई निश्चिता नहीं, क्योंकि प्रक्रिया के दौरान कुछ गलतियाँ होने की संभावनाए होती है।
  • यह प्रक्रिया छोटे मात्रा के टेक्स्ट के लिए उपियोगी नहीं है।

Conclusion

मुझे आशा है कि अब आप इस लेख के माध्यम से समझ गए होंगे कि OCR क्या है? OCR कितने प्रकार के होते हैं(Types of ocr in hindi) और यह कैसे काम करता है? इसलिए, अगर आपको लगता है कि यह लेख OCR software technology के बारे में बेहतर ढंग से समझने में मददगार है, तो इसे अपने दोस्तों के बीच साझा करें, और हमारे नवीनतम अपडेट के लिए घंटी आइकन को दबाकर हमें subscribe करें।

About The Author

Author and Founder digipole hindi

Biswajit

Hi! Friends I am BISWAJIT, Founder & Author of 'DIGIPOLE HINDI'. This site is carried a lot of valuable Digital Marketing related Information such as Affiliate Marketing, Blogging, Make Money Online, Seo, Technology, Blogging Tools, etc. in the form of articles. I hope you will be able to get enough valuable information from this site and will enjoy it. Thank You.

Leave a Reply

Your email address will not be published. Required fields are marked *