इंटरनेट की दुनिया इतनी विस्तृत और बड़ी है जिसमें ढेर सारी जानकारीया मोजुद है। इन परिस्थितियों में, सही सूचना को र्प्राप्त करना सच में एक कठिन कार्य है। इस प्रक्रिया को सरल और आसान बनाने के लिए जरूरत थी एक ऐसी Engine कि जो सही जानकारी को लोगो तक पोहचा सके।
और सर्च इंजन यही Engine है जो जानकारी के इस विशाल भन्डार मे से सही जानकारीयो को ढुढ़ना और उन्हे लोगो तक पोहचाने की प्रत्रिया को पूरा करता है। आज की इस आधुनिक दुनिया मे लगभग हर कोई सर्च इंजन का उपयोग करता है, चाहे वे Google हो या Bing याफिर कई ओर खोज इंजन।
लेकिन उन मे ज्यादातर लोग ये नही जानते है कि Search Engine क्या है? और गूगल जैसे सर्च इंजन कैसे काम करता है। तो चलिए शुरू करते हैं:
Table of Contents
Search Engine क्या है?
यह एक ऑनलाइन उपकरण है जो उपयोगकर्ता की keywords या search terms के आधार पर इंटरनेट पर मौजुद वेबसाइटों को खोजने के लिए डिज़ाइन किया गया है। इनका अपना एक विशालकाए डेटाबेस होता है जहा वे अनलाइन पर मौजुद सभी डेटाओ का एक क्रमबद्ध सुची तैयार करता है और उन्हें store करता है। अब जब कोई user search box पर किसी जानकारी के लिए अपना search quary दर्ज करता है तो परिणामों मे सर्च इंजन search term के आधार पर result प्रदशित करता है जोकि (SERP) के नाम से जाना जाता है।
आसान शद्वो मे कहा जाए तो, खोज इंजन एक ऐसी प्रक्रिया है जो इंटरनेट पर उपयोगकर्ताओं को जानकारी जुटाने मे मदद करता है। अब जब कोई उपयोगकर्ता खोज इंजन में अपना कीवर्ड दर्ज करता है तो, उन्हे परिनामस्वरुप वेबसाइटों, छवियों, वीडियो या अन्य किसी डेटा के रूप में वेब content प्राप्त होता है जोकि उपयोगकर्ता द्वारा दर्ज किए गए शब्दार्थ से मेल खाता हैं।ये सभी प्रक्रिया स्वचालित रूप से एल्गोरिदम के उपयोग से किया जाता है।
Search engines कैसे काम करता हैं?
हर खोज इंजन का अपना अलग algorithm होता है और अपने-अपने तरीकों के साथ एक दूसरे से भिन्न हो सकते हैं लेकिन इन सभी का मूलभूत सिद्धांत एक ही होता हैं। दरसल सभी search engine तीन प्राथमिक सिद्धांतो के साथ अपना काम करते हैं:
- Crawling
- Indexing
- Ranking
Crawling :- क्रॉलिंग डेटा खोजे जाने की एक प्रक्रिया है जिसमें खोज इंजन अपने रोबोट या क्रॉलर कि मदद से नई – नई webpages कि खोज करता है और अपने database मे उन्हे store करता है ताकि बाद में इनकी पुनर्प्राप्ति हो सके। यह webpages एक छवि, एक वीडियो या कोई पीडीएफ के रुप मे हो सकता है।पहले bot या क्रॉलर एक पहचान वाले वेब पेजों के साथ अपना काम शुरू करता है, और फिर नए URL कि तलास मे उन वेबपेजों के लिंको का अनुसरण करता है।
Indexing :- bots या crawler द्बारा डेटा को क्रॉल कर लेने के बाद अगला प्रक्रिया Indexing होता है। अब खोज इंजन, खोजे जाने बाले उन पेजों मे से सही pages को “इंडेक्स” के रूप में मान्यता देते है और उन्हे आपने डेटाबेस में संग्रहीत कर लेते है। दरसल, Indexing सभी वेबसाइटों का एक बड़ा पुस्तकालय है। क्रॉलिंग और इंडेक्सिंग का ये प्रक्रिया एक निश्चित समय के लिए निरंतर चलता रहता है जिसे crawler बजेट कहा जाता है।क्रॉलिंग और इंडेक्सिंग दोनों ही निरंतर प्रक्रियाएं हैं जो डेटाबेस को ताज़ा रखने के लिए बार-बार होता रहता हैं।वेबपेजो का सठिक विश्लेषण हो जाने के बाद, उन्हे संभावित खोज क्वेरी के लिए परिणाम स्वरूप प्रदशि॔त किया जाता है।
Ranking :- रैंकिंग इसका सबसे अंतिम चरण होता है जिसमें सर्वोत्तम परिणाम pages का चुनाब करना शामिल होता है, ताकि जब कोई user आपने search term के साध परिणामोको ढुढ़ता है तो उसे सबसे सर्वोत्तम page परिणाम स्वरुप दिखाई दे। हर एक इंजन का अपना अलग – अलग और दर्जनों रैंकिंग factors होता हे जिनका उपयोग वे pages कि रैंकिंग के दौरान करता है लेकिन उनमें से अधिकांश factors को गुप्त रखा जाता है।
search engines का इतिहास
इंटरनेट के शुरुआती दिनों में, बहुत कम वेब सर्वर थे जो सीमित डेटा परोसते थे और केवल डेटा की एक सूची बनाते थे, content नहीं। लेकिन आज, अरबों कि संखा मे वेब पेज ऑनलाइन पर मौजुद हैं और उन्हें ट्रैक करने के लिए कोई केंद्रीय प्रणाली नहीं है, इसलिए हम ऑनलाइन पर जानकारी खोजने के लिए इस पर निर्भर हैं।
www (वर्ल्ड वाइड वेब) के निर्माता Tim Berners-Lee, ने डाउनलोड करने योग्य फ़ाइलें कि एक वर्चुअल लाइब्रेरी बनाई और उन सभी डेटाओ को एक सूची में रखा। इस सूची का उपयोग करके, कोई भी हर एक वेब पेज को आसानी से एक्सेस कर सकता था। उन दिनों ज्यादातर वेबपेज विश्वविद्यालयों या सरकारी एजेंसी जैसे बड़े संगठनों द्वारा चलाए जाते थे।
1989-90 के वर्ष में Alan Emtz ने पहला सार्वजनिक खोज इंजन, ARCHIE बनाया, और इसे एक साल बाद जनता के लिए लॉन्च किया, जिसने वेब की तुलना में FTP (File Transfer Protocol) साइटों पर फ़ाइलों को खोजने की अनुमति दी। 1993 Jumpstation ने linear search की खोज कि, जिसमें एक ही परिणाम में पृष्ठ का शीर्षक और शीर्षलेख दिखाया गया। जिसमें खोज परिणामों को उसी क्रम में रैंक किया गया जिस क्रम में वे पाए गए थे।
1994- Jerry Yang and David Filo ने Yahoo! कि स्थापना की और वेब पेजों का पहला संग्रहालए वनाया जिसमें मानव निर्मित URL शामिल हैं। इसमे साइट के मालिक सूचनात्मक साइटों को मुफ्त में जोड़ सकते थे, लेकिन वाणिज्यिक साइटों को इसके लिए $300 प्रति वर्ष दर के हिसाब से भुगतान करना पड़ता था। उसी वर्ष Yahoo! ने WebCrawler कि खोज शुरू कर दि, और वेब क्रॉलर का दौड़ देखा जाने लगा और वे संपूर्ण पृष्ठों को अनुक्रमित करने वाला दुनिया का सवसे पहला खोज इंजन बना। लेकिन शुरुवाति दिनो मे इसकी Crawling की शक्ति बहुत धीमा था।
1995 मे AltaVista को पहला भाषा खोज इंजन के रूप में लॉन्च किया गया, जिसका मतलब ये है कि अब यह केवल कीवर्ड ही नहीं, बल्कि बोली जाने वाली हर भाषा में लिखे गए प्रश्नों को वे समझ सकता था। उस समय, वेब पेजो संखा करिवन 30 मिलियन के आसपास था, जिनमें से लगभग 20 मिलियन AltaVista के द्वारा index किया गया था।
1996 के वर्ष में Ask Jeeves,लॉन्च किया गया जिसने उपयोगकर्ताओं को अपने प्रश्न प्रस्तुत करने के लिए प्रोत्साहित किया। इसने प्रश्नों के परिणामों का मिलान करने के लिए मानव संपादकों का उपयोग किया। आज, लगभग 8 से 10 प्रतिशत searches को प्रश्नों के रूप में किया जाता है।सन 1996 मे, Larry Page और Sergey Brin ने Google BackRub का निमा॔न किया, जिसने वेबसाइटों को रैंक करने में backlink को आधार बनाया।सन 1998 Larry Page और Sergey Brin ने दो साल के अन्तर Google की स्थापना की, जो खोज परिणामों को रैंक करने के लिए बैकलिंक्स का उपयोग करता था।
उस समय, Google के पास नीले रंग का लिंक का एक बहुत ही सरल, और Ad free इंटरफ़ेस होया करता था, जिसमे साइट का दो-पंक्ति का एक विवरण होया करता था जिसे हम Meta Description के तौर पर जानते है।सन 2009 मे, Microsoft Bing को रीब्रांड के रूप में लॉन्च किया गया। इसके लॉन्च के कुछ समय बाद, Bing ने Yahoo को acquire कर लिया।
Top 10 best search engine list हिंदी में
ऑनलाइन दुनिया में बहुत सारे सर्च इंजन मौजूद हैं। वे सभी अपने फायदे और नुकसान के साथ अपनी उपस्थिति के लिए संघर्ष कर रहे हैं। उनमें से कुछ लाभ का सामना कर रहे हैं, लेकिन अधिकांश search engines अपने प्रतिद्वंद्वी के साथ संघर्ष कर रहे हैं। यहां मैंने top ten सच॔ इंजन का एक lists उनके व्यापक उपयोग और market shares के आधार पर बनाया है।
Note:- यह आकरे आज के स्तिति के अनुसार बनाए गए है, आगे चलके ये स्तिति बदल भी सकता है।
1. Google.com: खोज इंजन के दिग्गज Google को किसी परिचय की आवश्यकता नहीं है। यह दुनिया का सबसे अधिक इस्तेमाल किया जाने वाला लोकप्रिय सर्च इंजन है, जिससे दुनिया भड मे रोजाना 3 अरब से भी ज्यादा सर्च किया जाता है। ये एक ऐसा इंजन है जिसे किसी भी उपकरण से एक्सेस किया जा सकता है। Google का जटिल algorithms उपयोगकर्ताओं को उनकी खोजों के लिए सबसे सटीक परिणामओ का विश्लेषण कर उन्हे प्रस्तुत करने मे माहीर है।इसलिए Google को व्यवसायों के लिए सबसे अधिक उपियोगी माना जाता है।
क्योंकि इसकी रैंकिंग एल्गोरिथ्म इतना प्रभाबशाली है कि, किसी भी वेबसाइट रिकॉर्ड पर होने बाले क्लिको कि संख्याओ का Demography , location, Accesses device जैसी तत्थो का पुरा रिकॉर्ड रखता है जोकि व्यवसाय के परिप्रेक्ष्य से बहुत ही अहम होता है। इसके अलाबा इन रिकॉर्ड का Google अपने अन्य लाभदायक प्लेटफॉर्म जैसे Adword, Adsense आदि जैसे परियोजनाओ मे उपयोग करता है।
Google ने April 2022 तक 92.07 प्रतिशत बाजार हिस्सेदारी बनाए रखते हुए, बाजार पर अपना दबदबा कायम रखा। Google का ज्यादातर राजस्व विज्ञापन से उत्पन्न होता है। हालाँकि, Google की तुलना में Bing बहुत ही छोटा है, लेकिन यह कई देशों में इसने एक सम्मानजनक बाजार हिस्सेदारी वनाए होये है। Bing को दरसल Microsoft द्वारा संचालित किया जाता है।Google की तरह ही, Bing भी छवियों, वीडियो, मानचित्र और समाचार जैसे विभिन्न टैब में खोज परिणामों को फ़िल्टर करता है।
2. Bing.com: Google के विलकुल उलट, बिंग के मुखपृष्ठ में हमेशा एक आश्चर्यजनक छवि और समाचार होता हैं। Bing इस उद्योग में April 2022 तक 3.04% बाजार हिस्सेदारी के साथ दुनिया का दूसरा सबसे बड़ा खोज इंजन है।
3. Yahoo.com: Yahoo! की कहानी बडे ही दिलचस्प है। इस कंपनी की शुरुबात सन 1994 में Jerry Yang and David Filo द्वारा की गई थी। शुरुबात मे उन्होंने इस साइट का नाम “erry and David’s Guide to the World Wide Web” रखा था, इसके तुरंत बाद ही इस साइट का नाम बदलकर Yahoo! रखा। Yahoo! के मेल और उसकी अन्य वेब सेवाओं को लेकर 2000 में करिवन 125 अरब डॉलर तक पोहच ने का अकलन किया गया था। लेकिन फिर स्तिति अचानक वदल गईं और अकलन गलत साबित होया।
उन दिनो गुगल के हलात कुछ अच्छे नही थे इसलिए सन 2002 में Google के संस्थापक Larry Page and Sergey Brin ने Google को Yahoo! को बेचने की पेशकस की थी! लेकिन कुछ आंतरिक असहमति के कारण मात्र $1,000,000 के लिए Yahoo! ने इस पेशकस को ठुकरा दिया थ। फिर चिजे अचानक से बदल गई और तब तक Google की कीमत बढ़कर 3 बिलियन डॉलर हो चुका था। एक शानदार शुरुआत और कहीं अधिक संसाधन होने के बावजूद भी, Yahoo! बाजार में पिछर के रह गया और April 2022 तक के आकरो के अनुसार 1.39 प्रतिशत market share के साथ तिसरे स्थान पर रहे गया। Yahoo! अब Microsoft के Bing इंजन द्वारा संचालित होता है।
4. Baidu.com: यह एक चीन आधारित खोज इंजन है जिसे वर्ष 2000 में लॉन्च किया गया था। यह चीन में सबसे लोकप्रिय खोज इंजन है, जिसने चीन में बाजार हिस्सेदारी का 81% से अधिक अधिग्रहण कर लिया है, जबकि Google के पास इस देश में बाजार हिस्सेदारी का केवल 0.61% हिस्सा है। इसके बावजूद भी Baidu चीन के बाहर एक अच्छा विकल्प नहीं है। हालांकि यह अभी भी हर दिन 3.3 बिलियन से अधिक खोजों पर हावी है। AI(Artificial Intelligence) जैसी तकनिकी अनुसंधान और विकास में इस कंपनी का भारी निवेश है। यह अपनी उभरती तकनिकी के साथ भविष्य के लिए धीरे-धीरे विकसित हो रहा है।
इस खोज इंजन को इसकी डेटा नीति के लिए दोषी ठहराया जा रहा है। कभी इस को डेटा गोपनीयता के लिए दोषी ठहराया जाता है, और कभी-कभी निगरानी के लिए। भारत-चीन सीमा पर तनाव के दौरान भारत ने Baidu पर प्रतिबंध लगा दिया है(India has banned Baidu)। इसके बावजूद भी यह वैश्विक बाजार में 1.27% के साथ चौथा स्थान हासिल करने में सक्षम रहा है।
5. Yandex.com: यह एक Russian based सर्च इंजन है जो Russia मे सबसे ज्यादा देखा जाता है। Baidu के समान, यह केवल रूस में लोकप्रिय है, देश की चौथी सबसे अधिक देखी जाने वाली वेबसाइट है। Yandex में एक बहुत ही सरल यूजर इंटरफेस है, जो इसके बड़े आकर्षक का कारक है। काम करने मे यह Google जितना ही सरल है, लेकिन साथ ही इसमें बहुत सारी सुविधाएँ भी मौजुद हैं।ये 0.87% की बाजार हिस्सेदारी के साथ दुनिया मे पाचवे नम्वर पर स्तित है।
6. Duckduckgo.com: DuckDuckGo सातवां सबसे बड़ा सर्च इंजन है, जिसकी वैश्विक बाजार में 0.68 प्रतिशत कि हिस्सेदारी माना जाता है। यह users के डेटा प्राइवेसी को ensure करने का दावा करता है। इसलिए अगर किसी को आप अपने डेटा संग्रह करने कि अनुमती देना नही चाहते तो बेजिझक DuckDuckGo को आझमा सकते है। क्योंकि ये आपकी व्यक्तिगत जानकारी संग्रहीत नहीं करता है इसलिए ये सर्च इंजन विज्ञापनों के साथ आपका पीछा नहीं करता है। DuckDuckGo कि बात कि जाए तो आज कि स्तिति मे 27.4 मिलियन के आसपास इसके द्वारा दैनिक search किया जाता है ,और यह आकड़ा लगातार बढ़ रहा है। Globle Marketing share मे यह छटा नम्वर पर आता है।
7. Ask.com: Ask.com की स्थापना 1996 में कैलिफोर्निया में Garrett Gruener and David Warthen के द्वारा की गई थी। यह साइट मुख्य रूप से खोज इंजन क्षमताओं के साथ प्रश्न और उत्तर कि प्रारूप पर काम करता है। इस साइट पर उपयोगकर्ता प्रश्न पूछ सकते हैं, जिनका उत्तर ज्यादातर अन्य उपयोगकर्ताओं द्वारा दिया जाता है जैसे कि “quora”। इस साइट का प्रश्न और उत्तर प्रारूप उन उपयोगकर्ताओं के बीच एक बड़ा आकर्षण का कारक है जो अपने प्रश्नों के उत्तर की तलाश में होता हैं। यह दुनिया में 0.72 प्रतिशत बाजार हिस्सेदारी के साथ सातबा सबसे बड़ा सर्च इंजन है।
8. Naver.com: “Naver” को 1999 में कोरिया में पहले वेब पोर्टल के रूप में पेश किया गया था। यह Korea का सबसे लोकप्रिय सर्च इंजन है, जिसकी इस देश के बाजार में 75 प्रतिशत कि हिस्सेदारी है। आज के समय में Naver ईमेल क्लाइंट से लेकर इनसाइक्लोपीडिया , बच्चों का सर्च इंजन और न्यूज वेब पोर्टल आदि जैसे कई तरह की सेवाएं प्रदान करता है।Naver दुनिया का आठवां सबसे सफल सर्च इंजन है, जिसकी दुनिया भर में बाजार हिस्सेदारी 0.13 फीसदी है।
9. Aol.com: AOL पहली बार 1985 में अस्तित्व में आया था। AOL “अमेरिका ऑनलाइन” का संक्षिप्त रूप है।यह वेब पोर्टल न्यूयॉर्क शहर में स्थित अपनी सेवाएं प्रदान करता है और यह 1990 के दशक के मध्य में इंटरनेट के शुरुआती अग्रदूतों में से एक था।इस खोज इंजन ने डायल-अप , वेब पोर्टल, ईमेल और त्वरित संदेश जैसी सेवाए प्रदान की। 2000 में, AOL को ततकालीन मीडिया आइकन Time Warner को $165 बिलियन में खरीदा था। तब AOL दुनिया में आपने सेबाओ के साथ शीर्ष पर स्तित था।
AOL पहले NetFind के नाम से जाना जाता था , जिसे 1999 में “AOL सर्च” नाम दिया गया। पर, Google जैसे advanced algorithm प्रतिस्पर्धि के तौर पर अस्तित्व में आने के बाद AOL ने इंटरनेट बजार पर अपना प्रभुत्व खो दिया। AOL ने तब अपना ध्यान प्रमुख ऑनलाइन मीडिया कंपनियों को अधिग्रहण करने मे लगाया।इसने 2010 में 25 मिलियन डॉलर के वदले में “TechCrunch” को और 2011 में 315 मिलियन डॉलर में “Huffington Post” को खरीद लिया।
इसके अलाबा भी कई और प्रमुख ऑनलाइन मीडिया कंपनियों को अधिग्रहण किया।आखिर मे सन 2015 को, Verizon Communications ने AOL को $4.4 बिलियन में अधिग्रहन किया लिया गया।आज भी, AOL सर्च इंजन जारी है, लेकिन यह AOL और Verizon के व्यवसाय का एक छोटा सा हिस्सा है। यह खोज इंजन को 2016 से बिंग द्वारा भी सहायता किया जराहा है।किसी जमाने का प्रसिद्ध यह AOL अभी भी शीर्ष 10 खोज इंजनों में सामिल किया जाता है जिसकी कुल बाजार हिस्सेदारी करीबन 0.05% है।
10. Startpage.com: Startpage एक Dutch सर्च इंजन है जिसकी स्थापना वर्ष 1998 में हुई थी। इसकी खास बात यह है कि यह न तो आपकी जानकारी को ट्रैक करता है और न ही किसी कुकीज को स्टोर करता है। इसकी एक और विशेषता यह है कि इसमें Google में प्लग इन करने की सुविधा है, इस प्रकार, कोई व्यक्ति Google खोज का उपयोग Startpage के माध्यम से गोपनीयता के साथ कर सकता है। इस सर्च इंजन पर 82 भाषाओं में खोज की जा सकती है। वैश्विक बाजार हिस्सेदारी में इसके बहुत कम योगदान के साथ Startpage को दसवां सबसे लोकप्रिय खोज इंजन माना जा सकता है।
FAQ’s
Q). सर्च इंजन के कितने प्रकार होते हैं?
A). काम के आधार पर इसे निम्नलिखित चार श्रेणियों में वर्गीकृत किया जाता है।
1. क्रॉलर सर्च
2. निर्देशिका खोज
3, हाइब्रिड सर्च
4. अन्य विशेष खोज
Q). सर्च इंजन के कुछ उदाहरण क्या हैं?
ज्यादातर लोकप्रिय खोज इंजन परिणामों को प्रदर्शित करने के लिए Crawling
तकनीक का उपयोग करते हैं। Crawling आधारित इन खोज इंजनो का उदाहरण निम्नलिखित रुप मे दिया जा सकता है:
1. Google
2. binge
3. Yahoo!
4. Baidu
5. Yandex
A). इन लोकप्रिय सर्च इंजनों के अलावा भी कई ओर अन्य क्रॉलर आधारित सर्च इंजन उपलब्ध हैं । जेसे DuckDuckGo, AOL और Ask आदि इनमे शामिल है।
About The Author
Biswajit
Hi! Friends I am BISWAJIT, Founder & Author of 'DIGIPOLE HINDI'. This site is carried a lot of valuable Digital Marketing related Information such as Affiliate Marketing, Blogging, Make Money Online, Seo, Technology, Blogging Tools, etc. in the form of articles. I hope you will be able to get enough valuable information from this site and will enjoy it. Thank You.