सर्च इंजन क्या है, कैसे काम करता है तथा 10 सर्च इंजन के नाम

एक वक्त था जब हमें अपने सवालों के जवाब ढूँढने तथा अपनी जिज्ञासाओं को शांत करने के लिए दादा-दादी या घर के किसी बड़े सदस्य के पास जाना पढ़ता था। सूचनाओं के स्रोत इस दौर में बहुत हद तक सीमित थे, लेकिन समय के साथ विकसित होती टेक्नोलॉजी के चलते आज हमारे पास किसी जानकारी को प्राप्त करने के कई विकल्प मौजूद हैं और इन सभी में इंटरनेट सबसे शक्तिशाली और सुविधाजनक विकल्प है।

इंटरनेट खासकर गूगल (Google) का इस्तेमाल वर्तमान में हर उम्र का व्यक्ति तरह-तरह के सवालों का जवाब ढूँढने के लिए दिनभर में ना जाने कितनी बार करता है, लेकिन क्या आपने कभी जानने का प्रयास किया है कि आखिर सर्च इंजन कहा जाने वाला गूगल कैसे काम करता है या कोई सर्च इंजन क्या होता है तथा आपके सभी सवालों का जवाब चुटकियों में कैसे दे देता है?

आइए इस लेख के माध्यम से समझने का प्रयास करते हैं कि, सर्च इंजन क्या होते हैं, ये कैसे काम करते हैं तथा गूगल अर्थात किसी सर्च इंजन के पास आपके सभी सवालों का जवाब कैसे होते हैं?

सर्च इंजन क्या है?

सर्च इंजन इस दौर में हम में से अधिकांश लोगों के जीवन का एक अभिन्न अंग बन चुके हैं। दैनिक समाचार एवं ताज़ा घटनाएँ, सेवाओं और व्यवसायों की खोज, खरीदारी, किसी विषय विशेष के बारे में पढ़ना, नौकरी की खोज, ट्रैवल और हॉलिडे प्लानिंग और न जाने कितने ऐसे कार्य हैं, जिन्हें हम सर्च इंजन के माध्यम से पूरा करते हैं।

सर्च इंजन इंटरनेट में एक मध्यस्थ (Mediator) के रूप में काम करते हैं, जो इंटरनेट पर मौजूद हजारों लाखों वेबसाइट्स की सामग्री को जरूरतमन्द यूजर्स तक पहुंचाने का काम करते हैं। उदाहरण के तौर पर मान लें आपको ऑनलाइन शॉपिंग करनी है किन्तु आपको किसी भी ई-कॉमर्स वेबसाइट के बारे में पता नहीं है, ऐसे में आप ऑनलाइन शॉपिंग किस प्रकार करेंगे?

यहाँ सर्च इंजन अपनी महत्वपूर्ण भूमिका निभाते हैं, ये किसी विषय के बारे में खोजे जाने पर आपको बताते हैं कि जिस विषय से जुड़ी जानकारी आपको चाहिए वह किसी खास वेबसाइट पर उपलब्ध है। जैसे यदि आप सर्च इंजन में ऑनलाइन शॉपिंग से जुड़ी क्वेरी (Query) डालेंगे तो सर्च इंजन आपको फ्लिपकार्ट या ऐमज़ान जैसी ई-कॉमर्स वेबसाइट्स के बारे में बताएगा जहाँ से आप आसानी से शॉपिंग कर पाएंगे।

सर्च इंजन के पास इंटरनेट में उपस्थित तथा आम लोगों के लिए उपयोगी लगभग सभी वेबसाइट्स का डेटा होता है। जब कोई व्यक्ति किसी भी विषय को सर्च इंजन में खोजता है तो सर्च इंजन उसके पास उपलब्ध डेटा का विश्लेषण कर यूजर्स को लाखों वेबसाइट्स में से केवल उसके काम की वेबसाइट परिणाम (Search Result) के रूप में दिखता है।

सर्च इंजन की एतिहासिक पृष्ठभूमि

सर्च इंजन के इतिहास को समझने से पूर्व इंटरनेट तथा WWW की शुरुआत पर नज़र डालना आवश्यक है। साल 1969 में अमेरिकी रक्षा विभाग द्वारा ARPANET (Advanced Research Projects Agency Network) की शुरुआत की गई, जो आधुनिक इंटरनेट का शुरुआती रूप था।

हालाँकि अब तक इसका इस्तेमाल केवल कुछ सरकारी विभागों मुख्यतः रक्षा विभाग तक ही सीमित था और विभिन्न कंप्यूटर नेटवर्क में एक दूसरे के साथ कम्यूनिकेशन करने का एक मानक (Standard) तरीका भी मौजूद नहीं था।

1983 में ट्रांसमिशन कंट्रोल प्रोटोकॉल/इंटरनेटवर्क प्रोटोकॉल (TCP/IP) नामक एक नए संचार प्रोटोकॉल की शुरुआत हुई, जो वर्तमान इंटरनेट की रीढ़ साबित हुई। इस व्यवस्था ने अलग-अलग नेटवर्क पर विभिन्न प्रकार के कंप्यूटरों को एक दूसरे से कम्यूनिकेशन करने की अनुमति दी। 1991 में वर्ल्ड वाइड वेब (WWW) की शुरुआत के साथ साल 1993 से इंटरनेट आम लोगों के इस्तेमाल के लिए शुरू कर दिया गया।

Also Read This : क्या है ऑप्टिकल फाइबर केबल तथा किस सिद्धांत पर कार्य करती है?

दुनियाँ का सबसे पहला सर्च इंजन “Archie” था, जिसे 1990 में विकसित किया गया। वर्ल्ड वाइड वेब की शुरुआत के दो वर्ष बाद एक अन्य सर्च इंजन “JumpStation” शुरू किया गया, यह अपने पूर्ववर्ती से अधिक उन्नत था तथा परिणामों को उसी क्रम में रैंक करता था, जिस क्रम में वे प्राप्त किये गए थे।

साल 1994 में David Filo तथा Jerry Yang ने प्रसिद्ध सर्च इंजन Yahoo! की शुरुआत करी। 1996 में Larry Page और Sergey Brin ने “BackRub” की शुरुआत करी, जो गूगल का प्रारंभिक रूप था। इसमें बैकलिंक्स (किसी एक वेबसाइट से दूसरे को लिंक करना) के आधार पर सर्च परिणामों को वरीयता दी जाती थी। साल 1998 में गूगल को लॉन्च किया गया और तब से समय के साथ यह उन्नत होता गया है तथा इसका वर्तमान रूप आज हमारे सामने है।

सर्च इंजन के प्रकार

सर्च इंजन को उनके काम करने के तरीकों के आधार पर निम्नलिखित तीन श्रेणियों में वर्गीकृत किया जाता है।

क्रॉलर आधारित सर्च इंजन
मानव संचालित सर्च इंजन
हाइब्रिड सर्च इंजन

#1 क्रॉलर आधारित सर्च इंजन

प्रमुख सर्च इंजन गूगल, याहू तथा बिंग आदि सभी क्रॉलर आधारित सर्च इंजन हैं। क्रॉलर आधारित सर्च इंजन से आशय ऐसे सर्च इंजनों से है, जो अपने सर्च डेटाबेस में नई सामग्री जोड़ने के लिए एक रोबॉट, जिसे क्रॉलर या स्पाइडर कहा जाता है का इस्तेमाल करते हैं, ये सर्च इंजन मुख्यतः चार चरणों में अपना कार्य करते हैं, जिन्हें हम आगे विस्तार से समझेंगे।

#2 मानव संचालित डायरेक्ट्रीज

ओपन डायरेक्ट्रीज मानव संचालित सर्च इंजन हैं, ये एक ऐसे प्लेटफ़ॉर्म होते हैं जहाँ कोई वेबसाइट मालिक अपनी वेबसाइट या किसी वेबपेज को उसकी श्रेणी तथा अन्य जानकारी दर्ज कर रजिस्टर करने के लिए आवेदन कर सकता है।

सबमिट की गई वेबसाइट को डायरेक्ट्री संपादकीय टीम द्वारा जाँचा जाता है और वेबसाइट को उचित श्रेणी में जोड़ दिया जाता है या सूचीबद्ध करने के लिए अस्वीकार कर दिया जाता है। Yahoo! Directory तथा Look Smart मानव संचालित डायरेक्ट्री के उदाहरण हैं।

#3 हाइब्रिड सर्च इंजन

हाइब्रिड सर्च इंजन, जैसा कि, इसके नाम से पता चलता है खोज परिणामों में वेबसाइट्स को सूचीबद्ध करने के लिए क्रॉलर आधारित तथा मैन्युअल डायरेक्ट्री दोनों का इस्तेमाल करते हैं।

Google जैसे अधिकांश क्रॉलर आधारित सर्च इंजन क्रॉलर को प्राथमिक तंत्र के रूप में इस्तेमाल करते हैं, किन्तु साथ ही ये सर्च इंजन मानव संचालित डायरेक्ट्री का भी इस्तेमाल किसी वेबपेज से जानकारी प्राप्त करने के लिए करते हैं तथा उसे खोज परिणामों में प्रदर्शित करते हैं।

सर्च इंजन कैसे काम करते हैं?

उम्मीद है आप सर्च इंजन क्या है तथा ये कितने प्रकार के होते हैं इसे समझ चुके होंगे आइये अब जानते हैं सर्च इंजन काम कैसे करता है तथा कैसे किसी एक वेबसाइट के पास लाखों, करोड़ों विभिन्न वेबसाइट्स का डेटा उपलब्ध रहता है?

चूँकि वर्तमान में इस्तेमाल किये जाने वाले सर्च इंजन क्रॉलर आधारित सर्च इंजन हैं अतः हम यहाँ क्रॉलर आधारित सर्च इंजन की कार्यप्रणाली को समझने की कोशिश करेंगे। सर्च इंजन द्वारा अपना सर्च डेटाबेस तैयार करने के लिए एक प्रोग्राम का इस्तेमाल किया जाता है, जिसे क्रॉलर या स्पाइडर कहा जाता है।

गौरतलब है कि, प्रोग्राम किसी मशीन को एक विशिष्ट कार्य करने का निर्देश होता है। हम दैनिक जीवन में जितनी भी मशीनों का इस्तेमाल करते हैं उन सबको उनका कार्य करने के लिए प्रोग्राम या निर्देशित किया जाता है। सर्च इंजन द्वारा डेटा इकट्ठा कर हमें परिणाम दिखाने का यह कार्य निम्नलिखित चार चरणों में पूरा किया जाता है

#1 क्रॉलिंग

क्रॉलिंग (Crawling) सर्च इंजन की कार्यप्रणाली का पहला चरण है, इसमें सर्च इंजन क्रॉलर किसी वेबपेज पर मौजूद जानकारी को स्कैन करते हैं। ये स्कैन नए वेबपेज को इंडेक्स करने तथा एक बार इंडेक्स किये जा चुके वेबपेज को अपडेट करने के लिए एक निश्चित समायान्तरल पर किया जाता है।

सर्च इंजन द्वारा प्रयोग में लाए जाने वाले ये क्रॉलर किसी वेबपेज में उपस्थित दूसरे वेबपेज की लिंक (URL) द्वारा उस वेबपेज तक भी पहुँच जाते हैं और यह सिलसिला चलता रहता है तथा सर्च इंजन डेटाबेस में उन सभी वेबपेजों का डेटा जमा होता रहता है।

#2 इंडेक्सिंग

इस चरण में स्कैन किये गए वेबपेज को सर्च इंजन डेटाबेस में जोड़ा जाता है, यहाँ उस वेबपेज को प्रदर्शित करने वाले शब्दों की पहचान होती है तथा ऐसे शब्दों को “कीवर्ड” के रूप में संदर्भित किया जाता है और वेबपेज को पहचाने गए शब्द से जोड़ दिया जाता है।

कीवर्ड वे शब्द है, जिनका हम खोज के रूप में सर्च इंजन में इस्तेमाल करते हैं। इसके अतिरिक्त यदि किसी वेबपेज पर मौजूद जानकारी प्रासंगिक न हो तो उस स्थिति में उस वेबपेज को सर्च इंजन इंडेक्स नहीं करता है।

#3 कॉन्टेन्ट की प्रासंगिकता

इस चरण में इंडेक्स किये गए वेबपेजों को उनकी क्वालिटी के आधार पर पुनः सूचीबद्ध किया जाता है, जिसे सर्च इंजन की भाषा में रैंकिंग (Ranking) कहते हैं।

सर्च इंजन के पास किसी विषय विशेष से संबंधित सैकड़ों वेबपेज होते हैं, किन्तु कौन से वेबपेज खोज परिणामों में शीर्ष पर दिखाए जाने हैं इसके लिए सभी वेबपेजों को विभन्न मानकों पर जाँचा जाता है तथा इन मानकों के आधार पर ही प्रत्येक वेबपेज को खोज परिणामों में स्थान प्रदान किया जाता है।

#4 परिणाम प्रदर्शित करना

यह सर्च इंजन की कार्यप्रणाली का आखिरी चरण है, इसमें किसी “कीवर्ड” के खोजे जाने पर उससे संबंधित परिणाम प्रदर्शित किये जाते हैं तथा उपयोगकर्ता अपनी इच्छा के अनुसार किसी एक परिणाम को खोल कर आवश्यक जानकारी जुटा सकता है।

10 सर्च इंजन के नाम

इंटरनेट पर कई सर्च इंजन मौजूद हैं किन्तु यूजर बेस की बात करें तो दुनियाँ भर में सर्च इंजन के तौर पर गूगल सबसे लोकप्रिय है, आंकड़ों के अनुसार दुनियाँ की तकरीबन 85% से अधिक इंटरनेट खोजें गूगल के माध्यम से ही करी जाती हैं।

गूगल की शुरुआत आधिकारिक तौर पर साल 1998 में लैरी पेज और सर्गेई ब्रिन द्वारा की गई। गूगल सर्च इंजन के अतिरिक्त मैप, ई-मेल, वीडियो स्ट्रीमिंग जैसी सेवाएं भी प्रदान करता है।

दूसरा सबसे प्रमुख सर्च इंजन माइक्रोसॉफ्ट कंपनी का बिंग (Bing) है, इसे 2009 में लॉन्च किया गया था। बिंग सर्च इंजन गूगल की तर्ज पर मैप के साथ-साथ इमेज, वेब और वीडियो सर्च सहित विभिन्न सेवाएं प्रदान करता है। औसतन 6 फीसदी लोग सर्च इंजन के रूप में बिंग का इस्तेमाल करते हैं।

वैश्विक स्तर पर इस्तेमाल किये जाने वाले सर्च इंजनों में याहू (Yahoo) औसतन 2.5 फीसदी यूजर बेस के साथ तीसरे स्थान पर है। यह सर्च इंजन के साथ एक ई-मेल सेवा उपलब्ध करवाने वाली कंपनी है, जिसे 1994 में शुरू किया गया। इन प्रमुख सर्च इंजनों के अलावा कुछ अन्य भी हैं जिनमें से #10 सर्च इंजन के नाम नीचे दिए हैं

Baidu
Yandex
DuckDuckGo
Ask
AOL
Wolfram Alpha
Ecosia
Qwant
Startpage
Search Encrypt

“Baidu” चीन में सबसे अधिक इस्तेमाल किया जाने वाला सर्च इंजन है, जिसकी स्थापना जनवरी, 2000 में चीनी उद्यमी Eric Xu द्वारा की गई थी। आपको बता दें कि, चीन में गूगल तथा फ़ेसबुक समेत कई सेवाएं प्रतिबंधित हैं।

Baidu खोज के परिणाम के रूप में वेबपेजों, ऑडियो फाइलों तथा छवियों को प्रदर्शित करता है। इसके अतिरिक्त यह मानचित्र, समाचार, क्लाउड स्टोरेज समेत कुछ सहित कुछ अन्य सेवाएं भी प्रदान करता है।

सर्च इंजन कमाई कैसे करते हैं?

आपके मन में यह सवाल होगा कि, कोई सर्च इंजन जैसे गूगल बिना कोई शुल्क लिए अपने यूजर्स को सेवा कैसे उपलब्ध कराता है? आपको बता दें गूगल की कमाई का मुख्य स्रोत उसमें दिखाए जाने वाले विज्ञापन होते हैं।

चुँकि गूगल के पास लोकप्रियता एवं इंटरनेट इस्तेमाल करने वाले लोगों का बहुत बड़ा हिस्सा है इसलिए किसी सेवा या उत्पाद का प्रचार गूगल पर करना किसी भी व्यवसाय के लिए बेहतरीन विकल्प है। गूगल विभिन्न कंपनियों से पैसे लेता है तथा बदले में उनकी वस्तुओं या सेवाओं का प्रचार विज्ञपनों के माध्यम से करता है।

गूगल इन विज्ञापनों को लोगों की वेबसाइट्स के माध्यम से दिखाता है, जो गूगल पब्लिशर प्रोग्राम (Google AdSense) के तहत उससे जुड़े हैं। विज्ञापनों से आने वाले राजस्व का एक बड़ा हिस्सा वेबसाइट के मालिकों को प्राप्त होता है, जबकि बचा हिस्सा गूगल द्वारा लिया जाता है।