एक वक्त था जब हमें अपने सवालों के जवाब ढूँढने तथा अपनी जिज्ञासाओं को शांत करने के लिए दादा-दादी या घर के किसी बड़े सदस्य के पास जाना पढ़ता था। सूचनाओं के स्रोत इस दौर में बहुत हद तक सीमित थे, लेकिन समय के साथ विकसित होती टेक्नोलॉजी के चलते आज हमारे पास किसी जानकारी को प्राप्त करने के कई विकल्प मौजूद हैं और इन सभी में इंटरनेट सबसे शक्तिशाली और सुविधाजनक विकल्प है।
इंटरनेट खासकर गूगल (Google) का इस्तेमाल वर्तमान में हर उम्र का व्यक्ति तरह-तरह के सवालों का जवाब ढूँढने के लिए दिनभर में ना जाने कितनी बार करता है, लेकिन क्या आपने कभी जानने का प्रयास किया है कि आखिर सर्च इंजन कहा जाने वाला गूगल कैसे काम करता है या कोई सर्च इंजन क्या होता है तथा आपके सभी सवालों का जवाब चुटकियों में कैसे दे देता है?
आइए इस लेख के माध्यम से समझने का प्रयास करते हैं कि, सर्च इंजन क्या होते हैं, ये कैसे काम करते हैं तथा गूगल अर्थात किसी सर्च इंजन के पास आपके सभी सवालों का जवाब कैसे होते हैं?
सर्च इंजन क्या है?
सर्च इंजन इस दौर में हम में से अधिकांश लोगों के जीवन का एक अभिन्न अंग बन चुके हैं। दैनिक समाचार एवं ताज़ा घटनाएँ, सेवाओं और व्यवसायों की खोज, खरीदारी, किसी विषय विशेष के बारे में पढ़ना, नौकरी की खोज, ट्रैवल और हॉलिडे प्लानिंग और न जाने कितने ऐसे कार्य हैं, जिन्हें हम सर्च इंजन के माध्यम से पूरा करते हैं।
सर्च इंजन इंटरनेट में एक मध्यस्थ (Mediator) के रूप में काम करते हैं, जो इंटरनेट पर मौजूद हजारों लाखों वेबसाइट्स की सामग्री को जरूरतमन्द यूजर्स तक पहुंचाने का काम करते हैं। उदाहरण के तौर पर मान लें आपको ऑनलाइन शॉपिंग करनी है किन्तु आपको किसी भी ई-कॉमर्स वेबसाइट के बारे में पता नहीं है, ऐसे में आप ऑनलाइन शॉपिंग किस प्रकार करेंगे?
यहाँ सर्च इंजन अपनी महत्वपूर्ण भूमिका निभाते हैं, ये किसी विषय के बारे में खोजे जाने पर आपको बताते हैं कि जिस विषय से जुड़ी जानकारी आपको चाहिए वह किसी खास वेबसाइट पर उपलब्ध है। जैसे यदि आप सर्च इंजन में ऑनलाइन शॉपिंग से जुड़ी क्वेरी (Query) डालेंगे तो सर्च इंजन आपको फ्लिपकार्ट या ऐमज़ान जैसी ई-कॉमर्स वेबसाइट्स के बारे में बताएगा जहाँ से आप आसानी से शॉपिंग कर पाएंगे।
सर्च इंजन के पास इंटरनेट में उपस्थित तथा आम लोगों के लिए उपयोगी लगभग सभी वेबसाइट्स का डेटा होता है। जब कोई व्यक्ति किसी भी विषय को सर्च इंजन में खोजता है तो सर्च इंजन उसके पास उपलब्ध डेटा का विश्लेषण कर यूजर्स को लाखों वेबसाइट्स में से केवल उसके काम की वेबसाइट परिणाम (Search Result) के रूप में दिखता है।
सर्च इंजन की एतिहासिक पृष्ठभूमि
सर्च इंजन के इतिहास को समझने से पूर्व इंटरनेट तथा WWW की शुरुआत पर नज़र डालना आवश्यक है। साल 1969 में अमेरिकी रक्षा विभाग द्वारा ARPANET (Advanced Research Projects Agency Network) की शुरुआत की गई, जो आधुनिक इंटरनेट का शुरुआती रूप था।
हालाँकि अब तक इसका इस्तेमाल केवल कुछ सरकारी विभागों मुख्यतः रक्षा विभाग तक ही सीमित था और विभिन्न कंप्यूटर नेटवर्क में एक दूसरे के साथ कम्यूनिकेशन करने का एक मानक (Standard) तरीका भी मौजूद नहीं था।
1983 में ट्रांसमिशन कंट्रोल प्रोटोकॉल/इंटरनेटवर्क प्रोटोकॉल (TCP/IP) नामक एक नए संचार प्रोटोकॉल की शुरुआत हुई, जो वर्तमान इंटरनेट की रीढ़ साबित हुई। इस व्यवस्था ने अलग-अलग नेटवर्क पर विभिन्न प्रकार के कंप्यूटरों को एक दूसरे से कम्यूनिकेशन करने की अनुमति दी। 1991 में वर्ल्ड वाइड वेब (WWW) की शुरुआत के साथ साल 1993 से इंटरनेट आम लोगों के इस्तेमाल के लिए शुरू कर दिया गया।
Also Read This : क्या है ऑप्टिकल फाइबर केबल तथा किस सिद्धांत पर कार्य करती है?
दुनियाँ का सबसे पहला सर्च इंजन “Archie” था, जिसे 1990 में विकसित किया गया। वर्ल्ड वाइड वेब की शुरुआत के दो वर्ष बाद एक अन्य सर्च इंजन “JumpStation” शुरू किया गया, यह अपने पूर्ववर्ती से अधिक उन्नत था तथा परिणामों को उसी क्रम में रैंक करता था, जिस क्रम में वे प्राप्त किये गए थे।
साल 1994 में David Filo तथा Jerry Yang ने प्रसिद्ध सर्च इंजन Yahoo! की शुरुआत करी। 1996 में Larry Page और Sergey Brin ने “BackRub” की शुरुआत करी, जो गूगल का प्रारंभिक रूप था। इसमें बैकलिंक्स (किसी एक वेबसाइट से दूसरे को लिंक करना) के आधार पर सर्च परिणामों को वरीयता दी जाती थी। साल 1998 में गूगल को लॉन्च किया गया और तब से समय के साथ यह उन्नत होता गया है तथा इसका वर्तमान रूप आज हमारे सामने है।
सर्च इंजन के प्रकार
सर्च इंजन को उनके काम करने के तरीकों के आधार पर निम्नलिखित तीन श्रेणियों में वर्गीकृत किया जाता है।
- क्रॉलर आधारित सर्च इंजन
- मानव संचालित सर्च इंजन
- हाइब्रिड सर्च इंजन
#1 क्रॉलर आधारित सर्च इंजन
प्रमुख सर्च इंजन गूगल, याहू तथा बिंग आदि सभी क्रॉलर आधारित सर्च इंजन हैं। क्रॉलर आधारित सर्च इंजन से आशय ऐसे सर्च इंजनों से है, जो अपने सर्च डेटाबेस में नई सामग्री जोड़ने के लिए एक रोबॉट, जिसे क्रॉलर या स्पाइडर कहा जाता है का इस्तेमाल करते हैं, ये सर्च इंजन मुख्यतः चार चरणों में अपना कार्य करते हैं, जिन्हें हम आगे विस्तार से समझेंगे।
#2 मानव संचालित डायरेक्ट्रीज
ओपन डायरेक्ट्रीज मानव संचालित सर्च इंजन हैं, ये एक ऐसे प्लेटफ़ॉर्म होते हैं जहाँ कोई वेबसाइट मालिक अपनी वेबसाइट या किसी वेबपेज को उसकी श्रेणी तथा अन्य जानकारी दर्ज कर रजिस्टर करने के लिए आवेदन कर सकता है।
सबमिट की गई वेबसाइट को डायरेक्ट्री संपादकीय टीम द्वारा जाँचा जाता है और वेबसाइट को उचित श्रेणी में जोड़ दिया जाता है या सूचीबद्ध करने के लिए अस्वीकार कर दिया जाता है। Yahoo! Directory तथा Look Smart मानव संचालित डायरेक्ट्री के उदाहरण हैं।
#3 हाइब्रिड सर्च इंजन
हाइब्रिड सर्च इंजन, जैसा कि, इसके नाम से पता चलता है खोज परिणामों में वेबसाइट्स को सूचीबद्ध करने के लिए क्रॉलर आधारित तथा मैन्युअल डायरेक्ट्री दोनों का इस्तेमाल करते हैं।
Google जैसे अधिकांश क्रॉलर आधारित सर्च इंजन क्रॉलर को प्राथमिक तंत्र के रूप में इस्तेमाल करते हैं, किन्तु साथ ही ये सर्च इंजन मानव संचालित डायरेक्ट्री का भी इस्तेमाल किसी वेबपेज से जानकारी प्राप्त करने के लिए करते हैं तथा उसे खोज परिणामों में प्रदर्शित करते हैं।
सर्च इंजन कैसे काम करते हैं?
उम्मीद है आप सर्च इंजन क्या है तथा ये कितने प्रकार के होते हैं इसे समझ चुके होंगे आइये अब जानते हैं सर्च इंजन काम कैसे करता है तथा कैसे किसी एक वेबसाइट के पास लाखों, करोड़ों विभिन्न वेबसाइट्स का डेटा उपलब्ध रहता है?
चूँकि वर्तमान में इस्तेमाल किये जाने वाले सर्च इंजन क्रॉलर आधारित सर्च इंजन हैं अतः हम यहाँ क्रॉलर आधारित सर्च इंजन की कार्यप्रणाली को समझने की कोशिश करेंगे। सर्च इंजन द्वारा अपना सर्च डेटाबेस तैयार करने के लिए एक प्रोग्राम का इस्तेमाल किया जाता है, जिसे क्रॉलर या स्पाइडर कहा जाता है।
गौरतलब है कि, प्रोग्राम किसी मशीन को एक विशिष्ट कार्य करने का निर्देश होता है। हम दैनिक जीवन में जितनी भी मशीनों का इस्तेमाल करते हैं उन सबको उनका कार्य करने के लिए प्रोग्राम या निर्देशित किया जाता है। सर्च इंजन द्वारा डेटा इकट्ठा कर हमें परिणाम दिखाने का यह कार्य निम्नलिखित चार चरणों में पूरा किया जाता है
#1 क्रॉलिंग
क्रॉलिंग (Crawling) सर्च इंजन की कार्यप्रणाली का पहला चरण है, इसमें सर्च इंजन क्रॉलर किसी वेबपेज पर मौजूद जानकारी को स्कैन करते हैं। ये स्कैन नए वेबपेज को इंडेक्स करने तथा एक बार इंडेक्स किये जा चुके वेबपेज को अपडेट करने के लिए एक निश्चित समायान्तरल पर किया जाता है।
सर्च इंजन द्वारा प्रयोग में लाए जाने वाले ये क्रॉलर किसी वेबपेज में उपस्थित दूसरे वेबपेज की लिंक (URL) द्वारा उस वेबपेज तक भी पहुँच जाते हैं और यह सिलसिला चलता रहता है तथा सर्च इंजन डेटाबेस में उन सभी वेबपेजों का डेटा जमा होता रहता है।
#2 इंडेक्सिंग
इस चरण में स्कैन किये गए वेबपेज को सर्च इंजन डेटाबेस में जोड़ा जाता है, यहाँ उस वेबपेज को प्रदर्शित करने वाले शब्दों की पहचान होती है तथा ऐसे शब्दों को “कीवर्ड” के रूप में संदर्भित किया जाता है और वेबपेज को पहचाने गए शब्द से जोड़ दिया जाता है।
कीवर्ड वे शब्द है, जिनका हम खोज के रूप में सर्च इंजन में इस्तेमाल करते हैं। इसके अतिरिक्त यदि किसी वेबपेज पर मौजूद जानकारी प्रासंगिक न हो तो उस स्थिति में उस वेबपेज को सर्च इंजन इंडेक्स नहीं करता है।
#3 कॉन्टेन्ट की प्रासंगिकता
इस चरण में इंडेक्स किये गए वेबपेजों को उनकी क्वालिटी के आधार पर पुनः सूचीबद्ध किया जाता है, जिसे सर्च इंजन की भाषा में रैंकिंग (Ranking) कहते हैं।
सर्च इंजन के पास किसी विषय विशेष से संबंधित सैकड़ों वेबपेज होते हैं, किन्तु कौन से वेबपेज खोज परिणामों में शीर्ष पर दिखाए जाने हैं इसके लिए सभी वेबपेजों को विभन्न मानकों पर जाँचा जाता है तथा इन मानकों के आधार पर ही प्रत्येक वेबपेज को खोज परिणामों में स्थान प्रदान किया जाता है।
#4 परिणाम प्रदर्शित करना
यह सर्च इंजन की कार्यप्रणाली का आखिरी चरण है, इसमें किसी “कीवर्ड” के खोजे जाने पर उससे संबंधित परिणाम प्रदर्शित किये जाते हैं तथा उपयोगकर्ता अपनी इच्छा के अनुसार किसी एक परिणाम को खोल कर आवश्यक जानकारी जुटा सकता है।
10 सर्च इंजन के नाम
इंटरनेट पर कई सर्च इंजन मौजूद हैं किन्तु यूजर बेस की बात करें तो दुनियाँ भर में सर्च इंजन के तौर पर गूगल सबसे लोकप्रिय है, आंकड़ों के अनुसार दुनियाँ की तकरीबन 85% से अधिक इंटरनेट खोजें गूगल के माध्यम से ही करी जाती हैं।
गूगल की शुरुआत आधिकारिक तौर पर साल 1998 में लैरी पेज और सर्गेई ब्रिन द्वारा की गई। गूगल सर्च इंजन के अतिरिक्त मैप, ई-मेल, वीडियो स्ट्रीमिंग जैसी सेवाएं भी प्रदान करता है।
दूसरा सबसे प्रमुख सर्च इंजन माइक्रोसॉफ्ट कंपनी का बिंग (Bing) है, इसे 2009 में लॉन्च किया गया था। बिंग सर्च इंजन गूगल की तर्ज पर मैप के साथ-साथ इमेज, वेब और वीडियो सर्च सहित विभिन्न सेवाएं प्रदान करता है। औसतन 6 फीसदी लोग सर्च इंजन के रूप में बिंग का इस्तेमाल करते हैं।
वैश्विक स्तर पर इस्तेमाल किये जाने वाले सर्च इंजनों में याहू (Yahoo) औसतन 2.5 फीसदी यूजर बेस के साथ तीसरे स्थान पर है। यह सर्च इंजन के साथ एक ई-मेल सेवा उपलब्ध करवाने वाली कंपनी है, जिसे 1994 में शुरू किया गया। इन प्रमुख सर्च इंजनों के अलावा कुछ अन्य भी हैं जिनमें से #10 सर्च इंजन के नाम नीचे दिए हैं
- Baidu
- Yandex
- DuckDuckGo
- Ask
- AOL
- Wolfram Alpha
- Ecosia
- Qwant
- Startpage
- Search Encrypt
“Baidu” चीन में सबसे अधिक इस्तेमाल किया जाने वाला सर्च इंजन है, जिसकी स्थापना जनवरी, 2000 में चीनी उद्यमी Eric Xu द्वारा की गई थी। आपको बता दें कि, चीन में गूगल तथा फ़ेसबुक समेत कई सेवाएं प्रतिबंधित हैं।
Baidu खोज के परिणाम के रूप में वेबपेजों, ऑडियो फाइलों तथा छवियों को प्रदर्शित करता है। इसके अतिरिक्त यह मानचित्र, समाचार, क्लाउड स्टोरेज समेत कुछ सहित कुछ अन्य सेवाएं भी प्रदान करता है।
सर्च इंजन कमाई कैसे करते हैं?
आपके मन में यह सवाल होगा कि, कोई सर्च इंजन जैसे गूगल बिना कोई शुल्क लिए अपने यूजर्स को सेवा कैसे उपलब्ध कराता है? आपको बता दें गूगल की कमाई का मुख्य स्रोत उसमें दिखाए जाने वाले विज्ञापन होते हैं।
चुँकि गूगल के पास लोकप्रियता एवं इंटरनेट इस्तेमाल करने वाले लोगों का बहुत बड़ा हिस्सा है इसलिए किसी सेवा या उत्पाद का प्रचार गूगल पर करना किसी भी व्यवसाय के लिए बेहतरीन विकल्प है। गूगल विभिन्न कंपनियों से पैसे लेता है तथा बदले में उनकी वस्तुओं या सेवाओं का प्रचार विज्ञपनों के माध्यम से करता है।
गूगल इन विज्ञापनों को लोगों की वेबसाइट्स के माध्यम से दिखाता है, जो गूगल पब्लिशर प्रोग्राम (Google AdSense) के तहत उससे जुड़े हैं। विज्ञापनों से आने वाले राजस्व का एक बड़ा हिस्सा वेबसाइट के मालिकों को प्राप्त होता है, जबकि बचा हिस्सा गूगल द्वारा लिया जाता है।