सर्च इंजन क्या है और कैसे काम करता है?

what is search engine

सर्च इंजन वह प्रोग्राम है। या, सर्च इंजन एक एसा प्रोग्राम है जो इन्टरनेट के असीमित डेटाबेस से उपयोगकर्ता के सवाल को खोजता है (कीवर्ड / वाक्यांश बोला जाता है), और उसके संभंधी जो जानकारी मिलती है उसको सर्च रिजल्ट पेज से पता चलता है। जैसे Google करता है। हर सवाल को दुनिया चौड़ा वेब में सर्च किया जाता है।

इंटरनेट में जो भी खोज किया जाता है, उसको ढूंड के खोज इंजन सटीक परिणाम दिखाने का काम करता है। कुछ खोज इंजन के नाम “Google, Yahoo, Bing” है। आपको एक उदाहरण से अच्छे से समझाता हूँ। आपका मन में एक प्रश्न आया तो आप तुरंत Google जो एक खोज इंजन है उसमे खोज करने लगते हैं। आपका सवाल है “कंप्यूटर क्या है और ये कैसे काम करता है”।

खोज इंजन इंटरनेट पे जितने भी वेबसाइटों में उनमे यह सवाल है कि खोज करता है। जहाँ भी यह प्रश्न मैच होगा उन वेबसाइटों के नाम का मतलब खोज परिणाम के पहले पृष्ठ में दिखाइ देगा। उसके बाद कोई भी एक लिंक पे आप क्लिक करके “कंप्यूटर क्या है और ये कैसे काम करता है” इसका जवाब हो सकता है।

जो सवाल है उसी को INTERNET की भाषा में कीवर्ड कहते हैं। तो चलिए अब आपके मन में एक सवाल जरुँर आया होगा की इसी तरह ये Search engine मतलब Google, yahoo, Bing, काम कैसे होता है। जो जानकारी खोज करते हैं उसका पुरा सही सही जवाब भी देता है।

प्रमुख खोज इंजनों का नाम (Name of major search engines)

    1. Google
    2. Bing
    3. Yahoo
    4. Ask.com
    5. AOL.com
    6. Baidu
    7. Wolframalpha
    8. DuckDuckGo
    9. Internet Archive
    10. Yandex.ru

भारतीय खोज इंजन का नाम (Name of indian search engine)

जहाँ कहीं भी सारा सर्च इंजन है, वहाँ हमारा देश कैसे पीछे हटता है? यहाँ आपके लिए कुछ भारतीय सर्च इंजन की हमने लिस्ट बनाई है। ये सभी इतने लोकप्रिय नहीं हैं, पर कुछ हद तक अच्छा काम करते हैं।

    1. 123Khoj
    2. Epic Search
    3. Bhanvad
    4. GISASS
    5. Guruji

सर्च इंजन कैसे काम करता है? (How the search engine works)

पहले से हि आपको बता दिया गया है की जो भी सवाल, पाठ, समद अपने ब्राउज़र के सर्च इंजन सर्च में लिखा जाता है, उन्हें कीवर्ड बोला जाता है। अगर आप google में “हिंदी में सर्च इंजन क्या है” लिखते हैं तो ये कीवर्ड है। यह कीवर्ड को विश्व व्यापी वेब में ढूंडा जाता है। जब ये कीवर्ड किसी वेबसाइट के शीर्षक या लेख के कंटेंट के साथ मैच होता है और टैग के साथ मैच होता है, तो उसको खोज परिणाम में शो करता है। ये तो आम आदमी के लिए था, थोडा तकनीकी रूप से समझते हैं।

खोज इंजन तिन चरण में काम करता है। सबसे पहले क्रॉलिंग, इंडेक्सिंग, रैंकिंग और पुनर्प्राप्ति

क्रॉलिंग (Crawling)
क्रॉलिंग मतलब ढौंडना। और अच्छे से समझ लो एक वेबसाइट के पूरे डेटा को अधिग्रहण करना या एक वेबसाइट की पूरी जानकारी को हासिल करना। इस प्रक्रिया में वेबसाइट को स्कैन करना, पेज का शीर्षक क्या है, कीवर्ड की जानकारी, सामग्री में कितने कीवर्ड हैं, चित्र और कोन कोन से पेज में लिंक हैं वेबसाइट के साथ। लेकिन आजकल के आधुनिक क्रॉलर में सायद तक एक वेबपेज के पुरे कैश को ही कॉपी कर लेते हैं। इसके साथ साथ पृष्ठ लेआउट कैसा है, विज्ञापन कहां है, लिंक कहां दिया गया है ये भी स्टोर होता है।

खोज इंजन वेबसाइट को क्रॉल कैसे करता है? एक आत्मम चालित बॉट होते हैं जो हर नए और सूने पृष्ठों को खोजते हैं जो कि डिस्कवरी बोला जाता है। बोट्स को स्पाइडर भी बोलते हैं, जो हर रोज कोर पेजों पर जाते हैं। लेकिन हमारे या आप जैसे नहीं बोहत ही तेजी से पढ़ें करते हैं।

Google के अनुसार लगभग 1 सेकंड में 100 से 1000 पृष्ठ को विज़िट करता है। जब बॉट को कोई नया पेज नहीं मिलता है तो वह उसे बैक-एंड प्रोसेसिंग (पेज का शीर्षक, मेटा टैग, कीवर्ड, बैकलिंक, चित्र, वीडियो) को के लिए भेज दैट है। और फिर चेक करता है की इस पृष्ठ के साथ कोन कोन से पृष्ठ और जुड़े हुए हैं।

इंडेक्सिंग (Indexing)
अपने दिमाग पे ज्यादा जोर मत डालो ये इंडेक्सिंग को समझना बड़ा आसान है। अनुक्रमण एक प्रक्रिया हैं जहाँ Crawl के दोरान जो भी डेटा मिलते हैं उन सभी डेटा को डेटाबेस में जगह देना है। एक उदाहरण लेलो आपके पास बोहत सारी किताबें हैं। आप उन पुस्तकों के लेखक का नाम, पुस्तकों का नाम, पुस्तकों के हर पृष्ठ को पढ़ते हुए क्रॉलिंग करते हैं, लेकिन इन सभी विवरणों की लिस्टिंग करना केवल अनुक्रमित हैं। अब इस बात पे गोर करें सर्च इंजन सिर्फ एक वेबसाइट को क्रॉल नहीं करता है, बल्कि दुनिया में जितने भी वेबसाइट हैं उन्हें क्रॉल और इंडेक्स की भूमिका है।

Google खोज संमेलन के अनुसार Google स्पाइडर हर रोज करिअबन 3 ट्रिलियन पेज क्रॉल करता है। इसका मतलब ये है की गूगल के पास दुनिया में जितनी जानकारी है उन सब का पुस्तकालय है।

रैंकिंग और पुनर्प्राप्ति (Ranking and Retrieval)
खोज इंजन का ये समान अंतिम स्टेप है, लेकिन ये अंतिम स्टेप ही बोहत ही अधिक जटिल है। क्यूंकि जब आप कुछ Google में खोज करते हैं तो सबसे पहले खोज का काम ये है की जिस की जानकारी को आप खोज कर रहे हैं वही जानकारी आपको मिली है। लोगों का खोज इंजन पे केवल निर्भर होता है जब वह उपयोगकर्ता प्रासंगिक सामग्री ढूंड निकाल के दिखाती है। इसके लिए Google कुछ एल्गोरिथम का उपयोग करता है। जो एल्गोरिथ्म कुछ मापदंडों के मुताबिक काम करते हैं। जिनमे से कुछ सामग्री की आयु, सामग्री कीवर्ड, सामग्री पृष्ठ शीर्षक है।

पेज रैंकिंग के लिए Google के 200 कारक हैं। जिनके जरिये ही ये पता लगाया जाता है की खोज करने पे पेज GOOGLE HOME के ​​किस स्थिति पे खोज परिणाम दिखना चाहिए। रैंक एल्गोरिदम को समझना पाना बड़ा मुस्किल है। क्यूंकि 1 बिलियन वेब पेज से को व्हाको गूगल सर्च द्वारा पहले पेज में शो करता है। इसी तरह रैंकिंग कारकों को हैक करने के लिए बोहत सभी हैकर्स ने अपना दिमाग लगा रखा है।

पहले रैंकिंग का अंदाज़ा बहुत बार पोस्ट में कीवर्ड इस्तेमाल किया गया है और बैकलिंक वैसे ये सबसे बड़ी आसानी से साइट को रैंक किया जाता है। अब कुछ वर्षों से Google रैंकिंग कारकों को धुंद निकलना बड़ा ही मुस्किल हो गया है। हर साल Google अपना एल्गोरिथम बदल रहा है। क्यूंकि Google उन साइटों को पहले आने का मोका देता है जो सच में महनत कर रहे हैं। कुछ इस तरह से इन तिन चरणों में खोज इंजन काम करता है।

सर्च इंजन का इतिहास (Search engine history)

सभी सर्च इंजन का काम एक ही था इन्टरनेट पे डेटा सर्च करना और डिस्प्ले करना। सुरावती दिनों में खोज इंजन कुछ और नहीं बस एक फ़ाइल स्थानांतरण प्रोटोकॉल का संग्रह था। जितने भी सर्वर एक दुसरे से कनेक्ट थे उनमे से डेटा ढूंडना था। तब के विश्व व्यापी वेब इंटरनेट से जुड़ने का एक मात्र जरिया था। सर्च इंजन को इसलिए बनाया गया क्युटी वेब सर्वर और फाइल को डिटेक्ट करना इतना असान नहीं था।

एक्साइट (Excite)
एक्साइट का जन्म फरवरी 1993 में हुआ था। एक्साइट भी एक विश्वविद्यालय का प्रोजेक्ट था और उस प्रोजेक्ट का नाम आर्चीटेक्स्ट था। इस परियोजना में 6 uundergraduatestudent थे। स्टैनफोर्ड यूनिवर्सिटी का यह प्रोजेक्ट 1995 तक आगे चलकर क्रॉलिंग सर्च इंजन का रूप ले चुका था। काफी वृद्धि के कारण इस वेब-क्रॉलर और मैगेलन को भी खरीदा गया। अंत में इस तरह एमएसएन और नेटस्केप के साथ साझेदारी कर ली।

याहू (Yahoo)
इसका नाम तो अभी भी है, थोडा बोहत तो आप जानते ही होंगे इसके जनम 1994 को हुआ था। इसकी शुरुवात स्टैनफोर्ड विश्वविद्यालय में हुई थी। 1994 में जेरी यांग और डेविड फिलो ने इसकी शुरुआत की थी। ये दोनों इलेक्ट्रिकल इंजीनियरिंग के स्नातक छात्र थे। उन्होंने कहा कि जब एक वेबसाइट बनाई गई थी जिसका नाम “जेरी और डेविड को वर्ल्ड वाइड वेब के लिए गाइड करना” था। ये मार्गदर्शिका एक निर्देशिका थी जो दुसरे वेबसाइटों दुसरे वेबसाइटों को व्यवस्थित करके रखती थी। 1994 में याहि गाइड याहू का रूप ले लिया गया था। yahoo.com डोमेन 18 जनवरी 1995 पंजीकृत हुआ था।

वेब क्रॉलर (WebCrawler)
ये एक मेटा सर्च इंजन है जिसका जन्म 20 अप्रैल 1994 को हुआ था। Google और याहू दोनों के शीर्ष परिणाम को ये शो करता था। जिसमें आप ऑडियो, वीडियो, समाचार को बड़ी आसानी से खोज कर सकते हैं। इसको बनाने वाले का नाम ब्रायन पिंकर्टन यूनिवर्सिटी ऑफ वाशिंगटन में है।

लाइकोस (Lycos)
इसका भी जन्म 1994 में ही हुआ था। ये खोज के साथ search एक वेब पोर्टल सेवा देता है। कार्नेगी मेलन विश्वविद्यालय से इसकी शुरुआत हुई। ये ईमेल, वेब होस्टिंग, सोशल नेटवर्किंग और मनोरंजन वेबसाइटों की सेवा भी देती है।

Infoseek
Infoseek भी काफी लोकप्रिय खोज इंजन है जिसका जन्म 1994 में ही हुआ था, जिसके संस्थापक स्टीव किर्श थे। Infoseek को INFOSEEK निगम संचालित करता है। इसकी हेड क्वार्टर सनीवेल, कैलिफोर्निया है। इस कंपनी को द वाल्ट डिज़नी कंपनी ने 1998 में खरीद ली थी, फिर ये बाद में याहू के साथ जुड़ गए और अभी तक इसका कोई नाम नहीं है।

अल्ताविस्ता (AltaVista)
इसका जन्म 1995 में हुआ था। पुँराने ज़ाने में ये एक जाड़ा इस्तेमाल करने जाने वाली खोज इंजन है। 2003 में इसको याहू ने खरीद लिया। लेकिन ब्रांड और सेवाओं altavista के ही थे। लेकिन 2013 जुलाई में सभी सेवाओं को याहू ने बंद कर दिया और ये याहू सर्च इंजन में पुनर्निर्देशित हो गए।

Inktomi
इंटकमी का जन्म 1996 में हुआ था। उनके संस्थापक यूसी बर्कले प्रोफेसर एरिक ब्रेवर और एक स्नातक छात्र थे जिनका नाम पॉल गौथियर है। स्टार्टवात में ये भी एक खोज इंजन था, जो कि यूनीवर्सिटी में विकसित किया गया था।

Ask.com
इसका नाम तो आज भी है। ASK.COM पहले आस्क जीव्स था। इसका भी जन्म 1996 में हुआ था। ये एक प्रश्न उत्तर साइट है। जिसका जस्टा फोकस ई-बिजनेस और वेब सर्च इंजन पे था। इसके संस्थापक का नाम गैरेट ग्रुनेर और डेविड वॉर्थन कैलिफोर्निया है।

गूगल (Google)
वैसे आज के जब में Google एक अरबो खरबों की कंपनी है, जो ऑक्सफोर्ड डिक्शनरी में अपिनी खुद की जगह बना राखी है, जो की एक क्रिया है। लेकिन इसको बनाने में दो पीएचडी छात्रों का हाथ था, जिसका नाम सर्गेई ब्रिन और लैरी पेज जो की स्टैनफोर्ड यूनिवर्सिटी, कैलिफोर्निया के छात्र थे, 1995 में वे वहीँ पे आपस में मिले थे और उसी से इस खोज इंजन की शुरूआत हुई।

1996 में सर्गेई ब्रिन और लैरी पेज जब PHD पढाई कर रहे थे तो उन्होंने अपना PHD का पुनः खोज प्रोजेक्ट में कुछ अलग करने की सोची और वो सोचे थे “अगर हम वेबसाइट को रैंक करें दुसरे वेबसाइट के साथ तुलना करके, तो काफी अच्छा होगा, जब उनका रैंक करने का तरीका ये था, जब तक सर्च किया गया समद, उस वेबपेज में उस गणना से वो रैंक करगें और यही कल्पना आज Google का रूप है। शुरुवात में उन्होंने इसका नाम BACKRUB दिया था। 1997- दोनों में सर्च इंजन का नाम “Google” रखा गया।

⇒  URL क्या है? और यह कैसे काम करता है?
 वन टाइम पासवर्ड (OTP) क्या है?

SHARE