Google के जॉन म्यूएलर ने एक प्रश्न का उत्तर दिया कि Google robots.txt का उपयोग करके उन पृष्ठों को अनुक्रमित क्यों करता है जिन्हें उसे क्रॉल नहीं करना चाहिए और इन क्रॉल के बारे में संबंधित खोज कंसोल रिपोर्ट को अनदेखा करना क्यों सुरक्षित है।
क्वेरी पैरामीटर URL पर बॉट ट्रैफ़िक
प्रश्न पूछने वाले व्यक्ति ने दस्तावेज़ में बताया कि बॉट गैर-मौजूद क्वेरी पैरामीटर यूआरएल (?q=xyz) को नोइंडेक्स मेटा टैग वाले पेजों से लिंक करते हैं जो robots.txt में भी अवरुद्ध हैं। जो सवाल सामने आया वह यह है कि Google इन पेजों के लिंक को क्रॉल करता है, robots.txt द्वारा ब्लॉक कर दिया जाता है (नोइंडेक्स रोबोट मेटा टैग देखे बिना) और फिर Google सर्च कंसोल में “अनुक्रमित, हालांकि robots.txt द्वारा ब्लॉक किया गया” के रूप में रिपोर्ट करता है।
उस व्यक्ति ने निम्नलिखित प्रश्न पूछा:
“लेकिन यहां बड़ा सवाल यह है: Google पेजों को अनुक्रमित क्यों करेगा जब वे सामग्री देख ही नहीं सकते? इसका क्या लाभ है?”
Google के जॉन म्यूएलर ने पुष्टि की कि यदि वे पृष्ठ को क्रॉल नहीं कर सकते हैं तो वे नोइंडेक्स मेटा टैग नहीं देख सकते हैं। वह साइट: खोज ऑपरेटर का एक दिलचस्प उल्लेख भी करता है, और परिणामों को अनदेखा करने की अनुशंसा करता है क्योंकि “औसत” उपयोगकर्ता उन परिणामों को नहीं देखेंगे।
उन्होंने लिखा है:
“हां, आप सही हैं: यदि हम पेज को क्रॉल नहीं कर सकते हैं, तो हम नोइंडेक्स नहीं देख सकते हैं। हालांकि, यदि हम पेजों को क्रॉल नहीं कर सकते हैं, तो हमारे पास इंडेक्स में जोड़ने के लिए बहुत कुछ नहीं है। इसलिए जबकि आप उनमें से कुछ पृष्ठों को साइट:-लक्षित क्वेरी के साथ देख सकते हैं, औसत उपयोगकर्ता उन्हें नहीं देख पाएगा, इसलिए मैं इससे परेशान नहीं होऊंगा कि नोइंडेक्स भी ठीक है (कोई robots.txt अस्वीकृत नहीं है), इसका मतलब बस यही है यूआरएल अंततः क्रॉल हो जाएंगे (और खोज कंसोल रिपोर्ट में क्रॉल/अनुक्रमित नहीं होंगे – इनमें से कोई भी स्थिति साइट के बाकी हिस्सों के लिए समस्या पैदा नहीं करती है) महत्वपूर्ण बात यह है कि आप उन्हें क्रॉल करने योग्य + अनुक्रमित नहीं करते हैं ।”
मैं ले सकता हुं:
1. मुलर का उत्तर नैदानिक कारणों से उन्नत खोज ऑपरेटर साइट:सर्च का उपयोग करने की सीमाओं की पुष्टि करता है। इनमें से एक कारण यह है कि यह सामान्य खोज सूचकांक से जुड़ा नहीं है, यह पूरी तरह से अलग चीज है।
गूगल की जॉन मुलर ने साइट सर्च ऑपरेटर पर टिप्पणी की 2021 में:
“संक्षिप्त उत्तर एक साइट क्वेरी है: पूर्ण होने का इरादा नहीं है, और नैदानिक उद्देश्यों के लिए उपयोग नहीं किया जाता है।
साइट क्वेरी एक विशिष्ट प्रकार की खोज है जो परिणामों को किसी विशिष्ट साइट तक सीमित करती है। यह मूल रूप से केवल साइट शब्द, एक कोलन और फिर साइट का डोमेन है।
यह क्वेरी परिणामों को एक विशिष्ट साइट तक सीमित करती है। यह एक ही वेबसाइट के सभी पृष्ठों का व्यापक संग्रह नहीं होना चाहिए।”
2. robots.txt का उपयोग किए बिना नोइंडेक्स टैग इस प्रकार की स्थितियों के लिए उपयुक्त है जहां एक बॉट गैर-मौजूद पृष्ठों से लिंक करता है जिन्हें Googlebot द्वारा पता लगाया जाता है।
3. नोइंडेक्स टैग वाले यूआरएल सर्च कंसोल में “क्रॉल/अनुक्रमित नहीं” मान उत्पन्न करेंगे और बाकी साइट पर नकारात्मक प्रभाव नहीं डालेंगे।
लिंक्डइन पर प्रश्न और उत्तर पढ़ें:
जब वे सामग्री देख ही नहीं सकते तो Google पृष्ठों को अनुक्रमित क्यों करेगा?
शटरस्टॉक/ द्वारा प्रदर्शित छवि
