बुधवार, फ़रवरी 21, 2024

Top 5 This Week

spot_img

Related Posts

Google खोज बड़े पैमाने पर स्पैम हमले से अभिभूत है


Google के खोज परिणाम पिछले कुछ दिनों से स्पैम हमले का शिकार हो रहे हैं जिसे केवल पूरी तरह से नियंत्रण से बाहर बताया जा सकता है। कई डोमेन सैकड़ों-हजारों कीवर्ड के लिए रैंकिंग कर रहे हैं, जो एक संकेत है कि इस हमले का पैमाना आसानी से लाखों कीवर्ड वाक्यांशों तक पहुंच सकता है।

अद्यतन:
स्पैम की खोज सबसे पहले लिली रे ने की थी:

आश्चर्य की बात है, कई डोमेन केवल पिछले 24-48 घंटों के भीतर पंजीकृत किया गया है।

यह हाल ही में बिल हार्टज़र की पोस्टों की एक श्रृंखला से मेरे ध्यान में आया (लिंक्डइन प्रोफ़ाइल) जहां उन्होंने एक प्रकाशित किया लिंक ग्राफ़ मैजेस्टिक बैकलिंक्स टूल द्वारा उत्पन्न, जिसने कई स्पैम साइटों के लिंक नेटवर्क को उजागर किया।

उन्होंने जो लिंक ग्राफ़ पोस्ट किया, उसमें कई सारी वेबसाइटें कसकर दिखाई गईं जोड़ने एक दूसरे के साथ, जो कि एक काफी विशिष्ट पैटर्न है स्पैमयुक्त लिंक नेटवर्क.

मजबूती से जुड़े नेटवर्क का स्क्रीनशॉट

Google खोज बड़े पैमाने पर स्पैम हमले से अभिभूत हैमैजेस्टिक के माध्यम से बिल हार्टज़र द्वारा छविGoogle खोज बड़े पैमाने पर स्पैम हमले से अभिभूत है

बिल और मैंने फेसबुक मैसेंजर पर स्पैम साइटों के बारे में बात की और हम दोनों इस बात पर सहमत हुए कि हालांकि स्पैमर्स ने बैकलिंक नेटवर्क बनाने में बहुत काम किया, लेकिन लिंक वास्तव में उच्च रैंकिंग के लिए जिम्मेदार नहीं थे।

बिल ने कहा:

“यह, मेरी राय में, आंशिक रूप से Google की गलती है, जो लिंक के बजाय सामग्री पर अधिक जोर दे रहा है।”

मैं 100% सहमत हूं कि Google लिंक की तुलना में सामग्री पर अधिक जोर दे रहा है। लेकिन मेरा विचार है कि स्पैम लिंक वहाँ हैं ताकि Googlebot स्पैम पृष्ठों को खोज सके और उन्हें अनुक्रमित कर सके, भले ही केवल एक या दो दिनों के लिए।

एक बार अनुक्रमित हो जाने के बाद स्पैम पेज संभवत: उन चीज़ों का फायदा उठा रहे हैं जिनमें मैं दो खामियां मानता हूं Google के एल्गोरिदमजिसके बारे में मैं आगे बात करूंगा।

Google SERPs में नियंत्रण से बाहर स्पैम

कई साइटें लंबे वाक्यांशों के लिए रैंकिंग कर रही हैं जिन्हें रैंक करना कुछ हद तक आसान है, साथ ही स्थानीय खोज घटक वाले वाक्यांश भी हैं, जिन्हें रैंक करना भी आसान है।

लॉन्गटेल वाक्यांश ऐसे कीवर्ड वाक्यांश हैं जिनका उपयोग लोग करते हैं लेकिन बहुत ही कम। लॉन्गटेल एक अवधारणा है जो लगभग बीस वर्षों से चली आ रही है और बाद में 2006 में द लॉन्ग टेल: व्हाई द फ्यूचर ऑफ बिजनेस इज सेलिंग लेस ऑफ मोर नामक पुस्तक द्वारा लोकप्रिय हुई।

स्पैमर इन दुर्लभ खोजे गए वाक्यांशों के लिए रैंक करने में सक्षम हैं क्योंकि उन वाक्यांशों के लिए बहुत कम प्रतिस्पर्धा है, जिससे रैंक करना आसान हो जाता है।

इसलिए यदि कोई स्पैमर लंबे वाक्यांशों के लाखों पेज बनाता है तो वे पेज कम समय में हर दिन सैकड़ों हजारों कीवर्ड के लिए रैंक कर सकते हैं।

अमेज़ॅन जैसी कंपनियां एक दिन में सैकड़ों हजारों व्यक्तिगत उत्पाद बेचने के लिए लॉन्गटेल के सिद्धांत का उपयोग करती हैं जो एक उत्पाद को प्रति दिन सैकड़ों हजारों बार बेचने से अलग है।

स्पैमर इसी का फायदा उठा रहे हैं, रैंकिंग में आसानी के लिए लंबी पूंछ वाला वाक्यांशएस।

दूसरी चीज़ जिसका स्पैमर फायदा उठा रहे हैं, वह स्थानीय खोज में निहित खामी है।

स्थानीय खोज एल्गोरिदम गैर-स्थानीय कीवर्ड रैंकिंग के लिए एल्गोरिदम के समान नहीं है।

जो उदाहरण सामने आए हैं वे क्रेगलिस्ट और संबंधित कीवर्ड के भिन्न रूप हैं।

उदाहरण जैसे वाक्यांश हैं क्रेगलिस्ट ऑटो पार्ट्स, किराए के लिए क्रेगलिस्ट कमरे, मालिक द्वारा बिक्री के लिए क्रेगलिस्ट और हजारों अन्य कीवर्ड, जिनमें से अधिकांश क्रेगलिस्ट शब्द का उपयोग नहीं करते हैं।

स्पैम का पैमाना बहुत बड़ा है और यह “क्रेगलिस्ट” शब्द वाले कीवर्ड से कहीं आगे तक जाता है।

स्पैम पेज कैसा दिखता है

किसी ब्राउज़र से पृष्ठों पर जाकर यह देखना असंभव है कि स्पैम पृष्ठ कैसा दिखता है।

मैंने उन साइटों के स्रोत कोड को देखने का प्रयास किया जो Google में रैंक करती हैं लेकिन सभी स्पैम साइटें स्वचालित रूप से दूसरे डोमेन पर रीडायरेक्ट हो जाती हैं।

इसके बाद मैंने स्पैम यूआरएल दर्ज किया W3C वेबसाइट पर जाने के लिए लिंक चेकर लेकिन W3C बॉट भी साइट नहीं देख सका।

इसलिए मैंने अपने ब्राउज़र उपयोगकर्ता एजेंट को Googlebot के रूप में पहचानने के लिए बदल दिया लेकिन स्पैम साइट ने फिर भी मुझे रीडायरेक्ट कर दिया।

इससे संकेत मिलता है कि साइट यह जांच नहीं कर रही थी कि उपयोगकर्ता एजेंट Googlebot था या नहीं।

स्पैम साइट Googlebot IP पते की जाँच कर रही थी। यदि विज़िटर का आईपी पता Google से मेल खाता है तो स्पैम पृष्ठ Googlebot को सामग्री प्रदर्शित करता है।

अन्य सभी आगंतुकों को अन्य डोमेन पर रीडायरेक्ट मिला जो स्केची सामग्री प्रदर्शित करता था।

देखने के लिए एचटीएमएल जिस वेबसाइट पर मुझे Google IP पते के साथ जाना था। इसलिए मैंने स्पैम साइट पर जाने और पेज का HTML रिकॉर्ड करने के लिए Google के रिच रिजल्ट टेस्टर का उपयोग किया।

मैंने बिल हार्टज़र को दिखाया कि रिच रिजल्ट टेस्टर का उपयोग करके HTML कैसे निकाला जाता है और वह तुरंत इसके बारे में ट्वीट करने चला गया, हाहाहा। डांग!

रिच रिजल्ट टेस्टर के पास वेबपेज का HTML दिखाने का विकल्प होता है। इसलिए HTML की प्रतिलिपि बनाई, इसे एक टेक्स्ट फ़ाइल में चिपकाया और फिर इसे HTML फ़ाइल के रूप में सहेजा।

रिच रिजल्ट्स टूल द्वारा प्रदान किया गया HTML का स्क्रीनशॉट

Google खोज बड़े पैमाने पर स्पैम हमले से अभिभूत हैGoogle खोज बड़े पैमाने पर स्पैम हमले से अभिभूत है

मैंने किसी भी जावास्क्रिप्ट को हटाने के लिए HTML फ़ाइल को संपादित किया और फिर फ़ाइल को फिर से सहेजा।

अब मैं यह देख पा रहा था कि Google को वेबपेज कैसा दिखता है:

स्पैम वेबपेज का स्क्रीनशॉट

एक स्पैम वेबपेज का स्क्रीनशॉट जो Google में रैंक करता हैएक स्पैम वेबपेज का स्क्रीनशॉट जो Google में रैंक करता है

एक डोमेन 300,000+ कीवर्ड के लिए रैंक करता है

बिल ने मुझे एक स्प्रेडशीट भेजी जिसमें कीवर्ड वाक्यांशों की एक सूची थी जो स्पैम साइटों में से एक के लिए रैंक की गई थी। एक स्पैम साइट, उनमें से सिर्फ एक, 300,000 से अधिक कीवर्ड वाक्यांशों के लिए रैंक की गई।

एक डोमेन के लिए कीवर्ड दिखाने वाला स्क्रीनशॉट

छवि उस पर कीवर्ड वाक्यांशों के साथ एक स्प्रेडशीट का क्लोज़अप दिखा रही हैछवि उस पर कीवर्ड वाक्यांशों के साथ एक स्प्रेडशीट का क्लोज़अप दिखा रही है

बहुत सारे क्रेगलिस्ट कीवर्ड वाक्यांश थे लेकिन अन्य लंबी पूंछ वाले वाक्यांश भी थे, जिनमें से कई में स्थानीय खोज तत्व शामिल थे। जैसा कि मैंने बताया, लंबे वाक्यांशों के लिए रैंक करना आसान है, स्थानीय खोज वाक्यांशों के लिए रैंक करना आसान है और दो प्रकार के वाक्यांशों को जोड़ना और इन कीवर्ड वाक्यांशों के लिए रैंक करना वास्तव में आसान है।

यह स्पैम तकनीक क्यों काम करती है?

स्थानीय खोज गैर-स्थानीय एल्गोरिथम की तुलना में भिन्न एल्गोरिथम का उपयोग करता है। उदाहरण के लिए, सामान्य तौर पर किसी स्थानीय साइट को किसी क्वेरी को रैंक करने के लिए बहुत सारे लिंक की आवश्यकता नहीं होती है। स्थानीय खोज एल्गोरिदम को ट्रिगर करने और इसे भौगोलिक क्षेत्र के लिए रैंक करने के लिए पृष्ठों को बस सही प्रकार के कीवर्ड की आवश्यकता होती है।

इसलिए यदि आप “क्रेगलिस्ट ऑटो पार्ट्स” खोजते हैं तो यह स्थानीय खोज एल्गोरिदम को ट्रिगर करेगा और क्योंकि यह लंबी पूंछ वाला है, इसलिए इसे रैंक करने में बहुत अधिक समय नहीं लगेगा।

यह कई वर्षों से चली आ रही समस्या है. कई साल पहले एक वेबसाइट “राइनोप्लास्टी प्लानो, टेक्सास” के लिए रैंक करने में सक्षम थी, जिसमें पुरानी रोमन लैटिन सामग्री और अंग्रेजी में शीर्षक शामिल थे। राइनोप्लास्टी एक लंबी स्थानीय खोज है और प्लानो, टेक्सास एक अपेक्षाकृत छोटा शहर है। उस राइनोप्लास्टी कीवर्ड वाक्यांश के लिए रैंकिंग इतनी आसान थी कि लैटिन भाषा की वेबसाइट इसके लिए आसानी से रैंक करने में सक्षम थी।

Google को इस स्पैम समस्या के बारे में कम से कम 19 दिसंबर से पता है, जैसा कि डैनी सुलिवन के एक ट्वीट में स्वीकार किया गया है।

यह देखना दिलचस्प होगा कि इतने समय के बाद आखिरकार Google इस तरह के स्पैम से निपटने का कोई तरीका निकालता है या नहीं।

शटरस्टॉक/कैटरीना ओनिशचुक द्वारा प्रदर्शित छवि



ibnkamal
ibnkamalhttps://iseotools.me
Wasim Ibn Kamal | founder of iseotools.me, newslike.site and healtinfo.space | A developer and UI/UX designer. Cluster-notes.blogspot.com and tsbdu.blogspot.com are two of my blogs.

कोई जवाब दें

कृपया अपनी टिप्पणी दर्ज करें!
कृपया अपना नाम यहाँ दर्ज करें

Popular Articles