Cloudflare फ़ायरवॉल ने Google क्रॉलर को ब्लॉक किया|इंडेक्सिंग विफलता का समाधान कैसे करें

本文作者:Don jiang

कई वेबसाइट मालिकों को यह देखने को मिलता है कि उनकी साइट अचानक Google खोज परिणामों से “गायब” हो गई है। इसके पीछे का कारण बहुत संभव है कि Cloudflare फ़ायरवॉल ने ग़लती से Googlebot को ब्लॉक कर दिया, जिससे सर्च इंजन आपकी साइट को क्रॉल नहीं कर पाया।

Cloudflare की डिफ़ॉल्ट सुरक्षा नियम बहुत सख्त होते हैं, खासकर हाई-फ्रीक्वेंसी बॉट्स के लिए। थोड़ी सी चूक भी फ़ायरवॉल को ट्रिगर कर सकती है, जिससे Google की इंडेक्सिंग में देरी या कीवर्ड रैंकिंग में गिरावट आ सकती है।

यह लेख 4 व्यावहारिक चरणों में आपको Googlebot ब्लॉक समस्या को हल करने में मदद करेगा — जांच से लेकर फ़ायरवॉल सेटिंग समायोजन और विशिष्ट श्वेतसूची (whitelist) तक।

Cloudflare फ़ायरवॉल द्वारा Googlebot ब्लॉक

Table of Contens

पहले यह पुष्टि करें कि वास्तव में ब्लॉक हुआ है या नहीं

कई बार जैसे ही वेबसाइट Google में इंडेक्स नहीं होती, लोग तुरंत सेटिंग बदलने लगते हैं। लेकिन समस्या Cloudflare से न होकर कंटेंट क्वालिटी या robots.txt जैसी SEO समस्याओं की भी हो सकती है।

नीचे दिए गए तरीकों से पुष्टि करें कि क्या वाकई में Googlebot को ब्लॉक किया गया है:

Google Search Console में क्रॉलिंग त्रुटियाँ देखें

  • पथ: GSC में लॉगिन करें → “इंडेक्स” → “कवरेज” → “निष्कासित” में “क्रॉलिंग विफल” पृष्ठ देखें।
  • महत्वपूर्ण संकेत: यदि त्रुटियाँ 403/5xx या रीडायरेक्ट जैसी हों, तो यह फ़ायरवॉल ब्लॉकिंग का संकेत हो सकता है।

Cloudflare फ़ायरवॉल लॉग्स की तुलना करें

प्रक्रिया: Cloudflare लॉगिन करें → “सुरक्षा” → “घटनाएं” → समय सीमा चुनें और “User-Agent” में “Googlebot” खोजें।

स्थिति पर ध्यान दें:

  1. Block: स्पष्ट ब्लॉक (छूट देनी होगी)
  2. Challenge: CAPTCHA दिखाया गया (क्रॉलिंग को धीमा कर सकता है)
  3. JS Challenge: JavaScript जांच (मोबाइल Googlebot को विफल कर सकता है)

Google की आधिकारिक परीक्षण टूल का उपयोग करें

  1. लिंक: https://search.google.com/search-console/inspect
  2. ब्लॉक हुई URL दर्ज करें और “लाइव URL का परीक्षण करें” पर क्लिक करें।
  3. यदि “Crawl blocked” और HTTP कोड 403 दिखता है, तो यह ब्लॉकिंग की पुष्टि करता है।

CAPTCHA और पूर्ण ब्लॉक में अंतर समझें

CAPTCHA चुनौती: Googlebot को CAPTCHA पृष्ठ मिलता है (200 कोड के साथ), जिसे वह नहीं पढ़ सकता, और इंडेक्सिंग विफल हो जाती है।

पूर्ण ब्लॉक: 403 या 5xx त्रुटियाँ मिलती हैं, जिससे Googlebot पृष्ठ की सामग्री प्राप्त नहीं कर पाता।

Cloudflare फ़ायरवॉल की मूलभूत सेटिंग्स की जाँच करें

Cloudflare की सुरक्षा सेटिंग्स अच्छे बॉट्स को भी गलती से रोक सकती हैं, जैसे Googlebot।

तेज़ गति से किए गए अनुरोधों को अक्सर हमले के रूप में देखा जाता है, जिससे Googlebot पर भी प्रतिबंध लग सकता है।

नीचे दी गई 4 बुनियादी सेटिंग्स की जाँच करें:

Security Level को समायोजित करें

  1. समस्या: यदि “उच्च” या “बहुत उच्च” पर सेट किया गया है, तो वैध Googlebot अनुरोधों का 30% तक अवरुद्ध हो सकता है।
  2. प्रक्रिया: Cloudflare में जाएं → “सुरक्षा” → “सेटिंग्स” → सुरक्षा स्तर को “मध्यम” या “निम्न” पर सेट करें।
  3. टिप: सेटिंग बदलने के बाद लॉग्स देखें और विशेष नियमों से वास्तविक हमलों को ही रोकें।

क्षेत्रीय ब्लॉकिंग की जाँच करें

  • जोखिम: यदि आपने अमेरिका या यूरोप के IP ब्लॉक कर रखे हैं, तो Googlebot (जो मुख्यतः अमेरिका से आता है) अवरुद्ध हो सकता है।
  • प्रक्रिया: “सुरक्षा” → “WAF” → “क्षेत्र” → क्षेत्रीय ब्लॉक को बंद करें या ASN 15169 को छूट में डालें।

Under Attack Mode बंद करें (लाल ढाल चिह्न)

  • प्रभाव: यह मोड हर आगंतुक को 5-सेकंड सत्यापन में डालता है, जिसे Googlebot पार नहीं कर सकता।
  • प्रक्रिया: Cloudflare डैशबोर्ड में “Under Attack Mode” स्विच बंद करें।

सर्च इंजन के लिए JS चुनौती बंद करें

गंभीर समस्या: यदि “Browser Integrity Check” चालू है, तो कुछ Googlebot संस्करण (विशेषकर मोबाइल) JS न चला पाने के कारण विफल हो सकते हैं।

प्रक्रिया: “सुरक्षा” → “सेटिंग्स” → “ब्राउज़र इंटेग्रिटी चेक” → “सर्च इंजन पर लागू न करें” चुनें।

पूरक: User-Agent में “Googlebot” होने पर JS चुनौती अक्षम करने के लिए अलग नियम बनाएं।

फ़ायरवॉल में Googlebot को श्वेतसूची में डालना आवश्यक

सिर्फ सुरक्षा स्तर को कम करना वेबसाइट को असुरक्षित बना सकता है। एक सुरक्षित उपाय यह है कि आप विशेष नियमों के माध्यम से Googlebot को स्वीकृति दें।

Cloudflare नियम User-Agent, IP, या ASN पर आधारित हो सकते हैं।

User-Agent श्वेतसूची (उच्च प्राथमिकता)

कार्य: ऐसे सभी अनुरोधों की अनुमति देना जिनमें “Googlebot” User-Agent हो।

प्रक्रिया: Cloudflare → “सुरक्षा” → “WAF” → “नया नियम बनाएं”

  • फ़ील्ड: User-Agentशामिल है.*Googlebot.* डालें
  • क्रिया: “बायपास” या “अनुमति दें” चुनें

ध्यान दें: Googlebot-Image और Googlebot Smartphone जैसे वेरिएंट को भी शामिल करें।

ASN के माध्यम से श्वेतसूची (UA Spoof से बचने के लिए)

महत्व: कुछ खराब बॉट “Googlebot” User-Agent का नकली उपयोग कर सकते हैं, लेकिन ASN नकली नहीं हो सकता।

प्रक्रिया: एक अतिरिक्त नियम जोड़ें:

  • फ़ील्ड: ASNबराबर15169 (Google का ASN)

कई वेबसाइट मालिकों ने देखा है कि उनकी साइट अचानक Google खोज परिणामों से “गायब” हो गई है। इसके पीछे की एक आम वजह यह है कि Cloudflare का फ़ायरवॉल ग़लती से Googlebot को ब्लॉक कर रहा है, जिससे सर्च इंजन वेबसाइट के पेजों को ठीक से क्रॉल नहीं कर पाता।

Cloudflare की डिफ़ॉल्ट सुरक्षा सेटिंग्स काफी सख्त होती हैं, खासकर बार-बार एक्सेस करने वाले बॉट्स के लिए। ऐसे में अगर जरा सी भी चूक हुई तो फ़ायरवॉल Googlebot को ब्लॉक कर सकता है — जिससे या तो पेज इंडेक्स होने में देरी होती है या रैंकिंग एकदम गिर जाती है।

इस लेख में हम 4 स्टेप्स में आपको बताएंगे कि कैसे ब्लॉक की जांच करें, फ़ायरवॉल की बेसिक सेटिंग्स एडजस्ट करें, और Googlebot के लिए सफेदसूची (whitelist) बनाएं — ताकि Cloudflare के कारण होने वाली Google इंडेक्सिंग की समस्याओं को हल किया जा सके।

Cloudflare फ़ायरवॉल द्वारा Googlebot ब्लॉक

पहले यह सुनिश्चित करें कि वाकई में ब्लॉक हुआ है

अक्सर लोग यह देखते ही कि साइट Google में इंडेक्स नहीं हो रही, सेटिंग्स बदलना शुरू कर देते हैं। लेकिन हो सकता है कि दिक्कत फ़ायरवॉल की न हो — यह कंटेंट क्वालिटी, robots.txt जैसी SEO से जुड़ी दूसरी चीजें भी हो सकती हैं।

इसलिए पहले नीचे दिए गए तरीकों से चेक करें कि ब्लॉक सच में हुआ है या नहीं:

Google Search Console में क्रॉल एरर रिपोर्ट

  • पथ: GSC डैशबोर्ड में जाएं → बाएं मेनू में “इंडेक्सिंग” → “कवरेज” → “निकाल दिए गए” पेज देखें
  • मुख्य संकेत: अगर एरर में “रिजेक्टेड” (403/5xx) या “रीडायरेक्टेड” दिखता है, तो शायद यह फ़ायरवॉल ब्लॉक है

Cloudflare फ़ायरवॉल लॉग की तुलना करें

Cloudflare में लॉगिन करें → “सिक्योरिटी” → “इवेंट्स” → समय सीमा सेट करें → “User-Agent” में “Googlebot” ढूंढें

स्टेटस देखें:

  1. Block: पूरी तरह ब्लॉक (छूट दें)
  2. Challenge: कैप्चा दिया गया (क्रॉलिंग धीमा कर सकता है)
  3. JS Challenge: ब्राउज़र चेक (मोबाइल Googlebot को परेशानी हो सकती है)

Google की ऑफिशियल टेस्टिंग टूल का इस्तेमाल करें

  1. लिंक: https://search.google.com/search-console/inspect
  2. ब्लॉक हुए पेज का URL डालें और “Live Test” पर क्लिक करें
  3. अगर “Crawl blocked” दिखे और HTTP रिस्पॉन्स कोड 403 है, तो ब्लॉक कन्फर्म है

CAPTCHA और पूरा ब्लॉक में फर्क समझें

CAPTCHA चैलेंज: बॉट को कैप्चा पेज मिलता है (200 स्टेटस कोड, लेकिन पेज में कैप्चा है), जिससे Google क्रॉल नहीं कर पाता

पूरा ब्लॉक: 403 या 5xx स्टेटस कोड लौटता है — बॉट को कुछ नहीं मिलता

Cloudflare की फ़ायरवॉल बेसिक सेटिंग्स चेक करें

Cloudflare की डिफ़ॉल्ट सुरक्षा सेटिंग्स साइट को सुरक्षा देती हैं, लेकिन कभी-कभी Googlebot को गलती से ब्लॉक भी कर देती हैं।

अक्सर ज्यादा बार विजिट करने वाले बॉट्स को अटैक समझ लिया जाता है।

नीचे 4 बेसिक सेटिंग्स हैं, जिन्हें एडजस्ट करके आप गलत ब्लॉकिंग को काफी हद तक रोक सकते हैं:

Security Level (सुरक्षा स्तर) एडजस्ट करें

  1. समस्या: अगर यह स्तर “High” या “I’m under attack” पर है तो वैध Googlebot ट्रैफिक का 30% तक ब्लॉक हो सकता है
  2. कैसे ठीक करें: Cloudflare डैशबोर्ड → “Security” → “Settings” → Security Level को “Medium” या “Low” पर सेट करें
  3. ध्यान दें: इसके बाद लॉग्स देखें, और जरूरत होने पर कस्टम नियम बनाएं

गलत रीजन ब्लॉक्स को बंद करें

  • जोखिम: अगर आपने अमेरिका या यूरोप के IPs को ब्लॉक किया है तो Googlebot (जो अमेरिका से आता है) को भी ब्लॉक किया जा सकता है
  • कैसे ठीक करें: “Security” → “WAF” → “Regions” → ब्लॉक चेक करें, और ASN15169 (Google नेटवर्क) को एक्सक्लूड करें

Under Attack Mode बंद करें

  • असर: यह मोड सभी विजिटर्स से पहले एक 5-सेकंड वेरिफिकेशन करवाता है, जिसे Googlebot पास नहीं कर पाता, और क्रॉल फेल हो जाता है
  • कैसे बंद करें: Cloudflare डैशबोर्ड के होम पेज पर जाएं और “Under Attack Mode” को OFF करें

सर्च इंजनों के लिए JS चैलेंज को डिसेबल करें

खतरा: “Browser Integrity Check” ऑन होने से Googlebot मोबाइल जैसे बॉट JavaScript नहीं चला पाते और पेज फेल हो जाता है

कैसे करें: “Security” → “Settings” → “Browser Integrity Check” को ऐसे सेट करें कि यह सर्च इंजन पर लागू न हो

Extra: एक नियम बनाएं जो Googlebot User-Agent वाले ट्रैफ़िक के लिए JS चैलेंज को बायपास करे

Googlebot के लिए फ़ायरवॉल नियमों में छूट (Whitelist) देना ज़रूरी

सिर्फ सुरक्षा लेवल कम करना वेबसाइट को जोखिम में डाल सकता है। बेहतर है कि Googlebot को पहचान कर सिर्फ उसे अनुमति दें।

Cloudflare में आप User-Agent, IP और ASN जैसे पैरामीटर से नियम बना सकते हैं।

User-Agent व्हाइटलिस्ट (सबसे ज़रूरी)

फायदा: Googlebot वाला User-Agent मिलने पर फ़ायरवॉल उसे बायपास कर देता है

सेटअप: Cloudflare डैशबोर्ड → “Security” → “WAF” → “Rules” → नया नियम बनाएं

  • फ़ील्ड: User-Agent → “contains” → .*Googlebot.*
  • एक्शन: “Bypass” या “Skip” चुनें

टिप: Googlebot-Image, Googlebot Smartphone जैसे वेरिएंट्स को भी शामिल करें

ASN व्हाइटलिस्ट (फेक Googlebot से बचाव)

क्यों ज़रूरी है: कई फेक बॉट Googlebot का User-Agent कॉपी कर सकते हैं, लेकिन IP असली नहीं होता

सेटअप:

  • फ़ील्ड: ASN → “equals” → 15169 (Google का ASN)
Picture of Don Jiang
Don Jiang

SEO本质是资源竞争,为搜索引擎用户提供实用性价值,关注我,带您上顶楼看透谷歌排名的底层算法。

最新解读
滚动至顶部