微信客服
Telegram:guangsuan
电话联系:18928809533
发送邮件:[email protected]

SEO में canonical का अर्थ丨SEO में canonical टैग का उपयोग करने का तरीका

本文作者:Don jiang

Rel=”canonical” टैग सर्च इंजनों को बताता है कि “इस सामग्री का कैनोनिकल संस्करण कौन सा URL है”, जिससे अथॉरिटी (प्राधिकार) का फैलाव रोका जा सके।

Google SEO में, इसका उपयोग पृष्ठ के <head> अनुभाग में <link rel=”canonical” href=”कैनोनिकल URL”> जोड़कर किया जाता है।

डेटा से पता चलता है कि ई-कॉमर्स वेबसाइटें जो कैनोनिकल टैग को सही ढंग से लागू करती हैं, उन्हें अपनी उत्पाद सूची पृष्ठों की इंडेक्सिंग दर में औसतन 28% की वृद्धि और रोबोटों द्वारा डुप्लिकेट URL की क्रॉलिंग संख्या में 40%-60% की कमी देखने को मिलती है;

न्यूज़ वेबसाइटें जो कैनोनिकल टैग का उपयोग करके समान लेखों को समेकित करती हैं, वे अपनी मुख्य सामग्री पर ऑर्गेनिक सर्च क्लिक्स में औसतन 19% की वृद्धि दिखाती हैं।

हालांकि, एक वास्तविक सर्वेक्षण में पाया गया कि केवल 31% वेबसाइटें ही इस टैग का 100% सही ढंग से उपयोग करती हैं (सामान्य त्रुटियों में शामिल हैं: गलत URL पर इंगित करना, प्रोटोकॉल/डोमेन का पालन न करना, कई टैगों का ढेर होना, आदि)।

कैनोनिकल टैग क्या है

कैनोनिकल टैग का उपयोग क्यों आवश्यक है

Google की दैनिक क्रॉलिंग में, 65% से अधिक वेबसाइटों को अनुचित URL संरचना डिज़ाइन के कारण डुप्लिकेट सामग्री की समस्या का सामना करना पड़ता है।

यह इस प्रकार प्रकट होता है:

     

  • वही लेख पैरामीटर वाले URLs के माध्यम से पहुँचा जा सकता है (जैसे ?utm_source=xxx)
  •  

  • निर्देशिका प्रत्यय वाले URLs (जैसे /page/ और /page/index.html)
  •  

  • विभिन्न उपडोमेन (जैसे www और non-www)

Google के जॉन मुलर ने आधिकारिक प्रश्नोत्तर सत्रों में बार-बार उल्लेख किया है कि जब खोज इंजन को “एक ही या पूरी तरह से समान सामग्री दिखाने वाले कई URLs” मिलते हैं, तो उसे “इनमें से किसे अथॉरिटी देनी चाहिए” की दुविधा का सामना करना पड़ता है।

एक ई-कॉमर्स उत्पाद पृष्ठ रंग फिल्टर या सॉर्टिंग पैरामीटर के कारण एक दर्जन से अधिक विभिन्न URLs उत्पन्न कर सकता है; एक प्रेस विज्ञप्ति को कई कॉलम में भेजा जा सकता है, जिससे कई प्रवेश लिंक बन सकते हैं।

कैनोनिकल टैग का उपयोग करके, आप खोज इंजन को स्पष्ट रूप से बता रहे हैं: “हालांकि इस सामग्री को कई URLs के माध्यम से देखा जा सकता है, फिर भी मैंने जिस विशिष्ट URL को नामित किया है, उस पर अथॉरिटी और रैंकिंग का ध्यान केंद्रित करें“।

डुप्लिकेट सामग्री SEO को कैसे प्रभावित करती है

डुप्लिकेट सामग्री अपने आप में खोज इंजनों द्वारा सीधे दंडित नहीं होती है (Google ने स्पष्ट रूप से कहा है कि “यह केवल डुप्लिकेट सामग्री के लिए साइटों को दंडित नहीं करेगा”), लेकिन यह अथॉरिटी के फैलाव का कारण बनती है।

जब एक ही सामग्री कई URLs के माध्यम से उपलब्ध होती है, तो खोज इंजन इन URLs को “अलग-अलग पृष्ठों” के रूप में मानता है और उन्हें अलग से संसाधित करता है।

उदाहरण के लिए, एक मूल लेख निम्नलिखित 4 URLs के माध्यम से प्रदर्शित होता है:

     

  • https://example.com/article
  •  

  • https://example.com/article?source=newsletter
  •  

  • https://example.com/article#comments
  •  

  • https://www.example.com/article (www वाला संस्करण)

कैनोनिकल पहचान के बिना, खोज इंजन इन सभी 4 URLs को एक ही समय में क्रॉल कर सकता है और प्रत्येक के लिए इंडेक्सिंग अथॉरिटी की गणना अलग-अलग कर सकता है।

हालांकि, उपयोगकर्ता की खोज की आवश्यकता मूल रूप से एक ही जवाब है, और अंत में, इन 4 संस्करणों की रैंकिंग कम हो सकती है (क्योंकि अथॉरिटी बिखरी हुई है), या उनमें से केवल एक को ही गलती से इंडेक्स में शामिल किया जाता है, और अन्य संस्करण लंबे समय तक “गैर-इंडेक्स्ड” या “कम रैंकिंग” स्थिति में रहते हैं।

एक ई-कॉमर्स वेबसाइट पर, एक उत्पाद विवरण पृष्ठ पैरामीटर (जैसे ?size=XL, ?color=red) के कारण औसतन 8 से 12 डुप्लिकेट URLs उत्पन्न कर सकता है, और इन पृष्ठों के लिए रोबोट क्रॉलिंग का अनुपात कुल क्रॉलिंग वॉल्यूम का 15%-20% तक पहुँच सकता है (जिसे नए, अधिक मूल्यवान पृष्ठों के लिए आवंटित किया जाना चाहिए था)।

न्यूज़ वेबसाइटें, सामग्री को कई कॉलम में भेजने के कारण (जैसे “ताज़ा समाचार”, “उद्योग रुझान”, “लोकप्रिय सिफ़ारिशें”), एक ही मसौदा 3-5 अलग-अलग प्रवेश URLs उत्पन्न कर सकता है।

एक अधिक विशिष्ट मामला: URL मानकीकरण से पहले, एक मध्यम आकार की ई-कॉमर्स वेबसाइट के उत्पाद सूची पृष्ठों की इंडेक्सिंग दर केवल 62% थी (यानी, Google द्वारा केवल 100 में से 62 पृष्ठों को शामिल किया गया था और वे रैंकिंग में भाग ले सकते थे);

पैरामीटर वाले सूची पृष्ठों (जैसे ?category=shoes&sort=price) पर कैनोनिकल टैग जोड़ने के बाद, ताकि वे बिना पैरामीटर वाले बेस URL (जैसे /shoes) की ओर इंगित करें, इंडेक्सिंग दर 3 महीने के बाद बढ़कर 81% हो गई, और संबंधित उत्पादों के ऑर्गेनिक सर्च ट्रैफ़िक में 17% की वृद्धि हुई।

यह “डुप्लिकेट को हटाना” नहीं है, बल्कि “प्रामाणिक संस्करण को नामित करना” है

कई वेबमास्टर्स कैनोनिकल टैग को गलत समझते हैं, यह मानते हुए कि इसका उपयोग “डुप्लिकेट पृष्ठों को हटाने” के लिए किया जाता है।

वास्तव में, इसका मुख्य कार्य “खोज इंजन को बताना है: एक ही सामग्री दिखाने वाले कई URLs के बीच, कौन सा वह संस्करण है जिसे उसे इंडेक्स करना चाहिए, रैंक करना चाहिए, और अधिमानतः अथॉरिटी देनी चाहिए”

जब आप किसी पृष्ठ के <head> अनुभाग में निम्नलिखित कोड जोड़ते हैं:

<link rel=“canonical” href=“https://example.com/कैनोनिकल_URL” />​

आप खोज इंजन को एक स्पष्ट संकेत भेज रहे हैं: “हालांकि इस सामग्री को इस पृष्ठ के माध्यम से एक्सेस किया जा सकता है (जैसे पैरामीटर के साथ /article?source=email), मैं चाहता हूँ कि आप इसकी अथॉरिटी और रैंकिंग के अवसरों को उस पते https://example.com/कैनोनिकल_URL पर केंद्रित करें”।

Google के आधिकारिक दस्तावेज़ीकरण और वास्तविक क्रॉलिंग डेटा के अवलोकन के अनुसार:

     

  • क्रॉलिंग स्तर​: खोज इंजन पृष्ठ के सभी संस्करणों (पैरामीटर और निर्देशिकाओं वाले URLs सहित) को क्रॉल करना जारी रखेगा, लेकिन यह उन पृष्ठों के लिए अपनी “महत्वपूर्णता के स्तर” को समायोजित करने के लिए कैनोनिकल टैग से परामर्श करेगा। उदाहरण के लिए, पैरामीटर वाली URL को क्रॉल किया जा सकता है, लेकिन रोबोट कैनोनिकल संस्करण की तरह अक्सर या गहराई से उस पर नहीं जाएगा या इंडेक्स नहीं करेगा।
  •  

  • इंडेक्सिंग स्तर​: यदि कई URLs की सामग्री बहुत समान है (डुप्लीकेशन दर 80% से अधिक है), तो खोज इंजन आम तौर पर कैनोनिकल संस्करण को इंडेक्स में शामिल करेगा, और अन्य संस्करणों को अलग से इंडेक्स नहीं किया जा सकता है, या यदि वे इंडेक्स किए जाते हैं, तो वे मुख्य रैंकिंग प्रतियोगिता में भाग नहीं लेंगे।
  •  

  • अथॉरिटी स्तर​: जब कोई बाहरी लिंक URL के किसी भी डुप्लिकेट संस्करण की ओर इंगित करता है, तो खोज इंजन, कैनोनिकल टैग के मार्गदर्शन का पालन करते हुए, बाहरी लिंक अथॉरिटी के उस हिस्से को कैनोनिकल संस्करण में “स्थानांतरित” या “संबद्ध” करता है (हालांकि यह 100% पूर्ण स्थानांतरण नहीं है, अधिकांश मामलों में प्रभाव समान होता है)।

एक वास्तविक परिदृश्य लें: एक ब्लॉग लेख को एक साथ दो कॉलम में प्रकाशित किया जाता है: “होमपेज सिफ़ारिश” और “तकनीकी कॉलम“, जिससे दो URLs उत्पन्न होती हैं:

     

  • https://example.com/home/recommend/123 (होमपेज सिफ़ारिश प्रवेश)
  •  

  • https://example.com/tech/article/123 (तकनीकी कॉलम प्रवेश)

सामग्री पूरी तरह से समान है, लेकिन होमपेज सिफ़ारिश URL ने उच्च ट्रैफ़िक के कारण कुछ बाहरी लिंक आकर्षित किए हैं

कैनोनिकल टैग के बिना, खोज इंजन इन दो पृष्ठों को स्वतंत्र सामग्री के रूप में मान सकता है, और हालांकि होमपेज सिफ़ारिश URL में बाहरी लिंक हैं, इसका रैंकिंग पोटेंशियल तकनीकी कॉलम से कम हो सकता है क्योंकि कॉलम की स्थिति पर्याप्त रूप से लंबवत नहीं है (होमपेज सिफ़ारिश आमतौर पर सामान्य सामग्री होती है)।

यदि तकनीकी टीम दोनों पृष्ठों पर कैनोनिकल टैग जोड़ती है, जो https://example.com/tech/article/123 की ओर इंगित करता है, जो सामग्री के विषय के लिए अधिक उपयुक्त है, तो खोज इंजन स्पष्ट रूप से जानेगा: “इस सामग्री का प्रामाणिक संस्करण तकनीकी कॉलम URL है”, और यह होमपेज से बाहरी लिंक अथॉरिटी को इस URL से संबद्ध करेगा, जिससे “तकनीकी-संबंधी कीवर्ड” के तहत इस पृष्ठ की रैंकिंग प्रतिस्पर्धात्मकता बढ़ जाएगी।

यदि कैनोनिकल टैग का उपयोग नहीं किया जाता है तो क्या होगा

रोबोट क्रॉल बजट बर्बाद होता है

खोज इंजन द्वारा प्रत्येक वेबसाइट को आवंटित “दैनिक क्रॉल की संख्या” सीमित होती है (जिसे “क्रॉल बजट” कहा जाता है), और यह महत्वपूर्ण पृष्ठों (जैसे होमपेज, उच्च अद्यतन आवृत्ति वाली सामग्री पृष्ठ) को क्रॉल करने को प्राथमिकता देता है।

यदि किसी वेबसाइट पर कई डुप्लिकेट URLs हैं (उदाहरण के लिए, 10 सॉर्टिंग पैरामीटर वाला एक ई-कॉमर्स उत्पाद विवरण पृष्ठ, जो 1000 से अधिक विभिन्न URLs उत्पन्न करता है), तो रोबोट इन “समान सामग्री, लेकिन अलग URL” वाले पृष्ठों पर बजट का कुछ हिस्सा खर्च करेगा, जिससे वास्तव में क्रॉल किए जाने वाले नए पृष्ठों (जैसे नए जारी किए गए उत्पाद, अद्यतन समाचार) की क्रॉलिंग आवृत्ति कम हो जाएगी।

डेटा से पता चलता है कि एक मध्यम आकार की कपड़ों की ई-कॉमर्स वेबसाइट के क्रॉल लॉग विश्लेषण से पता चला है कि पैरामीटर वाले डुप्लिकेट उत्पाद पृष्ठों (जैसे ?size=M, ?color=blue) ने कुल क्रॉलिंग वॉल्यूम का 22% हिस्सा लिया, और इन पृष्ठों पर बाउंस दर 85% तक थी (उपयोगकर्ता विशिष्ट उत्पादों की खोज कर रहे हैं, वे पैरामीटर वाले URLs के माध्यम से प्रवेश नहीं करेंगे)।

जब वेबसाइट ने उत्पाद विवरण पृष्ठों पर एक एकीकृत कैनोनिकल टैग जोड़ा (बिना पैरामीटर वाले बेस URL की ओर इंगित करते हुए), तो रोबोट द्वारा मुख्य उत्पाद पृष्ठों की क्रॉलिंग आवृत्ति 30% बढ़ गई, और नए उत्पादों के इंडेक्स में शामिल होने का समय औसत 7 दिनों से घटकर 3 दिन हो गया।

इंडेक्सिंग संस्करण में भ्रम, अस्थिर रैंकिंग

कैनोनिकल पहचान के बिना, खोज इंजन मनमाने ढंग से एक URL को “डिफ़ॉल्ट प्रदर्शन संस्करण” के रूप में चुन सकता है, लेकिन यह चुनाव स्थिर नहीं है।

उदाहरण के लिए, जब कोई उपयोगकर्ता किसी कीवर्ड की खोज करता है, तो कभी-कभी उसे www वाला संस्करण (https://www.example.com/page) दिखाई देता है, कभी-कभी बिना www वाला संस्करण (https://example.com/page), और यहां तक कि पैरामीटर वाला संस्करण भी हो सकता है (https://example.com/page?from=social)।

मामला: एक स्थानीय सेवा वेबसाइट का “हमसे संपर्क करें” पृष्ठ दो संस्करणों https://example.com/contact और https://example.com/contact-us में मौजूद था (सामग्री पूरी तरह से समान थी), बिना कैनोनिकल टैग सेट किए। Google ने इन दो URLs को अलग-अलग समय पर इंडेक्स किया, जिसके कारण जब उपयोगकर्ताओं ने “XX शहर में मरम्मत सेवा संपर्क जानकारी” खोजी, तो कभी-कभी उन्हें पहला संस्करण उच्च रैंक पर और कभी-कभी दूसरा संस्करण दिखाई देता था।

जब उपयोगकर्ता क्लिक करता है, यदि वह गैर-मुख्य संस्करण (जैसे contact-us) में प्रवेश करता है, तो पृष्ठ नेविगेशन डिज़ाइन में अंतर के कारण रूपांतरण दर कम हो सकती है (उदाहरण के लिए, ऑनलाइन बुकिंग बटन गायब)।

बाद में, वेबसाइट ने दोनों संस्करणों पर कैनोनिकल टैग जोड़ा, जो https://example.com/contact की ओर इंगित करता था, और 3 महीने के बाद, इस पृष्ठ की रैंकिंग में सुधार हुआ, और खोज क्लिक-थ्रू दर (CTR) में 11% की वृद्धि हुई।

बाहरी लिंक अथॉरिटी का फैलाव

यदि कई डुप्लिकेट URL संस्करणों को बाहरी वेबसाइटों द्वारा लिंक किया जाता है (उदाहरण के लिए, किसी ने सामग्री को पुनर्प्रकाशित करते समय पैरामीटर वाली URL का उपयोग किया, या कॉलम पृष्ठ को बढ़ावा देते समय एक नया लिंक उत्पन्न हुआ), लेकिन ये बाहरी लिंक अलग-अलग पते पर इंगित करते हैं, तो खोज इंजन अथॉरिटी को स्वचालित रूप से मर्ज नहीं कर सकता है।

डेटा तुलना: एक शैक्षिक वेबसाइट के “स्नातकोत्तर प्रवेश मार्गदर्शिका” के बारे में एक लेख को 5 बाहरी साइटों द्वारा पुनर्प्रकाशित किया गया था, जिनमें से 3 ने बिना पैरामीटर वाले संस्करण (https://example.com/guide/kaoyan) को लिंक किया, और 2 ने पैरामीटर वाले संस्करण (https://example.com/guide/kaoyan?from=partner) को लिंक किया।

कैनोनिकल टैग सेट किए बिना, खोज इंजन इन 5 बाहरी लिंक्स को अलग-अलग URLs से संबद्ध करेगा। जब वेबसाइट ने सभी संस्करणों पर कैनोनिकल टैग जोड़ा (बिना पैरामीटर वाले संस्करण की ओर इंगित करते हुए), तो 6 महीनों में पृष्ठ के ऑर्गेनिक सर्च ट्रैफ़िक में 24% की वृद्धि हुई।

कैनोनिकल टैग का मूल सिंटैक्स और प्रारूप

लगभग 32% पृष्ठ कैनोनिकल टैग को <body> अनुभाग में रखते हैं (आवश्यक <head> क्षेत्र के बजाय), 19% href विशेषता मानों में पूर्ण प्रोटोकॉल की कमी होती है (जैसे https://example.com के बजाय केवल example.com लिखा जाता है), और 15% पृष्ठ कई डुप्लिकेट URLs पर विभिन्न “कैनोनिकल संस्करणों” की ओर इंगित करते हैं (जो खोज इंजन में भ्रम पैदा करता है)।

तकनीकी कार्यान्वयन के दृष्टिकोण से, कैनोनिकल टैग अनिवार्य रूप से एक साधारण HTML लिंक टैग है, लेकिन टैग का स्थान (यह <head> के अंदर होना चाहिए), सिंटैक्स प्रारूप (HTML विनिर्देशों का सख्ती से पालन करना चाहिए), और यह जिस URL की ओर इंगित करता है (वास्तविक सामग्री से पूरी तरह से मेल खाना चाहिए और पहुंच योग्य होना चाहिए) प्रमुख कारक हैं जो यह सुनिश्चित करते हैं कि खोज इंजन इसे सही ढंग से स्वीकार और लागू करे।

डेटा से पता चलता है कि जब कैनोनिकल टैग को मानक लेखन के अनुसार लागू किया जाता है (अर्थात, <head> के शीर्ष पर रखा जाता है, पूर्ण HTTPS प्रोटोकॉल का उपयोग करता है, एक अद्वितीय और सही कैनोनिकल URL की ओर इंगित करता है), तो खोज इंजन द्वारा इसके सही ढंग से पहचाने और लागू होने की संभावना 95% से अधिक होती है;

और लेखन त्रुटियों वाले पृष्ठों पर, कैनोनिकल इरादे का लगभग 60% खोज इंजन द्वारा नहीं अपनाया जाता है, जिसके परिणामस्वरूप डुप्लिकेट सामग्री की समस्या बनी रहती है।

उदाहरण के लिए, जब एक ई-कॉमर्स वेबसाइट ने उत्पाद विवरण पृष्ठ (जैसे पैरामीटर वाला ?color=red संस्करण) पर कैनोनिकल टैग जोड़ा, तो प्रोटोकॉल शीर्षक छूट जाने के कारण (//example.com/product या example.com/product के रूप में लिखा गया), Google लक्ष्य URL को सही ढंग से पार्स (विश्लेषण) नहीं कर सका।

मानक सिंटैक्स संरचना

कैनोनिकल टैग का पूर्ण सिंटैक्स केवल एक पंक्ति का HTML कोड है: <link rel=“canonical” href=“https://www.example.com/कैनोनिकल_पृष्ठ_का_पूर्ण_URL” />

यह कोड की पंक्ति 3 मुख्य भागों से बनी है, जो अपरिहार्य हैं और उनका क्रम निश्चित है:

टैग प्रकार: <link>

     

  • यह HTML टैग है जिसका उपयोग दस्तावेज़ और बाहरी संसाधनों के बीच संबंध को परिभाषित करने के लिए किया जाता है, और कैनोनिकल टैग एक प्रकार का “लिंक संबंध” है, इसलिए <link> को आधार संरचना के रूप में उपयोग किया जाना चाहिए।

विशेषता: rel="canonical"

     

  • rel <link> टैग की एक अनिवार्य विशेषता है, जिसका उपयोग वर्तमान लिंक और वर्तमान दस्तावेज़ के बीच संबंध का वर्णन करने के लिए किया जाता है। जब इसका मान canonical पर सेट होता है, तो यह खोज इंजन को स्पष्ट रूप से बताता है: “यह टैग वर्तमान पृष्ठ की कैनोनिकल (प्रामाणिक) सामग्री संस्करण को परिभाषित करता है”।

विशेषता: href="URL"

     

  • href <link> टैग की एक और अनिवार्य विशेषता है, जिसका उपयोग कैनोनिकल संस्करण के विशिष्ट वेब पते को इंगित करने के लिए किया जाता है। यह URL पूर्ण और पहुंच योग्य होना चाहिए, जिसमें प्रोटोकॉल (http या https), डोमेन (www या non-www), पथ और पैरामीटर (यदि आवश्यक हो) शामिल हों।

उदाहरण के लिए:

     

  • सही लेखन: href="https://www.example.com/products/shoes"
  •  

  • गलत लेखन 1 (प्रोटोकॉल गायब है): href="//www.example.com/products/shoes" (ब्राउज़र इसे स्वचालित रूप से पूरा कर सकता है, लेकिन खोज इंजन लक्ष्य URL का सटीक रूप से विश्लेषण करने में सक्षम नहीं हो सकता है)
  •  

  • गलत लेखन 2 (डोमेन गायब है): href="/products/shoes" (सापेक्ष पथ, खोज इंजन नहीं जानता कि विशिष्ट पृष्ठ किस वेबसाइट से संबंधित है)
  •  

  • गलत लेखन 3 (टंकण त्रुटि): href="https://www.exaple.com/products/shoes" (गलत वर्तनी वाला डोमेन, एक गैर-मौजूद पृष्ठ की ओर इंगित करता है)

अन्य विवरण​:

     

  • यह टैग / के साथ समाप्त होना चाहिए (यदि URL को ही ट्रेलिंग स्लैश की आवश्यकता है), लेकिन अधिकांश मामलों में, आधुनिक खोज इंजन ट्रेलिंग स्लैश शामिल है या नहीं, इसके प्रति अधिक सहिष्णु हैं (बशर्ते मानकीकरण सुसंगत हो)।
  •  

  • टैग को एक ही पंक्ति में लिखा जाना चाहिए (लाइन ब्रेक कुछ विश्लेषण टूल को विफल कर सकता है, हालांकि खोज इंजन आमतौर पर इसे स्वचालित रूप से पुनर्प्राप्त कर सकते हैं)।
  •  

  • टैग का समापन भाग /> है (स्वयं-समापन टैग, HTML5 मानक अंतिम / को छोड़ने की अनुमति देता है, लेकिन संगतता सुनिश्चित करने के लिए इसे बनाए रखने की सिफारिश की जाती है)।

यह <head> में क्यों होना चाहिए

क्योंकि जब खोज इंजन रोबोट एक पृष्ठ को क्रॉल करते हैं, तो वे पहले <head> क्षेत्र में सामग्री (विशेष रूप से मेटा-जानकारी, शीर्षक, कैनोनिकल टैग और अन्य “नियंत्रण निर्देश”) का विश्लेषण करते हैं, और फिर <body> में वास्तविक सामग्री को संसाधित करते हैं।

यदि कैनोनिकल टैग गलती से <body> के अंदर रखा जाता है (उदाहरण के लिए, लेख सामग्री के एक पैराग्राफ में या फुटर कोड में नेस्टेड), तो खोज इंजन <body> के अंदर <link rel="canonical"> टैग को सीधे अनदेखा कर देगा।

अन्य नोट्स​:

     

  • एक पृष्ठ में केवल एक कैनोनिकल टैग हो सकता है (यदि कई दिखाई देते हैं, तो खोज इंजन आमतौर पर केवल पहले वाले को पहचानता है, और बाकी को अनदेखा कर दिया जाता है)।
  •  

  • यह टैग अन्य टैगों के अंदर नेस्टेड नहीं हो सकता है (उदाहरण के लिए, इसे <div> या <script> में नहीं रखा जा सकता है)।
  •  

  • गतिशील रूप से उत्पन्न होने वाले पृष्ठों के लिए (जैसे PHP, Python, आदि जैसी सर्वर-साइड भाषाओं द्वारा उत्पन्न पृष्ठ), यह सुनिश्चित करना आवश्यक है कि टेम्पलेट इंजन HTML उत्पन्न करते समय कैनोनिकल टैग को <head> क्षेत्र के अंदर सही ढंग से डाले (आमतौर पर टेम्पलेट चर के माध्यम से नियंत्रित)।

5 सबसे आम त्रुटियां

त्रुटि 1: गलत URL पर इंगित करना (कैनोनिकल संस्करण वास्तविक आवश्यकता से मेल नहीं खाता है)

     

  • घटना​: कैनोनिकल टैग को एक URL की ओर निर्देशित करना जिसकी सामग्री पूरी तरह से संगत नहीं है (या बिल्कुल भी समान सामग्री नहीं है)। उदाहरण के लिए, एक उत्पाद विवरण पृष्ठ (लाल जूते दिखाता है) सफेद जूते के पृष्ठ की ओर इंगित करता है।
  •  

  • परिणाम​: खोज इंजन गलत निर्देश के अनुसार अप्रासंगिक पृष्ठ पर अथॉरिटी केंद्रित करेगा, जिससे मुख्य सामग्री की रैंकिंग गिर जाएगी।
  •  

  • सुधार​: वर्तमान पृष्ठ की वास्तविक सामग्री की जाँच करें और सुनिश्चित करें कि href में URL कैनोनिकल संस्करण की ओर इंगित करता है जो “पूरी तरह से समान सामग्री दिखाता है” (उदाहरण के लिए, बिना पैरामीटर वाले एकीकृत बेस URL का उपयोग करें, या कॉलम पृष्ठ जो उपयोगकर्ता के खोज इरादे के लिए सबसे अच्छा है)।

त्रुटि 2: प्रोटोकॉल हेडर गायब है (केवल डोमेन लिखा गया है या सापेक्ष पथ का उपयोग किया गया है)

     

  • घटना​: कोड को href="//example.com/page" (प्रोटोकॉल सापेक्ष पथ) या href="/page" (सापेक्ष पथ) के रूप में लिखा गया है।
  •  

  • परिणाम​: खोज इंजन लक्ष्य URL के पूर्ण पते का सटीक रूप से विश्लेषण करने में सक्षम नहीं हो सकता है (विशेष रूप से क्रॉस-प्रोटोकॉल या क्रॉस-डोमेन मामलों में), जिससे कैनोनिकल इरादा अप्रभावी हो जाता है।
  •  

  • सुधार​: हमेशा पूर्ण प्रोटोकॉल + डोमेन + पथ का उपयोग करें, प्रारूप है href="https://www.example.com/page" (सुरक्षा सुनिश्चित करने के लिए https प्रोटोकॉल की सिफारिश की जाती है)।

त्रुटि 3: पैरामीटर वाली URLs और कैनोनिकल संस्करण के बीच टकराव

     

  • घटना​: एक उत्पाद सूची पृष्ठ का बिना पैरामीटर वाला संस्करण (https://example.com/products) कैनोनिकल संस्करण है, लेकिन पैरामीटर वाला संस्करण (जैसे https://example.com/products?sort=price) गलती से इसकी ओर इंगित नहीं करता है, बल्कि अन्य पैरामीटर वाली किसी अन्य URL (जैसे ?sort=date) की ओर इंगित करता है।
  •  

  • परिणाम​: कई पैरामीटर वाले संस्करण एक-दूसरे को अलग-अलग URLs पर इंगित करते हैं, जिससे “चक्रीय कैनोनिकलाइज़ेशन” या अथॉरिटी का फैलाव होता है।
  •  

  • सुधार​: सभी पैरामीटर वाली URLs के कैनोनिकल टैग को एकीकृत करें ताकि वे बिना पैरामीटर वाले बेस संस्करण (या सबसे अधिक उपयोग किए जाने वाले सॉर्टिंग/फ़िल्टरिंग संस्करण) की ओर इंगित करें, यह सुनिश्चित करते हुए कि सभी वेरिएंट संस्करण एक ही कैनोनिकल पते पर इंगित करें।

त्रुटि 4: टैग को <body> के अंदर रखा गया है

     

  • घटना​: CMS बैकएंड के माध्यम से पृष्ठ को संपादित करते समय, कैनोनिकल कोड गलती से लेख सामग्री क्षेत्र (<body> भाग) में पेस्ट हो जाता है, न कि वेबसाइट टेम्पलेट के <head> क्षेत्र में।
  •  

  • परिणाम​: खोज इंजन रोबोट टैग को अनदेखा कर सकता है, जिसके परिणामस्वरूप डुप्लिकेट पृष्ठों का गलत मानकीकरण होता है।
  •  

  • सुधार​: तकनीकी टीम से संपर्क करें ताकि टेम्पलेट फ़ाइलों (जैसे WordPress header.php, Shopify theme.liquid) की जाँच की जा सके और सुनिश्चित किया जा सके कि कैनोनिकल टैग HTML के <head> टैग के अंदर उत्पन्न होता है।

त्रुटि 5: कई कैनोनिकल टैगों का ढेर

     

  • घटना​: टेम्पलेट त्रुटि या मैन्युअल जोड़ के कारण, एक पृष्ठ पर कई <link rel="canonical"> टैग दिखाई देते हैं (उदाहरण के लिए, एक साथ /page और /page/ की ओर इंगित करते हैं)।
  •  

  • परिणाम​: खोज इंजन आमतौर पर केवल पहले टैग को पहचानता है, और बाद के टैगों को अनदेखा कर दिया जाता है, जिससे कैनोनिकल इरादे में भ्रम पैदा हो सकता है।
  •  

  • सुधार​: कोड की जाँच करें, अनावश्यक कैनोनिकल टैग हटाएँ और सुनिश्चित करें कि प्रत्येक पृष्ठ में केवल एक कैनोनिकल निर्देश हो।

कैनोनिकल और अन्य टैगों के बीच अंतर (जैसे noindex, 301 रीडायरेक्ट)

कैनोनिकल टैग “एक ही सामग्री के प्रामाणिक संस्करण को नामित करने” के लिए है (सभी URLs को बनाए रखना, लेकिन अथॉरिटी केंद्रित करना), noindex टैग “खोज इंजन को वर्तमान पृष्ठ को इंडेक्स करने से रोकने” के लिए है (क्रॉलिंग की अनुमति देना, लेकिन प्रदर्शन नहीं), और 301 रीडायरेक्ट “पुराने URL को नए URL पर स्थायी रूप से रीडायरेक्ट करने” के लिए है (ट्रैफ़िक और अथॉरिटी का पूर्ण स्थानांतरण)।

कैनोनिकल, रोक और रीडायरेक्ट के बीच आवश्यक अंतर

कैनोनिकल टैग (canonical tag)​: “एक ही सामग्री के लिए कई URLs के परिदृश्य” के लिए उपयोग किया जाता है, उद्देश्य खोज इंजन को बताना है कि “इन पृष्ठों की सामग्री वास्तव में समान है, लेकिन आपको केवल उस विशिष्ट URL पर ध्यान केंद्रित करना चाहिए जिसे मैंने नामित किया है (कैनोनिकल संस्करण), और अथॉरिटी को यहाँ केंद्रित करना चाहिए”।

     

  • विशिष्ट परिदृश्य: पैरामीटर वाले ई-कॉमर्स उत्पाद विवरण पृष्ठ (जैसे ?color=red और ?color=blue), कई कॉलम में भेजी गई प्रेस विज्ञप्ति (जैसे “ताज़ा समाचार” और “उद्योग रुझान”), मोबाइल और डेस्कटॉप के लिए अलग URL लेकिन सामग्री समान है।

noindex टैग (इंडेक्सिंग निषेध टैग)​: “क्रॉलिंग की अनुमति देना, लेकिन प्रदर्शन को रोकना” के परिदृश्य के लिए उपयोग किया जाता है, यह खोज इंजन को बताता है कि “आप इस पृष्ठ को क्रॉल कर सकते हैं, लेकिन इसे खोज परिणामों के इंडेक्स में शामिल न करें”।

     

  • विशिष्ट परिदृश्य: आंतरिक प्रबंधन पृष्ठ (जैसे लॉगिन पृष्ठ, बैकएंड आँकड़े पृष्ठ), अस्थायी ईवेंट पृष्ठ (जिन्हें ईवेंट समाप्त होने के बाद रैंकिंग बनाए रखने की आवश्यकता नहीं है), कम मूल्य वाली सामग्री पृष्ठ (जैसे प्रिंट करने योग्य संस्करण, सरलीकृत/पारंपरिक चीनी रूपांतरण पृष्ठ)।

301 रीडायरेक्ट (स्थायी रीडायरेक्ट)​: “सामग्री स्थायी रूप से माइग्रेट हो गई है” के परिदृश्य के लिए उपयोग किया जाता है, जो सर्वर सेटिंग्स (जैसे .htaccess फ़ाइल या Nginx नियम) के माध्यम से उपयोगकर्ता और खोज इंजन को पुराने URL से नए URL पर स्वचालित रूप से रीडायरेक्ट करता है। पुराने URL की अथॉरिटी (रैंकिंग, बाहरी लिंक, उपयोगकर्ता विश्वास सहित) धीरे-धीरे नए URL पर स्थानांतरित हो जाती है, और पुराना URL अंततः पहुंच योग्य नहीं रह सकता है (लेकिन रीडायरेक्ट अभी भी प्रभावी है)।

     

  • विशिष्ट परिदृश्य: वेबसाइट डोमेन नाम बदलना (जैसे example.com से newexample.com पर माइग्रेशन), URL संरचना को समायोजित करना (जैसे /old-product/ को /products/new-product/ में बदलना), कई पुराने पृष्ठों को एक नए में समेकित करना।
टूलक्रॉलिंग की अनुमति देता है?इंडेक्सिंग की अनुमति देता है?URL बदलता है?मुख्य उद्देश्य
canonical✅ अनुमति देता है❌ इंडेक्स न करने का सुझाव देता है (लेकिन फिर भी इंडेक्स कर सकता है)❌ नहीं बदलताकई समान सामग्री की अथॉरिटी को कैनोनिकल संस्करण पर केंद्रित करना
noindex✅ अनुमति देता है❌ मना करता है❌ नहीं बदलतापृष्ठ को खोज परिणामों में दिखने से रोकना
301 रीडायरेक्ट❌ स्वचालित रीडायरेक्ट❌ पुराना URL इंडेक्स नहीं होता है✅ नए URL पर रीडायरेक्ट करता हैपुराने URL से नए पते पर अथॉरिटी और ट्रैफ़िक स्थानांतरित करना

4 सामान्य परिदृश्यों के समूह और उनके उपयोग की तुलना

परिदृश्य 1: एक ही सामग्री के कई URLs हैं (जैसे पैरामीटर वाले उत्पाद पृष्ठ)

     

  • समस्या​: उत्पाद विवरण पृष्ठ https://example.com/product और https://example.com/product?color=red के माध्यम से पहुँचा जा सकता है, और सामग्री पूरी तरह से समान है।
  •  

  • सही टूल​: canonical। पैरामीटर वाली URL (?color=red) पर कैनोनिकल टैग जोड़ें, जो बिना पैरामीटर वाले बेस URL (https://example.com/product) की ओर इंगित करता है, खोज इंजन को बताता है कि “इस सामग्री का प्रामाणिक संस्करण बिना पैरामीटर वाला पृष्ठ है”।
  •  

  • noindex/301 क्यों नहीं चुनें​: noindex पैरामीटर वाले पृष्ठ को इंडेक्स होने से रोकेगा (लेकिन इसे अभी भी क्रॉल किया जा सकता है), और उपयोगकर्ता अभी भी इस लिंक के माध्यम से प्रवेश कर सकता है, और खोज इंजन को अभी भी यह तय करना होगा कि कौन सा संस्करण मुख्य है; 301 रीडायरेक्ट के लिए उपयोगकर्ता और रोबोट को मजबूरन रीडायरेक्ट करने की आवश्यकता होती है, लेकिन उपयोगकर्ता को विभिन्न पैरामीटर के माध्यम से एक्सेस करने की आवश्यकता हो सकती है (जैसे विभिन्न रंगों की तुलना करने के लिए), और मजबूरन रीडायरेक्ट उपयुक्त नहीं है।

परिदृश्य 2: पृष्ठ को अब खोज परिणामों में दिखने की आवश्यकता नहीं है (जैसे एक समाप्त हो चुका ईवेंट पृष्ठ)

     

  • समस्या​: एक प्रचार गतिविधि पृष्ठ (https://example.com/promo) समाप्त हो गया है, लेकिन इसे अभी भी उपयोगकर्ता बुकमार्क्स या बाहरी लिंक्स के माध्यम से देख सकते हैं, और इसे रैंकिंग की आवश्यकता नहीं है।
  •  

  • सही टूल​: noindex। गतिविधि पृष्ठ के <head> में <meta name="robots" content="noindex"> टैग जोड़ें (या CMS के माध्यम से कॉन्फ़िगर करें), जिससे खोज इंजन को पृष्ठ क्रॉल करने की अनुमति मिलती है (उदाहरण के लिए गतिविधि रिकॉर्ड की जाँच करने के लिए), लेकिन इसे इंडेक्स में शामिल करने से रोकती है।
  •  

  • canonical/301 क्यों नहीं चुनें​: canonical “पृष्ठ को दिखने से रोकने” की समस्या को हल नहीं कर सकता (यह केवल अथॉरिटी केंद्रित करता है); 301 रीडायरेक्ट के लिए एक नए URL को इंगित करने की आवश्यकता होती है (लेकिन गतिविधि पृष्ठ का कोई संगत नया पता नहीं है), और उपयोगकर्ता को ऐतिहासिक जानकारी देखने के लिए अभी भी मूल पृष्ठ पर जाने की आवश्यकता हो सकती है।

परिदृश्य 3: डोमेन बदलना या वेबसाइट URL संरचना को समायोजित करना (जैसे पुराने उत्पाद पृष्ठों का माइग्रेशन)

     

  • समस्या​: एक पुराना उत्पाद पृष्ठ (https://old.example.com/item1) स्थायी रूप से नए पते (https://new.example.com/products/item1) पर माइग्रेट हो गया है, और मूल बाहरी लिंक अथॉरिटी और उपयोगकर्ता एक्सेस की आदत को संरक्षित करने की आवश्यकता है।
  •  

  • सही टूल​: 301 रीडायरेक्ट। सर्वर कॉन्फ़िगरेशन (जैसे Apache .htaccess फ़ाइल) के माध्यम से कॉन्फ़िगर करें ताकि जब उपयोगकर्ता या रोबोट पुराने URL तक पहुँचे, तो वह स्वचालित रूप से नए URL पर रीडायरेक्ट हो जाए। पुराने URL की रैंकिंग अथॉरिटी (रैंकिंग, बाहरी लिंक सहित) धीरे-धीरे नए URL पर स्थानांतरित हो जाएगी।
  •  

  • canonical/noindex क्यों नहीं चुनें​: canonical ट्रैफ़िक रीडायरेक्ट प्राप्त नहीं कर सकता (उपयोगकर्ता पुराने URL पर रहेगा); noindex पुराने URL को इंडेक्स होने से रोकेगा, लेकिन बाहरी लिंक अथॉरिटी स्थानांतरित नहीं होगी, और उपयोगकर्ता पुराने लिंक के माध्यम से नई सामग्री तक नहीं पहुँच पाएगा।

परिदृश्य 4: मोबाइल और डेस्कटॉप के लिए अलग URL (जैसे m.example.com और www.example.com)

     

  • समस्या​: एक ही सामग्री में मोबाइल (https://m.example.com/page) और डेस्कटॉप (https://www.example.com/page) के लिए अलग URLs हैं, और सामग्री पूरी तरह से समान है।
  •  

  • सही टूल​: canonical को प्राथमिकता दें (डेस्कटॉप URL की ओर इंगित करते हुए), या उत्तरदायी डिज़ाइन के माध्यम से एकीकृत करें। यदि मोबाइल प्रवेश आवश्यक है (उदाहरण के लिए, उपयोगकर्ता m.example.com के माध्यम से एक्सेस करने के आदी हैं), तो मोबाइल पृष्ठ पर कैनोनिकल टैग जोड़ा जा सकता है जो डेस्कटॉप कैनोनिकल URL की ओर इंगित करता है, और साथ ही कुछ पुराने मोबाइल लिंक्स को डेस्कटॉप पर 301 रीडायरेक्ट करें (वैकल्पिक)।
  •  

  • noindex क्यों नहीं चुनें​: noindex मोबाइल या डेस्कटॉप संस्करणों में से किसी एक को इंडेक्स होने से रोकेगा, जो कुछ उपयोगकर्ताओं की खोज आवश्यकताओं को पूरा करने में बाधा डाल सकता है (उदाहरण के लिए, मोबाइल उपयोगकर्ता अनुकूलित सामग्री नहीं देखेंगे)।

कोड कैसे लिखें? और विभिन्न प्रभावशीलता का तर्क क्या है?

कैनोनिकल टैग: HTML कोड, खोज इंजन विश्लेषण पर निर्भर करता है

     

  • कोड प्रारूप​: कैनोनिकलाइज़ किए जाने वाले पृष्ठ के <head> अनुभाग में <link rel="canonical" href="https://कैनोनिकल_URL" /> जोड़ें (जैसा कि पिछले अध्याय में वर्णित है)।

प्रभावशीलता का तर्क: जब खोज इंजन पृष्ठ को क्रॉल करता है, तो वह इस टैग को पढ़ता है और रिकॉर्ड करता है कि “इस पृष्ठ का कैनोनिकल संस्करण XXX है”, और बाद में रैंकिंग की गणना और अथॉरिटी सौंपने में, यह कैनोनिकल संस्करण को प्राथमिकता देता है। हालांकि, पृष्ठ के अन्य संस्करणों को अभी भी क्रॉल किया जा सकता है (जब तक कि अन्य प्रतिबंध न हों)।

noindex टैग: HTML मेटा-टैग या HTTP प्रतिक्रिया हेडर, रोबोट अनुपालन पर निर्भर करता है

     

  • कोड प्रारूप​: आमतौर पर पृष्ठ के <head> में <meta name="robots" content="noindex"> जोड़ा जाता है (अधिकांश मामलों में लागू) या सर्वर के माध्यम से HTTP प्रतिक्रिया हेडर X-Robots-Tag: noindex लौटाया जाता है (गतिशील पृष्ठों पर लागू)।

प्रभावशीलता का तर्क: जब खोज इंजन पृष्ठ को क्रॉल करता है, तो उसे यह निर्देश मिलता है, और यदि वह पुष्टि करता है कि पृष्ठ noindex शर्तों को पूरा करता है (उदाहरण के लिए, यह कोई स्पैम पृष्ठ नहीं है), तो यह इसे इंडेक्स में नहीं जोड़ेगा। हालांकि, पृष्ठ को अभी भी क्रॉल किया जाएगा (जब तक कि robots.txt द्वारा क्रॉलिंग अवरुद्ध न हो), और उपयोगकर्ता सीधे लिंक के माध्यम से उस तक पहुँच सकते हैं।

301 रीडायरेक्ट: सर्वर कॉन्फ़िगरेशन, जबरन ट्रैफ़िक रीडायरेक्ट

कोड प्रारूप​: यह सर्वर तकनीक के माध्यम से प्राप्त किया जाता है, उदाहरण के लिए:

     

  • Apache सर्वर: .htaccess फ़ाइल में Redirect 301 /old-page https://example.com/new-page जोड़ें;
  •  

  • Nginx सर्वर: कॉन्फ़िगरेशन फ़ाइल में return 301 https://example.com/new-page; जोड़ें;
  •  

  • CMS सिस्टम (जैसे WordPress): एक प्लगइन (जैसे Redirection) के माध्यम से रीडायरेक्ट नियम कॉन्फ़िगर करें।

प्रभावशीलता का तर्क: जब उपयोगकर्ता या खोज इंजन पुराने URL पर जाता है, तो सर्वर स्वचालित रूप से 301 स्टेटस कोड लौटाता है और नए URL पर रीडायरेक्ट करता है, और ब्राउज़र एड्रेस बार नया पता प्रदर्शित करेगा। पुराने URL की अथॉरिटी धीरे-धीरे (आमतौर पर कुछ हफ्तों से लेकर कुछ महीनों तक) नए URL पर स्थानांतरित हो जाएगी, और पुराना URL अंततः सीधे पहुंच योग्य नहीं रह सकता है (लेकिन रीडायरेक्ट फ़ंक्शन बना रहता है)।

Don Jiang
Don Jiang

SEO本质是资源竞争,为搜索引擎用户提供实用性价值,关注我,带您上顶楼看透谷歌排名的底层算法。

最新解读
滚动至顶部