微信客服
Telegram:guangsuan
电话联系:18928809533
发送邮件:[email protected]

ความหมายของ canonical ใน SEO丨วิธีใช้แท็ก canonical ใน SEO

本文作者:Don jiang

แท็ก rel=”canonical” คือการแจ้งให้เครื่องมือค้นหาทราบว่า “**URL ใดคือเวอร์ชันมาตรฐานของเนื้อหานี้**” เพื่อหลีกเลี่ยงการกระจายน้ำหนัก

ในการทำ Google SEO ใช้วิธีเพิ่ม <link rel=”canonical” href=”URL มาตรฐาน”> ในส่วน <head> ของหน้าเพจ

ข้อมูลแสดงให้เห็นว่า เว็บไซต์อีคอมเมิร์ซที่ปรับใช้แท็ก Canonical อย่างถูกต้อง มีอัตราการทำดัชนีของหน้าแสดงรายการผลิตภัณฑ์เพิ่มขึ้นโดยเฉลี่ย 28% และจำนวนการรวบรวมข้อมูลของ URL ที่ซ้ำกันลดลง 40%-60%

เว็บไซต์ข่าวที่รวมบทความที่คล้ายคลึงกันผ่านแท็กมาตรฐาน พบว่ามีการคลิกจากการค้นหาเนื้อหาหลักเพิ่มขึ้นโดยเฉลี่ย 19%

แต่จากการสำรวจจริง พบว่ามีเพียง 31% ของเว็บไซต์เท่านั้นที่ใช้แท็กนี้ได้อย่างถูกต้อง 100% (ข้อผิดพลาดที่พบบ่อย ได้แก่ การชี้ไปที่ URL ที่ผิดพลาด, การไม่เป็นไปตามมาตรฐานข้ามโปรโตคอล/โดเมน, การซ้อนทับกันของหลายแท็ก เป็นต้น)

Canonical Tag คืออะไร

เหตุผลที่ต้องใช้แท็ก canonical

ในการรวบรวมข้อมูลประจำวันของเครื่องมือค้นหา Google กว่า 65% ของเว็บไซต์มีปัญหาเนื้อหาซ้ำกัน ซึ่งเกิดจากการออกแบบโครงสร้าง URL ที่ไม่เหมาะสม

แสดงออกมาในรูปแบบ:

  • บทความเดียวกันสามารถเข้าถึงได้ผ่านที่อยู่ที่มีพารามิเตอร์ (เช่น ?utm_source=xxx)
  • มีส่วนต่อท้ายไดเรกทอรี (เช่น /page/ และ /page/index.html)
  • โดเมนย่อยต่างกัน (เช่น www และ non-www)

John Mueller จาก Google ได้กล่าวหลายครั้งในการถามตอบอย่างเป็นทางการว่า เมื่อเครื่องมือค้นพบว่า “มีหลาย URL ที่แสดงเนื้อหาที่คล้ายคลึงกันอย่างมากหรือเหมือนกันทุกประการ” จะเผชิญกับความยากลำบากในการตัดสินใจว่า “ควรจัดสรรน้ำหนัก (Weight) ให้กับ URL ใด”

หน้าผลิตภัณฑ์อีคอมเมิร์ซหนึ่งหน้าอาจสร้าง URL ที่แตกต่างกันถึงสิบกว่ารายการเนื่องจากการกรองสีหรือพารามิเตอร์การจัดเรียง; ข่าวประชาสัมพันธ์หนึ่งฉบับอาจถูกผลักไปยังหลายคอลัมน์ ทำให้เกิดลิงก์ทางเข้าหลายรายการ

การใช้แท็ก canonical จะบอกเครื่องมือค้นหาอย่างชัดเจนว่า: “**แม้ว่าเนื้อหานี้จะสามารถเห็นได้จากหลายที่อยู่ แต่โปรดมุ่งเน้นน้ำหนักและการจัดอันดับไปที่ URL ที่ฉันกำหนดนี้เท่านั้น**”

เนื้อหาซ้ำกันส่งผลต่อ SEO อย่างไร

เนื้อหาซ้ำกันเองจะไม่นำไปสู่การลงโทษจากเครื่องมือค้นหาโดยตรง (Google ระบุชัดเจนว่า “จะไม่ลงโทษเว็บไซต์เนื่องจากการทำซ้ำเนื้อหาเพียงอย่างเดียว”) แต่จะทำให้น้ำหนักถูกกระจาย

เมื่อเนื้อหาเดียวกันสามารถเข้าถึงได้ผ่านหลาย URL เครื่องมือค้นหาจะถือว่า URL เหล่านี้เป็น “**หน้าเพจที่แตกต่างกัน**” และประมวลผลแยกกัน

ตัวอย่างเช่น บทความต้นฉบับหนึ่งบทความแสดงผ่าน URL 4 รายการต่อไปนี้:

  • https://example.com/article
  • https://example.com/article?source=newsletter
  • https://example.com/article#comments
  • https://www.example.com/article (เวอร์ชันที่มี www)

หากไม่มีการระบุมาตรฐาน เครื่องมือค้นหาอาจรวบรวมข้อมูล URL ทั้ง 4 นี้พร้อมกัน และคำนวณน้ำหนักการทำดัชนีสำหรับแต่ละรายการแยกกัน

แต่ความต้องการในการค้นหาของผู้ใช้โดยพื้นฐานแล้วต้องการคำตอบเดียวเท่านั้น และท้ายที่สุดอันดับของเวอร์ชันทั้ง 4 นี้อาจจะต่ำทั้งหมด (เนื่องจากน้ำหนักถูกกระจาย) หรือแม้กระทั่งมีเพียงหนึ่งในนั้นที่ถูกจัดทำดัชนีโดยบังเอิญ และเวอร์ชันอื่น ๆ ยังคงอยู่ในสถานะ “ไม่ถูกจัดทำดัชนี” หรือ “อันดับต่ำ” เป็นเวลานาน

ในเว็บไซต์อีคอมเมิร์ซ หน้าแสดงรายละเอียดผลิตภัณฑ์หนึ่งหน้าอาจสร้าง URL ที่ซ้ำกันโดยเฉลี่ย 8-12 รายการเนื่องจากพารามิเตอร์ (เช่น ?size=XL, ?color=red) สัดส่วนการรวบรวมข้อมูลของหน้าเหล่านี้อาจสูงถึง 15%-20% ของปริมาณการรวบรวมข้อมูลทั้งหมด (ซึ่งควรจัดสรรให้กับหน้าใหม่ที่มีคุณค่ามากกว่า)

เว็บไซต์ข่าวเนื่องจากเนื้อหาถูกผลักไปยังหลายคอลัมน์ (เช่น “ข่าวล่าสุด” “แนวโน้มอุตสาหกรรม” “แนะนำยอดนิยม”) บทความเดียวอาจสร้าง URL ทางเข้าที่แตกต่างกัน 3-5 รายการ

กรณีศึกษาที่เฉพาะเจาะจง: เว็บไซต์อีคอมเมิร์ซขนาดกลางแห่งหนึ่งก่อนที่จะกำหนดมาตรฐาน URL อัตราการทำดัชนีของหน้าแสดงรายการผลิตภัณฑ์อยู่ที่ 62% เท่านั้น (กล่าวคือ มีเพียง 62 หน้าจาก 100 หน้าที่ถูก Google จัดทำดัชนีและอาจเข้าร่วมในการจัดอันดับ)

หลังจากเพิ่มแท็ก canonical สำหรับหน้าแสดงรายการที่มีพารามิเตอร์ (เช่น ?category=shoes&sort=price) (โดยชี้ไปที่ URL พื้นฐานที่ไม่มีพารามิเตอร์ เช่น /shoes) 3 เดือนต่อมาอัตราการทำดัชนีเพิ่มขึ้นเป็น 81% และการเข้าชมจากการค้นหาทั่วไปของผลิตภัณฑ์ที่เกี่ยวข้องเพิ่มขึ้น 17%

ไม่ใช่ “การลบซ้ำ” แต่เป็นการ “กำหนดเวอร์ชันที่มีอำนาจ”

ผู้ดูแลเว็บจำนวนมากมีความเข้าใจผิดเกี่ยวกับแท็ก canonical โดยเชื่อว่ามัน “ใช้เพื่อลบหน้าเพจที่ซ้ำกัน”

ในความเป็นจริง หน้าที่หลักของมันคือ “บอกเครื่องมือค้นหาว่า: ในหลาย URL ที่แสดงเนื้อหาเดียวกัน URL ใดที่คุณควรจัดทำดัชนี จัดเก็บ และให้การจัดอันดับเป็นพิเศษ”

เมื่อคุณเพิ่มโค้ดต่อไปนี้ในส่วน <head> ของหน้าเพจ:

<link rel=“canonical” href=“https://example.com/URL มาตรฐาน” />​

คุณกำลังส่งสัญญาณที่ชัดเจนไปยังเครื่องมือค้นหาว่า: “แม้ว่าหน้านี้ (เช่น /article?source=email ที่มีพารามิเตอร์) จะสามารถเข้าถึงเนื้อหาได้ แต่ฉันหวังว่าคุณจะรวมน้ำหนักและโอกาสในการจัดอันดับของมันไว้ที่ https://example.com/URL มาตรฐาน นี้”

ตามเอกสารอย่างเป็นทางการของ Google และการสังเกตข้อมูลการรวบรวมข้อมูลจริง:

  • ด้านการรวบรวมข้อมูล: เครื่องมือค้นหายังคงรวบรวมข้อมูลทุกเวอร์ชันของหน้าเพจ (รวมถึง URL ที่มีพารามิเตอร์และไดเรกทอรี) แต่จะอ้างอิงแท็ก canonical เพื่อปรับ “ความสำคัญ” ของหน้าเหล่านี้ ตัวอย่างเช่น URL ที่มีพารามิเตอร์อาจถูกรวบรวมข้อมูล แต่ตัวรวบรวมข้อมูลจะไม่กลับมาเยี่ยมชมหรือทำดัชนีเชิงลึกบ่อยเท่ากับเวอร์ชันมาตรฐาน
  • ด้านการทำดัชนี: หากเนื้อหาของหลาย URL มีความคล้ายคลึงกันสูง (อัตราการทำซ้ำเกิน 80%) เครื่องมือค้นหามักจะรวมเวอร์ชันมาตรฐานไว้ในคลังดัชนี ส่วนเวอร์ชันอื่น ๆ อาจไม่ถูกสร้างดัชนีแยกต่างหาก หรือแม้ว่าจะถูกทำดัชนีก็จะไม่เข้าร่วมในการแข่งขันจัดอันดับหลัก
  • ด้านน้ำหนัก: เมื่อลิงก์ภายนอกชี้ไปยัง URL ที่ซ้ำกันใด ๆ เครื่องมือค้นหาจะอ้างอิงคำแนะนำของแท็ก canonical เพื่อ “**โอน**” หรือ “**เชื่อมโยง**” น้ำหนักลิงก์ภายนอกนี้ไปยังเวอร์ชันมาตรฐาน (แม้ว่าจะไม่โอน 100% แต่ในกรณีส่วนใหญ่จะมีผลใกล้เคียง)

ตัวอย่างสถานการณ์จริง: บทความหนึ่งของเว็บไซต์บล็อกถูกเผยแพร่พร้อมกันในสองคอลัมน์คือ “**แนะนำหน้าแรก**” และ “**คอลัมน์เทคโนโลยี**” ทำให้เกิด URL สองรายการ:

  • https://example.com/home/recommend/123 (ทางเข้าแนะนำหน้าแรก)
  • https://example.com/tech/article/123 (ทางเข้าคอลัมน์เทคโนโลยี)

เนื้อหาของทั้งสองเหมือนกันทุกประการ แต่ URL แนะนำหน้าแรกเนื่องจากมีปริมาณการเข้าชมมากกว่า จึงดึงดูดลิงก์ภายนอกบางส่วน

หากไม่มีแท็ก canonical เครื่องมือค้นหาอาจถือว่าทั้งสองหน้าเป็นเนื้อหาอิสระ และ URL แนะนำหน้าแรกแม้ว่าจะมีลิงก์ภายนอก แต่เนื่องจากการกำหนดตำแหน่งคอลัมน์ไม่เป็นแนวตั้งมากพอ (การแนะนำหน้าแรกมักเป็นเนื้อหาทั่วไป) ศักยภาพในการจัดอันดับอาจไม่ดีเท่าคอลัมน์เทคโนโลยี

หากทีมเทคนิคเพิ่มแท็ก canonical ในทั้งสองหน้าและชี้ไปที่ https://example.com/tech/article/123 ซึ่งสอดคล้องกับหัวข้อเนื้อหามากกว่า เครื่องมือค้นหาจะทราบอย่างชัดเจนว่า: “เวอร์ชันที่มีอำนาจของเนื้อหานี้คือ URL ของคอลัมน์เทคโนโลยี” และเชื่อมโยงน้ำหนักลิงก์ภายนอกของหน้าแรกที่แนะนำมาด้วย ซึ่งจะช่วยเพิ่มความสามารถในการแข่งขันจัดอันดับของหน้านี้ภายใต้ “คำหลักที่เกี่ยวข้องกับเทคโนโลยี”

จะเกิดอะไรขึ้นหากไม่ใช้ Canonical Tag

งบประมาณการรวบรวมข้อมูลของ Crawler ถูกสิ้นเปลือง

“จำนวนการรวบรวมข้อมูลรายวัน” ที่เครื่องมือค้นหาจัดสรรให้กับแต่ละเว็บไซต์มีจำกัด (เรียกว่า “งบประมาณการรวบรวมข้อมูล”) โดยจะให้ความสำคัญกับการรวบรวมข้อมูลหน้าสำคัญ (เช่น หน้าแรก หน้าเนื้อหาที่มีความถี่ในการอัปเดตสูง)

หากเว็บไซต์มี URL ซ้ำกันจำนวนมาก (เช่น หน้าแสดงรายละเอียดผลิตภัณฑ์ของเว็บไซต์อีคอมเมิร์ซที่มีพารามิเตอร์การจัดเรียง 10 ชนิด สร้าง URL ที่แตกต่างกัน 1,000+ รายการ) Crawler จะใช้จ่ายงบประมาณบางส่วนไปกับหน้าเหล่านี้ที่ “เนื้อหาเดียวกันแต่ URL ต่างกัน” ทำให้ความถี่ในการรวบรวมข้อมูลของหน้าใหม่ที่จำเป็นต้องถูกรวบรวมข้อมูลจริง ๆ (เช่น ผลิตภัณฑ์ที่เพิ่งเปิดตัว ข้อมูลที่อัปเดต) ลดลง

ข้อมูลแสดงให้เห็นว่า จากการวิเคราะห์บันทึกการรวบรวมข้อมูลของเว็บไซต์อีคอมเมิร์ซเสื้อผ้าแห่งหนึ่ง หน้าผลิตภัณฑ์ที่ซ้ำกันซึ่งมีพารามิเตอร์ (เช่น ?size=M, ?color=blue) ใช้ปริมาณการรวบรวมข้อมูลทั้งหมด 22% ในขณะที่อัตราการตีกลับของหน้าเหล่านี้สูงถึง 85% (ผู้ใช้ค้นหาสินค้าเฉพาะ จะไม่เข้าสู่ผ่าน URL ที่มีพารามิเตอร์)

เมื่อเว็บไซต์นี้เพิ่มแท็ก canonical ที่เป็นหนึ่งเดียวสำหรับหน้าแสดงรายละเอียดผลิตภัณฑ์ (โดยชี้ไปที่ URL พื้นฐานที่ไม่มีพารามิเตอร์) ความถี่ในการรวบรวมข้อมูลสำหรับหน้าผลิตภัณฑ์หลักเพิ่มขึ้น 30% และเวลาในการจัดทำดัชนีสำหรับผลิตภัณฑ์ที่เพิ่งเปิดตัวลดลงจากเฉลี่ย 7 วันเหลือ 3 วัน

เวอร์ชันดัชนีสับสน อันดับไม่เสถียร

เมื่อไม่มีการระบุมาตรฐาน เครื่องมือค้นหาอาจเลือก URL ใดก็ได้เป็น “เวอร์ชันแสดงผลเริ่มต้น” แต่การเลือกนี้ไม่คงที่

ตัวอย่างเช่น เมื่อผู้ใช้ค้นหาคำหลักบางคำ บางครั้งพวกเขาเห็นเวอร์ชันที่มี www (https://www.example.com/page) บางครั้งเห็นเวอร์ชันที่ไม่มี www (https://example.com/page) หรือแม้แต่เวอร์ชันที่มีพารามิเตอร์ (https://example.com/page?from=social)

กรณีศึกษา: หน้า “ติดต่อเรา” ของเว็บไซต์บริการในท้องถิ่นแห่งหนึ่งมีอยู่พร้อมกันสองเวอร์ชันคือ https://example.com/contact และ https://example.com/contact-us (เนื้อหาเหมือนกันทุกประการ) โดยไม่มีการตั้งค่าแท็ก canonical Google ได้จัดทำดัชนี URL ทั้งสองนี้ในเวลาที่ต่างกัน ทำให้เมื่อผู้ใช้ค้นหา “บริการซ่อมบำรุงในเมือง XX ช่องทางติดต่อ” บางครั้งเห็นเวอร์ชันแรกมีอันดับสูงกว่า บางครั้งเห็นเวอร์ชันที่สอง

เมื่อผู้ใช้คลิกเข้าสู่เวอร์ชันที่ไม่ใช่เวอร์ชันหลัก (เช่น contact-us) อาจทำให้เกิดการลดลงของอัตราการแปลงเนื่องจากความแตกต่างในการออกแบบการนำทางหน้า (เช่น ขาดปุ่มนัดหมายออนไลน์)

ต่อมาเว็บไซต์นี้ได้เพิ่มแท็ก canonical ในทั้งสองเวอร์ชัน โดยชี้ไปที่ https://example.com/contact 3 เดือนต่อมาอันดับของหน้าเพจนี้เพิ่มขึ้น และอัตราการคลิกจากการค้นหา (CTR) เพิ่มขึ้น 11%

น้ำหนักลิงก์ภายนอกกระจาย

หาก URL ที่ซ้ำกันหลายเวอร์ชันถูกเชื่อมโยงโดยเว็บไซต์ภายนอก (เช่น มีคนใช้ URL ที่มีพารามิเตอร์เมื่อเผยแพร่เนื้อหาซ้ำ หรือสร้างลิงก์ใหม่เมื่อผลักไปยังหน้าคอลัมน์) แต่ลิงก์ภายนอกเหล่านี้ชี้ไปที่ที่อยู่ต่างกัน เครื่องมือค้นหาจะไม่สามารถรวมน้ำหนักได้โดยอัตโนมัติ

การเปรียบเทียบข้อมูล: บทความ “กลยุทธ์สอบเข้ามหาวิทยาลัย” ของเว็บไซต์การศึกษาแห่งหนึ่งถูกเผยแพร่ซ้ำโดย 5 ไซต์ภายนอก โดย 3 ลิงก์ไปยังเวอร์ชันที่ไม่มีพารามิเตอร์ (https://example.com/guide/kaoyan) และ 2 ลิงก์ไปยังเวอร์ชันที่มีพารามิเตอร์ (https://example.com/guide/kaoyan?from=partner)

เมื่อไม่ได้ตั้งค่าแท็ก canonical เครื่องมือค้นหาจะเชื่อมโยงลิงก์ภายนอกทั้ง 5 นี้กับ URL ที่แตกต่างกัน เมื่อเว็บไซต์นี้เพิ่มแท็ก canonical สำหรับทุกเวอร์ชัน (โดยชี้ไปที่เวอร์ชันที่ไม่มีพารามิเตอร์) ภายใน 6 เดือน การเข้าชมจากการค้นหาทั่วไปของหน้าเพจนี้เพิ่มขึ้น 24%

ไวยากรณ์พื้นฐานและวิธีการเขียนแท็ก canonical

ประมาณ 32% ของหน้าเพจวางแท็ก canonical ไว้ในส่วน <body> (แทนที่จะเป็นบริเวณ <head> ที่จำเป็น), 19% ของค่าแอตทริบิวต์ href ขาดโปรโตคอลที่สมบูรณ์ (เช่น เขียนเพียง example.com แทน https://example.com) และอีก 15% ของหน้าเพจชี้ไปที่ “เวอร์ชันมาตรฐาน” ที่แตกต่างกันในหลาย URL ที่ซ้ำกัน (ทำให้เครื่องมือค้นหาสับสน)

จากการใช้งานทางเทคนิค แท็ก canonical เป็นแท็กลิงก์ HTML ที่เรียบง่าย แต่ตำแหน่งของแท็ก (ต้องอยู่ภายใน <head>), รูปแบบไวยากรณ์ (ต้องปฏิบัติตามมาตรฐาน HTML อย่างเคร่งครัด), URL ที่ชี้ไป (ต้องสอดคล้องกับเนื้อหาจริงทุกประการและสามารถเข้าถึงได้) เป็นสิ่งสำคัญ

ข้อมูลแสดงให้เห็นว่า เมื่อแท็ก canonical ถูกปรับใช้ตามรูปแบบมาตรฐาน (กล่าวคือ วางไว้ด้านบนของ <head> ใช้โปรโตคอล HTTPS ที่สมบูรณ์ และชี้ไปที่ URL มาตรฐานที่ถูกต้องและเป็นเอกลักษณ์) โอกาสที่เครื่องมือค้นหาจะระบุและใช้แท็กนั้นอย่างถูกต้องจะสูงกว่า 95%

ในขณะที่หน้าเพจที่เขียนผิดพลาด ประมาณ 60% ของความตั้งใจมาตรฐานไม่ได้รับการยอมรับจากเครื่องมือค้นหา ทำให้ปัญหาเนื้อหาซ้ำยังคงอยู่

ตัวอย่างเช่น เว็บไซต์อีคอมเมิร์ซแห่งหนึ่งเมื่อเพิ่มแท็ก canonical สำหรับหน้าแสดงรายละเอียดผลิตภัณฑ์ (เช่น เวอร์ชันที่มีพารามิเตอร์ ?color=red) เนื่องจากลืมเขียนส่วนหัวโปรโตคอล (เขียนเป็น //example.com/product หรือ example.com/product) ทำให้ Google ไม่สามารถแยกวิเคราะห์ URL เป้าหมายได้อย่างถูกต้อง

โครงสร้างไวยากรณ์มาตรฐาน

ไวยากรณ์ที่สมบูรณ์ของแท็ก canonical มีเพียงโค้ด HTML หนึ่งบรรทัด: <link rel=“canonical” href=“https://www.example.com/URL_ที่สมบูรณ์_ของหน้ามาตรฐาน” />

บรรทัดนี้ประกอบด้วย 3 ส่วนหลัก ซึ่งขาดไม่ได้และลำดับคงที่:

ประเภทแท็ก: <link>

  • นี่คือแท็กที่ใช้ใน HTML เพื่อกำหนดความสัมพันธ์ระหว่างเอกสารกับทรัพยากรภายนอก แท็ก canonical เป็นส่วนหนึ่งของ “ความสัมพันธ์ของลิงก์” และต้องใช้ <link> เป็นโครงสร้างพื้นฐาน

แอตทริบิวต์: rel="canonical"

  • rel เป็นแอตทริบิวต์ที่จำเป็นสำหรับแท็ก <link> ซึ่งใช้เพื่ออธิบายความสัมพันธ์ของลิงก์ปัจจุบันกับเอกสารปัจจุบัน เมื่อค่าถูกตั้งค่าเป็น canonical จะแจ้งให้เครื่องมือค้นหาทราบอย่างชัดเจนว่า: “แท็กนี้กำหนดเวอร์ชันมาตรฐาน (มีอำนาจ) ของเนื้อหาหน้าปัจจุบัน”

แอตทริบิวต์: href="URL"

  • href เป็นแอตทริบิวต์ที่จำเป็นอีกตัวของแท็ก <link> ซึ่งใช้เพื่อระบุที่อยู่เว็บเฉพาะของเวอร์ชันมาตรฐาน URL นี้ต้องสมบูรณ์และสามารถเข้าถึงได้ รวมถึงโปรโตคอล (http หรือ https), โดเมน (www หรือ non-www), พาธ และพารามิเตอร์ (หากจำเป็น)

ตัวอย่าง:

  • การเขียนที่ถูกต้อง: href="https://www.example.com/products/shoes"
  • การเขียนที่ผิดพลาด 1 (ขาดโปรโตคอล): href="//www.example.com/products/shoes" (เบราว์เซอร์อาจเติมโดยอัตโนมัติ แต่เครื่องมือค้นหาอาจไม่สามารถแยกวิเคราะห์ URL เป้าหมายได้อย่างถูกต้อง)
  • การเขียนที่ผิดพลาด 2 (ขาดโดเมน): href="/products/shoes" (พาธสัมพัทธ์ เครื่องมือค้นหาไม่ทราบว่าเป็นหน้าเพจภายใต้เว็บไซต์ใด)
  • การเขียนที่ผิดพลาด 3 (สะกดผิด): href="https://www.exaple.com/products/shoes" (สะกดโดเมนผิด ชี้ไปที่หน้าที่ไม่มีอยู่)

รายละเอียดอื่น ๆ:

  • แท็กนี้ต้องลงท้ายด้วย / (หาก URL เองต้องการเครื่องหมายทับท้าย) แต่ในกรณีส่วนใหญ่ เครื่องมือค้นหาสมัยใหม่มีความอดทนต่อการมีหรือไม่มีเครื่องหมายทับท้ายค่อนข้างสูง (ตราบใดที่มาตรฐานเป็นหนึ่งเดียว)
  • แท็กต้องเขียนในบรรทัดเดียว (การขึ้นบรรทัดใหม่อาจทำให้เครื่องมือแยกวิเคราะห์บางตัวเกิดข้อผิดพลาด แม้ว่าเครื่องมือค้นหามักจะสามารถแก้ไขได้โดยอัตโนมัติ)
  • ส่วนปิดของแท็กคือ /> (แท็กปิดตัวเอง มาตรฐาน HTML5 อนุญาตให้ละเครื่องหมาย / สุดท้ายได้ แต่แนะนำให้คงไว้เพื่อให้แน่ใจว่าเข้ากันได้)

เหตุผลที่ต้องอยู่ใน <head>

เนื่องจากโปรแกรมรวบรวมข้อมูลของเครื่องมือค้นหาเมื่อรวบรวมข้อมูลหน้าเพจ จะให้ความสำคัญกับการแยกวิเคราะห์เนื้อหาในบริเวณ <head> ก่อน (โดยเฉพาะข้อมูลเมตา, ชื่อ, แท็กมาตรฐาน และ “คำสั่งควบคุม” อื่น ๆ) จากนั้นจึงประมวลผลเนื้อหาจริงใน <body>

หากแท็ก canonical ถูกวางไว้ผิดพลาดภายใน <body> (เช่น ฝังอยู่ในย่อหน้าบทความหรือโค้ดส่วนท้าย) เครื่องมือค้นหาจะละเว้นแท็ก <link rel="canonical"> ภายใน <body> โดยตรง

ส่วนเพิ่มเติมอื่น ๆ:

  • หนึ่งหน้าเพจสามารถมีแท็ก canonical ได้เพียงแท็กเดียวเท่านั้น (หากมีหลายแท็ก เครื่องมือค้นหามักจะระบุเพียงแท็กแรก ส่วนที่เหลือจะถูกละเว้น)
  • แท็กนี้ไม่สามารถฝังอยู่ในแท็กอื่นได้ (เช่น ไม่สามารถวางไว้ใน <div> หรือ <script>)
  • สำหรับหน้าเพจที่สร้างแบบไดนามิก (เช่น หน้าเพจที่ส่งออกผ่านภาษาแบ็กเอนด์ เช่น PHP, Python) จำเป็นต้องตรวจสอบให้แน่ใจว่าเอ็นจิ้นเทมเพลตได้แทรกแท็ก canonical ลงในบริเวณ <head> อย่างถูกต้องเมื่อส่งออก HTML (โดยทั่วไปจะควบคุมผ่านตัวแปรเทมเพลต)

5 ข้อผิดพลาดที่พบบ่อยที่สุด

ข้อผิดพลาด 1: ชี้ไปที่ URL ที่ผิดพลาด (เวอร์ชันมาตรฐานไม่ตรงกับความต้องการจริง)

  • ปรากฏการณ์: ชี้แท็ก canonical ไปที่ URL ที่เนื้อหาไม่สอดคล้องกันอย่างสมบูรณ์ (หรือไม่ใช่เนื้อหาเดียวกันเลย) ตัวอย่างเช่น canonical ของหน้าแสดงรายละเอียดผลิตภัณฑ์ (แสดงรองเท้าสีแดง) ชี้ไปที่หน้าแสดงรองเท้าสีขาว
  • ผลที่ตามมา: เครื่องมือค้นหาจะทำตามคำสั่งที่ผิดพลาดและรวมน้ำหนักไปที่หน้าเพจที่ไม่เกี่ยวข้อง ทำให้การจัดอันดับของเนื้อหาหลักลดลง
  • การแก้ไข: ตรวจสอบเนื้อหาจริงของหน้าปัจจุบัน และตรวจสอบให้แน่ใจว่า URL ใน href ชี้ไปที่เวอร์ชันมาตรฐานที่ “แสดงเนื้อหาเดียวกันทุกประการ” (เช่น ใช้ URL พื้นฐานที่ไม่มีพารามิเตอร์ที่เป็นหนึ่งเดียว หรือหน้าคอลัมน์ที่ตรงกับความตั้งใจในการค้นหาของผู้ใช้มากที่สุด)

ข้อผิดพลาด 2: ขาดส่วนหัวโปรโตคอล (เขียนเพียงโดเมนหรือใช้พาธสัมพัทธ์)

  • ปรากฏการณ์: โค้ดถูกเขียนเป็น href="//example.com/page" (พาธสัมพัทธ์โปรโตคอล) หรือ href="/page" (พาธสัมพัทธ์)
  • ผลที่ตามมา: เครื่องมือค้นหาอาจไม่สามารถแยกวิเคราะห์ที่อยู่ URL เป้าหมายได้อย่างแม่นยำ (โดยเฉพาะในสถานการณ์ข้ามโปรโตคอลหรือข้ามโดเมน) ทำให้ความตั้งใจมาตรฐานไม่ทำงาน
  • การแก้ไข: ใช้โปรโตคอล + โดเมน + พาธที่สมบูรณ์เสมอ รูปแบบคือ href="https://www.example.com/page" (แนะนำโปรโตคอล https เพื่อความปลอดภัย)

ข้อผิดพลาด 3: URL ที่มีพารามิเตอร์ขัดแย้งกับเวอร์ชันมาตรฐาน

  • ปรากฏการณ์: เวอร์ชันที่ไม่มีพารามิเตอร์ของหน้าแสดงรายการผลิตภัณฑ์ (https://example.com/products) เป็นเวอร์ชันมาตรฐาน แต่เวอร์ชันที่มีพารามิเตอร์ (เช่น https://example.com/products?sort=price) ไม่ได้ชี้ไปที่มันอย่างถูกต้อง แต่กลับชี้ไปที่ URL อื่นที่มีพารามิเตอร์ต่างกัน (เช่น ?sort=date)
  • ผลที่ตามมา: เวอร์ชันที่มีพารามิเตอร์หลายตัวชี้ไปที่ URL ที่แตกต่างกัน ทำให้เกิด “มาตรฐานแบบวนซ้ำ” หรือการกระจายน้ำหนัก
  • การแก้ไข: รวม canonical ของ URL ที่มีพารามิเตอร์ทั้งหมดให้ชี้ไปที่เวอร์ชันพื้นฐานที่ไม่มีพารามิเตอร์ (หรือเวอร์ชันการจัดเรียง/การกรองที่ใช้บ่อยที่สุด) เพื่อให้แน่ใจว่าเวอร์ชันที่แตกต่างกันทั้งหมดชี้ไปที่ที่อยู่มาตรฐานเดียวกัน

ข้อผิดพลาด 4: แท็กถูกวางไว้ภายใน <body>

  • ปรากฏการณ์: เมื่อแก้ไขหน้าเพจผ่านแบ็กเอนด์ CMS ได้เผลอวางโค้ด canonical ลงในพื้นที่เนื้อหาบทความ (ส่วน <body>) แทนที่จะเป็นบริเวณ <head> ของเทมเพลตเว็บไซต์
  • ผลที่ตามมา: ตัวรวบรวมข้อมูลของเครื่องมือค้นหาอาจละเว้นแท็กนี้ ทำให้หน้าเพจที่ซ้ำกันไม่ได้รับการกำหนดมาตรฐานอย่างถูกต้อง
  • การแก้ไข: ติดต่อทีมเทคนิคเพื่อตรวจสอบไฟล์เทมเพลต (เช่น header.php ของ WordPress, theme.liquid ของ Shopify) เพื่อให้แน่ใจว่าแท็ก canonical ถูกส่งออกภายในแท็ก <head> ของ HTML

ข้อผิดพลาด 5: การซ้อนทับกันของแท็ก canonical หลายแท็ก

  • ปรากฏการณ์: เนื่องจากข้อผิดพลาดของเทมเพลตหรือการเพิ่มด้วยตนเอง หน้าเพจหนึ่งมีแท็ก <link rel="canonical"> หลายแท็กปรากฏขึ้น (เช่น ชี้ไปที่ /page และ /page/ พร้อมกัน)
  • ผลที่ตามมา: เครื่องมือค้นหามักจะระบุเพียงแท็กแรกเท่านั้น แท็กที่ตามมาจะถูกละเว้น ซึ่งอาจนำไปสู่ความสับสนในความตั้งใจมาตรฐาน
  • การแก้ไข: ตรวจสอบโค้ด ลบแท็ก canonical ที่ซ้ำซ้อน และตรวจสอบให้แน่ใจว่าแต่ละหน้ามีคำสั่งมาตรฐานเพียงรายการเดียว

ความแตกต่างระหว่าง canonical และแท็กอื่น ๆ (เช่น noindex, 301 redirect)

แท็ก canonical คือ “การกำหนดเวอร์ชันที่มีอำนาจของเนื้อหาเดียวกัน” (คงไว้ซึ่ง URL ทั้งหมด แต่เน้นน้ำหนัก), แท็ก noindex คือ “การห้ามเครื่องมือค้นหาทำดัชนีหน้าปัจจุบัน” (อนุญาตให้รวบรวมข้อมูลแต่ไม่แสดงผล), และ 301 redirect คือ “การเปลี่ยนเส้นทางถาวร URL เก่าไปยัง URL ใหม่” (การถ่ายโอนการเข้าชมและน้ำหนักอย่างสมบูรณ์)

ความแตกต่างที่สำคัญของมาตรฐาน, การห้าม, การเปลี่ยนเส้นทาง

แท็ก canonical (แท็กมาตรฐาน): ใช้สำหรับ “**สถานการณ์ที่มีหลาย URL สำหรับเนื้อหาเดียวกัน**” โดยมีจุดประสงค์เพื่อบอกเครื่องมือค้นหาว่า “เนื้อหาของหน้าเหล่านี้เหมือนกัน แต่คุณต้องมุ่งเน้นไปที่ URL ที่ฉันกำหนดนี้เท่านั้น (เวอร์ชันมาตรฐาน) และรวมน้ำหนักไว้ที่นี่”

  • สถานการณ์ทั่วไป: หน้าแสดงรายละเอียดผลิตภัณฑ์อีคอมเมิร์ซที่มีพารามิเตอร์ (เช่น ?color=red และ ?color=blue), ข่าวประชาสัมพันธ์ที่ถูกผลักไปยังหลายคอลัมน์ (เช่น “ข่าวล่าสุด” และ “แนวโน้มอุตสาหกรรม”), URL แยกกันสำหรับมือถือและ PC แต่เนื้อหาเหมือนกัน

แท็ก noindex (แท็กห้ามทำดัชนี): ใช้สำหรับ “**สถานการณ์ที่อนุญาตให้รวบรวมข้อมูลแต่ห้ามแสดงผล**” โดยบอกเครื่องมือค้นหาว่า “คุณสามารถรวบรวมข้อมูลหน้านี้ได้ แต่อย่าใส่มันไว้ในคลังดัชนีผลการค้นหา”

  • สถานการณ์ทั่วไป: หน้าการจัดการภายใน (เช่น หน้าเข้าสู่ระบบ, หน้าสถิติแบ็กเอนด์), หน้ากิจกรรมชั่วคราว (ไม่จำเป็นต้องรักษาอันดับหลังกิจกรรมสิ้นสุด), หน้าเนื้อหาที่มีมูลค่าต่ำ (เช่น เวอร์ชันสำหรับพิมพ์, หน้าแปลงอักษรจีนตัวเต็ม/ตัวย่อ)

301 Redirect (การเปลี่ยนเส้นทางถาวร): ใช้สำหรับ “**สถานการณ์ที่เนื้อหาถูกย้ายถาวร**” โดยกำหนดค่าผ่านเซิร์ฟเวอร์ (เช่น ไฟล์ .htaccess หรือกฎ Nginx) เพื่อเปลี่ยนเส้นทางผู้ใช้และเครื่องมือค้นหาจาก URL เก่าไปยัง URL ใหม่โดยอัตโนมัติ น้ำหนักของ URL เก่า (รวมถึงอันดับ, ลิงก์ภายนอก, ความไว้วางใจของผู้ใช้) จะค่อย ๆ โอนไปยัง URL ใหม่ และในที่สุด URL เก่าอาจไม่ถูกเข้าถึงอีกต่อไป (แต่การเปลี่ยนเส้นทางยังคงใช้งานได้)

  • สถานการณ์ทั่วไป: การเปลี่ยนโดเมนเว็บไซต์ (เช่น ย้ายจาก example.com ไปยัง newexample.com), การปรับโครงสร้าง URL (เช่น เปลี่ยน /old-product/ เป็น /products/new-product/), การรวมหน้าเก่าหลายหน้าเป็นหน้าใหม่เดียว
เครื่องมืออนุญาตให้รวบรวมข้อมูลหรือไม่อนุญาตให้ทำดัชนีหรือไม่เปลี่ยน URL หรือไม่วัตถุประสงค์หลัก
canonical✅ อนุญาต❌ แนะนำไม่ทำดัชนี (แต่อาจจะยังทำดัชนี)❌ ไม่เปลี่ยนรวมน้ำหนักของเนื้อหาเดียวกันหลายรายการไปยังเวอร์ชันมาตรฐาน
noindex✅ อนุญาต❌ ห้าม❌ ไม่เปลี่ยนป้องกันไม่ให้หน้าเพจปรากฏในผลการค้นหา
301 Redirect❌ เปลี่ยนเส้นทางอัตโนมัติ❌ URL เก่าไม่ถูกทำดัชนี✅ เปลี่ยนไปที่ URL ใหม่โอนน้ำหนักและการเข้าชมของ URL เก่าไปยังที่อยู่ใหม่

4 ชุดสถานการณ์ทั่วไปเพื่อเปรียบเทียบการใช้งาน

สถานการณ์ 1: เนื้อหาเดียวกันมีหลาย URL (เช่น หน้าผลิตภัณฑ์ที่มีพารามิเตอร์)

  • ปัญหา: หน้าแสดงรายละเอียดผลิตภัณฑ์สามารถเข้าถึงได้ผ่าน https://example.com/product และ https://example.com/product?color=red เนื้อหาเหมือนกันทุกประการ
  • เครื่องมือที่ถูกต้อง: canonical เพิ่มแท็ก canonical ใน URL ที่มีพารามิเตอร์ (?color=red) ชี้ไปที่ URL พื้นฐานที่ไม่มีพารามิเตอร์ (https://example.com/product) เพื่อบอกเครื่องมือค้นหาว่า “เวอร์ชันที่มีอำนาจของเนื้อหานี้คือหน้าเพจที่ไม่มีพารามิเตอร์”
  • เหตุผลที่ไม่เลือก noindex/301: noindex จะทำให้หน้าที่มีพารามิเตอร์ไม่ถูกทำดัชนี (แต่อาจจะยังถูกรวบรวมข้อมูล) แต่ผู้ใช้อาจเข้าสู่ผ่านลิงก์นี้ และเครื่องมือค้นหายังคงต้องตัดสินว่าเวอร์ชันใดเป็นเวอร์ชันหลัก 301 redirect จำเป็นต้องบังคับผู้ใช้และ crawler ให้เปลี่ยนเส้นทาง แต่ผู้ใช้อาจจำเป็นต้องเข้าถึงผ่านพารามิเตอร์ต่าง ๆ (เช่น เปรียบเทียบสีที่แตกต่างกัน) จึงไม่เหมาะสำหรับการเปลี่ยนเส้นทางแบบบังคับ

สถานการณ์ 2: หน้าเพจไม่จำเป็นต้องปรากฏในผลการค้นหาอีกต่อไป (เช่น หน้ากิจกรรมที่หมดอายุ)

  • ปัญหา: หน้ากิจกรรมโปรโมชั่น (https://example.com/promo) ได้สิ้นสุดลงแล้ว แต่ผู้ใช้อาจเข้าถึงผ่านบุ๊กมาร์กหรือลิงก์ภายนอกได้ และไม่ต้องการอันดับ
  • เครื่องมือที่ถูกต้อง: noindex เพิ่มแท็ก <meta name="robots" content="noindex"> ใน <head> ของหน้ากิจกรรม (หรือตั้งค่าผ่าน CMS) เพื่ออนุญาตให้เครื่องมือค้นหารวบรวมข้อมูลหน้าเพจได้ (เช่น ตรวจสอบบันทึกกิจกรรม) แต่ไม่อนุญาตให้เข้าสู่คลังดัชนี
  • เหตุผลที่ไม่เลือก canonical/301: canonical ไม่สามารถแก้ปัญหา “ไม่ให้หน้าเพจปรากฏ” ได้ (เพียงแค่เน้นน้ำหนัก) 301 redirect จำเป็นต้องระบุ URL ใหม่ (แต่หน้ากิจกรรมไม่มีที่อยู่ใหม่ที่สอดคล้องกัน) และผู้ใช้อาจยังจำเป็นต้องเข้าถึงหน้าเดิมเพื่อดูข้อมูลประวัติ

สถานการณ์ 3: เว็บไซต์เปลี่ยนโดเมนหรือปรับโครงสร้าง URL (เช่น การย้ายหน้าผลิตภัณฑ์เก่า)

  • ปัญหา: หน้าผลิตภัณฑ์เก่า (https://old.example.com/item1) ถูกย้ายถาวรไปยังที่อยู่ใหม่ (https://new.example.com/products/item1) และจำเป็นต้องรักษาน้ำหนักลิงก์ภายนอกเดิมและพฤติกรรมการเข้าถึงของผู้ใช้
  • เครื่องมือที่ถูกต้อง: 301 Redirect ตั้งค่าผ่านเซิร์ฟเวอร์ (เช่น ไฟล์ .htaccess ของ Apache) ว่า: เมื่อผู้ใช้หรือ crawler เข้าถึง URL เก่า จะเปลี่ยนเส้นทางไปยัง URL ใหม่โดยอัตโนมัติ อันดับและน้ำหนักลิงก์ภายนอกของ URL เก่าจะค่อย ๆ โอนไปยัง URL ใหม่
  • เหตุผลที่ไม่เลือก canonical/noindex: canonical ไม่สามารถทำการเปลี่ยนเส้นทางการเข้าชมได้ (ผู้ใช้ยังคงอยู่ที่ URL เก่า) noindex จะทำให้ URL เก่าไม่ถูกทำดัชนี แต่น้ำหนักลิงก์ภายนอกจะไม่ถูกโอน และผู้ใช้ไม่สามารถเข้าถึงเนื้อหาใหม่ผ่านลิงก์เก่าได้

สถานการณ์ 4: URL แยกกันสำหรับมือถือและ PC (เช่น m.example.com และ www.example.com)

  • ปัญหา: เนื้อหาเดียวกันมี URL แยกกันสำหรับมือถือ (https://m.example.com/page) และ PC (https://www.example.com/page) เนื้อหาเหมือนกันทุกประการ
  • เครื่องมือที่ถูกต้อง: ให้ความสำคัญกับการใช้ canonical (ชี้ไปที่ URL ของ PC) หรือรวม URL โดยใช้การออกแบบที่ตอบสนอง (Responsive Design) หากเวอร์ชันมือถือเป็นทางเข้าที่จำเป็น (เช่น ผู้ใช้คุ้นเคยกับการเข้าถึงผ่าน m.example.com) สามารถเพิ่มแท็ก canonical ในหน้าเพจมือถือเพื่อชี้ไปที่ URL มาตรฐานของ PC และในขณะเดียวกันก็เปลี่ยนเส้นทางลิงก์มือถือเก่าบางส่วนไปยัง PC ผ่าน 301 redirect (ทางเลือก)
  • เหตุผลที่ไม่เลือก noindex: noindex จะทำให้เวอร์ชันมือถือหรือ PC เวอร์ชันใดเวอร์ชันหนึ่งไม่ถูกทำดัชนี ซึ่งอาจทำให้ความต้องการในการค้นหาของผู้ใช้บางส่วนไม่ได้รับการตอบสนอง (เช่น ผู้ใช้มือถือไม่เห็นเนื้อหาที่ปรับให้เข้ากัน)

เขียนโค้ดอย่างไร? ตรรกะการทำงานแตกต่างกันอย่างไร?

แท็ก canonical: โค้ด HTML ขึ้นอยู่กับการแยกวิเคราะห์ของเครื่องมือค้นหา

  • วิธีการเขียนโค้ด: เพิ่ม <link rel="canonical" href="https://URL มาตรฐาน" /> ในส่วน <head> ของหน้าที่ต้องกำหนดมาตรฐาน (ตามที่อธิบายไว้ในบทก่อนหน้า)

ตรรกะการทำงาน: เมื่อเครื่องมือค้นหารวบรวมข้อมูลหน้าเพจ จะอ่านแท็กนี้และบันทึกว่า “เวอร์ชันมาตรฐานของหน้านี้คือ XXX” และจะให้ความสำคัญกับเวอร์ชันมาตรฐานเมื่อคำนวณอันดับและจัดสรรน้ำหนักในภายหลัง แต่หน้าเวอร์ชันอื่น ๆ อาจจะยังถูกรวบรวมข้อมูลอยู่ (เว้นแต่จะมีข้อจำกัดอื่น ๆ)

แท็ก noindex: เมตาแท็ก HTML หรือส่วนหัวตอบกลับ HTTP ขึ้นอยู่กับการปฏิบัติตามกฎของ Crawler

  • วิธีการเขียนโค้ด: โดยทั่วไปจะเพิ่ม <meta name="robots" content="noindex"> ใน <head> ของหน้าเพจ (ใช้ได้กับสถานการณ์ส่วนใหญ่) หรือส่งคืนส่วนหัวตอบกลับ HTTP X-Robots-Tag: noindex ผ่านเซิร์ฟเวอร์ (ใช้ได้กับหน้าไดนามิก)

ตรรกะการทำงาน: เมื่อเครื่องมือค้นหารวบรวมข้อมูลหน้าเพจ จะตรวจจับคำสั่งนี้ หากยืนยันว่าหน้าเพจเป็นไปตามเงื่อนไข noindex (เช่น ไม่ใช่หน้าเพจที่เป็นการโกง) จะไม่รวมอยู่ในคลังดัชนี แต่หน้าเพจจะยังคงถูกรวบรวมข้อมูลอยู่ (เว้นแต่จะใช้ robots.txt เพื่อบล็อกการรวบรวมข้อมูล) และผู้ใช้สามารถเข้าถึงได้ผ่านลิงก์โดยตรง

301 Redirect: การกำหนดค่าเซิร์ฟเวอร์ การเปลี่ยนเส้นทางการเข้าชมแบบบังคับ

วิธีการเขียนโค้ด: ใช้งานผ่านเทคโนโลยีเซิร์ฟเวอร์ ตัวอย่างเช่น:

  • เซิร์ฟเวอร์ Apache: เพิ่ม Redirect 301 /old-page https://example.com/new-page ในไฟล์ .htaccess
  • เซิร์ฟเวอร์ Nginx: เพิ่ม return 301 https://example.com/new-page; ในไฟล์กำหนดค่า
  • ระบบ CMS (เช่น WordPress): ตั้งค่ากฎการเปลี่ยนเส้นทางผ่านปลั๊กอิน (เช่น Redirection)

ตรรกะการทำงาน: เมื่อผู้ใช้หรือเครื่องมือค้นหาเข้าถึง URL เก่า เซิร์ฟเวอร์จะส่งคืนรหัสสถานะ 301 โดยอัตโนมัติและเปลี่ยนเส้นทางไปยัง URL ใหม่ แถบที่อยู่ของเบราว์เซอร์จะแสดงที่อยู่ใหม่ อันดับของ URL เก่าจะค่อย ๆ (โดยปกติคือหลายสัปดาห์ถึงหลายเดือน) โอนไปยัง URL ใหม่ และในที่สุด URL เก่าอาจไม่ถูกเข้าถึงโดยตรงอีกต่อไป (แต่ฟังก์ชันการเปลี่ยนเส้นทางยังคงอยู่)

Don Jiang
Don Jiang

SEO本质是资源竞争,为搜索引擎用户提供实用性价值,关注我,带您上顶楼看透谷歌排名的底层算法。

最新解读
滚动至顶部