เว็บไซต์ถูกทำเครื่องหมายโดย Google ว่า “มีเนื้อหาสแปม”|แต่ไม่พบหน้าที่เจาะจง

本文作者:Don jiang

กลไกการพิจารณาคอนเทนต์สแปมของ Google นั้นซับซ้อนมาก บางครั้งเนื้อหาที่มีปัญหาอาจถูกซ่อนไว้ลึก ๆ (เช่น หน้าโปรไฟล์ของผู้ใช้ หน้าทดสอบเก่า ๆ) หรือเกิดจากปลั๊กอินของบุคคลที่สามที่มีช่องโหว่ ซึ่งทำให้โค้ดสแปมถูกฝังเข้ามา แม้ผู้ดูแลระบบจะพยายามตรวจสอบหลายรอบก็ยังหาไม่เจอ

บทความนี้จะแนะนำวิธีที่ประหยัดต้นทุนและสามารถดำเนินการได้จริง

โดยใช้เบาะแสจาก Google Search Console เพื่อสแกนหา “จุดอับ” ภายในเว็บไซต์ให้ทั่วถึง พร้อมชี้ให้เห็นถึงคอนเทนต์เก่า ๆ หรือความเสี่ยงจากลิงก์ภายนอกที่อาจถูกมองข้ามไป

เว็บไซต์ที่ Google แจ้งว่าเป็นคอนเทนต์สแปม

ขั้นตอนแรก: ใช้เบาะแสจากข้อมูลใน Google Search Console

หากเว็บไซต์ได้รับการแจ้งว่า “มีคอนเทนต์สแปม” Google Search Console ถือเป็นช่องทางแรกที่ควรเข้าไปดู

แต่หลายคนมักมองแค่ “การดำเนินการด้วยตนเอง (Manual Action)” เท่านั้น และมองข้ามข้อมูลสำคัญอื่น ๆ ที่ซ่อนอยู่ในส่วนลึกของระบบ เช่น หน้าที่มีทราฟฟิกผิดปกติ คีย์เวิร์ดที่อันดับตกจากอัลกอริทึม หรือ path แปลก ๆ ที่แฮกเกอร์อาจฝังไว้

ดูรายงาน “ความปลอดภัยและการดำเนินการด้วยตนเอง”

  • ในเมนูด้านซ้าย ให้เข้าไปที่ “ความปลอดภัยและการดำเนินการด้วยตนเอง” > “การดำเนินการด้วยตนเอง” แล้วดูว่าเว็บไซต์ถูกระบุว่าเข้าข่ายใดบ้าง เช่น “คอนเทนต์สแปม” หรือ “หน้าคลอคกิ้ง” เป็นต้น
  • หากมีการแจ้งเตือน ให้แก้ไขหน้าที่มีปัญหาตามคู่มือ แต่ถ้าไม่มีการแจ้งเตือนเลย อาจเกิดจากอัลกอริทึมของ Google ที่ประเมินอัตโนมัติ ควรตรวจสอบเพิ่มเติม

ใช้รายงาน “ประสิทธิภาพ” เพื่อดูพฤติกรรมที่ผิดปกติ

  • เข้าไปที่ รายงาน “ประสิทธิภาพ” ตั้งช่วงเวลาเป็น “28 วันที่ผ่านมา” แล้วเลือกแท็บ “ผลการค้นหา”
  • จัดเรียงตาม CTR (อัตราการคลิก) จากต่ำไปสูง แล้วหาหน้าที่มี CTR ต่ำกว่า 1% หรือมีจำนวนการแสดงผลพุ่งสูงแต่ไม่มีการคลิกเลย ซึ่งอาจเป็นหน้าโดน Google มองว่า “คุณภาพต่ำหรือเป็นสแปม”

ดาวน์โหลดข้อมูลจากรายงาน “หน้าที่ถูกจัดทำดัชนี”

จากแท็บ “การจัดทำดัชนี” เข้าไปดูรายงาน “หน้าที่ถูกจัดทำดัชนี” แล้วโฟกัสที่หัวข้อต่อไปนี้:

  • หน้าที่ถูกยกเว้น เช่น “เนื้อหาซ้ำ” หรือ “มีแท็ก noindex”
  • หน้าที่กลายเป็น 404 โดยไม่คาดคิด (อาจเกิดจาก URL ที่แฮกเกอร์สร้างขึ้นเอง)

ตรวจสอบลิงก์ภายนอกในแท็บ “ลิงก์”

เข้าไปที่ “ลิงก์” > “ลิงก์ภายนอก” แล้วตรวจสอบว่า มีการเพิ่มขึ้นของลิงก์จากแหล่งที่ไม่น่าเชื่อถือ หรือมี แองเคอร์เท็กซ์ซ้ำ ๆ แบบผิดปกติ หรือไม่ ลิงก์ลักษณะนี้อาจเป็นเหตุให้โดนบทลงโทษเรื่อง “ลิงก์สแปม”

ตรวจสอบว่าเว็บมีการเปลี่ยนแปลงอะไรแปลก ๆ บ้างหรือไม่

หาก Google Search Console ไม่มีเบาะแสชัดเจน อาจเป็นไปได้ว่าปัญหาเกิดจากการเปลี่ยนแปลงในเว็บไซต์ช่วงหลัง เช่น การเพิ่มปลั๊กอินที่มีช่องโหว่ หรือการทำ SEO ที่มากเกินไปจนดูน่าสงสัยในสายตา Google

ตรวจสอบว่าไม่ได้ทำ SEO แบบ “มากเกินไป”

  • ยัดคีย์เวิร์ดมากเกิน: มีการใช้คีย์เวิร์ดเดิมซ้ำ ๆ ใน title, body, alt text หรือไม่? ลองใช้เครื่องมืออย่าง SEOquake เช็ก density ถ้าเกิน 5% อาจต้องลดลง
  • เนื้อหาคุณภาพต่ำจาก AI: ใช้ AI สร้างบทความแล้วโพสต์โดยไม่ตรวจสอบคุณภาพหรือความซ้ำซ้อน? ใช้ Copyscape เพื่อตรวจสอบความซ้ำ

ช่องโหว่จากปลั๊กอินหรือธีม

  • ปลั๊กอินใหม่ที่เพิ่งติดตั้ง: โดยเฉพาะปลั๊กอินประเภทเก็บข้อมูลอัตโนมัติ หรือระบบลงทะเบียนผู้ใช้ อาจเปิดช่องให้เกิดสแปมได้
  • โค้ดแปลก ๆ ที่แทรกเข้ามา: ลองดูไฟล์ functions.php หรือ header.php ว่ามีโค้ด redirect หรือแทรกลิงก์ซ่อนไว้หรือไม่
  • ทางออกเบื้องต้น: ปิดปลั๊กอินหรือฟีเจอร์ที่เพิ่งเพิ่ม แล้วดูว่า Google ยังเตือนอยู่หรือไม่

ตรวจสอบการเพิ่มลิงก์ภายนอกหรือแองเคอร์เท็กซ์ที่ผิดปกติ

  • ใช้ Ahrefs หรือ Semrush เช็กว่า มีลิงก์ใหม่จำนวนมาก มาจากเว็บที่ไม่เกี่ยวข้องหรือเปล่า เช่น เว็บพนัน ยา ฯลฯ
  • ตรวจสอบแองเคอร์เท็กซ์: มีคำประเภท “ดาวน์โหลดฟรี” หรือ “ราคาถูกที่สุด” ที่ฟังดูสแปม ๆ หรือไม่

ใช้ log server เพื่อตรวจสอบการเข้าถึงผิดปกติ

นำ log ไฟล์ช่วง 30 วันที่ผ่านมา (เช่น /var/log/apache2/access.log) มาตรวจสอบว่า:

  1. มีการพยายามเข้า wp-admin หรือหน้าจัดการซ้ำ ๆ หรือไม่
  2. มีการส่ง POST ไปยัง path แปลก ๆ เช่น /upload.php
  3. มี error 404 จำนวนมาก หรือไม่ (อาจมีการสแกนหาช่องโหว่อยู่)

เคล็ดลับสำคัญ

  • ย้อนกลับการเปลี่ยนแปลงที่เสี่ยง: ลองลบปลั๊กอินหรือโค้ดที่เพิ่มเข้ามาล่าสุด แล้วดูผลลัพธ์
  • UGC (User-Generated Content) เป็นแหล่งสแปมได้: ตรวจสอบคอมเมนต์หรือหน้าโปรไฟล์ของผู้ใช้ และเปิดใช้งานระบบตรวจสอบก่อนเผยแพร่ (แนะนำปลั๊กอิน: Antispam Bee)

ใช้เครื่องมือช่วยสแกนเว็บทั้งระบบ เพื่อไม่พลาด “จุดอับ”

ถ้าเว็บไซต์มีหลายร้อยหรือหลายพันหน้า การตรวจเองทีละหน้าคงเป็นไปไม่ได้ โดยเฉพาะคอนเทนต์สแปมมักซ่อนอยู่ตามหน้าโปรไฟล์ของผู้ใช้, URL ที่สร้างแบบไดนามิก หรือโฟลเดอร์ที่ใช้ทดสอบ

“จุดอับ” แบบนี้ Google อาจเข้ามาเก็บข้อมูลได้ แต่ผู้ดูแลระบบอาจไม่ทันสังเกต

ใช้ crawler เพื่อดึงลิงก์ทั้งหมดในเว็บ

ใช้เครื่องมือ Screaming Frog (เวอร์ชันฟรีสแกนได้ 500 หน้า): ใส่ URL เว็บไซต์แล้วปล่อยให้มันไล่สแกนลิงก์ทุกหน้า จากนั้นดาวน์โหลดรายงานเพื่อตรวจหาลิงก์น่าสงสัย

  • URL ที่มีพารามิเตอร์น่าสงสัย เช่น ?utm_source=spam หรือ /ref=123ab
  • โฟลเดอร์แปลก ๆ เช่น /temp/, /old/, /backup/ เป็นต้น
  • Checkbot (ปลั๊กอินเบราว์เซอร์): ช่วยเช็กพวกลิงก์เสีย, เนื้อหาที่โดนแฮก, หัวข้อซ้ำ ฯลฯ ได้อัตโนมัติ

    ตรวจสอบเนื้อหาซ้ำ/คัดลอกแบบรวม

    • Siteliner (ฟรี): ใส่ชื่อโดเมนแล้วดูรายงานว่าเพจไหนในเว็บเรามีเนื้อหาคล้ายกัน เช่น รายละเอียดสินค้าซ้ำ ๆ
    • Copyscape Premium: แบบเสียเงินแต่แม่นยำมาก ช่วยเช็กว่าเราลอกคนอื่นมาหรือใครเอาเนื้อหาเราไปใช้

    โซนต้องระวังเป็นพิเศษ – แหล่งสแปมบ่อย

    เนื้อหาที่ผู้ใช้สร้างเอง (UGC):

    1. คอมเมนต์: ใช้ site:yourdomain.com inurl:comments ค้นดูว่ามีคอมเมนต์สแปมหรือเปล่า
    2. หน้าโปรไฟล์: เข้า URL อย่าง /author/john/, /user/profile/ ดูว่ามีเนื้อหาไม่เหมาะสมไหม

    RSS Feed / API:

    ถ้าใช้ WordPress ให้เช็ก /feed/ กับ /wp-json/ ว่ามีใครฝังสแปมไว้ไหม

    หน้าที่มาจากการแบ่งหน้า / ฟิลเตอร์:

    เช่น /category/news/page/99/ พวกนี้อาจจะซ้ำหรือไม่มีเนื้อหาเลย

    เช็ก Log Server เพื่อหาความผิดปกติ

    ใช้ grep หรือ Excel กรอง log 30 วันที่ผ่านมา ดูว่า:

    • มีคนเข้าหน้าแปลก ๆ เช่น /random-page.html เยอะผิดปกติ
    • มี bot ปลอมเป็น Googlebot หรือ bot แฮกเกอร์ที่ crawl หนักเกิน

    จุดสำคัญที่ต้องรู้

    • ระวัง URL ที่มีพารามิเตอร์: อย่าง /product?id=xxx อาจสร้างหน้าซ้ำเยอะมากแบบไม่รู้ตัว
    • หน้าโดนแฮกมักมีคำพวกพนัน 18+ หรือมี redirect, ข้อความซ่อนอยู่
    • ถ้ามีหลายหน้าที่ผิดปกติ ให้ใช้ Google Search Console ลบแคชชั่วคราวก่อน

    ล้างขยะจากหน้าเก่า ๆ หรือหน้าเทส

    บางครั้งเรานึกว่าลบไปหมดแล้ว แต่จริง ๆ Google ยังเห็นอยู่ และมองว่าเป็นสแปม

    ถ้าหน้านั้นถูกปล่อยทิ้งไว้, มีลิงก์แปลก ๆ ที่โดนฝัง หรือข้อมูลเก่าเกินไปจนทำให้คนเข้าใจผิด ก็จะดึงคะแนนทั้งเว็บลงได้

    เนื้อหาหมดอายุ – ลบหรือ mark ว่าไม่มีค่า

    • หน้าสินค้า/บทความเก่า: ใช้ Screaming Frog หรือเครื่องมืออื่นดูว่าเพจไหนไม่อัปเดตมาเกินปี แล้วลบหรือใส่ noindex
    • หน้าโปรโมชันเก่า: ถ้าอยู่ใน /promo/ หรือ /sale/ แล้วคลิกไปเจอสินค้าหมด ให้ redirect ไปสินค้าที่คล้ายกัน
    • หน้าสรุปหรือ archive: อย่าง /2020/ ถ้าไม่มีใครเข้าก็ใส่ noindex ไปเลย

    หน้าทดลองที่ลืมลบหลัง dev

    • เช็กโฟลเดอร์ชั่วคราว: อย่าง /test/, /demo/, /temp/ ลองค้นแบบ site:yourdomain.com inurl:test ดู
    • ลบหน้าทดสอบที่ไม่ใช้แล้ว: เช่น /booking-test/ แบบนี้ควรถอนออกให้หมด และแจ้งลิงก์เสียด้วย

    URL ขยะที่โดนแฮกสร้างขึ้นมา

    ตรวจพารามิเตอร์น่าสงสัย:

    • ค้นหาแบบ site:yourdomain.com intext:พนัน|อุ้มบุญ|ใบเสร็จ เพื่อดูหน้าที่อาจโดนแฮก
    • ดูจาก log ว่ามีพารามิเตอร์แปลก ๆ เข้าบ่อยไหม เช่น ?ref=spam ถ้ามีให้บล็อกการเข้าถึง

    แก้ไขช่องโหว่: เปลี่ยนรหัสผ่านฐานข้อมูล, อัปเดตปลั๊กอินและธีมทั้งหมด

    เนื้อหาจากผู้ใช้งานที่คุณภาพต่ำ

    • เคลียร์หน้าผู้ใช้ทั้งหมด: WordPress จะมี /author/username/ ให้เช็กว่าอันไหนไม่มีโพสต์ ไม่มีเนื้อหา ควรลบ
    • บล็อกคอมเมนต์สแปมจาก index: เพิ่ม Disallow: /*?replytocom= ใน robots.txt

    จุดสำคัญ

    • เริ่มจากหน้าที่ Google index ไว้: ค้นแบบ site:yourdomain.com + ชื่อโฟลเดอร์ เช่น site:yourdomain.com /test/
    • อย่าลืมแจ้ง Google หลังลบ: ใช้ URL Removal Tool ใน Google Search Console เพื่อเร่งการอัปเดต

    หมายเหตุ: การรีวิวโดยทีม Google ใช้เวลาประมาณ 1-3 สัปดาห์ ระหว่างนี้ควรอัปเดตเนื้อหาเรื่อย ๆ เพื่อป้องกันไม่ให้โดนมองเป็นสแปมอีก

    Picture of Don Jiang
    Don Jiang

    SEO本质是资源竞争,为搜索引擎用户提供实用性价值,关注我,带您上顶楼看透谷歌排名的底层算法。

    最新解读