กลไกการพิจารณาคอนเทนต์สแปมของ Google นั้นซับซ้อนมาก บางครั้งเนื้อหาที่มีปัญหาอาจถูกซ่อนไว้ลึก ๆ (เช่น หน้าโปรไฟล์ของผู้ใช้ หน้าทดสอบเก่า ๆ) หรือเกิดจากปลั๊กอินของบุคคลที่สามที่มีช่องโหว่ ซึ่งทำให้โค้ดสแปมถูกฝังเข้ามา แม้ผู้ดูแลระบบจะพยายามตรวจสอบหลายรอบก็ยังหาไม่เจอ
บทความนี้จะแนะนำวิธีที่ประหยัดต้นทุนและสามารถดำเนินการได้จริง
โดยใช้เบาะแสจาก Google Search Console เพื่อสแกนหา “จุดอับ” ภายในเว็บไซต์ให้ทั่วถึง พร้อมชี้ให้เห็นถึงคอนเทนต์เก่า ๆ หรือความเสี่ยงจากลิงก์ภายนอกที่อาจถูกมองข้ามไป
Table of Contens
Toggleขั้นตอนแรก: ใช้เบาะแสจากข้อมูลใน Google Search Console
หากเว็บไซต์ได้รับการแจ้งว่า “มีคอนเทนต์สแปม” Google Search Console ถือเป็นช่องทางแรกที่ควรเข้าไปดู
แต่หลายคนมักมองแค่ “การดำเนินการด้วยตนเอง (Manual Action)” เท่านั้น และมองข้ามข้อมูลสำคัญอื่น ๆ ที่ซ่อนอยู่ในส่วนลึกของระบบ เช่น หน้าที่มีทราฟฟิกผิดปกติ คีย์เวิร์ดที่อันดับตกจากอัลกอริทึม หรือ path แปลก ๆ ที่แฮกเกอร์อาจฝังไว้
ดูรายงาน “ความปลอดภัยและการดำเนินการด้วยตนเอง”
- ในเมนูด้านซ้าย ให้เข้าไปที่ “ความปลอดภัยและการดำเนินการด้วยตนเอง” > “การดำเนินการด้วยตนเอง” แล้วดูว่าเว็บไซต์ถูกระบุว่าเข้าข่ายใดบ้าง เช่น “คอนเทนต์สแปม” หรือ “หน้าคลอคกิ้ง” เป็นต้น
- หากมีการแจ้งเตือน ให้แก้ไขหน้าที่มีปัญหาตามคู่มือ แต่ถ้าไม่มีการแจ้งเตือนเลย อาจเกิดจากอัลกอริทึมของ Google ที่ประเมินอัตโนมัติ ควรตรวจสอบเพิ่มเติม
ใช้รายงาน “ประสิทธิภาพ” เพื่อดูพฤติกรรมที่ผิดปกติ
- เข้าไปที่ รายงาน “ประสิทธิภาพ” ตั้งช่วงเวลาเป็น “28 วันที่ผ่านมา” แล้วเลือกแท็บ “ผลการค้นหา”
- จัดเรียงตาม CTR (อัตราการคลิก) จากต่ำไปสูง แล้วหาหน้าที่มี CTR ต่ำกว่า 1% หรือมีจำนวนการแสดงผลพุ่งสูงแต่ไม่มีการคลิกเลย ซึ่งอาจเป็นหน้าโดน Google มองว่า “คุณภาพต่ำหรือเป็นสแปม”
ดาวน์โหลดข้อมูลจากรายงาน “หน้าที่ถูกจัดทำดัชนี”
จากแท็บ “การจัดทำดัชนี” เข้าไปดูรายงาน “หน้าที่ถูกจัดทำดัชนี” แล้วโฟกัสที่หัวข้อต่อไปนี้:
- หน้าที่ถูกยกเว้น เช่น “เนื้อหาซ้ำ” หรือ “มีแท็ก noindex”
- หน้าที่กลายเป็น 404 โดยไม่คาดคิด (อาจเกิดจาก URL ที่แฮกเกอร์สร้างขึ้นเอง)
ตรวจสอบลิงก์ภายนอกในแท็บ “ลิงก์”
เข้าไปที่ “ลิงก์” > “ลิงก์ภายนอก” แล้วตรวจสอบว่า มีการเพิ่มขึ้นของลิงก์จากแหล่งที่ไม่น่าเชื่อถือ หรือมี แองเคอร์เท็กซ์ซ้ำ ๆ แบบผิดปกติ หรือไม่ ลิงก์ลักษณะนี้อาจเป็นเหตุให้โดนบทลงโทษเรื่อง “ลิงก์สแปม”
ตรวจสอบว่าเว็บมีการเปลี่ยนแปลงอะไรแปลก ๆ บ้างหรือไม่
หาก Google Search Console ไม่มีเบาะแสชัดเจน อาจเป็นไปได้ว่าปัญหาเกิดจากการเปลี่ยนแปลงในเว็บไซต์ช่วงหลัง เช่น การเพิ่มปลั๊กอินที่มีช่องโหว่ หรือการทำ SEO ที่มากเกินไปจนดูน่าสงสัยในสายตา Google
ตรวจสอบว่าไม่ได้ทำ SEO แบบ “มากเกินไป”
- ยัดคีย์เวิร์ดมากเกิน: มีการใช้คีย์เวิร์ดเดิมซ้ำ ๆ ใน title, body, alt text หรือไม่? ลองใช้เครื่องมืออย่าง SEOquake เช็ก density ถ้าเกิน 5% อาจต้องลดลง
- เนื้อหาคุณภาพต่ำจาก AI: ใช้ AI สร้างบทความแล้วโพสต์โดยไม่ตรวจสอบคุณภาพหรือความซ้ำซ้อน? ใช้ Copyscape เพื่อตรวจสอบความซ้ำ
ช่องโหว่จากปลั๊กอินหรือธีม
- ปลั๊กอินใหม่ที่เพิ่งติดตั้ง: โดยเฉพาะปลั๊กอินประเภทเก็บข้อมูลอัตโนมัติ หรือระบบลงทะเบียนผู้ใช้ อาจเปิดช่องให้เกิดสแปมได้
- โค้ดแปลก ๆ ที่แทรกเข้ามา: ลองดูไฟล์
functions.php
หรือheader.php
ว่ามีโค้ด redirect หรือแทรกลิงก์ซ่อนไว้หรือไม่ - ทางออกเบื้องต้น: ปิดปลั๊กอินหรือฟีเจอร์ที่เพิ่งเพิ่ม แล้วดูว่า Google ยังเตือนอยู่หรือไม่
ตรวจสอบการเพิ่มลิงก์ภายนอกหรือแองเคอร์เท็กซ์ที่ผิดปกติ
- ใช้ Ahrefs หรือ Semrush เช็กว่า มีลิงก์ใหม่จำนวนมาก มาจากเว็บที่ไม่เกี่ยวข้องหรือเปล่า เช่น เว็บพนัน ยา ฯลฯ
- ตรวจสอบแองเคอร์เท็กซ์: มีคำประเภท “ดาวน์โหลดฟรี” หรือ “ราคาถูกที่สุด” ที่ฟังดูสแปม ๆ หรือไม่
ใช้ log server เพื่อตรวจสอบการเข้าถึงผิดปกติ
นำ log ไฟล์ช่วง 30 วันที่ผ่านมา (เช่น /var/log/apache2/access.log
) มาตรวจสอบว่า:
- มีการพยายามเข้า wp-admin หรือหน้าจัดการซ้ำ ๆ หรือไม่
- มีการส่ง POST ไปยัง path แปลก ๆ เช่น
/upload.php
- มี error 404 จำนวนมาก หรือไม่ (อาจมีการสแกนหาช่องโหว่อยู่)
เคล็ดลับสำคัญ
- ย้อนกลับการเปลี่ยนแปลงที่เสี่ยง: ลองลบปลั๊กอินหรือโค้ดที่เพิ่มเข้ามาล่าสุด แล้วดูผลลัพธ์
- UGC (User-Generated Content) เป็นแหล่งสแปมได้: ตรวจสอบคอมเมนต์หรือหน้าโปรไฟล์ของผู้ใช้ และเปิดใช้งานระบบตรวจสอบก่อนเผยแพร่ (แนะนำปลั๊กอิน: Antispam Bee)
ใช้เครื่องมือช่วยสแกนเว็บทั้งระบบ เพื่อไม่พลาด “จุดอับ”
ถ้าเว็บไซต์มีหลายร้อยหรือหลายพันหน้า การตรวจเองทีละหน้าคงเป็นไปไม่ได้ โดยเฉพาะคอนเทนต์สแปมมักซ่อนอยู่ตามหน้าโปรไฟล์ของผู้ใช้, URL ที่สร้างแบบไดนามิก หรือโฟลเดอร์ที่ใช้ทดสอบ
“จุดอับ” แบบนี้ Google อาจเข้ามาเก็บข้อมูลได้ แต่ผู้ดูแลระบบอาจไม่ทันสังเกต
ใช้ crawler เพื่อดึงลิงก์ทั้งหมดในเว็บ
ใช้เครื่องมือ Screaming Frog (เวอร์ชันฟรีสแกนได้ 500 หน้า): ใส่ URL เว็บไซต์แล้วปล่อยให้มันไล่สแกนลิงก์ทุกหน้า จากนั้นดาวน์โหลดรายงานเพื่อตรวจหาลิงก์น่าสงสัย
?utm_source=spam
หรือ /ref=123ab
/temp/
, /old/
, /backup/
เป็นต้นCheckbot (ปลั๊กอินเบราว์เซอร์): ช่วยเช็กพวกลิงก์เสีย, เนื้อหาที่โดนแฮก, หัวข้อซ้ำ ฯลฯ ได้อัตโนมัติ
ตรวจสอบเนื้อหาซ้ำ/คัดลอกแบบรวม
- Siteliner (ฟรี): ใส่ชื่อโดเมนแล้วดูรายงานว่าเพจไหนในเว็บเรามีเนื้อหาคล้ายกัน เช่น รายละเอียดสินค้าซ้ำ ๆ
- Copyscape Premium: แบบเสียเงินแต่แม่นยำมาก ช่วยเช็กว่าเราลอกคนอื่นมาหรือใครเอาเนื้อหาเราไปใช้
โซนต้องระวังเป็นพิเศษ – แหล่งสแปมบ่อย
เนื้อหาที่ผู้ใช้สร้างเอง (UGC):
- คอมเมนต์: ใช้
site:yourdomain.com inurl:comments
ค้นดูว่ามีคอมเมนต์สแปมหรือเปล่า - หน้าโปรไฟล์: เข้า URL อย่าง
/author/john/
,/user/profile/
ดูว่ามีเนื้อหาไม่เหมาะสมไหม
RSS Feed / API:
ถ้าใช้ WordPress ให้เช็ก /feed/
กับ /wp-json/
ว่ามีใครฝังสแปมไว้ไหม
หน้าที่มาจากการแบ่งหน้า / ฟิลเตอร์:
เช่น /category/news/page/99/
พวกนี้อาจจะซ้ำหรือไม่มีเนื้อหาเลย
เช็ก Log Server เพื่อหาความผิดปกติ
ใช้ grep
หรือ Excel กรอง log 30 วันที่ผ่านมา ดูว่า:
- มีคนเข้าหน้าแปลก ๆ เช่น
/random-page.html
เยอะผิดปกติ - มี bot ปลอมเป็น Googlebot หรือ bot แฮกเกอร์ที่ crawl หนักเกิน
จุดสำคัญที่ต้องรู้
- ระวัง URL ที่มีพารามิเตอร์: อย่าง
/product?id=xxx
อาจสร้างหน้าซ้ำเยอะมากแบบไม่รู้ตัว - หน้าโดนแฮกมักมีคำพวกพนัน 18+ หรือมี redirect, ข้อความซ่อนอยู่
- ถ้ามีหลายหน้าที่ผิดปกติ ให้ใช้ Google Search Console ลบแคชชั่วคราวก่อน
ล้างขยะจากหน้าเก่า ๆ หรือหน้าเทส
บางครั้งเรานึกว่าลบไปหมดแล้ว แต่จริง ๆ Google ยังเห็นอยู่ และมองว่าเป็นสแปม
ถ้าหน้านั้นถูกปล่อยทิ้งไว้, มีลิงก์แปลก ๆ ที่โดนฝัง หรือข้อมูลเก่าเกินไปจนทำให้คนเข้าใจผิด ก็จะดึงคะแนนทั้งเว็บลงได้
เนื้อหาหมดอายุ – ลบหรือ mark ว่าไม่มีค่า
- หน้าสินค้า/บทความเก่า: ใช้ Screaming Frog หรือเครื่องมืออื่นดูว่าเพจไหนไม่อัปเดตมาเกินปี แล้วลบหรือใส่
noindex
- หน้าโปรโมชันเก่า: ถ้าอยู่ใน
/promo/
หรือ/sale/
แล้วคลิกไปเจอสินค้าหมด ให้ redirect ไปสินค้าที่คล้ายกัน - หน้าสรุปหรือ archive: อย่าง
/2020/
ถ้าไม่มีใครเข้าก็ใส่noindex
ไปเลย
หน้าทดลองที่ลืมลบหลัง dev
- เช็กโฟลเดอร์ชั่วคราว: อย่าง
/test/
,/demo/
,/temp/
ลองค้นแบบsite:yourdomain.com inurl:test
ดู - ลบหน้าทดสอบที่ไม่ใช้แล้ว: เช่น
/booking-test/
แบบนี้ควรถอนออกให้หมด และแจ้งลิงก์เสียด้วย
URL ขยะที่โดนแฮกสร้างขึ้นมา
ตรวจพารามิเตอร์น่าสงสัย:
- ค้นหาแบบ
site:yourdomain.com intext:พนัน|อุ้มบุญ|ใบเสร็จ
เพื่อดูหน้าที่อาจโดนแฮก - ดูจาก log ว่ามีพารามิเตอร์แปลก ๆ เข้าบ่อยไหม เช่น
?ref=spam
ถ้ามีให้บล็อกการเข้าถึง
แก้ไขช่องโหว่: เปลี่ยนรหัสผ่านฐานข้อมูล, อัปเดตปลั๊กอินและธีมทั้งหมด
เนื้อหาจากผู้ใช้งานที่คุณภาพต่ำ
- เคลียร์หน้าผู้ใช้ทั้งหมด: WordPress จะมี
/author/username/
ให้เช็กว่าอันไหนไม่มีโพสต์ ไม่มีเนื้อหา ควรลบ - บล็อกคอมเมนต์สแปมจาก index: เพิ่ม
Disallow: /*?replytocom=
ใน robots.txt
จุดสำคัญ
- เริ่มจากหน้าที่ Google index ไว้: ค้นแบบ
site:yourdomain.com + ชื่อโฟลเดอร์
เช่นsite:yourdomain.com /test/
- อย่าลืมแจ้ง Google หลังลบ: ใช้ URL Removal Tool ใน Google Search Console เพื่อเร่งการอัปเดต
หมายเหตุ: การรีวิวโดยทีม Google ใช้เวลาประมาณ 1-3 สัปดาห์ ระหว่างนี้ควรอัปเดตเนื้อหาเรื่อย ๆ เพื่อป้องกันไม่ให้โดนมองเป็นสแปมอีก