Il sistema di rilevamento dei contenuti spam di Google è complesso. A volte le pagine incriminate sono nascoste in profondità (come pagine di registrazione utenti, vecchi contenuti di test), oppure a causa di vulnerabilità di plugin di terze parti vengono iniettati codici spam, facendo sì che i proprietari del sito non trovino tracce nonostante molte verifiche.
Questo articolo fornisce una soluzione economica ed efficace.
Imparerai come utilizzare i segnali nascosti nei dati di Google Search Console, scansionare efficientemente gli “angoli morti” dell’intero sito, e ripulire vecchi contenuti e backlink spesso trascurati.
Table of Contens
ToggleControlla prima i segnali dai dati di Google Search Console
Quando un sito viene segnalato come “contenuto spam”, Google Search Console è la via più diretta per le verifiche.
Tuttavia, molti proprietari controllano solo le notifiche di “Azioni manuali” e ignorano segnali nascosti nel backend — come pagine con traffico anomalo, keyword con calo di ranking causato da algoritmi, o percorsi segreti nascosti dagli hacker.
Controlla il rapporto “Sicurezza e azioni manuali”
- Nel menu a sinistra della Console, vai su “Sicurezza e azioni manuali” > “Azioni manuali” e verifica se ci sono violazioni evidenti (es. “contenuto spam”, “pagine ingannevoli”).
- Se ci sono notifiche, correggi le pagine indicate; se vedi “Nessun problema”, potrebbe essere un segnale automatico dell’algoritmo (necessaria verifica approfondita).
Filtra traffico anomalo nel rapporto “Prestazioni”
- Apri il rapporto Prestazioni, imposta l’intervallo “ultimi 28 giorni” e filtra per “Impression dei risultati di ricerca”.
- Ordina il CTR (Click Through Rate) dal più basso al più alto, cerca pagine con CTR molto basso (es. meno dell’1%) o con impression aumentate improvvisamente ma senza clic. Google potrebbe considerarle “contenuto di bassa qualità/spam”.
Esporta lo stato di indicizzazione delle pagine
Vai alla sezione “Indicizzazione” della Console e scarica il rapporto “Stato indicizzazione pagine”, presta attenzione a:
- Pagine escluse (es. duplicati o tag noindex).
- Pagine 404 inattese (possono essere URL creati dagli hacker).
Monitora il rischio backlink nella sezione “Link”
Vai su “Link” > “Link esterni”, controlla se ci sono molte ancore ripetute o link da siti con bassa autorità, poiché possono causare penalizzazioni per “link spam”.
Verifica cambiamenti sospetti recenti nel sito
Se Google Search Console non mostra indizi chiari, il problema potrebbe derivare da modifiche recenti — come vulnerabilità introdotte da un nuovo plugin o cambiamenti SEO che hanno attivato penalità algoritmiche.
Controlla l’eccesso di ottimizzazione SEO
- Keyword stuffing: Hai inserito troppe volte la stessa parola chiave in titoli, contenuti o tag Alt? Usa strumenti come SEOquake per verificare la densità; se supera il 5%, riduci.
- Contenuti di bassa qualità prodotti in massa: Hai pubblicato pagine generate da AI senza revisione umana? Controlla con Copyscape per leggibilità e duplicati.
Plugin/tema vulnerabili
- Plugin recentemente installati: Specialmente quelli per raccolta contenuti automatica o registrazione utenti, spesso sfruttati dagli hacker per creare pagine spam.
- Rischio di iniezione codice: Controlla file tema come
functions.php
oheader.php
per codice sospetto (redirect nascosti o link invisibili). - Soluzione temporanea: Disabilita i plugin o funzioni aggiunti recentemente per vedere se sparisce l’avviso di Google.
Crescita improvvisa o anomala di backlink
- Usa strumenti come Ahrefs o Semrush per controllare la provenienza dei nuovi backlink: ci sono link da settori non correlati (come gioco d’azzardo o medicale)?
- Ancora anomala: tante ancora con keyword spam come “download gratuito”, “compra a basso costo”.
Accessi sospetti nei log server
Controlla i log dell’ultimo mese (es. /var/log/apache2/access.log
):
- Accessi ripetuti a pagine di login backend (es.
wp-admin
). - Richieste POST su percorsi insoliti (es.
/upload.php
). - Tanti errori 404 (potrebbero essere tentativi di scanner da parte di hacker).
Consigli importanti
- Ripristina prima modifiche a rischio: disinstalla plugin sospetti, torna a versioni precedenti di codice modificato.
- Attenzione a contenuti generati dagli utenti (UGC): controlla spam nei commenti e profili utenti, attiva moderazione (plugin: Antispam Bee).
Scansiona tutto il sito con tool, non trascurare “angoli morti”
Controllare manualmente migliaia di pagine è quasi impossibile. Contenuti spam spesso si nascondono in pagine di registrazione utenti, URL dinamici con parametri, o vecchie directory di test.
Questi “angoli morti” possono essere scansionati da Google, ma probabilmente non li hai mai controllati.
Cattura tutti i link del sito con un crawler
Lo Screaming Frog (versione gratuita fino a 500 URL) può scansionare automaticamente tutti gli URL del sito, poi esporta i dati per filtrare i link sospetti.
?utm_source=spam
, /ref=123ab
./temp/
, /old/
, /backup/
.Checkbot (estensione del browser): rileva automaticamente link rotti, contenuti hackerati e titoli duplicati.
Controllo di contenuti duplicati/plagiati in massa
- Siteliner (gratuito): inserisci il dominio e genera un report evidenziando le pagine con alto tasso di contenuti duplicati interni (es. descrizioni simili nelle pagine prodotto).
- Copyscape Premium: a pagamento ma molto preciso, verifica se le tue pagine sono plagiate da altri siti o viceversa.
Scansiona le tre principali “aree sporche”
Contenuti generati dagli utenti (UGC):
- Sezione commenti: usa
site:tuo-dominio.com inurl:comments
per cercare commenti spam. - Profili utenti: come
/author/john/
,/user/profile/
, controlla direttamente se ci sono contenuti sospetti.
Feed RSS / Percorsi API:
Controlla su WordPress se /feed/
o /wp-json/
sono stati infettati con spam.
Funzioni di paginazione e filtro:
Come /category/news/page/99/
, le pagine finali possono essere vuote o con contenuti duplicati.
Analisi dei log server per individuare anomalie
Filtra i log degli ultimi 30 giorni con grep
o Excel:
- Pagine sconosciute visitate frequentemente (es.
/random-page.html
). - Bot dei motori di ricerca con frequenza anomala (gli hacker spesso si mascherano da Googlebot).
Consigli chiave
- Attenzione alle pagine con parametri dinamici: come
/product?id=xxx
, controlla che non generino contenuti duplicati inutili. - Segnali di pagine hackerate: titoli con parole chiave di gioco d’azzardo o pornografia; testo nascosto o codici di reindirizzamento.
- Se trovi molte pagine problematiche, invia subito una richiesta di “rimozione snapshot” dalla Google Search Console per limitare i danni temporanei.
Gestione di contenuti vecchi, pagine di test e fonti nascoste di spam
Pensi di aver “pulito tutto”, ma vecchi articoli o pagine di test potrebbero ancora essere considerati spam da Google.
Sono pagine non aggiornate da tempo, magari hackerate con link nascosti o con contenuti obsoleti che confondono gli utenti, facendo scendere la valutazione del sito.
Contenuti scaduti: elimina o marca le pagine “senza valore”
- Vecchie pagine prodotto/blog: usa strumenti come Screaming Frog per filtrare pagine non aggiornate da più di un anno, elimina o aggiungi il tag
noindex
. - Pagine promozionali scadute: controlla cartelle come
/promo/
,/sale/
, se i prodotti sono fuori catalogo fai un redirect 301 verso prodotti simili. - Pagine archivio con contenuti duplicati: come archivi per anno (
/2020/
), se il traffico è zero applicanoindex
.
Pagine di test lasciate dallo sviluppo
- Scansiona directory temporanee: cerca
/test/
,/demo/
,/temp/
e verifica che non siano indicizzate (site:dominio.com inurl:test
). - Pulisci pagine di funzionalità abbandonate: ad esempio pagine di test “prenotazione” (
/booking-test/
), elimina definitivamente e segnala link rotti.
Pagine spam con parametri creati da hacker
Controlla URL con parametri sospetti:
- Su Google cerca
site:dominio.com intext:gioco|surrogacy|fattura
per trovare pagine compromesse. - Analizza i log del server per URL con parametri frequenti come
?ref=spam
, elimina e blocca queste regole.
Correggi vulnerabilità: cambia la password del database, aggiorna plugin/tema all’ultima versione.
Contenuti UGC di bassa qualità
- Pulisci in massa profili utenti: in WordPress controlla pagine
/author/username/
e elimina account senza post o dati. - Blocca i percorsi di commenti spam: aggiungi nel robots.txt
Disallow: /*?replytocom=
per evitare l’indicizzazione delle pagine di commenti paginati.
Consigli chiave
- Priorità alle pagine già indicizzate da Google: verifica con
site:dominio.com + nome_cartella
, per esempiosite:dominio.com /test/
. - Non basta cancellare, invia aggiornamenti: dopo la pulizia, usa lo strumento di rimozione URL nella Search Console per velocizzare l’aggiornamento.
Nota che la revisione manuale di Google di solito richiede 1-3 settimane, nel frattempo mantieni il sito aggiornato per evitare ulteriori penalizzazioni.