Evitare lo spamming |
 |

Lo spamming è l'attività contraria alla netiquette, cioè l'insieme delle regole di comportamento universalmente accettate dagli utenti della rete Internet. Tipici esempi di spamming sono le email pubblicitarie, le finestre pop-up, gli script che installano dialer, i post nei forum contenenti link pubblicitari. Per quanto riguarda i motori di ricerca, le forme di spamming più comuni hanno come scopo quello di fare leggere agli spider cose che l'utente non vede attraverso la navigazione. Il caso più estremo è quello in cui si cerca di dirottare su siti a pagamento utenti che cercano parole chiave molto generiche come "mp3", "viaggi", "sesso" e così via. Nel corso del tempo, i motori di ricerca sono stati adeguati in modo da essere in grado di rilevare la maggior parte dei casi in cui tali tecniche vengono impiegate. In tal caso il sito non viene indicizzato e, se lo spamming persiste, il sito viene escluso dall'indice. Dato l'alto numero di pagine contenute negli indici, tuttavia, è possibile che l'individuazione dello spamming non sia immediata, e pertanto le pagine "colpevoli" possono rimanere a lungo indicizzate. Vi sono inoltre alcune forme di spamming che possono essere individuate solo manualmente. E' dunque possibile la segnalazione da parte degli utenti di forme di spamming non rilevate dai motori di ricerca.
Google: spamreport@google.com o www.google.com/contact/spamreport.html
Yahoo!: http://add.yahoo.com/fast/help/us/ysearch/cgi_reportsearchspam
Cloaking Configurazione del web server in modo da fornire pagine web diverse in base all'identità di chi effettua un interrogazione. Dunque lo spamming consiste nel far sì che al motore di ricerca venga servita una pagina diversa di quella servita visualizzato dal browser, allo scopo di ottenere un posizionamento preferenziale di un sito per parole chiave che in realtà non fanno parte del contenuto del sito stesso. Generalmente il web server si identifica lo user agent dello spider (o l'indirizzo IP) per "consegnargli" la versione della pagina preparata per i motori di ricerca, anziché quella normale visualizzata dai browser. (un elenco completo degli user agent si trova all'indirizzo www.robotstxt.org).
Redirect Il tag meta refresh è un istruzione html standard che forza il browser a caricare un'altra pagina. Ciò viene interpretato dai motori di ricerca come un tentativo di fare indicizzare una pagina, quella in cui è presente il redirect, che di fatto non viene vista dagli utenti perché essi vengono appunti reindirizzati verso una pagina diversa. Queste pagine vengono definite "doorway pages", e vengono create appositamente per i motori di ricerca nei casi in cui i siti sono inaccessibili dagli spider. E' la situazione tipica che si presenta quando il sito viene realizzato con tecniche sofisticate che mal si conciliano con le esigenze dei motori di ricerca. Se comunque il redirect è necessario, per evitare di correre il rischio di essere considerati "spammer", è necessario definire un delay di minimo 10 secondi tramite il parametro previsto nell'istruzione meta refresh.
In alternativa, è possibile fare eseguire il redirect tramite un javascript o un flash, tecnica che però è considerata spamming se combinata all'utilizzo di una pagina doorway. Inoltre, si deve tenere conto del fatto che il motore di ricerca non sarà in grado di seguire i link. Nel caso in cui la pagina in questione sia la homepage e il link sia l'unico passaggio attraverso il quale si accede al resto del sito, ciò impedisce al motore di ricerca di andare oltre la homepage. Se si tratta di una presentazione in flash (o altri sistemi) si può ovviare a ciò inserendo il classico link html "skip intro" che consente di saltare l'introduzione. In tutti i casi, è possibile usare il tag "link" nell'intestazione nel modo seguente: link xhref="altra_pagina.htm".
Testo nascosto Del testo contenente le keyword può essere reso invisibile utilizzando un colore uguale a quello dello sfondo (bianco su bianco, nero su nero, ecc).
Keyword Stuffing La ripetizione eccessiva (più di 2 volte) delle keyword all'interno dei singoli tag meta e title è considerata spamming. Inoltre un tag non può essere ripetuto, neppure se contiene testo diverso.
Duplicate Pages/ Mirror Sites Pagine identiche nello stesso sito e siti duplicati in domini diversi sono considerati spamming.
Oltre allo spamming insito nelle modalità di costruzione delle pagine web, vi è quello legato alla creazione artificiosa di link popularity. Con il successo di Google, infatti molti webmaster hanno cercato di creare delle pagine solo per poterci inserire dei link che facciano aumentare il PageRank tramite link reciproci con altri siti. Tali pagine sono conosciute come FFA, free for all. Si tratta in pratica di uno scambio di link di massa fra pagine che contengono solo tanti link decontestualizzati. La maggior parte delle FFA viene oramai individuata dai motori di ricerca in breve tempo. Si possono comunque trovare pagine FFA ben indicizzate, ma nel momento in cui il motore di ricerca le dovesse individuare come spamming, tutti i siti linkati verrebbero penalizzati di conseguenza. Si tratta di un rischio che non vale la pena di correre, tanto più che raramente le pagine FFA hanno PR alto.
Esistono inoltre siti con alto PR che ospitano link a pagamento. Alcuni webmaster consci del valore di un link dalle loro pagine hanno infatti pensato di sfruttare economicamente la cosa. Si tratta di un'infrazione delle linee guida che ha portato alcuni gestori di siti a ricevere citazioni in giudizio dai motori di ricerca.
Va fatta molta attenzione anche allo scambio di link verso siti web che usano trucchi di posizionamento considerati spamming. Un legame di questo tipo potrebbe essere sanzionato con una penalità nei motori di ricerca, e in casi estremi con l'esclusione. Se un sito viene escluso da un motore di ricerca a causa dello spamming, si devono rimuoverne le cause, e successivamente segnalare la natura dei cambiamenti effettuati:
Google: help@google.com
Yahoo!: http://add.yahoo.com/fast/help/us/ysearch/cgi_feedback
Infine, si sconsiglia di utilizzare programmi per il submit automatico e la verifica automatica del ranking. Tali programmi sfruttano le risorse di elaborazione dei motori di ricerca e sono pertanto da questi osteggiati. Il loro utilizzo massiccio e indiscriminato può portare ad una penalità specialmente in Google, particolarmente attento alla cosa.
|
|
|
|